Как развить навыки в Data Scince - личный опыт
Постоянно набрасываю себе книги и курсы, которые мне действительно понравились и помогли
База
1️⃣ Классическое машинное обучение (табличные данные)
📖 "Python Machine Learning by Sebastian Raschka" – классика, но избегайте 13-й главы (устарела).
🎓 Специализация "Машинное обучение и анализ данных" от МФТИ и Яндекса – 6 курсов, из которых первые три по ML, 4-й — по статистике (очень полезно), а 5-6 можно пропустить.
🏆 Участвуйте в открытых соревнованиях на Kaggle. Это поможет научиться метрикам и валидации.
🎥 Лекции с Датафеста – YouTube канал и плейлист "ML Training" (ссылка).
2️⃣ Углубление в бустинги
Понимание их работы – основа для табличных задач, важно разбираться в CatBoost, XGBoost и LightGBM.
📜 Документация:
3️⃣ MLOps (O'Reilly)
📖 "Introducing MLOps" – 200 страниц о том, как управлять моделями машинного обучения и обеспечивать их надежную работу в продакшене.
4️⃣ System Design для Data Science
📖 "Designing Machine Learning Systems" (O'Reilly) – о том, как строить системы с правильным выбором метрик, поддерживаемостью и масштабируемостью.
5️⃣ Развитие аналитических навыков – это не просто база, а один из самых важных аспектов!
📖 "Девенпорт, аналитика как конкурентное преимущество"
💻 Разобраться с SQL и Pandas – это фундамент для работы с данными.
7️⃣ АБ-тестирование
📖 "Trustworthy Online Controlled Experiments"
📚 Гайды и курсы:
8️⃣ NLP
Тема огромная, с tf-idf -> Word2Vec, fasttext, LSTM -> трансформеры -> BERT -> GPT -> LLM (и LoRA).
🎓 Курс от ШАДа по NLP – ссылка.
🎓 Курс от Lena Voita – ссылка.
📖 Обзорная статья A Comprehensive Overview of Large Language Models – ссылка.
9️⃣ Computer Vision
📖 Deep Learning with PyTorch – базовый курс по DL для работы с компьютерным зрением. Практическая книга по классификации и сегментации изображений.
✨ Изучайте темы по мере интереса:
image classification
segmentation
GAN
object detection
instant segmentation
pose estimation
diffusion models
multimodal models
Vision Transformer
Еще больше полезных материалов и обсуждений – в моем Telegram-канале 🚀