Как развить навыки в Data Scince - личный опыт

Постоянно набрасываю себе книги и курсы, которые мне действительно понравились и помогли

База

1️⃣ Классическое машинное обучение (табличные данные)
📖 "Python Machine Learning by Sebastian Raschka" – классика, но избегайте 13-й главы (устарела).
🎓 Специализация "Машинное обучение и анализ данных" от МФТИ и Яндекса – 6 курсов, из которых первые три по ML, 4-й — по статистике (очень полезно), а 5-6 можно пропустить.
🏆 Участвуйте в открытых соревнованиях на Kaggle. Это поможет научиться метрикам и валидации.
🎥 Лекции с ДатафестаYouTube канал и плейлист "ML Training" (ссылка).

2️⃣ Углубление в бустинги
Понимание их работы – основа для табличных задач, важно разбираться в CatBoost, XGBoost и LightGBM.
📜 Документация:

3️⃣ MLOps (O'Reilly)
📖 "Introducing MLOps" – 200 страниц о том, как управлять моделями машинного обучения и обеспечивать их надежную работу в продакшене.

4️⃣ System Design для Data Science
📖 "Designing Machine Learning Systems" (O'Reilly) – о том, как строить системы с правильным выбором метрик, поддерживаемостью и масштабируемостью.

5️⃣ Развитие аналитических навыков – это не просто база, а один из самых важных аспектов!
📖 "Девенпорт, аналитика как конкурентное преимущество"
💻 Разобраться с SQL и Pandas – это фундамент для работы с данными.

6️⃣ Рекомендательные системы
🎓 Recsys курс на YouTube и плейлист.

7️⃣ АБ-тестирование
📖 "Trustworthy Online Controlled Experiments"
📚 Гайды и курсы:

8️⃣ NLP
Тема огромная, с tf-idf -> Word2Vec, fasttext, LSTM -> трансформеры -> BERT -> GPT -> LLM (и LoRA).
🎓 Курс от ШАДа по NLP – ссылка.
🎓 Курс от Lena Voitaссылка.
📖 Обзорная статья A Comprehensive Overview of Large Language Modelsссылка.

9️⃣ Computer Vision
📖 Deep Learning with PyTorch – базовый курс по DL для работы с компьютерным зрением. Практическая книга по классификации и сегментации изображений.
✨ Изучайте темы по мере интереса:

  • image classification

  • segmentation

  • GAN

  • object detection

  • instant segmentation

  • pose estimation

  • diffusion models

  • multimodal models

  • Vision Transformer

Еще больше полезных материалов и обсуждений – в моем Telegram-канале 🚀