В этой статье я собрал огромную коллекцию курсов, книг, и ресурсов для всех, кто любит и изучает машинное обучение. Сохраняйте себе эту подборку, чтобы не потерять, по мере выхода новых курсов, подборка будет обновляться.
Благодаря этим бесплатным курсам, вы сможете расширить свои знания и навыки в области машинного обучения, data science и искусственного интеллекта, повысить свою конкурентоспособность на рынке труда и открыть для себя новые возможности в карьере. Независимо от вашего уровня подготовки и опыта, вам обязательно найдется курс, который поможет вам достичь ваших целей.
Платные курсы могут оказаться достаточно затратными, особенно для новичков в области машинного обучения. При наличии достаточной мотивации и желания можно успешно освоить эту область без необходимости тратить деньги на платные курсы.
Курсы по алгоритмам машинного обучения
В данном курсе Вы реализуете с нуля все основные алгоритмы классического машинного обучения на чистом Python, Pandas и NumPy.
Свежий курс от Microsoft. Курс содержит 26 уроков и 52 упражнения. В нем раскрыты такие темы, как построение регрессионных моделей, обработка данных, методы кластеризации, введение в nlp.
Основное внимание на курсе уделяется базовым математическим, статистическим и программированием навыкам, необходимым для типичных задач анализа данных.
Вы рассмотрите эти фундаментальные концепции на примере задачи кластеризации данных и будете использовать этот пример для изучения базовых навыков программирования, которые необходимы для изучения машинного обучения.
Канал с гадами и последними инструментами по машинному обучению, простой способ следить за последними новинками и свежими новостями из мира МО.
ИИ‑самоучитель Learn Anything — идеальный инструмент для освоения любых навыков. Нейронная сеть преобразует абстрактные желания и ваши запросы в структурированный учебный план, предоставляя статьи, руководства и видеоуроки.
Основная цель курса — развить кругозор и «насмотренность» будущих создателей ML‑систем. Есть даже раздел про большие языковые модели. Курс содержит: 15 видеолекций, 14 семинаров, создание собственного проекта.
Вы познакомитесь с важными аспектами машинного обучения: продвинутые алгоритмы машинного обучения (бустинг, SVM, кластеризация и методы понижения размерности), обработка естественного языка с помощью нейросетей, внедрение нейросетей в Telegram‑ботов. Практические задания приближены к задачам, которые специалисты по ИИ встречают в работе.
Новоый спецкурса, посвященный классическим алгоритмам машинного обучения (теория + практика).
Хороший курс для углубления в вычислительную нейронауку. Курс состоит из 34 коротких видеороликов, начиная с вводных тем и заканчивая недавними открытиями, которые мы до сих пор до не изучены. Кроме того, в курсе есть практические упражнения в Google Colab.
Курс «Введение в машинное обучение» Константина Воронцова рассматривает популярные задачи, решаемые с помощью машинного обучения, такие как классификация, регрессия и кластеризация. Слушателю необходимо иметь представление об основных математических понятиях, таких как функции, производные, векторы и матрицы, а также базовые навыки программирования и знакомство с языком Python.
Курс «Машинное обучение для больших данных семинар», программа «Прикладная математика и информатика», НИУ ВШЭ Лектор — Алексей Космачев
Обновляемая структурированная подборка бесплатных ресурсов по тематикам Data Science и Machine Learning: курсы, открытые базы данных и датасеты, источники информации и т. д.
В рамках данного курса слушатели познакомятся с теоретическими и практическими основами искусственных нейронных сетей. Слушатели научатся применять нейронные сети для решения широкого круга задач из области анализа данных.
Здесь есть все от ресурсов с вакансиями и фриланс‑проектами до подробного разбора вопросов с собеседований.
В этом ролике затронуты самые важные понятия ML и смежных областей, помимо теории, есть много кода и практических заданий (например, прогнозирование стоимости жилья).
Курсы по математике для аналитиков данных
Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по‑настоящему глубоко анализировать и систематизировать огромные массивы данных.
Курс для студентов без математического бэкграунда. В курсе изложены основные понятия необходимые для понимания методов, на которых строится машинное обучение и модели нейронных сетей. Также целью курса является разъяснть как могут быть преобразованы и представлены данные для последующего обучения моделей на них.
Идея этого курса — рассказать про математику. Но не про школьную математику, а про математику, которой занимаются настоящие Математики. Можно сказать, что это курс мехматовской математики в изложении, пригодном даже для детей. Если все понятно и очень интересно — то вам сюда!
Это бесплатный курс для изучения основ линейной алгебры.
Математика для Дата Саентистов. Полезная математисечкая теория с уклонном в машинное обучени в данном канале.
Изучите основы теории вероятностей и статистики c Университетом Брауна. В курсе предоставлены наглядные, интерактивные визуализации, которые помогут вам в обучении.
Отличный продвинутый курс — «Введение в описательную статистику».
Это очень короткий курс, в котором вы изучите линейные преобразования, векторы, метод главных компонентов.
В этом курсе 7 уроков. В нем вы научитесь находить решения систем дифференциальных уравнений.
Курс «Введение в статистику» — это совершенно БЕСПЛАТНЫЙ курс для начинающих. Курс ведет сооснователь Udacity Себастьян Трун. Структура курса интересна и увлекательна для начинающих.
Этот курс представляет собой введение в статистический анализ данных. Темы курса охватывают области прикладной вероятности, выборки, оценки, проверки гипотез, линейной регрессии, дисперсионного анализа, категориального анализа данных и многое другое.
Разбор вопросов с собеседований по машинному обучению.
Этот предмет представляет собой введение в теорию вероятностей и анализ данных. Он предназначен для того, чтобы дать студентам знания и практический опыт, необходимые им для интерпретации данных. Основные понятия вероятности вводятся с самого начала, поскольку они обеспечивают систематический способ описания неопределенности.
Это бесплатный плейлист с лекциями от Райгородского Андрея Михайловича, директора Физтех‑школы прикладной математики и информатики МФТИ.
Data Science кусры
В курсе «Python for Data Science» акцент делается на решении множества задач, что позволяет применять полученные знания и вспомнить уже отработанный материал.
Тщательно подобранный список Awesome ресурсов по науке о данных: cтатьи, книги, шпаргалки, даатасеты, инструменты, курсы.
Курс знакомит слушателей с основами машинного обучения и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Data Science. Мы подробно разберем основные теоретические понятия, а также начнем знакомство с библиотеками Pandas и Scikit‑learn — наиболее популярными инструментами для анализа данных и машинного обучения, используя язык программирования Python.
Путеводитель в мир анализа данных. Решая практические задачи, участники познакомятся с основами машинного обучения в увлекательной и доступной форме.
В этом хранилище содержится коллекция книг, связанных с наукой о данных. Эти книги охватывают различные темы, такие как машинное обучение, глубокое обучение, визуализация данных, статистика и многое другое.
📌 Анализ данных для социологов
Изучите методы анализа данных для ответа на вопросы, представляющие культурный, социальный, экономический и политический интерес.
Просто, доступно и с чувством юмора расскажем как анализировать данные на языке Python и применять машинное обучение для поиска закономерностей в массивах данных.
Подборка интересных курсов для Дата Саентистов от одного из лучших университетов в мире.
Курс «Прикладные задачи анализа данных», майнор «Интеллектуальный анализ данных», НИУ ВШЭ Лектор — Михаил Гущин
Курсы по визуализации данных
Изучите основные принципы визуализации данных и способы их применения с помощью ggplot2.
Курс состоят из трёх небольших лекций по теории информационного дизайна и трёх практических примеров по использованию d3.js.
Курс по психологии визуализации данных, проводимый Майклом Френдли, преподавателем университета в Торонто, представляет собой увлекательное погружение в исторический и психологический контекст визуализации данных. Половина курса посвящена изучению научных исследований о восприятии информации и человеческом факторе в информационном дизайне. Лекции содержат множество новых примеров и ссылок, позволяющих лучше понять принципы работы визуализации данных.
Научитесь создавать красивые и информативные визуализации с этим курсом от Kaggle.
Возьмите на себя роль младшего аналитика данных и используйте различные навыки и приемы работы с реальными наборами данных для выполнения практических задачи по визуализации данных.
Развивайте свои аналитические способности и осваивайте один из самых востребованных профессиональных навыков в Data science.
Это курс от Udacity, в котором есть теоретическая часть про информационный дизайн и практическая часть про применение d3.js и библиотек основанном на нём.
Курс отличный: он бесплатный, большой и там более подробно рассмотрены основы программирования, есть тесты и задания, а также он содержит кучу ссылок на классные примеры.
Этот курс будет интересен тем, кто хотел бы визуализировать карты. В курсе есть полезная информация где взять геоданные для России.
Курсы Deep learning
Вы начнете обучение с основ вроде полносвязных сетей, а закончится вниманием и новейшими архитектурами глубокого оубчения. Весь код курса — на PyTorch. При этом упор будет как на практику, на и на НЕповерхностную теорию: вам понадобятся начальные знания алгебры и матанализа.
📂 Курс 📂 Код
📌 Deep Learning An MIT Press book
Одна из лучших книг по глубокому обучению. Эта книга признана мл сообществом, и более того — она бесплатная и доступна онлайн. Она содержит полный набор: алгебру, теорвер, базу ML, best practices и теорию DL и разборы известных архитектур.
Обучение с подкреплением — один из способов машинного обучения, в ходе которого испытуемая система обучается, взаимодействуя с некоторой средой.
Это пошаговый практический курс, который поможет вам пройти изучить RL с сымых основ.
Бесплатный DL курс, предназначенный для людей с некоторым опытом программирования, которые хотят научиться применять глубокое обучение и машинно обучние к практическим задачам.
Большая коллекция бесплатных книг и статей по науке о данных. В поиске вы можете найти книгу практически на любую тему.
На Stanford CS 25 «Transformers United» выступали такие звездные гости, как Андрей Карпаты, Ноам Браун, Лукас Бейер и сам Джефф Хинтон! В рамках этого курса вы изучите основные концепции и принципы работы трансформеров, а также научитесь применять их для решения различных практических задач. Курс будет включать в себя как лекции, так и практические занятия, в ходе которых студенты будут иметь возможность самостоятельно применять полученные знания.
Курсы от Kaggle по Pandas, Python и SQL, ML. Курсы не только для начинающих, но и для опытных программитоа: Intermediate Machine Learning, NLP, Computer Vision, Feature Engineering, Data Cleaning и другое.
Отличный курс по нейросетям на русском от Александра Дьяконова.
RLHF — это одна из ключевых техник, которая привела к появлению современных LLM.
В этом курсе, который ведет Никита Намджоши, разработчик из GenAI в Google cloud, вы узнаете, как работает RLHF, в том числе как применить его для настройки LLM в собственных приложениях. Вы также воспользуетесь библиотекой с открытым исходным кодом для настройки базового LLM и оцените настроенную модель, сравнив ее ответы до и после RLHF‑настройки.
Бесплатный курс по обработке естественного языка (NLP) от The Hugging Face
В этом курсе вы сможете узнать об обработке естественного языка с помощью библиотек из экосистемы Hugging Face.
Курс «Глубинное обучение для текстовых данных», ПМИ НИУ ВШЭ Лектор — Александр Шабалин
Продвинутый курс по NLP из Университета Карнеги‑Меллона.
Курсы R
В рамках трёхнедельного курса рассматриваются все основные этапы статистического анализа R, считывание данных, предобработка данных, применение основных статистических методов и визуализация результатов. Слушатели научатся основным элементам программирования на языке R, что позволит быстро и эффективно решать широчайший спектр задач, возникающих при обработке данных.
Курс продолжает знакомить слушателей с использованием R для анализа данных. В этом курсе мы разберем несколько продвинутых тем, которые не были рассмотрены в первой части: предобработка данных при помощи пакетов data.table и dplyr, продвинутые приемы визуализации, работа в R Markdown.
Курс познакомит слушателей с языком R, основными структурами данных и семантическими правилами. Мы также рассмотрим несколько углублённых тем, которые помогут овладеть принципами написания эффективного кода.
Этот бесплатный онлайн‑курс поможет получить прочную основу в области визуализации данных и манипулирования ими с помощью R. Направьте свою карьеру в области науки о данных с помощью необходимых навыков и техник.
В рамках трёхнедельного курса рассматриваются все основные этапы статистического анализа R, считывание данных, предобработка данных, применение основных статистических методов и визуализация результатов. Слушатели научатся основным элементам программирования на языке R, что позволит быстро и эффективно решать широчайший спектр задач, возникающих при обработке данных.
Курсы по Python
Здесь собрана большая коллекция бесплатных курсов, книг и ресурсов Python в 2024.
Курсы по генеративным моделям
Недавно Microsoft выпустил новый бесплатный курс для новичков по генеративным моделям. Для прохождения курса необходим доступ к OpenAI API и базовые навыки программирования на Python.
Курс включает в себя 18 уроков, посвященных основам работы с крупными языковыми моделями, искусственными интеллектами, а также способам применения этих знаний в разработке собственных проектов.
За 32 часа на курсе вы научитесь основам нейросети с нуля. Внутри — 5 модулей про Generative AI, LLM и Responsible AI от топовых кураторов из Google. Никакой воды, только теория и практика.
Nvidia совсем недавно опубликовала в открытом доступе бесплатные обучающие курсы для пользователей любого уровня подготовки по нейросетям и нейромоделям для понимания работы ИИ.
Бесплатные курсы по большим языковым моделям:
В этом курсе вы сможете узнать об обработке естественного языка с помощью библиотек из экосистемы Hugging Face. Трансформеры, работа с датасетами, токенизаторы, llm. Курс совершенно бесплатный и не содержит никакой рекламы.
Главы с 1 по 4 знакомят с основными концепциями библиотеки Transformers. К концу первой части курса вы будете знать, как работают модели‑трансформеры и сможете использовать модель из Hugging Face Hub, доработать ее на собственном датасете и поделиться своими результатами на Hub.
В главах с 5 по 8 вы узнаете об основах работы с датасетами HF и токенизаторами, а затем решите классические задачи НЛП. К концу этой части вы сможете самостоятельно решать самые распространенные проблемы НЛП.
Главы с 9 по 12 выходят за рамки НЛП и рассказывают о том, как модели Transformer можно использовать для решения задач в области обработки речи и компьютерного зрения. Попутно вы узнаете, как создавать демонстрационные версии своих моделей и делиться ими, а также оптимизировать их для использования в производственных средах. К концу этой части вы будете готовы применять библиотеки для решения (почти) любой задачи машинного обучения!
⏩ Глава 1: Освоение OpenAI API
Первая глава знакомит читателей с API ChatGPT. Предоставлена дорожная карта для понимания ключевых стратегий, включая модерацию, Machine Reasoning и Prompt Chaining.
Вторая глава посвящена практике использования LangChain. Описан процесс разработки, от настройки среды до внедрения передовых методик извлечения информации (Document Loaders, Text Splitters, Semantic Search, RAG Systems).
⏩ Глава 3: ML Ops для LLMs, или LLMOps
Третья глава представляет собой руководство по интеграции LLM в рабочие процессы.
Описываются ключевые этапы от выбора модели до ее развертывания и мониторинга.
Стоит учитывать, что книга не может охватить много аспектов, по‑большей части всё вокруг прикручивания готового чат‑бота для своих целей
Но при всё при этом можно найти для себя много всего полезного
Бесплатный курс от Cohere о том как работают эмбединги, механизм внимания, трансформеры, генерация текста и как всё это применять для реальных задач.
Еще в курсе рассказывают про промпт‑инжиниринг и дается несколько примеров того как все это применять к задачам вроде document QA, semantic search (w Langchain) и так далее.
Курс дает представление о том, как работают LLM, их практическом применении, и направляет учащихся на использование LLM для создания и развертывания собственных приложений.
Теоретическая часть курса изложена понятно, с использованием аналогий и примеров и наглядных иллюстраций, а практическая часть содержит примеры кода, которые помогут вам закрепить полученные знания. Курс регулярно обновляется.
Компания LangChain не так давно выпустила курс о последних достижениях в области LLM и о создания диалоговых агентов.
В курсе особое внимание уделено введению в синтаксиса — LangChain Expression Language (LCEL), который позволяет настраивать поведение агентов.
Участники курса учатся генерировать структурированный вывод с помощью вызова функций, использовать LCEL для настройки обработки запросов, применять вызовы функций для тегирования данных и понимать маршрутизацию запросов с помощью инструментов LangChain.
Для начала лучше иметь базовое знание Python и опыт написания промптов для языковых моделей.
Прохождение этого курса предоставляет хорошую возможность изучить новейшие инструменты для создания диалоговых агентов на основе искусственного интеллекта и улучшить свои навыки в этой области!
А здесь вы можете найти всю коллекцию бесплатных курсов от Deeplearning.ai, созданных в сотрудничестве со многими компаниями, такими как LangChain, OpenAI, Google, Weights & Biases, Microsoft и другими.
В этом курсе рассказывается, как создавать приложения на базе LLM, используя API, Langchain и W&B Prompts. В нем рассказывается про разработку, тестирование и проведение экспериментов и создание приложений на основе на LLM.
Для прохождения курсы нужен опыт работы на Python, но знание алгоритмов машинного обучения не требуются
Все курсы объясняются доступным языком и знакомят вас с понятием «генеративные модели». Эти курсы дают полное представление о том, как LLM модели обучаются и как создавать их самостоятельно.
После того, как пройдете этот курс, можно будет рассказывать на вечеринке, что учились создавать ChatGPT в Google.
На edX в этом году появились 2 курса от Databricks:
Этот курс предназначен для разработчиков, специалистов по исследованию данных и инженеров, которые хотят создавать приложения, на основе LLM, с помощью самых современных и популярных фреймворков. К концу курса вы напишите свой LLM‑проект, отличный вариант попрактиковаться. Курс расчитан на 6 недель, по 4–10 часов в неделю.
Вы узнаете о том, что привело к распространению моделей на основе трансформеров включая BERT, GPT и T5, и о невероятных прорывах и технологиях LLM, которые привели к появлению таких приложений, как ChatGPT. Кроме того, вы получите представление о последних достижениях в разаработке, которые продолжают улучшать LLM, например Flash Attention, LoRa, AliBi и PEFT.
Серия из трех курсов познакомит слушателей со знаниями и навыками для обучения, тонкой настройки и интеграции LLM в продакшен.
Охватывает такие темы, как Prompt Engineering, LLMOps, UX для языковых пользовательских интерфейсов, дополненные языковые модели, быстрая разработка LLM‑приложений, будущие тенденции в LLM, фундаментальные концепции и прохождение askFSDL.
RLHF — это одна из ключевых техник, которая привела к появлению современных LLM.
В этом курсе, который ведет Никита Намджоши, разработчик из GenAI в Google cloud, вы узнаете, как работает RLHF, в том числе как применить его для настройки LLM в собственных приложениях.
Вы также воспользуетесь библиотекой с открытым исходным кодом для настройки базового LLM и оцените настроенную модель, сравнив ее ответы до и после RLHF‑настройки.
Вышла вторая версия популярного бесплатного LLM курса.
Это пошаговое руководство с полезными ресурсами, разделенное на три части: основы LLM, наука больших языковых моделей и инженерия (W.I.P.).