-1

Data science, что у нас тут собственно происходит.

// АД - анализ данных, DS - data scientist, data science

Ну что ж, расскажу немного о работе Data Scientist-а, то есть человека, занимающийся машинным обучением.

Тут пикабушники, рассказывая о своей работе, фотографируют корабли, автомобили и так далее. Что ж, тоже что-нибудь придумаю.


Итак, кто мы (уже АД-овцы)?


Вообще, программисты, но так мы себя не называем, на то есть причины:

1) Обычно кода совсем мало: DS за весь проект может написать 500 строк кода, а то и меньше.

2) Программисты - это какой-то средний уровень, а ds все-таки уже скорей ученые. По-разному, конечно.


Какие задачи?


Задачи по АДу - это задачи, нерешаемые классическими алгоритмами. И в самом деле: как можно алгоритмами и "if"-ами можно предсказывать что-то совершенно не очевидное иногда даже для человека или, например, найти на картинке автомобиль за миллисекунды?


Что нам дают?


Набор данных для обучения нашей модели называется датасет. Датасеты могут быть совершенно разными, зависит от задачи. Например,

Для предсказания вида "будет ли дождь" обычно дают датасет в виде csv таблицы, где строки - это примеры, а столбцы - фичи, то есть условия, при которых идет/не идет дождь.

Для нахождения соли на поверхности Земли нам дают картинки

Data science, что у нас тут собственно происходит. Data Science, Анализ данных, Машинное обучение, Длиннопост

Здесь первая, третья, 5-ая и т. д. - это поверхность Земли (фрагмент), 2-ая, 3-я и т. д. - это маски, то есть фрагменты, где указано местонахождение соли. И нам для других фрагментов нужно предсказать где соль. (это соревнование доступно на kaggle)


Есть задачи наоборот, нарисовать картинку, или написать текст. Тогда нам дают картинку, которую нейросетка понимает, а потом воспроизводит. Если так сделать много раз, то можно будет где-то в середине сети (где она поняла картинку) заполнять своими числами, и она будет рисовать другие картинки.


Как мы решаем?


Способов много. До этого я всегда говорил про нейронные сети, но существует огромное количество других методов машинного обучения. Просто мне интереснее говорить про нс. Нейросети - это как раз глубинное обучение.


Пока так, про подбор архитектуры, kaggle, метрику - в следующем посту :). Пишите, что непонятно, а про что поподробнее.


P. S. Кстати, у ds есть такая штука - loss, это наш фетиш) Но об этом в следующем посту.

Дубликаты не найдены

+2

Мне не нравится аббревиатура АД. До меня долго доходило что это.

раскрыть ветку 4
+1

Пофиксил

раскрыть ветку 3
0

>уже АД-овцы

И как вы будете называться если убрать АД?

раскрыть ветку 2
0

Задачи по АДу - это задачи, нерешаемые классическими алгоритмами. И в самом деле: как можно алгоритмами и "if"-ами можно предсказывать что-то совершенно не очевидное иногда даже для человека или, например, найти на картинке автомобиль за миллисекунды?

If-ами автомобиль не найдешь, а вот дерево решений составить можно.
Есть несколько вопросов:
1) При устройстве на работу какой уровень подготовки у Вас был? Какие проекты делали в качестве учебных?
2) Когда Вам дают данные, в CSV например, делаете ли вы предобработку - привести значения в нужную форму (нормализация это называется вроде, может ошибаюсь) или заполнение пропущенных данных (хотя, вероятнее всего, это уже непосредственно задача ДС)
Спасибо за статью, жду продолжения.

раскрыть ветку 1
0

Про дерево: хех, замечание интересное. Но автомобиль и деревом не найти :).

1) Я не работаю в какой-либо компании. Я основатель научного сообщества ASC, пусть пока не очень известного. Про подготовку - трудно сказать. Если вам интересен вуз, то скажем так: для прохождения в вуз я еще слишком молод. А так изучал сам, курсы проходил, читал книги по матану.

2) Зависит от задачи, например если больные ублюдки те, кто дают данные пихают картинки в csv, то конечно нет. Но когда речь идет о данных, где есть не вся инфа, тогда смотрим: можно заполнять нулями (простейшее), средним значением. Если такого мусора немного, то я обычно выкидываю их из выборки, это реально помогает. Но, повторюсь, зависит от задачи, думаю решение может быть совершенно неожиданным.

0

Где найти книги по математике, в которой объясняют зачем она нужна, а не тупо формулы с фразами "отсюда очевидно..."

раскрыть ветку 1
0

Кто "она", не воткнул? Но вообще, если хочется ml, то на хабре и википедии вроде достаточно понятная теория, до какой-то степени хотя бы...

0

Подписался.

Похожие посты
688

Программа обучения Data science для самостоятельного изучения

Я решил собрать некоторые материалы в одном месте для всех тех, кто хочет войти в науку о данных.
Некоторые курсы я считаю обязательными (их я выделил жирным), некоторые желательными для более глубокого понимания области. Я считаю, что прохождение «жирных» курсов позволит вам приобрести некое понимание о data science, пройдя же все курсы, вы сможете претендовать на начальную позицию.Этот текст - моё видение, некоторые дополнительные ссылки я приложу в конце поста. Буду рад любой конструктивной критике.


1. Основы программирования

Введение в python (обязательно):

https://stepik.org/course/67 — введение в Питон

https://stepik.org/course/512 — введение в Питон чуть более глубокое.

Без программирования аналитику данных представить сложно.


2. Основы математики и статистики

Высшая математика и теория вероятности (желательны для глубокого понимания):

https://stepik.org/course/95/promo — введение в матанализ

https://stepik.org/course/716/promo — матанализ 1

https://stepik.org/course/711/promo — матанализ 2

https://stepik.org/course/2461/promo — курс по линейной алгебре

https://stepik.org/course/3089 — теория вероятности

Подготовительный курс по R (язык программирования для работы с данными):

https://stepik.org/course/497/promo — курс по языку программирования R


Высшая математика позволит вам понимать, что вообще происходит. Без высшей математики вы будете в науке о данных как разнорабочий на стройке — положить кирпичи можете, положить цемент можете, а вот построить крепкую стену/дом без прораба уже не сможете. Так и в науке о данных — будете знать, что такое классификатор, что такое регрессия, алгоритм k-соседей, а вот построить хорошую предсказывающую модель не сможете.


Статистика (обязательно):

https://stepik.org/course/76

https://stepik.org/course/524

https://stepik.org/course/2152

https://stepik.org/course/326

Статистика нужна. Статистика позволяет понять, как работать с данными в первом приближении.


Курсы по алгоритмам и технологиям (не обязательно, но желательно для понимания):

https://stepik.org/course/2614 — базы данных

https://stepik.org/course/217— алгоритмы

https://stepik.org/course/1547 — алгоритмы 2

Последние три курса нужны для лучшего вхождения в сферу и понимания того, что вы делаете. Так, к примеру, знание базовой алгоритмистики позволит вам избежать очень большого количества глупых ошибок.


3. Машинное обучение

Введение в машинное обучение и искусственный интеллект (обязательно):

https://stepik.org/course/4852 — введение в машинное обучение

https://stepik.org/course/401 — машинное обучение

https://stepik.org/course/8057 — машинное обучение

Тут без пояснений — если вы учите data science, то сам data science учить придется.


4. Специализация

Специализация (крайне желательно):

https://stepik.org/course/54098 — обработка текста

http://web.stanford.edu/class/cs224n/ — обработка текста

http://cs231n.stanford.edu/ — обработка изображений

https://stepik.org/course/50352 — компьютерное зрение

Специализация позволит вам применить полученные ранее навыки. Список курсов приведен крайне короткий, и вам придется самим выбирать в каком направлении двигаться дальше.

Полезные материалы


Полезности:

https://vk.com/mlcourse - классная группа, где собрано много полезной информации.

https://habr.com/ru/company/ods/blog/322626/ — курс по data science.

Источники:

Мой путь в data science — история успеха.

https://habr.com/ru/company/plarium/blog/505458/ — история успеха 2.

https://docs.google.com/document/d/1TbMBahh6PNz-qK5hCojfrTJj... (сравнительная таблица).

https://youtu.be/w-IdSp_mQuM — ещё один план-трек.

Показать полностью
42

План обучения Data scientist на 6 месяцев ( только из бесплатных курсов на русском)

В этом видео, мы разберем план обучения, по которому я бы учился data science, если бы начинал сейчас. Все ссылки на курсы ниже или в описании к видео. Все ресурсы на русском языке и абсолютно бесплатные.

План обучения:


1 месяц

Статистика

https://stepik.org/course/76/promo

https://stepik.org/course/524/promo


Основы линейной алгебры

https://www.youtube.com/watch?v=RNTRY...

https://stepik.org/course/401/promo


Матанализ

https://www.youtube.com/watch?v=WUvTy...

на английском, но есть субтитры на русском


2-3 месяц

Введение в DS и машинное обучение:

https://stepik.org/course/4852/promo


mlcourse.ai - https://www.youtube.com/watch?v=dEFxo...

Плейлист с лекциями на русском.

Более новые лекции на английском и домашние задания на самом сайте mlcourse.ai


intro-to-machine-learning - https://www.udacity.com/course/intro-...


Учебные соревнования на kaggle:

https://www.kaggle.com/c/titanic

https://www.kaggle.com/c/house-prices...


4-5 месяц

Deep learning

https://dlcourse.ai/

https://www.udacity.com/course/deep-l...


6 месяц.

Набиваем руку на kaggle:

https://www.kaggle.com/c/digit-recogn...

https://www.kaggle.com/tongpython/cat...

https://www.kaggle.com/c/aptos2019-bl...


SQL

https://stepik.org/course/63054/promo

https://stepik.org/course/70710/promo

https://www.sql-ex.ru/


Сайт с шаблонами для резюме:

https://www.overleaf.com/latex/templa..

Показать полностью
120

Чем занимается искусственный интеллект

Сегодня отовсюду слышно термины «Машинное обучение» и «Искусственный интеллект». Но что это такое? Человекоподобный робот, который уже скоро отберёт вашу работу, котика и семью? Я бы хотел приоткрыть завесу магии и показать, что ИИ сегодня — вовсе не что-то страшное и таинственное

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Прежде всего, давайте разберёмся, чем машинное обучение отличается от искусственного интеллекта?

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

На самом деле, ИИ — скорее маркетинговый термин. Поэтому существует шутка о том, что если вы пишете код на Питоне, то это машинное обучение. А если презентуете что-то людям, то, конечно, это искусственный интеллект

Что может на самом деле

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Постоянно появляются новости о том, что ИИ научился генерировать лица людей, рисовать пейзажи или играть в приставку лучше, чем люди. Из-за этого и создаётся впечатление, что крутые роботы скоро займут наши рабочие места. Но это в какой-то мере ошибка выжившего: все громкие новости — уникальные проекты. Большая же часть «разработчиков искусственного интеллекта» решают куда более приземлённые задачи. Например:


Оптимизация поисковой выдачи


Когда вы набираете какую-нибудь фразу в поисковике, именно алгоритмы машинного обучения подсказывают вам её продолжение. А другие решают в каком порядке выдавать вам сайты, лучше подходящие под ваш запрос. Всё для того, чтобы вы воскликнули "Именно то, что мне нужно!"

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

А также рекомендаций и рекламы

Похожие алгоритмы пытаются предсказать вам видео, которое вы с большей вероятностью посмотрите и рекламу, на которую вам захочется кликнуть. Была даже грустная шутка о том, что лучшие умы человечества сегодня заняты тем, что думают, как заставить человека кликнуть на баннер

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Кредитный скоринг

Когда вы хотите взять кредит, банк должен быть уверен, что вы его выплатите. Вы заполняете анкету и на основе предыдущих случаев выплаты/невыплаты кредита людей с похожими на вас данными, банк выставляет вам определённый «балл», который повлияет на решение. У меня шансы почему-то не очень высокие :)

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Наука и медицина

Здесь применение машинного обучения и вовсе безгранично! Вот, например, результат работы нейронной сети, предсказывающей очаги рассеянного склероза по снимкам МРТ

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Подробнее!

Мы посмотрели на несколько частных примеров, теперь давайте обсудим, какие вообще существуют области машинного обучения. Обычно, их выделяют 3:


1. Обучение с учителем

2. Обучение без учителя

3. Обучение с подкреплением

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Поговорим подробнее про задачи, решаемые в каждой из них


Обучение с учителем

Допустим, у вас есть какие-то данные. Это может быть таблица, которую можно посмотреть в Excel, картинки или, например, звуковые записи. Будем называть одну единицу данных объектом: это строка из таблицы с признаками какого-то одного человека (или чего-то другого), одна картинка или один аудиофайл


Если мы точно знаем какое-то свойство объекта, то можем попытаться его предсказать! Например, в таблице с данными пациентов в одном из столбиков может говориться, выжил человек или нет. Картинки могут быть точно подписаны: на какой пёсель, а где котейка. Вместе со звуком может идти какая-то дополнительная информация: слова на записи или жанр песни. Поэтому обучение и называется «с учителем»

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Классификация

Если мы точно знаем, что объекты делятся на несколько классов, можно попытаться их различать! Пусть компьютер посмотрит на все остальные признаки объекта и попытается понять, чем пёсики отличаются от котиков или что же влияет на выздоровление пациентов

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Регрессия


А что если мы хотим предсказать не какой-то класс, а непрерывное число? Например, у нас есть таблица с данными квартир. Мы знаем сколько у каждой квартиры комнат, какова её площадь, этаж и район. А самое главное, для каждой нам известна цена. Если мы хотим снять квартиру, не переплачивая или продать свою, нам нужно понять, сколько будет стоить квартира с такими параметрами. Это позволит сделать регрессия

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Обучение без учителя

Не всегда мы точно знаем, что хотели бы предсказывать. Иногда просто есть куча данных и хочется найти в них что-то интересное. Тогда можно просто загрузить данные в алгоритм в надежде, что он что-то обнаружит

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Если вы никогда не видели такой картинки, загуглите «Граф друзей ВК». Он покажет сеть ваших друзей. Каждая точка соединена с вами, и если два человека дружат между собой, между ними рисуется связь. На моём графе чётко видно 2 кластера: это люди из разных городов


Часто строятся дендрограммы, показывающие, какие объекты похожи друг на друга больше всего

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Видно, что сначала в 1 группу объединились самые близкие точки: E и F, затем A и B, и так далее. В конце концов остаются два кластера: что довольно легко увидеть на графике слева


Вот как это выглядит с реальными данными об автомобилях. Если вы разбираетесь в машинах, можете предположить, по какому принципу они считались похожими

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Можно завернуть дендрограмму в круг. Вы, наверняка, видели подобные филогенетические деревья. Это очень часто используется в генетике

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Обучение с подкреплением

Если у вас есть не набор данных, а какая-то динамичная среда, вы можете поместить в неё модель машинного обучения! Например, заставить её играть в Змейку. Вы говорите «Ты можешь ходить вверх, вниз, вправо и влево и видеть экран». Дальше вы поощряете модель за увеличение длины тела и штрафуете за проигрыш. Таким образом система старается повысить желаемый результат и учится! Всё, как в биологии

Есть даже генетические алгоритмы, в которых создаётся много случайных моделей. Те, кто достиг лучшего результата, остаются в живых и дают потомство, остальные удаляются. Дарвин хлопал бы в ладоши

Считалось, что компьютеру никогда не одолеть такую сложную игру, как Го, но в 2015 году это всё же произошло. Команде исследователей за это даже присвоили почётный 9 дан

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Позже алгоритм от этой же компании играл в Доту 2 против человека, а в 2018 году сыграл командой. Здесь успех уже не был так ошеломляющ, но это всё же колоссальный прорыв

Как это работает?

Мы познакомились с задачами и областями ИИ. Но как это всё устроено внутри всё ещё напоминает магию. Я бы хотел разрушить это ощущение, поэтому давайте сами изобретём один из распространённых алгоритмов


Предположим, у нас есть набор данных пациентов. Для каждого человека мы знаем давление и есть ли у него диагноз «Гипертония». Можно отобразить это на графике вот так:

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Каждая точка — пациент. График читается, смотря на координаты точки по каждой из осей. Например, давление у человека, которому соответствует самая левая точка — примерно 135/60


Теперь представим, что к нам поступили данные о давлении нового пациента и мы не знаем диагноз. Нужно сказать, всё ли в порядке или лучше пройти осмотр. Как это сделать?

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Для нас очевидно, что давление высоковато. Но представьте, что пациентов поступает сразу 10000. Неохота смотреть на каждого из них, верно? Давайте попытаемся понять, как мы отнесли эту точку к классу гипертоников

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Очевидно, она просто ближе к ним! Мы смотрим на ближайших соседей точки и говорим «Раз ты рядом с ними, наверное, ты к ним и относишься»

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Поздравляю, мы только что изобрели метод k ближайших соседей! k потому что мы можем смотреть на 1, 2 или другое число близких точек


Конечно, такую задачу человек решит легко, зачем же здесь учить чему-то машины? Но в этом примере было всего 2 признака: систолическое и диастолическое давление. Их легко изобразить на плоскости. Если бы их было 3, то можно было бы попытаться нарисовать 3-мерное пространство. А если 4? А если 400? :)


Для компьютера посчитать расстояние до каждой точки было бы решаемой задачей, для человека — невыполнимой. Поэтому, главное понять идею алгоритма, остальное сделает машина

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Известный физик Ричард Фейнман когда-то шутил: «Математики — странные ребята. Ты просишь у них какую-то формулу, они говорят:

— О, у нас есть чудесная формула для N размерностей!

— Зачем мне N, я же живу в трёхмерном мире?!

— Так просто подставь N=3»


Оказывается, такая абстрактная математика бывает полезна

Надеюсь, я немного развеял у вас ощущение того, что искусственный интеллект — это что-то таинственное и непонятное. Это просто более крутой анализ данных, статистика на стероидах

Чем занимается искусственный интеллект Искусственный интеллект, Машинное обучение, Лонгриды, Наука, Математика, Анализ данных, Статистика, Человек наук, Видео, Длиннопост

Сегодня ИИ решает довольно узкие задачи и ещё не скоро заменит человека во всех сферах жизни


Моя группа ВК и телеграм

Показать полностью 20 1
81

Дорога в Data Science глазами новичка

Что такое Data Science?

В 21 веке информация повсюду. Вы буквально не можете жить, не оставляя вокруг себя информационный след. Зашли вы утром в ВК поставить пару лаек или купили в магазине пармезан, информация об этом сохранилась в огромных базах данных. А вдруг эта информация может быть полезна? Может быть, покупая один продукт, люди часто покупают и другой — тогда имеет смысл поставить эти полки рядом (или наоборот — в разных концах магазина). А может быть, скрытые закономерности есть в научных данных? Какие существуют наиболее эффективные алгоритмы их обработки? Можно ли, анализируя данные с фотографий или видео, научить компьютер узнавать на них объекты? Этим и многим другим может заниматься data scientist

Дорога в Data Science глазами новичка Data Science, Программирование, Машинное обучение, Искусственный интеллект, Нейронные сети, IT, Человек наук, Длиннопост

Почему появился этот пост

Мне довелось пройти Летнюю школу по анализу данных от ТГУ (Томск). На ней я надеялся получить структурированные знания с нуля о том, что такое анализ данных и машинное обучение, базовые знания для них. Коротко говоря, оказалось, что эта школа не совсем для новичков (как бы это ни позиционировалось в рекламе). Вот, что записано в моём блокноте на самой первой лекции:

Для первого дня сложно
Плюх в океан знаний
Я утонул

К концу школы структурированных знаний я так и не получил. Спикеры были очень разные и говорили на совсем разные темы. Зато какие были спикеры! Лекции нам читали (а некоторые и вели практику) люди из Яндекс, Сколтеха, IBM и томской IT-компании Rubius. Пусть я так и не узнал базовых вещей, а блокнот исписан терминами на погуглить. Зато, я увидел отличные примеры того, как можно применять анализ данных в самых разных областях: науке, индустрии и бизнесе. Базовые знания можно получить и самостоятельно, но понять, как можно их применять получается не всегда (отсюда работники Макдоналдс с красным дипломом). Школа явно показала пробелы в знаниях, которые необходимо заполнить

Об этом и данный пост. Здесь вы найдёте пошаговый план, как его видит человек, стоящий в начале этого пути. К каждой теме, которую следует изучить, будет прилагаться ссылка на курс. План рассчитан на людей без базы. Под базой я понимаю знание высшей математики и наличие навыков программирования. Для людей, обладающих этим, могу порекомендовать эту статью и специализацию по машинному обучению на Coursera. А также, буду благодарен за совет новичку. Итак, начнём!

Дорога в Data Science глазами новичка Data Science, Программирование, Машинное обучение, Искусственный интеллект, Нейронные сети, IT, Человек наук, Длиннопост

0. Математический анализ

Если у вас нет высшего образования, пройти этот курс нужно обязательно. За алгоритмами машинного обучения и нейронных сетей скрывается в первую очередь математика. Если вам непонятны такие слова, как определитель матрицы или частная производная, начать следует именно отсюда. Если вы понимаете эти термины (или хотя бы знаете, где про них прочитать, чтобы вспомнить), этот пункт можно пропустить

Дорога в Data Science глазами новичка Data Science, Программирование, Машинное обучение, Искусственный интеллект, Нейронные сети, IT, Человек наук, Длиннопост

1. Математическая статистика

В анализе данных без этой дисциплины никуда. Вот список курсов, которые обеспечат вам уверенное знание предмета:

•Курс «Основы статистики» на Stepik — отлично подойдёт для начала. Есть также продолжения курса, будет полезно пройти и их

•Курс «Математическая статистика» на Stepik — поможет закрепить полученные знания с помощью достаточного количества практики

•Курс «Статистические методы в гуманитарных исследованиях» на Coursera — пусть вас не отталкивает название, курс подойдёт для всех. Преподаватель потрясающий, так что будет понятно даже гуманитариям. Главное преимущество этого курса — параллельно идёт обучение работе в программах STATISTICA и R

Дорога в Data Science глазами новичка Data Science, Программирование, Машинное обучение, Искусственный интеллект, Нейронные сети, IT, Человек наук, Длиннопост

2. Дискретная математика

Знание этого предмета не является обязательным, пункт можно пропустить. Но всё же, вы часто будете встречать некоторые термины как, например, графы. Для уверенного обращения с ними рекомендуется изучить эту тему. Тем же, кого интересует научная сторона Data science и разработка алгоритмов — этот пункт строго обязателен

•Курс «Основы дискретной математики» на Stepik

•Курс «Основы теории графов» на Stepik

•Курс «Дискретные структуры» на Stepik

3. Программирование на Python

Python и R будут вашими основными инструментами для работы. С R вы познакомитесь в курсе статистики, здесь же изучите второй язык

•Курс «Основы программирования на Python», Coursera

•Курс «Python: основы и применение», Stepik

4. Машинное обучение

Время переходить непосредственно к той области, которой хотите заниматься! В этом поможет классический курс от Andrew Ng (Стэнфордский университет) на Coursera. Курс на английском. Если вы его не знаете, можно поискать переводы курса, но рекомендуется начать изучать и язык

5. Получение опыта на Kaggle

Платформа для соревнований по машинному обучению поставит перед вами реальные задачи, а также позволит посмотреть на решения опытных людей. Лучшее место для начала применения своих знаний!

6. Дальнейшее обучение, собеседования

Полистайте список вакансий, подумайте, чего ещё вам не хватает и торопитесь получить работу мечты!

Дорога в Data Science глазами новичка Data Science, Программирование, Машинное обучение, Искусственный интеллект, Нейронные сети, IT, Человек наук, Длиннопост

Больше постов про учёбу, IT и науку — в моём паблике ВК. Там же есть эта статья в более текстовом виде. Буду благодарен за советы и желаю всем удачи!

Показать полностью 4
Похожие посты закончились. Возможно, вас заинтересуют другие посты по тегам: