4

Вебинары трека Наука о данных Летней цифровой школы Сбера

Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.

1) Process Mining

Process Mining — это анализ процессов на основе цифровых следов. Объем российского рынка Process Mining на 2024 г. составил 0,9 млрд руб. и будет расти со среднегодовым темпом 69%.

Youtube: https://www.youtube.com/watch?v=gScXVnhE34M
Rutube: https://rutube.ru/video/f119e2a5e125d24c269cf154b025924d/
VK Видео: https://vk.com/video-214877772_456239067

Презентацию можно скачать здесь: https://t.me/rcppe/77?comment=93

2) Модельный риск в машинном обучении

Что сегодня обсудим?
1. Глобальная роль ИИ
2. Какова цена ошибки в модельном мире?
3. Расскажем об управлении модельным риском

Youtube: https://youtu.be/z1vJw86Cteo
Rutube: https://rutube.ru/video/b3b4dad12c0f9d6e69dbcba427b35952/
VK Видео: https://vkvideo.ru/video-214877772_456239066

Презентацию можно скачать здесь: https://t.me/rcppe/78?comment=94

3) AutoML и перспективные методы ИИ

Фреймворк LightAutoML (Lama) – автоматическое машинное обучение. Сбер, Центр Практического Искусственного Интеллекта (ЦПИИ)*
* ранее Лаборатория Искусственного Интеллекта

Youtube: https://youtu.be/xhl4crD3x8g
Rutube: https://rutube.ru/video/5ba5d1a7ed4a0a6bbc656e607263e354/
VK Видео: https://vkvideo.ru/video-214877772_456239067

Презентацию можно скачать здесь: https://t.me/rcppe/79?comment=96

4) Прогнозирование временных рядов

Машинное обучение для Time Series Forecasting. Временной ряд – последовательность некоторых значений по времени. Если рассматриваются одновременно несколько одиночных временных рядов, то такая структура называется многомерный временной ряд. Регулярный временной ряд – временной ряд с равномерными временными интервалами между точками. Имея историю L, делаем прогноз на горизонт H.

Youtube: https://youtu.be/inTVRC7y8AE 
Rutube: https://rutube.ru/video/35d4d2275c548512f70dde6e2d242f46/
VK Видео: https://vkvideo.ru/video-214877772_456239068

Презентацию можно скачать здесь: https://t.me/rcppe/80?comment=98

4.1) Материалы по прогнозированию на несколько точек вперед:

Taieb, S. B., Bontempi, G., Atiya, A. F., & Sorjamaa, A. (2012). A review and comparison of strategies for multi-step ahead time series forecasting based on the NN5 forecasting competition. Expert systems with applications, 39(8), 7067-7083. – Классическая статья с описанием стратегий (MIMO, recursive, direct, recursive-direct, direct-mimo) и их сравнением на датасете NN5.

Taieb, S. B., & Hyndman, R. J. (2012). Recursive and direct multi-step forecasting: the best of both worlds (Vol. 19). Department of Econometrics and Business Statistics, Monash Univ.. – Статья, в которой авторы представляют rectify-стратегию.

Taieb, S. B. (2014). Machine learning strategies for multi-step-ahead time series forecasting. Universit Libre de Bruxelles, Belgium, 75-86. – Теоретический анализ про bias-variance tradeoff между прямой и рекурсивной стратегиями.

Bao, Y., Xiong, T., & Hu, Z. (2014). Multi-step-ahead time series prediction using multiple-output support vector regression. Neurocomputing, 129, 482-493. – Сравнение различных стратегий (MIMO, recursive, direct) на support vector regression.

An, N. H., & Anh, D. T. (2015, November). Comparison of strategies for multi-step-ahead prediction of time series using neural network. In 2015 International Conference on Advanced Computing and Applications (ACOMP) (pp. 142-149). IEEE. – Сравнение различных стратегий на FFN, но это старая статья, без трансформеров.

Ferreira, L. B., & da Cunha, F. F. (2020). Multi-step ahead forecasting of daily reference evapotranspiration using deep learning. Computers and electronics in agriculture, 178, 105728. – Сравнение LSTM, CNN, CNN-LSTM, FFN и случайного леса с рекурсивной, прямой и MIMO стратегиями

4.2) Стратегии прогнозирования нескольких рядов:

Hertel, M., Beichter, M., Heidrich, B., Neumann, O., Schäfer, B., Mikut, R., & Hagenmeyer, V. (2023). Transformer training strategies for forecasting multiple load time series. Energy Informatics, 6(Suppl 1), 20. – Сравнение local-, global-. multivariate-modelling подходов на примере трансформерных SOTA-архитектур в узком домене.

5) Рекомендательные системы

Рекомендательные модели ML. Что сегодня обсудим?
1. Зачем компании строят рекомендательные системы?
2. Базовые алгоритмы рекомендательных систем
3. Простой baseline без ML
4. Baseline с ML
5. Трансформеры и LLM в рекомендатльных системах

Youtube: https://youtu.be/RLbwjG_Ojaw
Rutube: https://rutube.ru/video/b0d3826924576f308fdb63a26f213f48/
VK Видео: https://vkvideo.ru/video-214877772_456239071

Презентацию можно скачать здесь: https://t.me/rcppe/81?comment=103

6) AI решения: сокращаем путь от идеи до воплощения

DreamML – Фабрика моделей, Low-Code разработка. Модель машинного обучения в три клика. AI-модели в три клика по методологии Сбера.
DreamEA – Сервис пилотирования моделей ML. Запусти бизнес-пилот AI решения сегодня.
DreamDE – Автоматизация П1518. Модель машинного обучения в ПРОМ за 3 дня.

Youtube: https://youtu.be/FeNfXEl6RBE
Rutube: https://rutube.ru/video/af55115d5788f97c579e8fda70d0b2b7/
VK Видео: https://vkvideo.ru/video-214877772_456239072

Презентацию можно скачать здесь: https://t.me/rcppe/82?comment=107

Список всех вебинаров интенсива трека Наука о данных Летней школы Сбера

Вебинары трека Наука о данных Летней цифровой школы Сбера Машинное обучение, Искусственный интеллект, Анализ данных, Data Science, Нейронные сети, Bigdata, Вебинар, Видео, YouTube, Длиннопост

Пишите в комментариях, какие вебинары выложить ещё.

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан