Ландшафт потерь: дизайнер показал, где живут и обучаются нейросети⁠⁠

Инженер и креативный директор Хавьер Идеами запустил проект «Ландшафт потерь», в котором он создает визуализации того математического пространства, где живут и обучаются нейросети. Увидеть это математическое пространство обычно не получается, но именно его особенности определяют работу практически любой современной системы искусственного интеллекта — от программ автоматического перевода до систем распознавания лиц и приложений вроде FaceApp.

Градиентный спуск в ландшафте функции потерь, состоящем из миллиона отдельных точек

Свое название проект получил от математической функции потерь — основного параметра, который направляет работу нейросети при обучении. Функция потерь позволяет рассчитать размер ошибки в прогнозе нейросети в данный момент обучения. Эту величину можно также представить как высоту в математическом ландшафте, другие измерения которого отражают связи между нейронами. Чем ошибка больше, тем выше в математическом ландшафте сейчас находится нейросеть. Задача обучения при этом сводится к поиску низшей точки — то есть к спуску с «горы погрешностей» в «долину правильных ответов».

Этот спуск может происходить разными путями, и не всегда выбранный вариант приводит к истинному глобальному минимуму — иногда обучающаяся нейросеть застревает в некоторой долине просто потому, что случайно туда попала из исходной точки. Исследователи стараются наблюдать за этим процессом и не допускать таких ситуаций, — например, искажая ландшафт потерь за счет изменения гиперпараметров — структуры нейросети, числа связей в ней и других ее особенностей.

Видео на основе обучения той же нейросети (Convnet на датасете Imagenette)

Задача визуализации пространства обучения для современных сложных нейросетей до сих пор была весьма нетривиальной, однако недавно появились работы, которые позволяют его визуализировать до самого обучения или в процессе стресс-теста и контролировать таким образом возможные ошибки в выборе гиперпараметров.

Обучение сети Convnet на датасете Imagenette (подмножестве известного ImageNet) методом градиентного спуска

Морфология и визуализация ландшафта потерь

Здесь можно посмотреть еще видео

Источник

2.5K постов9.8K подписчиков

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан