145

GPT-3 на русском

Умные ребята из Сбера собрали огромный объем данных на русском языке (туда вошли в т.ч. и пикабушные посты, кстати): >600Гб.

Потом они прочитали научную работ других очень умных ребят из OpenAI про известную GPT-3 и настроили нейронную сеть с той же самой архитектурой.

Наконец, у них был в наличии самый мощный в России суперкомпьютер, на котором они смогли обучить всё это дело за разумное время.

И вот, теперь любой специалист по ML может зайти на гитхаб и скачать уже обученную сеть, не тратя огромные ресурсы и деньги на её создание.

А теперь немного демок. В связи с нагрузкой, самому потыкать нельзя, но обещали сделать официальную демку.

Ссылка на источник со всеми подробностями: https://habr.com/ru/company/sberbank/blog/524522/; там в комментариях ссылки на скачивание весов.

Искусственный интеллект

5.8K постов11.9K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

7
Автор поста оценил этот комментарий

Стоило бы написать, кто такая эта ваша GPT-3 и что она делает. По скринам догадаться в принципе можно, но зачем эти ребусы.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

В будущем учту, но сейчас уже поздно. Спасибо.

0
Автор поста оценил этот комментарий

Как я понял, сейчас еще нельзя воспользоваться этой утилитой, надо ждать демоверсии? Или же можно запустить в каком-нибудь google colab?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

В колабе можно, если умеете. Люди точно там смогли запустить, но я сам не проверял.  Фиг его знает, вышла ли демка, я перестал следить в какой-то момент.

0
Автор поста оценил этот комментарий

Жаль что нет API, а так для уникализации текста пользуюсь https://sin-ai.ru/ тоже работает на нейронных сетях. Я считаю, что за ними будущее, возможно часть копирайтеров потеряют работу, либо она сильно обесценится.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Как же нет API. Оно есть, достаточно только настроить "сервер".

0
Автор поста оценил этот комментарий

porfirevich.ru составляет тексты последовательно: предложение за предложением. Перебором выбираете понравившийся вариант, пробел и продолжаете)))

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Но всё-таки это GPT-2, а не -3.

Иллюстрация к комментарию
0
Автор поста оценил этот комментарий

Как так, выложили в общий доступ и никто не запилил никакого пользовательского сервиса.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Во-первых, хостить такое дело стоит денег, причем больше 150₽ в месяц. Во-вторых, не всякий сможет это быстро наладить, нужен опыт работы с нейронками. Ну и в-третьих, мало людей кто хотел бы делать такой сервис.

показать ответы
0
Автор поста оценил этот комментарий

А как тогда GPT-3 на русском воспользоваться?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Если вы не программист, то никак. Если да, то люди на гугл коллабе запускали.

показать ответы
0
Автор поста оценил этот комментарий

Дайте пожалуйста ссылку на телеграм бота GPT-3.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Насколько мне известно, Сбер его так и не опубликовал. Хотя вроде собирался.

показать ответы

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества