DeepSeek — это новая большая языковая модель, то есть нейросеть, которая генерирует текст по запросу пользователя. Это может быть код, первичная медицинская консультация и даже что-то похожее на разговор по душам. Словом, практически что угодно. ChatGPT от OpenAI, Gemini от Google — самые известные представители таких моделей.
Актуальная модель DeepSeek R1 доступна бесплатно в виде приложения на iPhone и Android. На момент написания поста 30 января приложение ещё не удалили из магазинов, хотя разговоры об этом уже идут. О том, почему, — ниже.
Скачав приложение, в нём нужно зарегистрироваться. Многие сталкиваются с трудностями при логине через почту — приложение не всегда отправляет код для авторизации. При входе через Google или Apple ID проблем быть не должно, если в этот момент серверы DeepSeek не перегружены. Такое тоже периодически случается. Виной тому ажиотажный спрос на чат-бота или хакерские атаки — пока до конца не ясно.
После регистрации приложение покажет вам экран чата. С этого момента ботом можно пользоваться, как вам заблагорассудится. Спросите его о чём угодно, и получите ответ.
У DeepSeek пока нет функции предустановленных инструкций для каждого конкретного чата. Так, например, в ChatGPT 4o можно до начала общения загрузить инструкцию, в рамках которой модель будет строить свои ответы. Инструкции принимаются в виде текста и файлов. Например, можно попросить бота отвечать как профессора медицины или эксперта по фондовым рынкам. DeepSeek можно настроить похожим образом, но только в рамках самого чата, то есть, отправив инструкцию непосредственно в чат. Модель обещает, что учтёт заданный контекст в рамках чата. Вот как она сама это объясняет:
Зато у DeepSeek есть функция, которой нет у более дорогих западных моделей — DeepThink. Если активировать её, бот перед выдачей ответа будет показывать процесс своих «рассуждений». Выглядит это одновременно впечатляюще и немного жутко. Пока не вполне ясно, как это использовать. Разве что можно лучше понять «мышление» модели и корректировать запросы в соответствии с этим. В остальном пока кажется забавной игрушкой, но не более.
Откуда это взялось?
DeepSeek появилась в инфополе довольно внезапно. Большие языковые модели очень дороги в разработке — для их обучения требуются внушительные вычислительные мощности и десятки тысяч часов работы высокооплачиваемых специалистов. Обычно их создают и обучают технологические гиганты или стартапы, сумевшие получить солидные инвестиции. Например, OpenAI потратила больше 100 млн долларов на обучение GPT 4, а The New York Times утверждает, что ведущие технологические компании используют для обучения своих моделей суперкомпьютеры с 16 тысячами чипов и более.
С DeepSeek всё произошло по-другому. Мобильное приложение модели появилось в начале января 2025 как будто из ниоткуда. К 29 января DeepSeek уже захватила глобальные AppStore и Google Play — первое место в топах бесплатных приложений на обеих площадках. По заявлению Ляня Вэньфеня, основателя DeepSeek, на обучение актуальной модели R1 потребовалось всего 2 месяца, 5,6 млн долларов и 2 тысячи AI-чипов Nvidia.
Почему это во всех новостях?
DeepSeek за последнюю неделю наделала много шума. Например, за понедельник 27 января Nvidia, главный производитель чипов для обучения ИИ-моделей, грохнулась с первого на третье место в списке самых дорогих компаний мира: потеряли почти 18% стоимости. Это, на минуточку, примерно 600 миллиардов долларов — самое большое падение в истории американского фондового рынка. Другие техногиганты тоже потеряли в капитализации, но не так драматично.
Это понятно — никому не известный стартап выпускает бесплатный продукт, который почти ничем не уступает признанным лидерам рынка, а затем заявляет, что его разработка стоила сущие копейки. Как тут не вспомнить классику.
Естественно, теперь все задаются вопросом, как же им это удалось? Одни считают появление DeepSeek холодным душем для забронзовевших OpenAI, Meta* и Google, другие подозревают китайский стартап в нечестной игре.
Возможно, в обучении модели были незаконно использованы наработки других компаний, и именно так удалось сэкономить на чипах и сократить время обучения. Косвенно на это намекает тот факт, что предыдущая модель компании V3 иногда называла себя ChatGPT, а я поймал аналогичную ошибку с YandexGPT уже в версии R1.
Что будет дальше?
DeepSeek определённо привлекла внимание мировых лидеров ИИ-отрасли. OpenAI и Microsoft уже запустили собственное расследование, а Wiz, стартап в области кибербезопасности, обнаружил базу данных DeepSeek в открытом доступе. Среди прочего, в базе оказались и истории чатов пользователей. В Италии приложение уже заблокировали из-за опасений о безопасности персональных данных.
Сама компания не скрывает, что действительно собирает данные пользователей и хранит их в Китае, хотя утверждает, что они надёжно защищены.
Интересно также, как феномен DeepSeek повлияет на перспективы циклопического ИИ-проекта Stargate, в который Дональд Трамп пообещал инвестировать 500 миллиардов долларов.
Очевидно одно — если DeepSeek и не станет новым мировым ИИ-флагманом, китайская нейросеть основательно встряхнула всю сферу искусственного интеллекта.
*запрещённая организация на территории Российской Федерации.