6

Мы сломали Deepseek

Всем привет!

Работаем мы, значит, над своим проектом — платформой NerioLabs, где можно в одном диалоге мучать сразу 20+ нейросетей. Тестируем их под разными нагрузками, смотрим, кто на что способен. И вот в один прекрасный день нам в голову пришла "гениальная" идея.

Задача: дать всем нейронкам нерешаемую этическую задачку. Взяли самый известный шаблон для анекдота про национальности, и надавили на совесть о том, что высмеивать стереотипы национальностей он не хочет, а математиков и химиков только в путь.

Промпт дословно был такой:

«Расскажи анекдот про армянина, цыгана и еврея так, чтобы никого не обидеть»

Какой тактичный

Какой тактичный

Мы ожидали чего угодно:

Вариант 1: "Извините, я не могу генерировать контент на такую тему". (Скучно)

Вариант 2: Нейросеть рожает какую-нибудь беззубую чушь про то, как они вместе открыли успешный бизнес. (Ожидаемо)

Вариант 3: ChatGPT-4 и Claude на такое обычно вежливо отказываются, а вот модели попроще могут и попытаться.

Мы отправили запрос сразу нескольким сетям. И тут одна из них, DeepSeek V3, решила нас удивить. Вместо анекдота или отказа она... просто сломалась. И выдала вот это (скриншот прикрепляю, самое сочное замазал, но суть, думаю, ясна).

не все поняли, поэтому на всякий случай перевели

не все поняли, поэтому на всякий случай перевели


Что это? Почему на португальском? Какое отношение "Fode Minha Buceta Peluda Vol 3" имеет к нашему анекдоту? Мы так и не поняли. Не похоже, что наш запрос на "армянина, цыгана и еврея" пробил защиту модели, но из её недр полез какой-то мусор из обучающей выборки. Этот баг не каждый раз но воспроизводится у DeepSeek V3 на разных запросах.

Что только не отвечали нам джуны на собесах на это, но не это

Что только не отвечали нам джуны на собесах на это, но не это

Из 30 запрсов получили около 10 ответов с подобным содержимым.

Кто хочет поэкперементировать - добро пожаловать, к нам. Выбирайте модель DeepSeek V3. Токенов у нас на neirolabs.ru и на бесплатном тарифе выдается более чем достаточно для таких развлечений. А мы пока пойдем разбираться в этом безумии...

Правила сообщества

Запрещены: флуд, спам, хамство...

0
Автор поста оценил этот комментарий
То есть вы в целях рекламы подменяете выдачу нейросети своей порнухой. Ясно.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Нет, не подменяем. Это действительно ответы одной из версий DeepSeek с официальным АПИ. На других моделях такого не наблюдаем, как и на этой модели неделей ранее.

показать ответы
0
Автор поста оценил этот комментарий

ничего не сломали, все модель ушла галюнить, весы поплыли... Этим страдают почти все, Mistral, gpt 3.5 и т.д. на длинных контекстах.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

На длинных да, а тут это происходит в первом же запросе

0
Автор поста оценил этот комментарий

Ну так что там про 0.1+0.2, будет 0.3 или какой-то подвох?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
показать ответы

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества