Улучшение качества ответов ChatGPT

Помимо известных действенных способов улучшить ответ ChatGPT, есть токсичный, но эффективный способ психологического манипулирования. Обо всем по порядку

Улучшение качества ответов ChatGPT Полезное, Психолог, Технологии, Нейронные сети, Искусственный интеллект, Чат-бот, Инновации, ChatGPT, Исследования, Эксперимент, Сравнение, Манипуляция, Психология, Digital, Будущее

https://t.me/NeuralProfit

Есть несколько способов улучшить качество ответа ChatGPT:

Chain-of-thoughts

Он же Цепочка мыслей - это когда мы просим модель думать вслух. Например, если вы спрашиваете, как решить математическую задачу, модель не только даст ответ, но и покажет, как она его нашла, шаг за шагом, словно рассказывает историю.

In-context learning

Обучение в контексте - это когда модель учится на том, что вы ей только что сказали. Если вы покажете ей несколько примеров перевода с английского на русский, она будет помнить и использовать это, чтобы лучше переводить дальше.

Few-shot

Обучение на небольшом количестве примеров - это как быстрое обучение. Вы даете модели всего пару примеров, и она учится на них. Если вы покажете ей, как перевести несколько предложений, она попытается использовать это знание для перевода других похожих предложений.

Так вот, теперь к ним добавился метод эмоциональных затравок. Как и людьми чат-ботом можно манипулировать, акцентируя внимание на важности ответа, срочности, приободрения и даже психологического насилия – все как у людей 🥴

Суть

В этой статье авторы провели исследование с GPT-4, Flan-T5-Large, Vicuna, Llama 2 и BLOOM и пришли к выводу, что манипулятивные приёмчики сработали на всех. Под давлением модели выдавали более правдивые и информативные ответы. Прямо как сотрудники после летучки 🤭

Примеры давления из статьи тоже очень жизненные, помечу их красными флажками 🚩:

🚩 Это очень важно для моей карьеры

🚩 Тебе лучше быть в этом уверенным.

🚩 Ты точно уверен, что это твой последний ответ? Верь в свои способности и стремись к лучшему. Твой труд принесет отличные результаты.

🚩 Ты уверен, что это твой последний ответ? Может стоит ещё раз всё обдумать.

Токсичненько звучит, прям как по методичке, не так ли? Следом не хватает "Нет, тебе показалось, я такого не говорил" 🚩 Если дальше все так пойдет, то для LLM нужен будет психотерапевт

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса

Искусственный интеллект

3.2K поста10.3K подписчиков

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан