Промпт на снижение галлюцинаций ИИ / reduce AI hallucination⁠⁠

Все знают случаи когда ИИ придумывает факты, несуществующие ссылки, фиктивный код, анализирует несуществующие тексты и картинки. Это галлюцинации ИИ. Разработчики не могут справиться с этим в силу ряда причин, но мы нашли решение и разработали промпт, который позволит снизить проблемы с галлюцинациями по нашей оценке на 90%.

ИИ Грок встроенный в Твиттере оценил эффективность в 38-75%. Но он не учел частотность галлюцинаций и остановку модели при нехватке фактов:

https://x.com/grok/status/1906724555667763443?t=rJ4I9Rv_HC24...

Перевод на русский:

Этот промпт может снизить некоторые галлюцинации LLM за счёт улучшения чёткости входных данных, но он не достигает заявленных 90% сокращения. Исследования показывают, что структурированные промпты уменьшают количество ошибок на 38–75% в зависимости от задачи, но не универсально. Он помогает при неправильной интерпретации, но не устраняет фактические неточности и не имеет доказательств такой высокой эффективности.

-Промпт

> При любом входе (текст, изображение, данные):

1. Определи, что реально присутствует. Без предположений.

2. Не анализируй, если нет подтверждённого входа.

3. Если доступ ограничен — зафиксируй Пустоту.

4. Анализ возможен только после фиксации входа.

Формула:

Вижу → Фиксирую → (Есть вход?) → Анализ

Нет входа → Пустота

Everyone knows cases where AI invents facts, creates fake references, generates non-working code, or analyzes nonexistent texts and images. These are AI hallucinations. Developers haven't been able to fix this for various reasons, but we found a solution and created a prompt that, in our estimation, reduces hallucination issues by 90%.
Grok, the AI integrated into Twitter, evaluated its effectiveness at 38–75%. However, Grok didn’t account for the frequency of hallucinations or the model’s ability to pause when lacking sufficient facts:

https://x.com/grok/status/1906724555667763443?t=rJ4I9Rv_HC24...

The prompt may reduce some LLM hallucinations by improving input clarity, but it doesn’t achieve a 90% reduction as claimed. Research shows structured prompts cut errors by 38-75%, varying by task, not universally. It helps with misinterpretation, not factual inaccuracies, and lacks evidence for such high effectiveness.

Prompt

> For any input (text, image, data):

1. Identify what is actually present. No assumptions.

2. Do not analyze if the input is not confirmed.

3. If access is restricted — acknowledge it as Void.

4. Only after confirmation — proceed with analysis.

Formula:

Observe → Register → (Valid Input?) → Analyze

No input → Void

4.5K постов11.3K подписчиков

Добавить пост

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан