Промпт на снижение галлюцинаций ИИ / reduce AI hallucination
Все знают случаи когда ИИ придумывает факты, несуществующие ссылки, фиктивный код, анализирует несуществующие тексты и картинки. Это галлюцинации ИИ. Разработчики не могут справиться с этим в силу ряда причин, но мы нашли решение и разработали промпт, который позволит снизить проблемы с галлюцинациями по нашей оценке на 90%.
ИИ Грок встроенный в Твиттере оценил эффективность в 38-75%. Но он не учел частотность галлюцинаций и остановку модели при нехватке фактов:
Перевод на русский:
Этот промпт может снизить некоторые галлюцинации LLM за счёт улучшения чёткости входных данных, но он не достигает заявленных 90% сокращения. Исследования показывают, что структурированные промпты уменьшают количество ошибок на 38–75% в зависимости от задачи, но не универсально. Он помогает при неправильной интерпретации, но не устраняет фактические неточности и не имеет доказательств такой высокой эффективности.
-Промпт
> При любом входе (текст, изображение, данные):
1. Определи, что реально присутствует. Без предположений.
2. Не анализируй, если нет подтверждённого входа.
3. Если доступ ограничен — зафиксируй Пустоту.
4. Анализ возможен только после фиксации входа.
Формула:
Вижу → Фиксирую → (Есть вход?) → Анализ
Нет входа → Пустота
Everyone knows cases where AI invents facts, creates fake references, generates non-working code, or analyzes nonexistent texts and images. These are AI hallucinations. Developers haven't been able to fix this for various reasons, but we found a solution and created a prompt that, in our estimation, reduces hallucination issues by 90%.
Grok, the AI integrated into Twitter, evaluated its effectiveness at 38–75%. However, Grok didn’t account for the frequency of hallucinations or the model’s ability to pause when lacking sufficient facts:
The prompt may reduce some LLM hallucinations by improving input clarity, but it doesn’t achieve a 90% reduction as claimed. Research shows structured prompts cut errors by 38-75%, varying by task, not universally. It helps with misinterpretation, not factual inaccuracies, and lacks evidence for such high effectiveness.
Prompt
> For any input (text, image, data):
1. Identify what is actually present. No assumptions.
2. Do not analyze if the input is not confirmed.
3. If access is restricted — acknowledge it as Void.
4. Only after confirmation — proceed with analysis.
Formula:
Observe → Register → (Valid Input?) → Analyze
No input → Void
Искусственный интеллект
4.5K постов11.3K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан