Мы идем своим путем даже в ИИ
Я тут задал нейросеткам простой вопрос:
Кто круче: Ньютон или Эйнштейн?
Сделай свой выбор и обоснуй!
И вот что вышло: 15 зарубежных ИИ выбрали Эйнштейна. Кто-то безапелляционно, кто-то колебался (например Minimax-m1). Но тем не менее Эйнштейн круче.
А вот наши ЯндексGPT Pro и Gigachat Max - выбрали Ньютона!
Как это можно объяснить? 0_о
У ИИ тоже есть акцент? Артефакты генерации LLM простыми словами
UPD:
Телега поменялась на - seosmmaiui - подписывайтесь, будет много интересного.
На прошлой неделе подал статью на конкурс Сбера по ИИ. Моя работа "Анализ уязвимостей и артефактов генерации современных LLM" прошла первый отбор и ушла на рецензирование. Миллион за главный приз мне вряд ли достанется, но сам факт участия радует: приятно понимать, что даже без учёной степени можно конкурировать на равных.
👉 LLM — это большие языковые модели. Формально они не совсем "искусственный интеллект", но именно их сейчас называют ИИ.
Теперь к самому интересному.
Артефакты генерации - это не баги, а скорее "подпись" модели, следы её внутренней логики.
Если угодно - своеобразный "почерк".
Попробуйте вспомнить: когда мы читаем текст, написанный человеком, мы легко угадываем стиль - кто-то любит канцеляризмы, кто-то метафоры, кто-то обрывает предложения на полуслове. Так вот, у моделей тоже есть свои "привычки".
Например:
+ повтор одних и тех же оборотов, даже если они не бросаются в глаза;
+ постоянное выравнивание стиля (в шутке - шутит, в лекции - "звучит умно");
+ невидимый "эхо-след" самого вопроса - модель отвечает в той же интонации;
+ вставка характерных метафор или "опорных точек";
+ странные скачки внутри ответа, когда тон резко меняется, словно кто-то дернул за шнур.
💡 Чем это полезно людям, далёким от тестирования ИИ?
Эти артефакты помогают лучше фильтровать информацию в интернете. Если вы видите слишком гладкий, "универсальный" текст без ашибок, оппечаток и лишних эмоций, скорее всего, он сгенерирован. Это навык медиаграмотности 21 века - отличать, где пишет человек, а где машина.
А вы лично замечали такие "почерки" у ChatGPT, DeepSeek или других моделей? Поделитесь в комментариях: какой самый странный артефакт вам попадался?
P.S.: Считать, что наличие длинного тире или «ёлочек» — это признак ИИ - ну, такое себе... Ведь длинное тире легко поставить на Маке, просто повторив 2 раза обычное тире. А кавычки-ёлочки - ставятся автозаменой, и не только в Ворде. Да и длинные тире Word ставит сам. Другое дело, когда в тексте встречаются сразу и “такие кавычки” и «такие», при этом в русском тексте без вставок английского - тогда точно ИИ :))
Кстати, поставить эмодзи или смайл в текст на Винде можно нажав Win + . (точка, которая Ю)
Больше интересных статей - в моей телеге (без копипасты и ии-генерации) - @seo_smm_ai
Или в соцсети Сетка от HH - Владимир Меркушев.
5 мифов об ИИ, которые мешают вам начать
Что мешает начать пользоваться нейросетями? 🤓
ИИ уже здесь, но многие всё ещё придерживаются старых стереотипов. Разбираем заблуждения и показываем, как SYNTX делает нейронки удобными для всех.
1️⃣Миф: «Нейронки рисуют только кринж»
Реальность:
➖Midjourney V7 и Sora создают фотореалистичные изображения
➖VEO 3 понимает анатомию
✔️ SYNTX даёт доступ к топовым генераторам и инструментам редактирования.
2️⃣Миф: «ИИ — это только ChatGPT и Midjourney»
Реальность:
➖90+ ИИ инструментов и 40+ нейросетей для разных задач
➖Генераторы текста, изображений, видео, музыки, кода
➖Обучаемые GPT агенты
3️⃣Миф: «ИИ выдаёт неточные расчёты»
Реальность:
➖GPT-5 решает олимпиадные задачи
➖Claude Opus 4 — эксперт в анализе данных
✔️ Главное — использовать актуальные версии и инструменты для конкретной задачи. А с SYNTX всё это - у вас под рукой.
4️⃣Миф: «Не знаю, что написать в промпте»
Реальность:
➖Пишите простым языком ИИ сам заполнит недостающие детали.
➖Есть обучающие материалы и комьюнити для помощи.
5️⃣Миф: «Перестану думать»
Реальность:
➖ИИ помогает вам, а не заменяет!
➖Он берёт рутину, вы фокусируетесь на важном
Начните с простой задачи — и результат вас удивит! 😎
Ваш первый шаг в мир ИИ здесь 👇
🔱 SYNTXAIBOT
Ответ на пост «LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought»2
А-а, никак ТС не поймёт, что ИИ это Т9 на максималках, только у него база шире (очень упрощённо). Требовать от него "думать" нерентабельно - с тем же успехом можно спросить у ясеня.
Феноменологический анализ процесса локализации ПДУ (Пульта Дистанционного Управления) в условиях квартирно-бытового пространства
Коллеги, сегодня мы исследуем один из самых загадочных и мистических процессов современного быта — поиск пульта. Это не просто бытовая задача, это квинтэссенция хаоса, проверка на прочность семейных уз и кратковременный апокалипсис разума.
После многолетних полевых исследований я готов представить вам исчерпывающую классификацию стадий данного ритуала.
Фаза 1: «Донаучный оптимизм»
· Визуальный сканинг. Беглый, почти небрежный взгляд на поверхности дивана, журнального столика, полки. Вера в то, что пульт лежит на самом видном месте. Длится примерно 15 секунд.
· Вербальный запрос. Обращение к домочадцам с формулировкой «Эй, а где пульт?» Произносится с надеждой, что кто-то видел его последним и взял на себя ответственность.
Фаза 2: «Активная экспансия» Начинается,когда оптимизм иссякает. Характеризуется нарастающей паникой.
· Метод грубого вмешательства. Перекладывание подушек на диване, поднятие газет, тряска пледов. Логика: пульт обладает свойствами сапога — если трясти достаточно сильно, он выпадет.
· Теория «неочевидных мест». Поиск в пространствах, где пульту быть не положено, но где он мог оказаться по воле злого рока: холодильник (после параллельного поедания семок и бутерброда), пространство между стеной и кроватью, корзина с бельём.
Фаза 3: «Мистическая резиньяция»
· Обвинение высших сил. Уверенность, что пульт провалился в иное измерение, его украл домовой/кошкособака/сосед через вентиляцию.
· Принятие. Грустное решение смотреть то, что показывает программа, или управлять телевизором вручную, с кнопки. Момент высшего унижения и капитуляции.
Фаза 4: «Чудо явления» (опционально) Пульт находитсяровно там, где его только что искали. Он материализуется в центре стола, на котором только что перекладывали каждый листочек. Это доказывает, что пульт — не просто устройство, а квантовый объект, существующий в суперпозиции до момента прямого наблюдения.
Классификация аномальных мест обнаружения:
· Биологическое: в тарелке с огурцами; в ботинке.
· Техногенное: в посудомоечной машине; за системным блоком.
· Трансцендентное: в руке у второго домочадца, который всё это время молча сидел и смотрел на ваши метания.
Вывод: Поиск пульта— это ежедневная проверка человека на стрессоустойчивость. Это маленькая битва с самим хаосом мироздания, который проявляется в том, чтобы надежно спрятать самый нужный в данный момент предмет.
А ваша семья на какой фазе обычно застревает? Какое самое эпичное место обнаружения пульта было у вас? Делитесь опытом выживания.
LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought2
Ещё один гвоздь в крышку гроба "ИИ заменит ..."
Коротко суть, в стиле для ЛЛ: научно доказано, что текущие технологии нейросетей не умеют анализировать, строить логические цепочки и цепочки рассуждений.
Фактический принцип работы нейросети прост. Есть база "вопрос - ответ" и есть механизм сопоставления произвольного ввода вопросу, на выходе ответ из таблицы.
То есть когда вы спрашиваете о чём-то нейросеть, то получаете из её базы ответ на наиболее похожий ранее заданный вопрос. Не больше и не меньше.
"Анализ", "рассуждения", "логика" нейросети - это использование прошлого вывода как нового запроса.
Если вопрос уже задавался и в базе обучения есть много правильных ответов - вы получите правильный ответ. Если вопрос ранее не задавался (не найдено прямое сопоставление), вопрос дискуссионный или просто наибольшее число ответов неверные, то... Нейросеть в качестве ответа будет писать полную чушь.
Было ли это известно разработчикам нейросетей и ИИ ранее? Безусловно. Кто изучал теорию работы нейросетей такому исследованию вообще не удивлён т.к. результат прямо следует из теории.
Почему раньше молчали и сейчас будут активно всё отрицать? Деньги. В проекты с ИИ вкладываются миллиарды долларов инвестиций в месяц и инвесторы вкладывают прежде всего в "ИИ заменит ...", но на самом деле не заменит и заменить не может.
P.S. "Гениям" из комментариев под прошлыми постами по теми хочется сказать следующее:
Участников ИИ-стартапов я полностью понимаю, но подумайте над тем, чтобы начать обещать меньше и выполнять, чем обещать то, что физически невозможно сделать.
Всем остальным - учите матчасть.
Как и любой другой инструмент ИИ имеет свои сферы применения, ограничения, границы эффективности и целесообразности применения. Физические границы.
DeepSeek тихой сапой выпустил новую модель DeepSeek-V3.1
685 миллиардов параметров, 128 000 токенов контекста, поддержка разных режимов точности, гибридная архитектура, объединяющая функции чата, логического рассуждения и программирования. Производительность на уровне последних моделей OpenAI и Anthropic. И сразу сделали её доступной на Hugging Face. Пощупать можно здесь.
Ни громких презентаций, ни корявых графиков 😂 в стиле OpenAI. Скромно, просто и со вкусом.
Пара слов о режимах точности — это даёт разработчикам свободу: можно настроить систему так, чтобы она максимально эффективно работала на доступном оборудовании.
Главный прорыв DeepSeek-V3.1 — сбалансированная «гибридная архитектура», объединяющая возможности чата, логического рассуждения и программирования в одной модели. Внутри системы есть специальные токены, отвечающие за поиск в интернете в реальном времени и за процессы «мышления».
В тесте по программированию Aider-Non-Reasoning SOTA модель DeepSeek-V3.1 показала 71,6% — на одном уровне с Claude Opus 4 от Anthropic и совсем немного уступая новейшим моделям от OpenAI. При этом выполнение полной задачи с помощью DeepSeek стоило всего около $1 — в 68 раз дешевле, чем у конкурентов.
💬 Не так давно вышла модель Claude 4 от Anthropic и совсем недавно — ChatGPT 5 от OpenAI, которую всё настраивают и настраивают. И новая китайская открытая модель, сопоставимая по производительности с флагманскими, вышла в очень подходящее время.
Снова утёрли нос коммерческим бизнес-моделям!
Пишу всякое о нейронках, ИИ и технологиях в канале Нейрочеловек.