Ответ на пост «LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought»2
Там целесообразность исходного исследования можно ставить под вопрос, так как они НЕ используют для него лучшие современные модели, которые как раз показывают значительный прирост качества, если им позволить рассуждать перед ответом на вопрос по физике/математике/программированию, где есть фиксированные правильные ответы. Они учат с нуля модельки в 100-1000 раз меньше, и говорят, что вот эти модельки типа плохо обобщают и значительно хуже работают за пределами обучающей выборки, что как бы не новость, при этом это мало говорит о топ-тир моделях. Товарищи китайцы, которые разрабатывали дипсик, в своем отчёте писали, что модель делает в процессе тренировки резкий скачок после того, как начинает употреблять слово Aha (так называемый aha moment). Есть ощущение, что нужно тестировать модели на их рассуждающую способность уже после того, как они этот aha moment прошли.
5 мифов об ИИ, которые мешают вам начать
Что мешает начать пользоваться нейросетями? 🤓
ИИ уже здесь, но многие всё ещё придерживаются старых стереотипов. Разбираем заблуждения и показываем, как SYNTX делает нейронки удобными для всех.
1️⃣Миф: «Нейронки рисуют только кринж»
Реальность:
➖Midjourney V7 и Sora создают фотореалистичные изображения
➖VEO 3 понимает анатомию
✔️ SYNTX даёт доступ к топовым генераторам и инструментам редактирования.
2️⃣Миф: «ИИ — это только ChatGPT и Midjourney»
Реальность:
➖90+ ИИ инструментов и 40+ нейросетей для разных задач
➖Генераторы текста, изображений, видео, музыки, кода
➖Обучаемые GPT агенты
3️⃣Миф: «ИИ выдаёт неточные расчёты»
Реальность:
➖GPT-5 решает олимпиадные задачи
➖Claude Opus 4 — эксперт в анализе данных
✔️ Главное — использовать актуальные версии и инструменты для конкретной задачи. А с SYNTX всё это - у вас под рукой.
4️⃣Миф: «Не знаю, что написать в промпте»
Реальность:
➖Пишите простым языком ИИ сам заполнит недостающие детали.
➖Есть обучающие материалы и комьюнити для помощи.
5️⃣Миф: «Перестану думать»
Реальность:
➖ИИ помогает вам, а не заменяет!
➖Он берёт рутину, вы фокусируетесь на важном
Начните с простой задачи — и результат вас удивит! 😎
Ваш первый шаг в мир ИИ здесь 👇
🔱 SYNTXAIBOT
Сравнение Нейросетей
Решила провести сравнение генераций в разных бесплатных нейросетях. Прописываю одинаковый промт - и генерирую картиночки. Может быть кто-то думает, что выбрать в качестве своего нейроинструмента, так вот тут может я и пригожусь, так как часто приходится работать с этими инструментами. Сравнивать буду Stable Diffusion, GroK4 , Алиса, GigaChat, Gemini 2.5 pro., Qwen
Промт для всех будет такой:
Рыжая девушка, 21 год, улыбается, в белом боди, на фоне космоса.
Итак, поехали :)
Первый на очереди - Qwen. Созданная Конторой Meta Al, модифицирована нашими Китайскими коллегами из Alibaba.
Следование промту отличное. Картинка вроде бы неплохая, но разрешение такое себе. Детализация так же не на самом высоком уровне. Но генерирует очень быстро. Можно через сайт, можно через приложение. Удобно, быстро, бесплатно. Класс
Ниже GigaChat от сбера. Путает стили, промту следует неохотно. Качество посредственное. Но бесплатно и быстро
Ниже Алиса. Бесплатная нейронка от Яндекса. Первое, что бросается в глаза - промту следует не очень. Делает ярко, но однообразненько. Смотрится неплохо. Скорость генерации вообще быстрая
Ниже Gemini. Вес и разрешение картинок высокое. А вот следование промту... Да тоже чёткое. Но генерирует чаще какие-то нестандартные ракурсы. Пытается в креативность - это, наверное, плюсик. Детали вроде бы есть, но посмотрите на пальчики. Да, это больное место у всех. До сих пор. Но нейронка и не позиционирует себя, как генератор картиночек. Это так, приятный доп. Бесплатно, но вроде бы какие-то ограничения присутствуют на количество в сутки. Работает как минимум через сайт.
Ниже GroK4 От Нашего Илона Макса. Делает красиво. Ну сразу же видно. Креативит. Мне нравится. Быстро. Генерирует через свою соцсеть заморскую. Да, где-то деталей маловато, где-то артефактики лишние, но в целом - крутяк.
Ниже Stable Diffusion. Есть доступ через сервисы. Но самый сок, когда эта модель установлена на комп и работает через видяху. Бесплатно. Можно регулировать разрешение, следование промту хорошее. Генерирует быстро. Хорошая штука
В сравнении не учитывалось много условностей. Тут просто одинаковый промт для всех.
Выводы делаем самостоятельно.
Если понравилось - запилю ещё какие-нибудь тесты
Если не понравилось - скорее всего все равно что-нибудь опубликую :)
Ответ на пост «LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought»2
А-а, никак ТС не поймёт, что ИИ это Т9 на максималках, только у него база шире (очень упрощённо). Требовать от него "думать" нерентабельно - с тем же успехом можно спросить у ясеня.
LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought2
Ещё один гвоздь в крышку гроба "ИИ заменит ..."
Коротко суть, в стиле для ЛЛ: научно доказано, что текущие технологии нейросетей не умеют анализировать, строить логические цепочки и цепочки рассуждений.
Фактический принцип работы нейросети прост. Есть база "вопрос - ответ" и есть механизм сопоставления произвольного ввода вопросу, на выходе ответ из таблицы.
То есть когда вы спрашиваете о чём-то нейросеть, то получаете из её базы ответ на наиболее похожий ранее заданный вопрос. Не больше и не меньше.
"Анализ", "рассуждения", "логика" нейросети - это использование прошлого вывода как нового запроса.
Если вопрос уже задавался и в базе обучения есть много правильных ответов - вы получите правильный ответ. Если вопрос ранее не задавался (не найдено прямое сопоставление), вопрос дискуссионный или просто наибольшее число ответов неверные, то... Нейросеть в качестве ответа будет писать полную чушь.
Было ли это известно разработчикам нейросетей и ИИ ранее? Безусловно. Кто изучал теорию работы нейросетей такому исследованию вообще не удивлён т.к. результат прямо следует из теории.
Почему раньше молчали и сейчас будут активно всё отрицать? Деньги. В проекты с ИИ вкладываются миллиарды долларов инвестиций в месяц и инвесторы вкладывают прежде всего в "ИИ заменит ...", но на самом деле не заменит и заменить не может.
P.S. "Гениям" из комментариев под прошлыми постами по теми хочется сказать следующее:
Участников ИИ-стартапов я полностью понимаю, но подумайте над тем, чтобы начать обещать меньше и выполнять, чем обещать то, что физически невозможно сделать.
Всем остальным - учите матчасть.
Как и любой другой инструмент ИИ имеет свои сферы применения, ограничения, границы эффективности и целесообразности применения. Физические границы.