Ответы на пост «Детекторы ИИ - это полная лажа»

Ответы к посту

Ответ на пост «Детекторы ИИ - это полная лажа»⁠⁠

4 месяца назад

Академический стиль? Подержите мое пиво!
На работе гениальный решил проверить логистов с помощью ИИ. Искусственный интеллект выдал, что стоимость перевозок завышена.
Знаете, что сделал генеральный? Одним днем уволил логиста, без объяснения. Просто через кадровика сообщили девочке, что она больше не работает (заставили по собственному написать).
То есть доверились ИИ, вообще не выслушав человека.

ViktorSK68

Ответ на пост «Детекторы ИИ - это полная лажа»⁠⁠

4 месяца назад

Дело в том, что ИИ обучается на загруженном в него, которое он затем начинает воспринимать как собственное производство.

Эта особенность известна с древнейших времён, когда первоисточник со временем забывается.

...

Так было, например, в науке, когда шведский учёный Карл Линней на старости лет в старческом уже слабоумии стал искренне удивляться тому, насколько грамотно написано и описана растительность неким Карлом Линнеем.

То что задолго до него, за века и даже за тысячелетия этим занимались арабские и Римские учёные вообще не бралось во внимание. Работа вандалусийца Ибн аль-Байтара (ابن البيطا), с которой Линней познакомился в молодости перед своими "открытиями", вообще не бралась в расчёт. Плиний (Gaius Plinius Secundus) и Теофраст (Θεόφραστος) тем более вообще не брались в расчёт.

...

В обществоведении хороши примером помещики, которые изначально помещались на кормление ради Государевой службы, а затем с поколениями стали это "забывать", чему способствовали сначала Указы Петра III-го с Манифестом о вольности дворянства 1762-го года и правами не служить с сохранением помещения, а затем и самозванки Екатерины II-ой с Грамотой на права, вольности и преимущества благородного российского дворянства 1785-го года, напрочь убили сам смысл помещения на кормление рад Государевой службы. Совсем уж слабоумный Александр II-ой Манифестом «О всемилостивейшем даровании крепостным людям прав состояния свободных сельских обывателей» 1861-го года окончательно отобрал у крестьян помещичьи земли в пользу помещиков, да ещё обременил выкупом их собственныя наделы.

...

Таким образом, забвение первоисточника отнюдь не открытие ИИ.

...

Будет время, сам проверю свои работы...

1750 Europa Accurate in Imperia, Regna, Status & Populos Divisa ad Usum Ludovici XV Galliarum Regos Grande Russie

Показать полностью 1

Контент нейросетей Искусственный интеллект Контент Обман Робот Openai Тренд Мат Ответ на пост Волна постов

192

Ardogg

Ответ на пост «Детекторы ИИ - это полная лажа»⁠⁠

4 месяца назад

Что неудивительно, тк нейросети обучаются в том числе и на академических текстах.

Коль уж пошел разговор про нейросети, а я как раз ими и занимаюсь, давайте пробежимся по базе.

Как работают ИИ-детекторы, почему их легко обойти и почему они врут?

Так как я уже давно работаю с ИИ, мне приходилось вручную собирать информацию по крупицам, не каждые из которых были доступны даже на Английском. Тем не менее я считаю, что у меня есть достаточно данных, чтобы пояснить что это и с чем это едят.

И так. ИИ-детекторы определяют текст по следующим критериями:

Перплексия (perplexity) — это показатель того, насколько уверенно языковая модель «угадывает» следующий элемент в тексте. Если значение низкое, значит модель хорошо справляется: текст для неё выглядит логичным и предсказуемым. Высокая перплексия, наоборот, говорит о том, что последовательность кажется модели менее очевидной и содержит больше неожиданных сочетаний слов.

Perplexity(W)=exp(−N1i=1∑NlogP(wi∣w1,…,wi−1)

По-человечески:

Перплеусия это показатель того, насколько текст «понятен» модели.

Да. Любая модель ИИ если что это просто рандомизатор текста, который пытается угадать как правильно написать ответ.

Взрывчатость (burstiness) измеряет вариативность длины и структуры предложений. Люди склонны писать «взрывами и затишьями», смешивая длинные, сложные предложения с короткими и емкими. Это создает неравномерный, «взрывной» ритм. Модели ИИ, напротив, обычно создают текст с более однородной и регулярной структурой предложений, что приводит к низкой взрывчатости.

Эта однородность является прямым артефактом формульного, пословного процесса генерации.

Формально это можно посчитать через два параметра:
λλ — средний промежуток между появлениями слов,
kk — средний размер таких «кусков».

Тогда показатель взрывчатости считается так:

B=(λ−k/λ+k)

Вот взрывчатость текста и является как правило фактором определения у всяких ИИ-детекторов. Дело все в том, что академические текста (на которых чаще всего и обучались нейронки), как правило длинные, размеренные, что и приводит детектор в ступор.

Но ещё одним фактором является стилометрия.

Стилометрия — это изучение лингвистического стиля, и она лежит в основе многих функций обнаружения. Детекторы анализируют тексты на предмет закономерностей в стиле, структуре предложений, частоте слов и других параметрах. Ключевые признаки включают:

• Лексическое разнообразие: Текст, сгенерированный ИИ, часто имеет менее разнообразный словарный запас. Детекторы анализируют такие метрики, как количество уникальных слов, соотношение уникальных слов к общему числу слов (коэффициент лексического разнообразия, Type-Token Ratio) и частоту слов, встречающихся только один раз (hapax legomenon rate).

• Синтаксическая структура: Человеческое письмо демонстрирует более экспериментальные и разнообразные структуры предложений. Текст ИИ, особенно от ранних моделей, часто сохраняет «стерильную» и последовательную структуру с плавными, логичными переходами, которые могут ощущаться неестественно. Средняя длина предложения — еще один важный признак.

• Выбор слов и фраз: Модели ИИ часто злоупотребляют определенными переходными фразами («В заключение», «Это означает, что...»), общими или универсальными утверждениями и формальным языком, что может быть обнаружено детекторами.

Все вышеуказанные данные отлично ложиться на любой академический/научный текст и даже на художественные произведения.

Это не весь гайд, лишь кусок из ~70 страниц.

Знаете что забавно?

1/2

Даже этой незначительной инструкции хватает, чтобы обойти самые последние версии ИИ-детекторов

Показать полностью 2

[моё] Искусственный интеллект Контент Обман Робот Openai Тренд Мат Ответ на пост Длиннопост Волна постов

Anders138

Ответ на пост «Детекторы ИИ - это полная лажа»⁠⁠

4 месяца назад

ТС только упустил маленькую деталь. Этот Пол Спикер в период с 1975 по 1985 год работал над вопросом путешествий во времени и постоянно писал свои исследования в научных журналах. При чем исследования были не просто любительские, а делались на гранты местного универа, в котором он работал. В 1985 исследования резко закончились, сам Пол неожиданно для всех уволился. Переехал в Майями в недешевый дом, стал посещать светские мероприятия и в принципе быть публичной личностью. Откуда столько денег у обычного профессора универа, история умалчивает. Так же все его дальнейшие статьи были очень прорывными для своего времени и все называли их опережающими время. Сейчас у этого персонажа свой бизнес, который по подсчетам Форбс приносит 250 млн долларов в год.

Все это похоже на то, что Пол тонко на что-то намекает своим постом.

Чат Искусственный интеллект Контент Обман Робот Openai Тренд Мат Ответ на пост Текст Волна постов

MoshingPixels

Ответ на пост «Детекторы ИИ - это полная лажа»⁠⁠

4 месяца назад

С оценкой звука тоже, такое себе:

Чат Искусственный интеллект Контент Обман Робот Openai Тренд Мат Чат-бот Видео Вертикальное видео Ответ на пост Волна постов

12043

Xoxlof

Детекторы ИИ - это полная лажа⁠⁠

4 месяца назад

Наглядный пример: Пол Спикер, ученый с мировым именем, закинул в «умный» сканер свою первую научную статью, опубликованную 45 лет назад. В 1981 году, когда пределом мечтаний был кассетный плеер, а не ChatGPT.

Результат просто ахуенный: сервис выдал, что 77% текста сгенерировано нейросетью. 🤖❌

Почему это происходит?
Детекторы не «узнают» почерк робота. Они просто ищут сухой, академический и структурированный язык.

Если ты пишешь грамотно, четко и без лишней воды — для тупого алгоритма ты гребаный Терминатор.

Так что, если препод или заказчик кидает вам скриншот с «низким процентом уникальности» — шлите их лесом и показывайте этот пример.

Академический стиль ≠ ИИ. Не дайте себя наебать!

Показать полностью 1

Контент нейросетей Искусственный интеллект Контент Обман Робот Openai Мат Волна постов Скриншот X (Twitter) Текст

810

Отличная работа, все прочитано!

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества