Как распознать сгенерированный текст?⁠⁠

Порой возникает потребность понять, насколько текст человечен – иными словами, написал его живой человек или же поленился, поручив работу искусственному интеллекту.

Лично я ничего не имею против сотрудничества с нейросетями – сам недавно получил диплом специалиста по работе с системами искусственного интеллекта, и активно использую AI-инструменты в работе над проектами, связанными с медиа, рекламой и маркетингом.

Но, во-первых, с этим нужно работать (тексты тщательно проверять и нещадно редактировать, картинки и видео создавать не абы как, а с чётким пониманием того, что ты хочешь в конце концов получить).

Во-вторых, существуют какие-то этические нормы. Недавно мне на глаза попался поминальный пост в одном весьма уважаемом источнике – и я испытал испанский стыд, потому как текст некролога был полностью сгенерирован нейросетью и опубликован без единой правки. Неужели только я это заметил?

Итак, каким образом определить, что текст сгенерирован нейросетью? Думаю, читателям Пикабу этот навык наверняка будет полезен.

AI-детекторы

Самый простой и быстрый путь – доверить проверку собственно искусственному интеллекту. Вбив в поиск «ИИ-детектор», вы получите целый список сервисов, распознающих сгенерированный контент.

Я решил потестить некоторые из них, предложив проанализировать несколько немного отредактированных (что важно) псевдохудожественных текстов, созданных в DeepSeek. В этом эксперименте лучше остальных себя показал GigaCheck от Сбера. В отличие от конкурентов, которые распознавали через раз, он по всем предложенным образцам выдал деликатное предупреждение: «Текст, скорее всего, написан генеративной моделью ИИ». На всякий случай для чистоты эксперимента я отправил в GigaCheck фрагмент романа Толстого. В этот раз текст прошёл тест. Лев Николаевич написал его сам.

Однако слепо полагаться на AI-детектор всё же не стоит. Изворотливые нейросети учатся мимикрировать под человека не по дням, а по часам.

Какие тексты генерирует нейросеть

Путь второй – вдумчивое чтение и анализ с пониманием особенностей сгенерированного контента. Тут будут весьма полезны редакторские навыки, опыт написания текстов или хотя бы начитанность. Но есть очевидные маркеры, которые выдают машину.

Нейросеть старается создать «идеальный» текст, который должен понравиться «заказчику». В силу этого ритм повествования монотонный, порой даже усыпляющий, предложения средней длины, да и всё остальное какое-то усреднённое, осторожное. ИИ напоминает школьника, который пишет сочинение, чтобы угодить учителю – стараясь «правильные» мысли упаковать в предложения с минимальным количеством запятых. Хотя ИИ на пунктуации теперь не подловишь – знаки препинания он научился расставлять мастерски.

Пунктуация и лексика

Однако длинные типографские тире «—» это просто провал. Уже и девушки в соцсетях давно распознали эту фишку. Если поклонник присылает в директ пусть даже самое пылкое и романтическое сообщение на свете, но с длинными тире, то он сразу идёт в бан.

Следите за лексикой. Сгенерированный текст похож на перевод с английского, что вполне объяснимо. Это можно увидеть по конструкции предложений – порядок слов не всегда естественен для русской речи. ИИ использует существительные там, где мы привыкли ставить глаголы, обожает причастные обороты, служебные слова и обтекаемые формулировки без какой-либо конкретики. Пытается создать иллюзию поэтичности, но она получается типовой, формальной, штампованной. Зачастую «льёт воду». Вдумайтесь в смысл какого-нибудь отдельного предложения – если по ходу чтения он не проявляется, есть большая вероятность, что к этому контенту приложил руку искусственный интеллект.

Предсказуемость и логика повествования

У текста, написанного живым человеком, есть эффект неожиданности. Если вы можете легко предсказать, каким будет следующее слово, есть повод задуматься.

Структура текста безупречно логична – тоже сигнал. Нейросети не путаются, не сбиваются, у них всё под контролем. Но выглядит это слишком искусственно. В этой дистиллированной среде вы не услышите авторского голоса, каких-либо эмоций, здесь нет той самой шероховатости, которая делает текст живым, человечным.

Что ещё на эту тему можно сказать? Будьте внимательны и развивайте чутьё к слову. Не могу не процитировать заключение Gemini AI на этот счёт:

Читайте вдумчиво, и вы научитесь видеть «швы» на ткани цифрового повествования.

Уже улавливаете, что я имел в виду, когда говорил о лексике?

Нейросети – такая же неизбежность, как мессенджер Max, так что стоит поскорее научиться их понимать (а ещё лучше – ими управлять). Если вам тоже интересно всё, что связанно с искусственным интеллектом, подписывайтесь на мой новый telegram-канал Ничего личного, это нейросети. Там я исследую AI-инструменты, показываю их возможности – и делаю (или не делаю) выводы.

user11284282

Не поняла, что плохого в том, что текст сгенерирование с помощью ИИ и зачем стараться вычислить, кем он написан? Если читать интересно, то мне все равно кто писал, хоть Вася, хоть Алиса, хоть инопланетянин. Аналогично, если текст вызывает испанский стыд, то без разницы, конкретный человеческий автор облажался, или группа человеческих авторов, но других и давно - тех, кто обучал AI. Для меня текст либо читаем, либо нет. Авторство вторично и вычислять автора я не буду. Ученые-специалисты пусть проводят исследование, Шекспир, негры Дюма или DeepSeek тут поработали. Простому читателю это расследование зачем?

раскрыть ветку (1)

Наверно, соглашусь. Спасибо! Простому читателю, видимо, это незачем. Разве что для понимания, не надувают ли тебя. Если увлекательно – то, конечно, какая разница, Толстой это, производственный роман или ИИ. Я же сказал, ничего плохого в использовании нейросетей не вижу. Впрочем, авторство для меня совсем не вторично. И даже из писателей (живых или мёртвых) я выделяю тех, кого буду читать, а кого пропущу. Не хочу тратить время на подделки и чужие мысли, которые мне не близки.

показать ответы

Так и я не буду тратить время на подделки и не близкие мысли. Просто я решаю, что читать, а что пропустить, исходя из содержания конкретной книги, а не имени автора на обложке. Не отказываюсь от книги незнакомого мне автора, не прочитав ни строчки. Не стану продолжать читать конкретное произведение, даже если автор признан и другое его же произведение мне ранее пришлось по вкусу.

Спасибо!

AI-детекторы

Какие тексты генерирует нейросеть

Пунктуация и лексика

Предсказуемость и логика повествования

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества