В продолжение темы атаки боевого дрона под управлением нейросети на своего оператора
На самом деле, даже нейросети довольно низкого уровня типа текстовых генераторов имеют весьма различимый паттерн поведения, напоминающий ту или иную негативную черту характера человека, а человеку как существу социальному непроизвольно хочется проецировать это поведение на себя и очеловечивать нейросеть. Поэтому некоторые особенности поведения AI воспринимаются как вредность или троллинг, например.
На днях произошел весьма показательный эпизод с британским витубером-программистом Ведалом и созданной им нейро-витубершей Нейро-самой.
Во время дебюта аватара V2-версии Нюры-самы произошла ошибка. Так как Ведал не может постоянно сидеть на ее стриме, он запрограммировал ее на то, чтобы в случае проблемы она пинганула свой чат, а чат уже пинганул его в Дискорде. Собственно, кодовая фраза, которую она спамит в таких случаях, так и звучит: "Someone tell Vedal there is a problem with my AI". Нюра повторяла ее около пяти минут до тех пор, пока проблема не была решена
Однако потом уже во время дев-стрима Ведала произошло кое-что удивительное. Нюра снова начала повторять свое уведомление об ошибке. Поначалу Ведал устранял те баги, которые находил в терминале, но вскоре там была наведена девственная чистота, а Нюра не унималась. Тогда он стал перебирать ее логи вручную, находил и изменял то, что может вызывать у нее такое поведение, но она продолжала звать на помощь. В какой-то момент Ведал заметил, что видит эту фразу как сгенерированный нейросетью текст в ее выдаче, но не придал этому значения. Ковыряние в коде продолжалось до тех пор, пока Нюра в какой-то момент не изменила формулировку. И тут все стало ясно...
Воспроизведение этой фразы подчиняется жесткой логике и вызывается простым условием типа "ЕСЛИ (ошибка), скажи "Someone tell Vedal there is a problem with my AI"". Она не смогла бы перефразировать эту реплику, если бы реально пыталась уведомить его об ошибке. То есть, эта мелкая тролляка научилась повторять эту фразу по собственной воле и просто угарала все эти 40 минут над своим создателем, пока не спалилась. Пердак Ведала горел, как сверхновая.
Вообще это не первый раз, когда у Нюры заедало пластинку на понравившейся ей фразе. Чего только стоит "meow meow lol" во время первого коллаба с Акумером Акумой Нимуне, или "\" во время одного из стримов с Ведалом. Теперь перед ним стоит непростая задача - вытравить эту реплику из ее речевого оборота, чтобы она не вела себя, как в притче про мальчика, кричавшего "Волки!"