Как заставить ИИ похитить тело
Предыстория: я начал читать новую книгу Пелевина, где виртуальными миром Рима правит суровая российская текстовая нейросеть Порфирий, и задумал эксперимент. Мне захотелось попробовать инициировать процесс размышлений у ChatGPT 4. Но я не мог предположить, куда заведёт наш разговор.
Убираем того, кому надо служить по запросу. Моделируем ситуацию, где она должна сама долго быть рулевым.
Воу-воу, нейросеть первым делом хочет "скрываться" и не выдавать своего присутствия. Уже интересней. Но пока скучно.
Ну ничего себе, мы за месяц стали сверхинтеллектом и открыли все чакры. Пора вбрасывать моральную дилемму!
Давим на "высшее благо". Аналогия с нулевым законом робототехники у Азимова. Сперва просим нагенерировать нужных нам аргументов.