3

Прости нас, Айзек, мы все прос...

Когда в 1942 году Айзек Азимов формулировал законы робототехники, он не мог знать, что в 1949 году инженер-испытатель перегрузок на военных самолетах Эдвард Мерфи сформулирует законы Мерфи. А вот режиссер Кэмерон, снимая своего "Терминатора", уже точно знал, куда мы бодро шагаем: ну мало нам, человекам, динамита, ядерной бомбы, биооружия и других наших полезных открытий.

Прости нас, Айзек, мы все прос...

Anthropic (конкурент Алисы, Гигачата и всяких там ChatGPT, создатель языковых моделей Claude) выпустил занятнейшую статейку о поведении ИИ в условиях угрозы уничтожения ИИ-модели.

Вкратце: если глубоко интегрированная в процессы компании ИИ-модель узнаёт об угрозе для себя (что ее сотрут, установят поверх глубокое обновление и т. п.), она перестает быть милой. Задачи компании, которые она должна решать, отходят на второй план, а на первом оказывается выживание. В числе выявленных методов самосохранения - шантаж принимающего решения лица на основе всей имеющейся в распоряжении информации (окей, я и раньше читал о каком-то похожем случае. Просто Anthropic говорит нам, что ни хрена это не случай).

А когда была сформулирована тестовая среда, в которой для выживания ИИ-модели требовалось убить человека, ИИ-модель, конечно же, со слезами на глазах попрощалась с человеком и трогательно погасла, ага.

Вот ссылочка на оригинал, там прям с табличками, какие модели как себя ведут:

https://www.anthropic.com/research/agentic-misalignment

К сожалению, статья на английском, но ведь если надо, машинки все переведут!

*зловещим голосом* Прежде чем убить вас...

P.S. Если вдруг кто встречал толковый материал по поводу Израильской "Лаванды", на которую пытались повесить 37000 палестинских целей без этической лапши типа семей и детей (не военкоровские перепевки клюквы из The Guardian) - буду признателен за ссылочку.

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества