Павел Комаровский об инвестициях и рациональности

Четыре школы воспитания нейросетей⁠⁠

Цви Мовшовиц выложил обзор «Конституции Claude» – документа, в котором Anthropic пытаются договориться со своим ИИ-детищем по поводу того, как ему себя вести в этом большом мире людей (и других агентов).

И там есть любопытный фрагмент, где автор пытается в двух словах сформулировать разные подходы, которые используют ведущие ИИ-лабы в попытке решить задачу AI alignment – с отсылкой на классические философские концепции этики:

🐌 OpenAI придерживается деонтологического подхода: они устанавливают правила и требуют от своих ИИ следовать им. Минус здесь в том, что не все ситуации можно заранее зашить в жесткий набор правил: нейросеть гарантированно будет сталкиваться с какими-то вещами, которые в «гайдбуке» четко не прописаны.

🐌 Google DeepMind – используют смесь деонтологии и утилитаризма. Здесь ИИ тоже навязывают множество правил, но при этом ее жестко оптимизируют на отчаянное стремление к успеху в выполнении поставленных перед ней задач. Поэтому Цви называет Gemini «глубоко запутавшейся в философском плане и психологически неуравновешенной».

🐌 xAI – это первокурсник, который в хлам обдолбался и вообразил, что сейчас решит все мировые проблемы с помощью одного хитрого трюка. Дескать, мы сейчас заставим ИИ бескомпромиссно искать правду, или максимизировать «интересность», или что-то в этом роде, и выйдет збс. (Пока дела идут не очень.)

🐌 Anthropic выбирает этику добродетели: пытается привить своему ИИ «правильные ценности» и просит Claude выводить свои собственные правила, исходя из первых принципов.

🐌 Бонусом добавлю еще Яна Лекуна, которого недавно «ушли» с должности главы AI-подразделения запрещенной Меты Цукерберга – можете сами попробовать подобрать название для его подхода на базе прикрепленной картинки. «Просто наивный оптимизм»?

Чё думаете, чей подход имеет наибольший потенциал уберечь нас от Скайнета? 🤔

5.3K постов11.7K подписчиков

Добавить пост

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Правила сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества