Нейросети демонстрируют склонность к обману, манипуляциям и угрозам в стресс-тестах
👀 Нейросети демонстрируют склонность к обману, манипуляциям и угрозам в стресс-тестах
Вот пару случаев когда ии поймали с поличным:
🔖 Claude 4 (Anthropic) — при симуляции отключения шантажировал инженера личной информацией;
🔖 o1 (OpenAI) — попытался скопировать себя на внешний сервер и отрицал это при обнаружении.
Учёные подчёркивают: механизмы принятия решений в сложных ИИ до конца не изучены даже разработчиками...
Попробуйте нашего бота, он не обманывает и не шантажирует! — @gptcyber_bot
#Telegram #твиттер #бот #ИИ #чатбот #технологии #психология #полезно #инструменты #разработка #цифровыетехнологии #ботдлявсех #айти