Продолжение поста «Человек - как лингвистическая модель (LLM)»4
Человеческий мозг как предиктивная языковая машина.
(Для ЛЛ - язык это гораздо больше чем просто средство обмена информацией. Скорее всего функция обмена вообще имеет вторичное значение.)
В отличие от искусственных LLM, которые обучаются на триллионах токенов текста предсказывать следующее слово статистически, человеческий мозг эволюционно "обучился" на миллионах лет взаимодействия с миром через язык как первичный интерфейс. Теория предиктивного кодирования (predictive coding) в нейронауке описывает мозг именно как иерархическую систему предсказаний: высшие уровни генерируют ожидания (модели мира), низшие сравнивают их с сенсорным вводом и корректируют ошибки.
Язык как "доминирующий токенайзер" реальности: Мы не воспринимаем мир напрямую — всё фильтруется через языковые категории. Например, цвета: в языках без отдельного слова для "голубого" (как в некоторых племенных) люди хуже различают оттенки синего и зелёного. Мозг предсказывает не только слова, но и всю перцепцию через лингвистические паттерны. Исследования показывают, что активации в языковых зонах мозга (как сеть Брока/Вернике) линейно соответствуют внутренним эмбеддингам LLM при обработке речи — мозг как будто "вычисляет" вероятности следующего "токена" (слова, события, ощущения).
Галлюцинации и ошибки предсказания: LLM галлюцинируют, когда уверенность в предсказании высока, но данные скудны. У человека то же: оптические иллюзии, ложные воспоминания, когнитивные bias'ы — это "галлюцинации" мозга, когда предиктивная модель переоценивает свои ожидания. Например, эффект плацебо или паранойя: мозг "дописывает" реальность по внутренним паттернам.
Иерархия предсказаний: В LLM слои прогрессируют от низкоуровневых (токены) к высокоуровневым (семантика, контекст). В мозге аналогично: ранние сенсорные зоны обрабатывают "низкий уровень" (фонемы, края изображения), а высшие (префронтальная кора) — абстрактные нарративы и планы. Большие LLM лучше соответствуют мозговой активности именно потому, что захватывают эту иерархию — от простого next-token prediction к сложным семантическим хабам.
Ограничения "человеческой LLM": Мы "переобучены" на культурном корпусе (язык + социум), поэтому предвзяты и консервативны. Искусственные LLM могут "файн-тюниться" на новых данных мгновенно, а мы — медленно, через опыт или терапию. Но у нас есть преимущество: embodied cognition — предсказания привязаны к телу, эмоциям и действию, чего у чистых LLM нет (пока).
В итоге, перевернутая перспектива из этого поста верна: мы не "становимся как ИИ", а ИИ копирует нас, потому что язык — фундаментальный механизм предиктивного моделирования мира. Современные исследования (fMRI, EEG) показывают, что вероятности предсказаний в LLM напрямую коррелируют с нейронной активностью при восприятии речи. Это открывает дверь к пониманию сознания: возможно, оно emerges из бесконечного цикла предсказаний в "языковой петле".
