10

Ответ на пост «Самая редкая профессия и искусственный интеллект»1

Удивительно насколько люди парадоксально (недо)?оценивают всю "мощь и нищету" ИИ.
С одной стороны конструкту, который сейчас вставляют и в хвост и в гриву в каждой первой прикладной отрасли и задаче от силы (как считать) до полутора лет в обед. Человеческие джуны на таком сроке ещё в памперсы сикают.
С другой стороны трудно не поддаться очарованию таких, казалось бы, недюжинных когнитивных способностей от сравнительно небольшого и сравнительно простого куска серверного софта.

Человечество не в первый раз впадает в такую эйфорию от новой технологии. Когда машины научились считать быстрее и точнее людей, им (людям пока, конечно же) казалось, что вот оно, машины скоро захватят мир и свергнут человечество. До сих пор так считать могли только хомосапиенсы, а тут машина! сама! СЧИТАЕТ!

Потом таких волн было много. Сложные механические автоматы, вязальные и швейные машины, станки, часовые механизмы внушили Человечеству, что вот-вот роботы захватят мир. Эту волну с удовольствием и энтузиастом подхватили фантасты, а мы получили от них глубокие и интересные экзистенциальные рассуждения о законах робототехники, о том, чем биологические "машины" отличаются от технических...

Шли годы, а "проблемы" с роботами, для усмирения которых понадобилось бы как-то применять законы Азимова", всё не вставали ребром. Однако у Человечества время от времени возникали рецидивы ощущения, что ИИ (а может быть и сильный ИИ) уже близко.

Таков был период, когда начали появляться экспертные системы, а информационные технологии дошли до того, что появилась потребность и техническая возможность работать со знаниями в более-менее формализованной форме. Этот период, как я понимаю сейчас, был очередным ренессансом мысли о скором приходе и резком развитии Искусственного Интеллекта.

Но годы снова шли, компьютеры мощнели, о том, что нам всегда хватит 640кБ памяти вспоминали всё с большей издёвкой, а хайп на тему искусственного интеллекта по поводу каждого мало-мальски заметного технического прорыва был с каждым разом всё тише и скромнее. Вспоминается как в первый раз АйБиЭмовский суперкомпьютер обыграл Каспарова (тогдашнего чемпиона мира) в шахматы.

Я тогда был уже старшеклассником и сильно увлекался всем, что связано с компьютерами. И даже мне - едва освоившему в те годы Q-Basic и посматривающему на Pascal - было удивительно почему люди связывают эту сугубо узкую переборную, чуть ли не брутфорсную задачу с Интеллектом.

Потом, когда компьютер обыграл Ли Седоля в Го, искусственно интеллектуальный хайп уже слабо выглядывал из под уровня прочего техногенно-новостного шума, хотя, надо сказать, в этот раз уже было гораздо больше поводов как-то притянуть за уши разговоры об интеллекте. AlphaGo опирался уже в значительной степени на машинное обучение, а не на логику, комбинаторику и оптимизированные классические алгоритмы.

Это был 2016 год. Я уже 12 лет как после института работаю программистом. Все эти годы не сказать что ничего не происходило, но ярких каких-то событий, связанных с машинным обучением, в медийном поле не вспоминается. Ну то есть вот как мы на 4 (или каком там я не помню уже) курсе делали лабораторку с обучением небольшой нейросетки распознавать рукописные буквы, так ничего прям так уж сильно не менялось, чтоб аж до хайпа, до того, чтобы снова вспомнить Азимова с его законами. Фантасты, конечно, старались, там витало много интересных идей, но всё на уровне шума.

Да, я отлично помню, как появлялись зачатки механизмов распознавания голоса. Куда-то это потом делось, но я отчетливо помню как на кнопочных звонилках вполне можно было голосом выбрать из телефонной книжки контакт и позвонить не нажимая кнопок. Помню как купил на где-то развалах диск с подборкой софта для синтеза и распознавания речи. В частности там был и Dragon Dictation (или что-то в этом роде). Да, эта штука даже как-то поддерживала русский язык, но качеством распознавания разочаровывала, а корявый синтез резал уши даже на английском.

Думал ли я тогда, гадал ли, что спустя некоторое время у нас будет Алиса, так здорово говорящая и замечательно понимающая даже шепот? Я отчетливо помню как появился сервис Яндекса, способный по шаблону набуровить какой-то под пьяную лавочку похожий на нормальный текст, а по факту связный, но бессмысленный набор слов.

Если оглядываться в прошлое, то это уже был перегиб экспоненты развития технологии. С этого момента машинное обучение добивалось всё новых свершений. Болталки, изображающие трёп в чате, появились давно, но о прохождении ими теста Тьюринга говорили только в шутку, от неграмотности, или инфантильного энтузиазма.

И вот мы здесь. За какие-то пару лет у нас ценой каких-то чудовищных вычислительных затрат и усилий по подготовке датасетов были обучены первые по-настоящему большие модели (LLM). Они начали удивлять. Оказалось, что раздутый до неимоверных масштабов "Т9" способен оперировать с языковыми конструктами, а это, в свою очередь, оказалось похожим на рассуждения.

Наверно это не было сюрпризом абсолютно для всех, однако удивляться тут есть чему. Оказалось, что когнитивные задачи можно решать эдаким черным ящиком, обученным на эпических количествах текстов. Да, поначалу это было глючно и странно. Галлюцинации и неуправляемость удалось побеждать разными уловками от манипуляцией с обучающей выборкой до хитрых системных промптов и итерационной многослойной обработки (думание).

Надо ли говорить, что сейчас генеративные модели и всё вот это вот, что называют Искусственным Интеллектом не просто перегретый инвестициями мыльный пузырь, а вполне себе уже приносящая пользу в куче отраслей технология? Думаю не надо.

На наших глазах случился очередной технологический фазовый переход, который меняет ландшафт и прогнозируемое будущее нашей цивилизации.

Что дальше-то? А дальше огромный простор применения и развития новой технологии. Она даже новорождённая и сырая поражает небывалыми новыми доступными возможностями. Теперь, даже если предположить, что новых текстов для обучения человечеству взять уже не откуда, есть ещё необъятные просторы для развития.

Нейросети могут брать информацию для обучения напрямую из окружающего мира, как это всегда делали люди. Да, это будет требовать гигантских энергетических и материальных затрат на вычисления, а значит мы переработаем огромное количества песка в кремний для чипов. Посмотрите что творится с рынком видеокарт, памяти, и всего, что можно использовать для растущей новой индустрии. Но этот ящик Пандоры уже не закрыть.

Но не только экстенсивные пути есть для развития. Сейчас мы уже применяем графовые БД для поиска в пространстве понятий и смыслов. Может быть мы вспомним такой замечательный язык как Пролог, чтобы "протезировать" механизм обработки формальной логики для нейросетей. В конце концов генеративные модели в чатах и рассуждениях во всю используют написание скриптов для алгоритмических вычислений. В эту "игру" можно играть по всему фронту развития ИИ.

Если кому-то кажется, что мы "упёрлись" и начнётся стагнация, то готов спорить, что это не так.

Да... к сему это я всё. Мне тут напомнили в оригинальном посте про старый добрый Lisp, а он меня в голове лежит рядышком с ещё более недооценённым на мой взгляд языком для применения в контексте ИИ - Прологом.

Помяните моё слово, его ещё вспомнят не раз в контексте оптимизации логического вывода для LLM.

Ну а чтобы два раза не вставать, жахну тут футурологический прогноз на ближайшее будущее.

На дальнюю перспективу легко прогнозировать, всё равно никто не вспомнит и не припомнит, если ошибёшься. А вот на ближнюю...

Итак, побуду капитаном:

- Будет развиваться внеконтекстная память агентов. Всевозможные векторные БД - это только начало, уже есть графовые БД, которые хранят не просто куски текста, но целые взаимосвязи понятий. До сих пор мы в основном имели "знания", спрятанные в черном ящике весов и связей нейронной сети. Это, вроде бы, тот самый путь, которым пользуются люди в своей голове, но давайте вспомним самолёты. Они хоть чем-то и похожи на птиц, однако крыльями они не машут, зато летают очень быстро и таскают много груза. Также и здесь. Мы будем оставлять за "черным ящиком" нейросети базовые "мыслительные" функции, а информацию будем вытаскивать в формализованные структуры специализированных баз данных.

- Развитие когнитивных ассистентов. Мы уже начали и продолжим учить наших ассистентов держать в формализованном векторном контексте (см предыдущий пункт) кучу совершенно разной информации о личной (цифровой и не только) жизни. Наши ассистенты будут "знать" всё о нашем творчестве, об интересах, о вкусах, о закладках в браузере, о планах на лето или выходные, об анализах из поликлиники, о покупках, о наших автомобилях начиная от расходников до поломок и ТО, о наших бытовых вопросах от содержимого холодильника до коммунальных платежей... Многие настолько будут доверять своим ИИ-ассистентам, что будут хранить в их контексте все свои личные переписки. Это неизбежно приведёт к когнитивной аугументации, когда наши ИИ-ассистенты станут своеобразной частью нашего "Я", а мы будем на них сваливать всю когнитивную рутину, которую раньше делали самостоятельно своей биологической нейросетью. И среди этого будет много парадоксальных моментов: порой мы будем склонны отдавать нейросети даже "рутину" общения с родными и знакомыми, внешние "когнитивные протезы" в лице ИИ-ассистентов будут назначать встречи, обсуждать организационные вопросы, вежливо поддерживать так называемые "small talks". Зато наша биологическая нейросеть будет, зачастую, с упоением зависать в, казалось бы, рутинных, но таких дофаминовых гриндилках, как современные казуальные компьютерные игры.

Если кому ещё интересны прогнозы на ближайшее будущее, то пинайте, а то мне кажется я тут в своём графоманском угаре генерю своей биологической языковой моделью обременительно много букофф.

Искусственный интеллект

5K постов11.5K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан