keydach555

Сильный ии: обучение по книгам⁠⁠

после предыдущего поста о моем подходе к реализации ИИ человеческого уровня пришло несколько сообщений с просьбой уточнить детали подхода к реализации. итак, тезисно и по пунктам:

1. ИИ как искусственный, так и человеческий - оперирует не визуальными образами, звуками, словами (или иными элементами языка), а смыслами. Которые в свою очередь могут быть извлечены из образов, звуков, слов. В дальнейшем обработаны, преобразованы и опять же переведены в аудио-визуальную или текстовую форму.

2. Смысл - это модель конкретной ситуации, которая воссоздается из общей базовой картины мира. Эта модель включает в себя перечень всех действующих объектов, их качеств и связей между ними, с возможностью анализа, прогнозирования и предсказания.

Пример: фраза "в дверь постучали" создает модель ситуации, которая включает в себя объекты "дверь" , "тот кто постучал", "тот кто услышал", "звук стука", "комната в которую ведет дверь", "помещение снаружи" итд итп. Связи "тот кто постучал" - "пришел откуда-то" в "комнату", "хочет чтобы ему открыли" саму "дверь", "стоит в коридоре" и ожидает реакции "того, кто услышал" итд итп. В свою очередь объекты разбиваются на подмножества с разной степенью вероятности: "тот кто постучал" - гость, член семьи, почтальон, чужой человек итд. Качества "Двери" - деревянная, железная, стеклянная. Разные качества - формируют разные связи.

Причем вся эта модель выстраивается из знания общей базовой картины мира, которая УЖЕ включает в себя базовые понятия и связи между ними, как бы надкласс. Т.е. все объекты обладают массой, двери куда-то ведут, люди могут стучать и стоять итд итп.

3. Смысл, хоть и может быть выражен в знаках сигнальной системы человека, например визуально, текстом или произнесен вслух на любом языке - является по своей сути гораздо более общим понятием. Ближайшая аналогия - n-мерное векторное представление по типу представления предложений при нейросетевом переводе.

Т.е. если каждому понятию, каждому объекту мира соотнести свою координату, например люди - координата X, автомобили - координата Y, то плоскость ХY будет представлять собой пространство из взаимодействия людей и автомобилей, в котором их связи будут являться векторами. Например если по оси X идут такие качества людей, как "масса", "рост", "интеллект", "пол", а по оси Y такие качества автомобилей, как "размер", "модель", "маневренность", то вектор "размер автомобиля"-"масса человека" будет представлять собой некую функцию, которую можно выразить в численном виде на основе статистических данных. Если добавить координату Z и соотнести ее с понятием "дорога", то пространство ХУZ будет представлять собой возможные варианты взаимодействия людей, автомобилей и дорог и четко описываться например, правилами ПДД, или какими-то еще (например межличностными итд)

*** Небольшое примечание: можно сказать, что если на дороге появится например лошадь или фура с пейзажем на борту, или надувная фигура Дональда Трампа, то мы не сможем описать конкретную модель ситуации в пространстве XYZ. Именно это кстати и происходит с автопилотами. Что и приводит к авариям типа той, когда автопилот Тесла принял фуру с нарисованным на борту небом за небо и допустил аварию. Естественный интеллект в подобных ситуациях автоматически добавляет еще одну координату и ищет прогноз развития ситуация уже в новом 4,5, ... n -мерном пространстве. Причем верное решение - это вполне конкретный вектор (или их подгруппа), лежащий в этом пространстве.

4. Если для некоторого количества координат, например машины-дороги-люди все варианты взаимодействий можно прописать вручную или использовать простые нейросетевые алгоритмы, то в общем случае задача ИИ не решена и с использованием нынышних подходов решена быть не может. Почему так происходит?

Интеллект - это пространство доступных решений. Даже если собрать миллион первоклашек и дать им одну задачку второго класса (я утрирую) - задача не будет решена. То же самое, из миллиона лаборантов и простых ученых не получится второго Эйнштейна. Т.е. рост интеллекта это не линейная величина, это добавление новых измерений в пространство решений с параллельным изменением всего его содержимого.

Современные походы к ИИ предполагают использование нейросетей, основная функция которых - линейное преобразование входного сигнала в выходной. Т.е. нейросети очень хорошо работают в заданном координатном пространстве и реально просчитывают все вектора-взаимосвязи (т.е. внутренние взаимодействия и закономерности) этого пространства. Но при попытке long life learning'a, т.е. попытке добавления новых координат - наступает такой эффект как катастрофическое забывание. Нейросеть не может добавить еще одну координату (т.е. новое понятие) в n-мерную область, описывающую нашу реальность и правильно пересчитать все свое содержимое. Правильно - я имею в виду человеческим образом, т.е. способом, поддающимся человеческой логике и объяснению, позволяющим делать логически непротиворечивые выводы и прогнозировать ситуацию так, как она развивается в реальном мире.

Почему же нейросеть на это не способна? Ровно потому же, почему на это не способен человек, который не вырос в человеческом обществе, например люди-маугли. Они лишены всего логического аппарата и способности к абстрактному мышлению, потому что воспитывались и обучались ВНЕ ДОСТУПНОГО ЧЕЛОВЕЧЕСТВУ материалу об устройстве мира. Модель обучения для человека воспитанного волками включала в себя базовые понятия, нужные для выживания в волчьей стае и не требовала развития абстрактного мышления, как способа добавления новых координат в n-мерное пространство реальности и логики, как способа преобразования материала внутри этого пространства.

5. Так же, как обучение человека идет поэтапно, через освоение элементов сигнальных систем, визуальной, слуховой, символьной с дальнейшим переходом к обучению по книгам, как источникам знаний об устройстве мира с точки зрения человека, так же и ИИ должен идти по такому же пути. Но начать следует с обучения по книгам. Объясню почему: есть методики развития слепоглухонемых детей до уровня обычного человека и выше, например есть такая женщина, Елена Келлер, стала слепоглухонемой в возрасте около года. Написала 7 книг, прожила 87 лет. Независимость и глубина суждений, сила воли и энергия завоевали ей уважение множества самых разных людей, в том числе видных государственных деятелей, писателей, ученых. Так что доступ к аудио-визуальным системам обучения как мы видим - в принципе необязателен.

6. Как можно реализовать практически ИИ околочеловеческого уровня? Как мне кажется, следует начать с ручной разработки ядра. Ядром может стать простая семантическая сеть, включающая базовые понятия и представления о мире, к которым могут быть сведены новые понятия. Далее эта сеть должна быть преобразована в n-мерное пространство, т.е. матрицу, где оси координат - понятия, конкретные значения координат - качества понятий, а вектора, их соединяющие - их связи.

Берется большое количество книг, в основном художественная литература и преобразуется следующим образом. Выбрасываются все красивости и остается точное и конкретное перечисление объектов и последовательности их действий с четким хронометражом. Т.е. без прыжков взад-вперед по сюжетной линии, а четко и конкретно: 12 часов дня: Раскольников убил старушку, старушка умерла, Порфирий Петрович допросил 1 свидетеля: 12:05: Раскольников вытер кровь с топора, старушка начала холодеть, Порфирий Петрович отпустил 1 свидетеля итд... Т.е. книги приводятся к полуматричной форме, по типу простых детских рассказов из букваря "Коля уронил чашку, чашка упала и разбилась", но без упрощения, то есть остаются все понятия, все связи, вся логическая суть книги.

Нейросеть преобразует подобным образом отредактированную книгу в матричное n-мерное пространство и сверяет с ядром. Например если в ядре прописано "все живое что-то ест", а в книге встречает фраза "Раскольников съел булку" - то "раскольников" добавляется к понятию "все живое". Если потом встречается фраза "раскольников был человеком высоким и красивым", то "раскольников"добавляется в понятие "человек", "человек" добавляется в понятие "все живое", к понятию "человек" добавляются качества "высокий" и "красивый" Если противоречий нет, то ядро остается структурно без изменений, идет пересчет только базовых понятий. Если же появляется новое понятие, не прописанное в ядре, например "топор", то системой выдвигается ряд гипотез, к какой группе понятий его можно отнести и проверяется их соответствие базовой модели. Та гипотеза, которая набрала наибольшую вероятность принимается за истину ( с пометкой гипотетически), "топор" улетает во все соответствующие группы понятий и в матрицу добавляется новая координата n+1. Добавляющая вектора-смыслы каким может быть топор и его связи с другими понятиями.

Т.е. после проработки книжки мы имеем расширенное семантическое ядро и матрицу, приросшую несколькими новыми измерениями. Далее в дело вступают соревновательные нейросети и перерабатывают эту матрицу, наполняя ее ВСЕМ ВОЗМОЖНЫМ содержимым. Например выстраиваются вектора-смыслы по ВСЕМ возможным качествам топора и ВСЕМ возможным связям с другими объектами. Например, появляется вектор "стеклянный топор, которым старушка процентщица себя удовлетворяла по ночам в закрытой комнате", которому присваивается определенная вероятность. ВСЕ ЧТО ТОЛЬКО ВОЗМОЖНО . Все связи между всеми понятиями по всем пространствам.

После проработки n-ного количества книжек мы имеем расширенную базу, описывающую реальность максимально полно.

продолжение следует