Сильный ИИ - примерный способ создания
пост - приглашение к обсуждению. не претендую на истину в последней инстанции, интересуют мнения специалистов в области нейросетей, возможно ли то, что я предлагаю, в принципе, или это уже где-то реализуется. для начала несколько тезисов
1. сильный ИИ человеческого уровня принципиально реализуем, поскольку сам человеческий мозг представляет собой физический/биологический механизм, подчиняющийся физическим и химическим закона нашего мира. Т.е. мозг представляет собой условную "нейросеть", позволяющую получать сырую информацию, сигнал нулевого уровня, извлекать из него смысл или наборы смыслов, формировать из них сигналы 1,2....n уровней, преобразовывать определенным образом, выполняя заданные условия, диктуемые ситуацией, контекстом, внутренними целями и окружающим миром и получать выходной сигнал. Соответствие выходного сигнала критериям максимизации/минимизации всего ряда целевых функций - является главным и основным условием его осмысленности. Т.е. ИИ человеческого уровня - получая ту же информацию, что и человек, должен формировать из нее выводы как минимум не хуже по степени их адекватности, соответствии ситуации и преследуемым целям, и общей осмысленности, чем средний человек.
2. нейросети сами по себе не способны создать сильный ИИ, хотя являются одним из основных инструментов его создания. нейросети - механизм по поиску внутренних статистических или иных закономерностей, позволяющих выполнить преобразование входного сигнала в выходной в соответствии с заданными целями и условиями, определяемыми косвенно в процессе обучения. они не ищут смысл, не выделяют его и не связывают с другими смыслами - они находят некие закономерности и используя их производят ряд линейных преобразований.
пример: если загрузить статистику предпочтений в еде, статистику ДТП и на основании этой информации сделать нейросетью прогноз о вероятности погибнуть в дтп для конкретного человека, любящего соленые огурцы - прогноз будет неутешительный. потому что практически 100% людей погибших в ДТП хотя бы раз в жизни ели соленые огурцы!!! Эта закономерность не имеет смысла, как и миллионы других, но нейросеть будет пытаться делать на основе нее выводы, вместо того, чтобы проанализировать цепочку смыслов и определить, что осмысленной взаимосвязи здесь нет. Т.е. нейросеть не может связать понятия человека и ДТП связями "вождение", "неисправность транспортного средства", "несчастный случай" итд, и сделать выводы что ни на одну из этих связей огурцы значимо не влияют.
3. для создания сильного ИИ требуется полноценная база данных, воссоздающая модель мира и внутренне глубоко взаимосвязанная. Смысл возникает из связи понятий и контекста, в котором они находятся. Т.е. смысл - это внутренне непротиворечивая общая модель конкретной ситуации, воссоздаваемая из поступающего сигнала на основе общей картины мира.
пример:
возьмем фразу "за окном орали кошки". наиболее вероятный смысл этой фразы - что человек находится в комнате, на дворе месяц март, время действия скорее всего ночь и кошек (скорее всего котов) как минимум 2. второй возможный смысл - время действия любое, кошки дерутся/ кошек рвут собаки/ кошек давит каток итд итп. Т.е. ИИ должен создать список из объектов, максимально возможного количества связей между ними и проставить каждой такой связи определенный уровень вероятности. Получив на вход следующее предложение он должен скорректировать список объектов, связи и вероятности. Если следующее предложение "дул холодный ветер, мерцали звезды" - значит вероятность марта и ночи вырастает, остальные пропорционально уменьшаются. Исходя из перечня объектов и связей с наибольшей вероятностью на текущий момент времени делаются прогнозы на новые объекты и связи и отсекаются маловероятные варианты. Т.е. если третья фраза будет "окно открылось" можно сделать ряд предсказаний по смыслу развития ситуации: человек-ночь-орут появляется новая связь "мешают спать", которая подгружает список эмоций и действий объекта "человек" и в список прогнозируемых объектов подгружается "объектX" с таким перечнем связей, который позволит устранить объект "кошки" и связь "мешают спать". И пошел новый пересчет модели ситуации.
4. создать полноценную базу данных окружающего мира, хотя бы с таким количеством объектов и связей между ними, которая доступна обычному человеку - для конкретного человека невозможно. это то же самое, что для сороконожки начать управлять каждой из своих ног. Умение создавать модель конкретной ситуации из общей картины мира и доступной базы смыслов - умение для человека нерациональное, инстинктивное и сложно алгоритмизуемое. Оно основано на ряде врожденных представлений, которые не из чего логически не выводятся, кроме собственного опыта. Например то, что все вещи падают на землю, вода мокрая, а лед скользкий. Но то, что нельзя создать из опыта конкретного человека, можно создать из объединенного опыта человечества, т.е. из культуры и науки.
5. Промежуточный вывод: смысл - это модель конкретной ситуации, состоящая из объектов и связей между ними, где связям присвоены веса вероятностей в зависимости от ранней ситуации модели и предположительные веса вероятностей по прогнозируемой ситуации модели. Т.е. конкретная ситуация - конкретный смысл в человеческом понимании - это своего рода виртуальная нейронная сеть, вычисляющая саму себя на основе общей базовой картины мира.
Среди ученых бытует мнение, что мир - это квантовый компьютер, вычисляющий сам себя. Возможно так оно и есть и при достаточно большой предыистории, предварительной истории взаимодействий - прогноз для ситуации однозначен. Т.е. если взять ситуацию, где две машины едут друг к другу на скорости 200 км/ч и расстояние 10 метров - то столкновение произойдет обязательно. То же самое касается любых объектов и любых взаимодействий между ними. Т.е. при достаточно полном моделировании ситуации, определении всех объектов, связей между ними и истории взаимодействий, и самое главное, при действующей системе проставления вероятностей - мы с точностью 90-100% можем спрогнозировать следующую итерацию системы. Когда эта точность становится равна точности человеческого мозга, мы автоматически получаем сильный ИИ.
6. Т.е. нам нужна нейронная сеть, которую прогнали и обучили на огромном количестве внутренне непротиворечивых ситуаций (в принципе возможных в этом мире) с большим количеством объектов и связей между ними, которая впоследствии научится при получении вводных данных о конкретной ситуации (объекты-связи) проставлять вероятность возникновения новых объектов и связей.
Вспоминаем, где можно найти огромное количество реально существующих объектов, реально существующих связей между ними и постоянное развитие ситуации во времени, т.е. возможность самообучения по прогнозированию ситуации. Правильно - это книги. В основном художественная литература.
7. Каким образом можно извлечь смысловые паттерны из книг и создать общую картину мира? Идти по чисто лексическому пути, выделять слова-объекты и статистически определять вероятность возникновения связей между ними - это путь, по которому мы придем к экспертным системам и семантическим сетям. Это тупик. Здесь скорее всего должны использоваться методы, используемые сейчас при нейросетевом переводе. Когда предложение на одном языке переводится в n-мерный вектор, а уже этот вектор переводится на другом языке. Кстати, наталкивался на любопытную статью - что при анализе гугловского нейросетевого переводчика разработчики определили зоны, в которых начинали кучковаться фразы, обороты и предложения на разных языках, которые, используя разные слова несут один смысл. Т.е. этот переводчик разработал внутри себя систему, позволяющую кучковать предложения, которые абсолютно различны лексически и синтаксически, но значат одно и то же. Практически речь идет о начальном этапе выделения смысла.
Как я вижу процесс обучения по книгам в идеале? Каждая книга по аналогии с предложениями при переводе преобразуется в n-мерный вектор. Из этого вектора по определенным правилам могут вычленяться вектора меньшей размерности, которые являются ответами на конкретные вопросы по книге. Вплоть до развернутого ответа на вопрос: почему герасим утопил му-му или зачем раскольников грохнул старушку.
Вначале, конечно, эти вектора-ответы будут очень маленькими, например "небо днем синее", "ночью кошки трудноразличимы" итд итп. Каждый из этих векторов будет нести конкретный смысл для конкретной ситуации. В дальнейшем, при большом наборе этих векторов запускаются соревновательные сети, формирующие из этих векторов вектора чуть большей размерности, несущие ответы на более развернутые вопросы, определяющие модель мира чуть более полно. Корректность этих векторов проверяется соответствием по всем векторам-книгам. Есть совпадения смыслов - оставляем, нет - удаляем. Пример: в какой-нибудь книге вычленяется смысловой вектор "кошки любят сырую рыбу" - проверяем его по другим векторам-книгам, все верно, оставляем в базе как проверенный мини-вектор, "кошки любят грызть кирпичи" - проверяем, фуфло, на выброс. В итоге мы получаем ситуацию, когда на любой вопрос, заданный нами (т.е. на любой входящий сигнал), система формирует сколь угодно подробный ответ в виде n-мерного вектора, ИМЕЮЩЕГО СМЫСЛ В ЧЕЛОВЕЧЕСКОМ ПОНИМАНИИ. И получаем сильный ИИ.
Жду Ваших комментариев. Возможна ли такая реализация искусственного интеллекта, может быть кто-то движется по этому пути?