Машинный перевод + Нейронные сети

Теги

С этим тегом используют:

Все теги

Рейтинг

Автор

Сообщество

Тип постов

любые текстовые картинка видео [мое] NSFW

Период времени

за все время неделя месяц интервал

11 постов сначала свежее

ElfinFrontier

6 месяцев назад

ChatGPT

Перевод текстов с помощью нейросети - есть ли подвох?⁠⁠

Нейросети уже умеют переводить тексты с высокой точностью. Их широко применяют в таких сервисах, как Google Translate, Deepl и Яндекс Переводчик. Теперь это можно делать в чат-ботах типа ChatGPT. Я покажу, насколько успешно справляется с переводами модель от OpenAI по сравнению с онлайн-переводчиками. Примечание: Для доступа к новейшей версии GPT-4 использовал чат MashaGPT.

Возьмем фрагмент из научно-популярной статьи и пропустим через переводчики.

Google Translate:

Кроме того, за исключением легчайших кварков (верхний и нижний, плюс анти-верх и анти-низ) и легчайшего заряженного лептона (электрон плюс позитрон), все остальные заряженные частицы Стандартной модели неустойчивы по отношению к радиоактивные (слабые) распады. По мере того как часы после начала горячего Большого взрыва продолжают отсчитывать время, пикосекунды превращаются в наносекунды, а наносекунды складываются в микросекунды. По мере продолжения этого процесса более тяжелые частицы перестают создаваться и медленно исчезают из нашей Вселенной.
Топ-кварки исчезли, как только нарушилась электрослабая симметрия, и распались всего за йоктосекунды. Следующими исчезают нижние/анти-донные кварки, за ними следуют тау- и антитау-лептоны. После этого уходят очаровательные/античармовые кварки, а за ними следуют странные/антистранные кварки. Примерно через 100 наносекунд среди массивных частиц остаются только верхние и нижние кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, а также нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны все еще сохраняются и в это время.

DeepL:

Кроме того, все остальные заряженные частицы Стандартной модели, за исключением самых легких кварков (вверх и вниз, плюс анти-кварк и анти-кварк) и самого легкого заряженного лептона (электрон, плюс позитрон), неустойчивы к радиоактивным (слабым) распадам. По мере того как часы после начала горячего Большого взрыва продолжают тикать, пикосекунды превращаются в наносекунды, а наносекунды - в микросекунды. По мере того как этот процесс продолжается, более тяжелые частицы перестают создаваться и постепенно исчезают из нашей Вселенной.
Верхние кварки исчезли сразу же после нарушения электрослабой симметрии, распавшись всего за йоктосекунды. Следующими исчезают нижние/антинижние кварки, затем лептоны тау и антитау. После этого исчезают кварки очарования/античармы, а затем странные/антистранные кварки. По прошествии, возможно, 100 наносекунд из массивных частиц остаются только восходящие и нисходящие кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны также продолжают существовать в это время.

Яндекс Переводчик:

Кроме того, за исключением самых легких кварков (верхний и нижний, плюс анти-верхний и анти-нижний) и самого легкого заряженного лептона (электрон плюс позитрон), все остальные заряженные частицы Стандартной модели нестабильны по отношению к радиоактивным (слабым) распадам. По мере того, как часы после начала горячего Большого взрыва продолжают отсчитывать время, пикосекунды превращаются в наносекунды, а наносекунды складываются в микросекунды. По мере продолжения этого процесса более тяжелые частицы перестают создаваться и медленно исчезают из нашей Вселенной.
Верхние кварки исчезли, как только нарушилась электрослабая симметрия, распавшись всего за йоктосекунды. Нижние/антидонные кварки исчезают следующими, за ними следуют лептоны тау и антитау. После этого уходят кварки очарования/антихарма, за которыми следуют странные/антистранные кварки. По прошествии, возможно, 100 наносекунд среди массивных частиц остаются только восходящие и нисходящие кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, а также нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны все еще сохраняются и в это время.

MashaGPT:

Все переводы приемлемы, но требуют обязательной редакторской доработки. К примеру, ни один сервис не назвал правильно специальный физический термин “очарованные кварки”.

В отличие от онлайн-сервисов в GPT можно настраивать запросы для перевода. Укажем, что нужно учитывать специальную терминологию:

В новом переводе значительно лучше прописана терминология из физики элементарных частиц, хотя остались и косяки (“чарм/анти-чарм”).

Перевод можно сделать более творческим. Например, облегчить синтаксис для восприятия текста:

Для лучшего перевода я использую промт:

Ты выступаешь в роли переводчика, корректора и редактора. Переведи текст с английского языка, улучшив до литературного варианта, на русский язык. Убедись, что перевод грамматически и семантически правильный. Сохрани первоначальный смысл текста. Напиши только исправления, улучшения и ничего более, не пиши подробных пояснений. Текст [ ].

Короче говоря, онлайн-сервисы по умолчанию справляются с переводом лучше нейросети. Но если настроить промты, то нейросеть улучшит результаты за счет того, что она умеет еще и редактировать свой перевод. Это повышает семантическую точность в передаче смысла предложений. А еще в чат-боте можно менять тональность и стиль перевода.

Показать полностью 7

ChatGPT Нейронные сети Чат-бот Трудности перевода Машинный перевод Длиннопост

SamuraiJack1

6 месяцев назад

Volodya's monologue⁠⁠

[моё] Нейронные сети Машинный перевод Видео

EugeneVeng

7 месяцев назад

EnglishPub

Новый ИИ переводит твою речь на Английский и не только⁠⁠

[моё] Искусственный интеллект Нейронные сети Машинный перевод Развлечения Видео YouTube

Roman.Urich1980

8 месяцев назад

Нейросеть для адаптации текста к переводу на другие языки⁠⁠

Буду очень признателен рекомендациям из личного опыта. Многим кто занимается написанием статей, с последующим их переводом на другие языки, данная ситуация знакома. Когда статью нужно делать в двух вариантах: 1. для русскоязычной аудитории, 2. для аудитории читателей на других языках. Не у всех есть средства на услуги профессиональных переводчиков, поэтому большинство пользуется машинным переводом. Однако, при таком переводе, смысл многих фраз и выражений либо теряется, либо вообще меняется (богат русский язык на выражения, аналогии, поговорки и т.п. имеющие множественные трактовки в зависимости от применения), поэтому перед тем как переводить, текст поначалу нужно адаптировать, переведя все двусмысленные и фигуральные выражения в буквальные и однозначные. Эта рутинная процедура, отнимающая много времени.
Раз уж мы живем во времена продвинутых технологий ИИ, то может кто-то пользуется нейросетями которые могут выполнять подобные задачи, и у которых нет такого помешательства на толерантности, политкорректности и прочих фобиях (кого-нибудь обидеть) как у нейросети яндекса, которая судя по количеству ограничений может работать только с текстами о розовых единорогах и радужных пони.

Совет Консультация Лингвистика Нейронные сети Перевод Трудности перевода Трактовка статьи Машинный перевод Текст

DesantSir

8 месяцев назад

Будущее наступило. Нейросеть локализует оригинальный голос и синхронизирует мимику⁠⁠

Мемы Локализация Нейронные сети Озвучка Евгений Понасенков Машинный перевод Видео Повтор

TrivialMan

2 года назад

Когда смотришь бесплатные курсы на ютубе⁠⁠

Переведено нейросетью Яндекса

Оригинал видео: https://www.youtube.com/watch?v=8gU1lDwLavA

Нейронные сети Машинный перевод YouTube Юмор Бесплатное образование Видео

Golevden

2 года назад

Мне жалко переводчиков ...⁠⁠

Нейросеть яндекса научилась переводить видео. Видео 20 минут было переведено и озвучено нейросетью за 30 секунд!!! Будущее всё ближе!

Нейронные сети Перевод Машинный перевод

keydach555

6 лет назад

Сильный ИИ - примерный способ создания⁠⁠

пост - приглашение к обсуждению. не претендую на истину в последней инстанции, интересуют мнения специалистов в области нейросетей, возможно ли то, что я предлагаю, в принципе, или это уже где-то реализуется. для начала несколько тезисов

1. сильный ИИ человеческого уровня принципиально реализуем, поскольку сам человеческий мозг представляет собой физический/биологический механизм, подчиняющийся физическим и химическим закона нашего мира. Т.е. мозг представляет собой условную "нейросеть", позволяющую получать сырую информацию, сигнал нулевого уровня, извлекать из него смысл или наборы смыслов, формировать из них сигналы 1,2....n уровней, преобразовывать определенным образом, выполняя заданные условия, диктуемые ситуацией, контекстом, внутренними целями и окружающим миром и получать выходной сигнал. Соответствие выходного сигнала критериям максимизации/минимизации всего ряда целевых функций - является главным и основным условием его осмысленности. Т.е. ИИ человеческого уровня - получая ту же информацию, что и человек, должен формировать из нее выводы как минимум не хуже по степени их адекватности, соответствии ситуации и преследуемым целям, и общей осмысленности, чем средний человек.

2. нейросети сами по себе не способны создать сильный ИИ, хотя являются одним из основных инструментов его создания. нейросети - механизм по поиску внутренних статистических или иных закономерностей, позволяющих выполнить преобразование входного сигнала в выходной в соответствии с заданными целями и условиями, определяемыми косвенно в процессе обучения. они не ищут смысл, не выделяют его и не связывают с другими смыслами - они находят некие закономерности и используя их производят ряд линейных преобразований.

пример: если загрузить статистику предпочтений в еде, статистику ДТП и на основании этой информации сделать нейросетью прогноз о вероятности погибнуть в дтп для конкретного человека, любящего соленые огурцы - прогноз будет неутешительный. потому что практически 100% людей погибших в ДТП хотя бы раз в жизни ели соленые огурцы!!! Эта закономерность не имеет смысла, как и миллионы других, но нейросеть будет пытаться делать на основе нее выводы, вместо того, чтобы проанализировать цепочку смыслов и определить, что осмысленной взаимосвязи здесь нет. Т.е. нейросеть не может связать понятия человека и ДТП связями "вождение", "неисправность транспортного средства", "несчастный случай" итд, и сделать выводы что ни на одну из этих связей огурцы значимо не влияют.

3. для создания сильного ИИ требуется полноценная база данных, воссоздающая модель мира и внутренне глубоко взаимосвязанная. Смысл возникает из связи понятий и контекста, в котором они находятся. Т.е. смысл - это внутренне непротиворечивая общая модель конкретной ситуации, воссоздаваемая из поступающего сигнала на основе общей картины мира.

пример:

возьмем фразу "за окном орали кошки". наиболее вероятный смысл этой фразы - что человек находится в комнате, на дворе месяц март, время действия скорее всего ночь и кошек (скорее всего котов) как минимум 2. второй возможный смысл - время действия любое, кошки дерутся/ кошек рвут собаки/ кошек давит каток итд итп. Т.е. ИИ должен создать список из объектов, максимально возможного количества связей между ними и проставить каждой такой связи определенный уровень вероятности. Получив на вход следующее предложение он должен скорректировать список объектов, связи и вероятности. Если следующее предложение "дул холодный ветер, мерцали звезды" - значит вероятность марта и ночи вырастает, остальные пропорционально уменьшаются. Исходя из перечня объектов и связей с наибольшей вероятностью на текущий момент времени делаются прогнозы на новые объекты и связи и отсекаются маловероятные варианты. Т.е. если третья фраза будет "окно открылось" можно сделать ряд предсказаний по смыслу развития ситуации: человек-ночь-орут появляется новая связь "мешают спать", которая подгружает список эмоций и действий объекта "человек" и в список прогнозируемых объектов подгружается "объектX" с таким перечнем связей, который позволит устранить объект "кошки" и связь "мешают спать". И пошел новый пересчет модели ситуации.

4. создать полноценную базу данных окружающего мира, хотя бы с таким количеством объектов и связей между ними, которая доступна обычному человеку - для конкретного человека невозможно. это то же самое, что для сороконожки начать управлять каждой из своих ног. Умение создавать модель конкретной ситуации из общей картины мира и доступной базы смыслов - умение для человека нерациональное, инстинктивное и сложно алгоритмизуемое. Оно основано на ряде врожденных представлений, которые не из чего логически не выводятся, кроме собственного опыта. Например то, что все вещи падают на землю, вода мокрая, а лед скользкий. Но то, что нельзя создать из опыта конкретного человека, можно создать из объединенного опыта человечества, т.е. из культуры и науки.

5. Промежуточный вывод: смысл - это модель конкретной ситуации, состоящая из объектов и связей между ними, где связям присвоены веса вероятностей в зависимости от ранней ситуации модели и предположительные веса вероятностей по прогнозируемой ситуации модели. Т.е. конкретная ситуация - конкретный смысл в человеческом понимании - это своего рода виртуальная нейронная сеть, вычисляющая саму себя на основе общей базовой картины мира.

Среди ученых бытует мнение, что мир - это квантовый компьютер, вычисляющий сам себя. Возможно так оно и есть и при достаточно большой предыистории, предварительной истории взаимодействий - прогноз для ситуации однозначен. Т.е. если взять ситуацию, где две машины едут друг к другу на скорости 200 км/ч и расстояние 10 метров - то столкновение произойдет обязательно. То же самое касается любых объектов и любых взаимодействий между ними. Т.е. при достаточно полном моделировании ситуации, определении всех объектов, связей между ними и истории взаимодействий, и самое главное, при действующей системе проставления вероятностей - мы с точностью 90-100% можем спрогнозировать следующую итерацию системы. Когда эта точность становится равна точности человеческого мозга, мы автоматически получаем сильный ИИ.

6. Т.е. нам нужна нейронная сеть, которую прогнали и обучили на огромном количестве внутренне непротиворечивых ситуаций (в принципе возможных в этом мире) с большим количеством объектов и связей между ними, которая впоследствии научится при получении вводных данных о конкретной ситуации (объекты-связи) проставлять вероятность возникновения новых объектов и связей.

Вспоминаем, где можно найти огромное количество реально существующих объектов, реально существующих связей между ними и постоянное развитие ситуации во времени, т.е. возможность самообучения по прогнозированию ситуации. Правильно - это книги. В основном художественная литература.

7. Каким образом можно извлечь смысловые паттерны из книг и создать общую картину мира? Идти по чисто лексическому пути, выделять слова-объекты и статистически определять вероятность возникновения связей между ними - это путь, по которому мы придем к экспертным системам и семантическим сетям. Это тупик. Здесь скорее всего должны использоваться методы, используемые сейчас при нейросетевом переводе. Когда предложение на одном языке переводится в n-мерный вектор, а уже этот вектор переводится на другом языке. Кстати, наталкивался на любопытную статью - что при анализе гугловского нейросетевого переводчика разработчики определили зоны, в которых начинали кучковаться фразы, обороты и предложения на разных языках, которые, используя разные слова несут один смысл. Т.е. этот переводчик разработал внутри себя систему, позволяющую кучковать предложения, которые абсолютно различны лексически и синтаксически, но значат одно и то же. Практически речь идет о начальном этапе выделения смысла.

Как я вижу процесс обучения по книгам в идеале? Каждая книга по аналогии с предложениями при переводе преобразуется в n-мерный вектор. Из этого вектора по определенным правилам могут вычленяться вектора меньшей размерности, которые являются ответами на конкретные вопросы по книге. Вплоть до развернутого ответа на вопрос: почему герасим утопил му-му или зачем раскольников грохнул старушку.

Вначале, конечно, эти вектора-ответы будут очень маленькими, например "небо днем синее", "ночью кошки трудноразличимы" итд итп. Каждый из этих векторов будет нести конкретный смысл для конкретной ситуации. В дальнейшем, при большом наборе этих векторов запускаются соревновательные сети, формирующие из этих векторов вектора чуть большей размерности, несущие ответы на более развернутые вопросы, определяющие модель мира чуть более полно. Корректность этих векторов проверяется соответствием по всем векторам-книгам. Есть совпадения смыслов - оставляем, нет - удаляем. Пример: в какой-нибудь книге вычленяется смысловой вектор "кошки любят сырую рыбу" - проверяем его по другим векторам-книгам, все верно, оставляем в базе как проверенный мини-вектор, "кошки любят грызть кирпичи" - проверяем, фуфло, на выброс. В итоге мы получаем ситуацию, когда на любой вопрос, заданный нами (т.е. на любой входящий сигнал), система формирует сколь угодно подробный ответ в виде n-мерного вектора, ИМЕЮЩЕГО СМЫСЛ В ЧЕЛОВЕЧЕСКОМ ПОНИМАНИИ. И получаем сильный ИИ.

Жду Ваших комментариев. Возможна ли такая реализация искусственного интеллекта, может быть кто-то движется по этому пути?

Показать полностью

[моё] Искусственный интеллект Нейронные сети Смысл Машинный перевод Переводчик Длиннопост Текст

Посты не найдены

12 Далее