16

Нейрочудеса и машинный перевод. Продолжение 1

На современном этапе


Cервис интерактивного перевода WIPO Translate (World Intellectual Property Organization, Всемирная организация интеллектуальной собственности)


Сообщение об обновлении версии появилось в сентябре 2017 г.
http://www.wipo.int/pressroom/ru/articles/2017/article_0007.html


Сервис предназначен для онлайн-перевода патентов, содержащихся в базе, которая непрерывно обновляется и содержит десятки миллионов файлов с текстами патентов на языках: (Arabic, German, Spanish, French, Korean, Japanese, Portuguese, Russian Chinese) into English and vice-versa).


Настраивается пользователем на перевод патентной информации:

- выбирается пара из множества языков

- предметная область (с загруженным в нее корпусом параллельных текстов из патентов).

https://www3.wipo.int/patentscope/translate/translate.jsf


Свежие примеры полностью автоматического перевода (без интерактивного взаимодействия и постредактирования):


Для обоих примеров выбрана предметная область: Automotive & Road Vehicle Engineering


Первый пример USA PATENT 9,784,382


A gas shut-off valve for installation in gas meters, has a valve disk that can be moved in the longitudinal direction with respect to its valve seat. The movement is realized by a linear unit held in the longitudinal direction in a valve casing, which is actuated by an electric motor via reduction gearing. The valve seat has a lip seal. The electric motor is a small DC motor. The reduction gearing and the linear unit, are installed in a panel of the valve casing. The linear unit is a rack-and-pinion gearing or a sliding-screw gearing, having an adjusting-nut element and an adjusting rod.


Газовый запорный клапан для установки в газовых счетчиков, имеет клапанный диск, который может перемещаться в продольном направлении по отношению _к его седлу_. Перемещение осуществляется с помощью линейного блока, удерживаемая в продольном направлении корпуса клапана, который приводится в действие электродвигателем через редуктор. Седло клапана имеет манжетное уплотнение. Электродвигатель _представляет собой_ небольшой двигатель Постоянного Тока. Редуктор и линейный блок, установлены в панели корпуса клапана. Линейный блок представляет собой зубчато-реечная передача или ротационно-винтовая передача, _с регулировочной гайкой элемента и регулировочный стержень.


Выводы: Вполне продвинутый перевод, и кстати, местами написано вполне по-человечьи (помечено _):


Второй пример (US20170305253) ELECTRIC CAR WITH PRE-ASSEMBLED MODULAR STRUCTURE


An electrically powered motor vehicle includes a main frame, a front axle assembly, and a rear axle assembly. The main frame includes a front frame subassembly, a floor-panel subassembly, a rear frame subassembly, and a top frame subassembly. Each of these frame subassemblies includes a lattice structure including steel box-section elements, preferably high-strength steel elements. Each of the frame subassemblies is prearranged for being pre-assembled separately and then subsequently assembled together with the other subassemblies to constitute the main frame. The structure is such as to afford high flexibility of production, and presents at the same time considerable safety characteristics, thanks to a high capacity of absorption of impact energy. In one embodiment designed for transport of goods, the motor vehicle is equipped with a transporting body having a hollow-walled body made of plastic material, filled with foamed plastic material, preferably obtained with the rotational-moulding technique.


Опция -- Статистический машинный перевод


Транспортное средство с электрическим приводом включает в себя основную раму, передний мост и задний мост. Основная рама имеет переднюю раму узла, подузел, панели пола задней рамы узла и верхнюю раму, узел. Каждый из этих узлов содержит решетчатую структуру кадра, включая стальные элементы коробчатого сечения, предпочтительно высокопрочных стальных элементов. Каждый из подузлов кадров является заранее заданным, предварительно собраны отдельно и затем собраны вместе с другими подузлами для образования основной рамы. Конструкция такова, что позволяет получить высокую гибкость производства, в то же время, и имеет значительные характеристики безопасности, благодаря высокой способности поглощения энергии удара. В одном варианте осуществления, предназначенных для транспортирования грузов, транспортное средство оборудовано транспортное тело с полыми стенками корпуса, выполненного из пластмассового материала, заполненную вспененным пластмассовым материалом, предпочтительно получают с вращательно-технологии формования.


Опция -- Нейронный машинный перевод


Транспортное средство с электроприводом включает в себя основную раму, передний осевой узел и задний осевой узел. Основная рама включает в себя передний рамный сборочный узел, подузел напольной панели, задний рамный сборочный узел и верхний рамный компоновочный узел. Каждый из этих каркасных узлов включает в себя решетчатую структуру, включающую в себя стальные коробчатые элементы, предпочтительно высокопрочные стальные элементы. Каждый из подузлов рамы предварительно собирают отдельно и затем собирают вместе с другими подузлами для формирования основной рамы. Структура такова, чтобы обеспечить высокую гибкость производства, и имеет в то же время значительные характеристики безопасности благодаря высокой емкости поглощения ударной энергии. В одном варианте осуществления для транспортировки грузов, транспортное средство оборудовано транспортным корпусом, имеющим тонкостенный корпус, выполненный из пластмассы, заполняют вспененным пластиковым материалом, предпочтительно полученным методом ротационного формования.


Выводы:

Статистический машинный перевод – больше общепринятых терминов, изложено менее гладко.

Нейронный машинный перевод – меньше общепринятых терминов, изложено более гладко.


PS Нейронная версия появилась совсем недавно. Возможно, она еще недостаточно натренирована

Найдены возможные дубликаты

0

Результат более-менее приемлемый, с учетом чудовищного количества текстов.


Однако за пределами одного предложения машина преобразовывать текст не умеет. Вот когда нейросеть научится выдавать что-то подобное:


The infrared radiation of this tank is collected by the optical system and focused on the oscillated mirror which in turn bounces the signal onto a detector array comprised of numerous tiny sensors. After the sensor signal is amplified, the electronic picture is picked up as an image by the display array. The observer perceives the visible image by viewing the picture display reflected from the back of the same mirror.


Испускаемое танком инфракрасное излучение фокусируется оптической системой на плоском качающемся зеркале, после чего попадает на матричный приёмник излучения, состоящий из множества микроскопических чувствительных элементов. Полученный сигнал, пройдя через усилитель, превращается в электронное изображение на матричном дисплее, которое после проецирования на обратную сторону качающегося зеркала превращается в видимое изображение, доступное для наблюдения.


тогда и поговорим :-)

раскрыть ветку 3
0

Инфракрасное излучение этого _резервуара_ собирается оптической системой и фокусируется на качающемся зеркале, который, в свою очередь, отклоняет сигнал на матрицу детекторов, состоящую из многочисленных крошечных датчиков. После того как сигнал датчика усиливается, электронное изображение воспринимается как изображение с помощью матрицы отображения. Наблюдатель воспринимает видимое изображение путем просмотра отображения изображения, отраженного от задней части того же зеркала.

tank: В данном случае выбрана предметная область Electrical Engineering &Electronics. Конечно, чем уже область, тем точнее перевод.
Насчет чудовищного количества текстов: да, для решения задачи автоперевода начальные условия определяются как можно точнее, и на задачу наваливаются "имеющейся массой". Так и самолет тяжелее птицы, а летает. Стоит ли копировать отдельные функции? По такому пути шли десятилетиями...

раскрыть ветку 2
0
Да, "перевод" повеселил. По грамматике очень неплохо, четверка с плюсом, все остальное оставляет желать лучшего. Собственно, что и требовалось доказать.

"Стоит ли копировать отдельные функции?" - проблема в том, что нам только и нужно, чтобы "летало", как - совершенно неважно. Сперва алгоритмами, потом статистикой, потом нейросетями, "а дустом пробовали?" - а оно все не хочет взлетать, потому что первично понимание смысла, именно отсюда "растут ноги". В лоб статистикой не взять потому, что мощность множества всех текстов заведомо превышает объем памяти и мощности любых компьютерных систем. Поэтому вы правильно отметили, что для того, чтобы подступиться к проблеме смысла, нужна база перекрестных связей, которую уже можно загнать в память компьютера (и которая пока что может формироваться только человеком, максимум - в полуавтоматическом режиме). Вот по этому пути разработчики и пойдут, если хотят чего-то добиться. Возможно, лет через 15-20 увидим машинные технические переводы, неотличимые от человеческих. С художественными текстами все намного хуже, там и человек-то не всегда справляется. Впрочем, вы обе мои статьи уже читали :-) Там, кстати говоря, из 8 градаций сложности технический перевод из примера выше идет как самый простой.

раскрыть ветку 1
0
Скоро будут переводчики как в масс эфекте
раскрыть ветку 4
0

?

раскрыть ветку 3
0
Ну там у них были импланты такие, на лету переводили даже инопланетные языки
раскрыть ветку 2
Похожие посты