Перевод текстов с помощью нейросети - есть ли подвох?
Нейросети уже умеют переводить тексты с высокой точностью. Их широко применяют в таких сервисах, как Google Translate, Deepl и Яндекс Переводчик. Теперь это можно делать в чат-ботах типа ChatGPT. Я покажу, насколько успешно справляется с переводами модель от OpenAI по сравнению с онлайн-переводчиками. Примечание: Для доступа к новейшей версии GPT-4 использовал чат MashaGPT.
Возьмем фрагмент из научно-популярной статьи и пропустим через переводчики.
Google Translate:
Кроме того, за исключением легчайших кварков (верхний и нижний, плюс анти-верх и анти-низ) и легчайшего заряженного лептона (электрон плюс позитрон), все остальные заряженные частицы Стандартной модели неустойчивы по отношению к радиоактивные (слабые) распады. По мере того как часы после начала горячего Большого взрыва продолжают отсчитывать время, пикосекунды превращаются в наносекунды, а наносекунды складываются в микросекунды. По мере продолжения этого процесса более тяжелые частицы перестают создаваться и медленно исчезают из нашей Вселенной.
Топ-кварки исчезли, как только нарушилась электрослабая симметрия, и распались всего за йоктосекунды. Следующими исчезают нижние/анти-донные кварки, за ними следуют тау- и антитау-лептоны. После этого уходят очаровательные/античармовые кварки, а за ними следуют странные/антистранные кварки. Примерно через 100 наносекунд среди массивных частиц остаются только верхние и нижние кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, а также нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны все еще сохраняются и в это время.
DeepL:
Кроме того, все остальные заряженные частицы Стандартной модели, за исключением самых легких кварков (вверх и вниз, плюс анти-кварк и анти-кварк) и самого легкого заряженного лептона (электрон, плюс позитрон), неустойчивы к радиоактивным (слабым) распадам. По мере того как часы после начала горячего Большого взрыва продолжают тикать, пикосекунды превращаются в наносекунды, а наносекунды - в микросекунды. По мере того как этот процесс продолжается, более тяжелые частицы перестают создаваться и постепенно исчезают из нашей Вселенной.
Верхние кварки исчезли сразу же после нарушения электрослабой симметрии, распавшись всего за йоктосекунды. Следующими исчезают нижние/антинижние кварки, затем лептоны тау и антитау. После этого исчезают кварки очарования/античармы, а затем странные/антистранные кварки. По прошествии, возможно, 100 наносекунд из массивных частиц остаются только восходящие и нисходящие кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны также продолжают существовать в это время.
Яндекс Переводчик:
Кроме того, за исключением самых легких кварков (верхний и нижний, плюс анти-верхний и анти-нижний) и самого легкого заряженного лептона (электрон плюс позитрон), все остальные заряженные частицы Стандартной модели нестабильны по отношению к радиоактивным (слабым) распадам. По мере того, как часы после начала горячего Большого взрыва продолжают отсчитывать время, пикосекунды превращаются в наносекунды, а наносекунды складываются в микросекунды. По мере продолжения этого процесса более тяжелые частицы перестают создаваться и медленно исчезают из нашей Вселенной.
Верхние кварки исчезли, как только нарушилась электрослабая симметрия, распавшись всего за йоктосекунды. Нижние/антидонные кварки исчезают следующими, за ними следуют лептоны тау и антитау. После этого уходят кварки очарования/антихарма, за которыми следуют странные/антистранные кварки. По прошествии, возможно, 100 наносекунд среди массивных частиц остаются только восходящие и нисходящие кварки (и антикварки), электроны и позитроны, мюоны и антимюоны, а также нейтрино и антинейтрино. И да, фотоны, глюоны и гравитационные волны все еще сохраняются и в это время.
MashaGPT:
Все переводы приемлемы, но требуют обязательной редакторской доработки. К примеру, ни один сервис не назвал правильно специальный физический термин “очарованные кварки”.
В отличие от онлайн-сервисов в GPT можно настраивать запросы для перевода. Укажем, что нужно учитывать специальную терминологию:
В новом переводе значительно лучше прописана терминология из физики элементарных частиц, хотя остались и косяки (“чарм/анти-чарм”).
Перевод можно сделать более творческим. Например, облегчить синтаксис для восприятия текста:
Для лучшего перевода я использую промт:
Ты выступаешь в роли переводчика, корректора и редактора. Переведи текст с английского языка, улучшив до литературного варианта, на русский язык. Убедись, что перевод грамматически и семантически правильный. Сохрани первоначальный смысл текста. Напиши только исправления, улучшения и ничего более, не пиши подробных пояснений. Текст [ ].
Короче говоря, онлайн-сервисы по умолчанию справляются с переводом лучше нейросети. Но если настроить промты, то нейросеть улучшит результаты за счет того, что она умеет еще и редактировать свой перевод. Это повышает семантическую точность в передаче смысла предложений. А еще в чат-боте можно менять тональность и стиль перевода.