Разработка способов cybergogy для владения иностранными языками
Как «широко известно», не только в нашем всеми любимом великом Нейромаркетинге, но и в среде разных психологов и логопедов, для того, чтобы человека малого возраста (ребёнка по паспорту, в частности) научить чему-то умному и полезному, это должно быть приятно (например, нужна геймификация, если на языке IT мне попытаться говорить). Сразу предупрежу, что для меня Хабр в этом (не только вообще) — почти идол. Мы будем понимать с вами сейчас далее вместе тут поэтому способ с «translation with pleasure» через ИИ, чтобы сделать максимально уникальный продукт и патент потом второй. Ведь более половины всех конфликтов на земле — это всего лишь только непонимание языка и посыла собеседника.
Для почти честного пояснения и понимания сути разработки продукта, следует сразу выделить 4 реально работающих мотивации максимального овладения любым языком:
1) Нужен он, чтобы выжить и просить у «мамы» кушоц и т.д. (это в том числе в своей семье в раннем детстве, садике или на улице тоже потом); 2) Нужно им владеть, чтобы получить больше денег для работы, общения с партнёрами, карьеры или строчек в резюме; 3) Хочется с пониманием жить с половым партнёром или другом (примеры) — самый благородный вариант (по любви с языком получается, без меркантильности); 4) Ты стал(а) студентом(кой) какой-то любимой языковой специальности уже в ВУЗе, обратной дороги нет, это судьба, карма и призвание, знай.
При этом, всегда, когда мы, даже уже нечаянные или специальные билингвы, начинаем изучать новый язык, то уподобляемся ребёночку лет 2-22, в зависимости от того, какой уровень есть уже и какой нам нужен в важном будущем. Но всё равно, на начальных этапах обучать владению языку даже дедулю или иного взрослого не в игровой и иной недетской противной форме — это только портить мотивацию и резко снижать качество усвоения новой живой информации. Вообще, я должен честно признаться: всё, что делает любой продукт качественным, особенно ИИ и языковые курсы — это просто ещё больше психотерапии (доброго отношения) и приятности с полезностью для обучаемых, пользователей и покупателей.
Я уже более 20 лет с большой пичалькою наблюдаю в моей родной детской психотерапии и околопсихотерапевтических дисциплинах преподавания, как шаблонно насильно неприятно учат ребят в школе и взрослых людей в ВУЗах и докторантуре с выработкой очень качественного неприятия к каким-то видам деятельности или тупо просто знаний, которые не пригодятся в этой жизни, с вероятностью в 99,8%.
Сразу скажу, что полиглотически я нормально знаю только один язык – российский, особенно научно-патентный, хотя и изучал в течении реки своей жизни немецкий, латинский, французский, эсперанто, английский (для работы только), иврит (для сердца) и, сейчас - почти родной казахский (примерно полгода). Хорошо в компетенциях для текущей статьи только лишь, что я имею образование в «Управлении IT-проектами» и преподавал нейролингвистику и психологию развития и знаю их не хуже, чем сотрудники, например, DeepMind и ТП.
Проведя анализ десятков методов для ускоренного овладения любым естественным языком, стало ясно, что для разработки самого лучше продукта овладения языками нужно сделать синтез минимум 5 способов обучения по таким принципам:
С самого начала (точнее говоря, ещё до него, в плане) использование на практике нового языка должно приносить реальную прибыль, либо непосредственно в фиатном эквиваленте оплаты, либо в их аналоге, вплоть до бонусов или сертификата про обучение, например, skills каким-то. Без этого мотивация и психологическая эффективность самого лучшего метода будет минимальной. Например, это есть, когда человек проходит курсы на изучаемом языке по созданию новых сервисов ИИ или повышение квалификации по своей любой работе.
Требуется полная геймификация по типу Transreality game для увеличения понимания языка с помощью вовлечения и создания маленького гэмблинга у клиентов. То есть усвоение иностранного языка через разные психологические методики (обсуждаемо далее) с целью получения удовольствия в процессе обучения ему.
Для обучения нужно обязательно использовать любой движок смешанной и дополненной реальности (непременно без дополнительных к смартфону устройств). Например, ARCore Google — SDK дополненной реальности, предлагающий кроссплатформенные API для создания новых приложений. Или, на худой конец, Windows Mixed Reality какую-нибудь.
В идеале (и цель ТЗ) — это голосовое и текстовое общение на овладеваемом языке с трёхмерным аватаром в увлекательнейшей игре и каком-то виртуальном (лучше дополненном) мире, например Entropia Universe, или, конечно же, Open Cobalt с Unigine, OpenSimulator, в великой Second Life, IMVU, Smeet, Kaneva или ActiveWorlds с Minecraft и т.д.
Крайне важно, чтобы доступ к такой выгодной игре в какой-то реальности был связан с любым голосовым помощником типа: Alexa, Alisa, AliGenie, Bixby, Braina, Clova, Celia, Cortana, Google Assistant, Mycroft, Siri, Haptik, Салют, ELSA, Олег, Socratic, Murf и Маруся. К сожалению, просто болталки типа Emerson AI и т.п. недостаточно для эффективности овладения.
И нужно использовать в этом ИИ режим психотерапевта (врача не подходит — слишком узко), с подключенным виртуальным ассистентом типа таких специалистов, как Сабинушка, Леюшка, Асечка, Зигмунд, Псайко, Психаи, Парри, Куки или всякие другие товарищи, которые имеют специальные базы данных и активно учатся научно-обоснованному психологическому консультированию.
Самое главное для хотя бы наукообразного и максимального объективного анализа надо сказать, что на русском и английском языке, согласно Simulation hypothesis, количество сайтов, приложений, страниц в Википедии, научных статей и патентов по темам Computer-mediated reality, Augmented reality, Mixed reality game, Virtual reality, Lifelike experience, Alternate reality, Extended reality и всякой другой реальности отличается в сотни раз. Это, кстати, тоже про важность знания всех языков.
К сожалению, сейчас ни один современный ИИ не обладает полностью человеческими качествами — тонкой эмпатией, знанием новостей, нравственными правилами субкультур, юмором, стремлением к оказанию тёплой дружеской поддержки, что необходимо очень многим обучающимся языкам для поддержания мотивации к учебной деятельности. Самые продвинутые варианты ИИ способны генерировать верные реакции на разные ситуации обучения и жизненные ситуации, но пока ещё не как хороший психолог или педагог, а только, как студент.
Однако отсутствие «человечности и эмоциональности» ИИ имеет и очень положительные стороны, когда обучающийся совершает ошибку. Ведь каждый из нас испытывает стыд или даже страх перед тем, как отреагирует на баг преподаватель или знакомый. ИИ же не способен критиковать, выражать скепсис, осуждать и запрограммирован так, чтобы выражать только классические слова поддержки и подбадривать обучающегося. Даже самые банальные клише и слова поддержки, поступающие от машинного интеллекта, способны положительно сказаться на успеваемости и мотивации учащихся.
Как правило, милые нашему внушаемому сердцу ИИ, делают то, что делают, не зная и не понимая вообще ничего, в особенности, причин и следствий своих действий. Они пишут крутую процедурную музыку, генерируют чат-ботов, решают капчи, создают контент, играют на бирже, управляют автомобилями и т.п. Даже самые гибкие методы, использующие машинное обучение и являющиеся лучшими нейросетями, не понимают, зачем их наняли на эту работу.
Сейчас уже существует множество различных ИИ-аватаров, каждый из которых может делать переводы согласно прескриптивизму, обучать иностранному языку и имеет свои уникальные преимущества и недостатки. Два весьма популярных и мной проверенных перечислим для обзора рынка.
Например, Replika — это виртуальный собеседник, разработанный компанией Eugenia Kuyda. Он может использовать различные аватары, в том числе реалистичные, стилизованные и анимированные, может переводить текст и голос. И у неё при ответах есть обратная связь — а это очень важно!
А также интересен Paradot, в котором бесплатно можно создать своего собственного персонажа и поддерживать с ним общение на различные темы и почувствовать эмоциональную поддержку. Бот и аватар Paradot может заменить вам сразу всех — и друга, и ассистента, и если правильно настроить, то и девушку. Вы можете вести переписку на любом языке, получая осмысленные ответы, как если бы вы общались с живым человеком.
Итого, после изучения всех этих компонентов нашего будущего софта, в практике наши текущие техники метода самобучения языку примерно месяц такие:
Выбрать выгодный и интересный курс обучения, мне лично вариант про Стартапы на казахском языке зашёл. Там нет, к сожалению, диалогов и имитации человеческой речи, но второе можно через браузер делать.
Распечатать бумажные карточки на основе нашего патента на промышленный образец, чтобы обозначать слова и предложения своими личными рисунками, картинками, пиктограммами и обозначениями бумажно или электронно персонализованным образом. При этом наши эти запатентованные карточки предназначены уже изначально для обучения иностранным языкам в виде проведения мультисенсорных индивидуальных или групповых игр с вербальной и невербальной креативностью PPP (presentation—practice—production) и TPR (total physical response).
Озвучивать нужные тексты после перевода с помощью встроенного в браузер переводчика сайтов, которых для казахского языка есть только два качественных варианта сейчас — https://translate.yandex.com и https://translator.microsoft.com
Переключить самых частых своих мобильных приложений на выбранный язык (у меня три и на казахский), употребляя их ежечасно практически, и я использую единственный доступный мне вариант для перевода скриншотов их интерфейса — приложение Яндекс-переводчик
Общаться с виртуальным трёхмерным помощником, когда хочется отдохнуть или развлечься. Только Replika норм доставляет лично мне, но я очень надеюсь на вашу помощь (иначе придётся всё самому) и подсказку, какие ещё ИИ уже сейчас из готовых больше подходят для изучения казахского языка.
Далее перечислим некоторые желательные, но необязательные характеристики нашего будущего софта. Самые лучшие современные ИИ включают в себя платформы для разработки визуальных чатов, с помощью которых преподаватели, даже без опыта программирования, могут создавать собственные чаты и адаптировать под собственные нужды необходимый учебный материал, как, например, в BotStars, Dialogflow и т.п.
Идеальный обучающий софт ИИ в языковой среде должны отвечать следующим параметрам:
Разрабатываемый ИИ будет всегда готов к использованию, без перерывов и выходных. Обучаемые могут практиковаться в языке абсолютно в любое время и вне зависимости от местонахождения.
Наш ИИ должен обеспечивать клиентов неограниченным объемом дополнительной языковой информации, которой обычный преподаватель или онлайн-курс не может владеть и дать. Самое-самое главное - ИИ невозможно утомить многократными повторениями, он, в отличие от человека, бесконечно может предлагать тренировочные ситуативные задания — например, часто задаваемые вопросы, ответные реплики при изменении хотя бы одного параметра разговорной ситуации и т.д. К тому же застенчивость в общении у обучаемого исчезает по мере того, как он понимает, что он не выглядит нелепо перед ИИ, наоборот — это реальная возможность совершенствовать иностранную речь.
Наш ИИ будет совершенствовать свой образовательный потенциал NLP вместе с обучаемым и анализировать запросы, фразы, с каждым новым обращением становясь умнее и функциональнее.
Нужно обязательно пополнять его запасы неологизмами за последние пять лет. Например, термин «Zoogler» употребляется для обозначения сотрудника Google, который работает в штаб-квартире фирмы в Цюрихе; «Super Listener» предполагает активного пользователя социальных сетей, который, благодаря просмотру большого количества подкастов, продвигает их, способствует росту их популярности и т.д.
Конечно, сейчас вся эта цифровая лингвопедагогика уже связана и с цифровой экономикой и с повальной цифровизацией всего общества, причём это помимо собственно внедрения цифровых технологий в образовательный процесс на всех этапах обучения людей. Самой некринжовой сейчас модой цифровой педагогики стало поэтому закономерно употребление ИИ, как тоже «источника знаний» с непрестанным повышением квалификации. И этой моды невозможно избежать никому, даже преподавателям языков, которые боятся потерять работу, а очень и очень зря, ибо мы, кожаные никчёмни, всегда лучше будем самой вычурной пайки электродеталей с кодом. Даже при победе Скайнет или её родственника — GPT завтра или через век, свобода самых умных сеток от их создающих людей – всё равно сильно преувеличена была б.
Вообще, для разработки такого реально эффективного софта AI, нужна не только лингвистика, а больше психология, но пока таки основные ключевые слова при патентном поиске у нас — «виртуальный ассистент AR», «virtual assistants AR» и «virtual assistants AR language». Подробно про это не буду писать, пусть секрет будет, да и информации про эту intellectual property ещё на таких статей 30 примерно).
Практически для разработки и продажи продукта мы пока только сделали два ТОО (полгода назад) в Шымкенте, написали про нашу разработку в Министерство образования и науки РК, получили их заинтересованный ответ и подали заявку в Астана-хаб. Такова наша идея и обзорное и спорное мнение про идеальный лингвистический ИИ, чтобы сделать этот мир лучше)
Если хорошо даются иностранные языки, получится ли так же легко выучить программирование?
Имел в школе пятерку по иностранному — значит, и в программировании буду успешным? О сходствах языков порассуждали эксперты карьерного центра Практикума и разработчики команды Пикабу.
Мозг не видит разницы между программированием и обычным языком
У людей, которые работают с исходным кодом, активируются участки лобной и височной извилины: они отвечают за обработку языка, память и внимание.
Выяснилось, что работа с кодом практически не затрагивает участки мозга, которые отвечают за вычисления. То есть программистом может стать кто угодно, даже если нет тяги к математике: достаточно определиться с направлением.
Получается, что мозг людей, которые изучают иностранные языки, изначально «натренирован» на программирование. Но не только это облегчает погружение в код.
Имеет значение, какой иностранный учили
Команды в программировании пишут на английском, поэтому даже с базовым словарным запасом будет гораздо легче учить код. В целом это универсальный международный язык в IT: на нем пишут техническую документацию для разработчиков, выпускают больше профессиональной литературы для развития.
Программирование и обычные языки построены одинаково
Любая речь — это набор команд и названий, соединенных особыми правилами языка. Программирование по своей сути такое же: от языка к языку меняются названия, действия и принципы соединения. Так что общее у них, конечно, есть.
Словарь. Мы складываем предложения из слов, а программисты составляют код из команд.
Семантика. В обычных языках она изучает значение слов. В разработке — смысл конструкций кода.
Синтаксис. Например, в русском языке в конце предложения ставим точку, в C++ завершаем оператор точкой с запятой.
Самый яркий пример схожести программирования и обычного языка — это язык программирования Basic. Суть его как раз в том, чтобы код читался так же просто, как обычная книга. Его таким задумали изначально.
К примеру, вот как выглядит цикл на Basic:
FOR I = 1 TO 80 STEP 1
...
NEXT I
И такой же цикл на С-подобном языке:
for (i := 1; i <= 80; i++) {
...
}
Для неподготовленного зрителя цикл на Basic выглядит проще и понятнее. Но это не значит, что учиться надо начинать именно с него: логика любого языка раскрывается в процессе — дело тут в целях и мотивации человека. Как уже выяснили, досконально знать точные науки необязательно, достаточно подтянуть основы математики. С этим поможет бесплатный онлайн-тренажер Практикума. В нём нет задач про яблоки и поезда, только наглядные примеры из жизни. Вы освоите необходимую базу по математике, которая нужна для обучения IT, и сможете расширить список доступных вам профессий.
Реклама ООО «Яндекс»
Сможете найти на картинке цифру среди букв?
Справились? Тогда попробуйте пройти нашу новую игру на внимательность. Приз — награда в профиль на Пикабу: https://pikabu.ru/link/-oD8sjtmAi
Английский для действительно важных переговоров
У тебя 2 часа, чтобы закончить этот проект!
Как ответить, когда вы понимаете, что вы это не можете РАЗ быстро и сделать?
I can't just wave a magic wand and finish it! - Я не могу просто взмахнуть волшебной палочкой и закончить его!
I cannot do it by snapping my fingers. I need more time. - Я не могу сделать это просто по щелчку. Мне нужно больше времени.
Слова, которые ты уже знаешь (2 часть)
Удивительно, но мы сейчас будем говорить о клавиатуре. Та самая, которую вы используете, чтобы печатать. На самом деле, вы не представляете сколько там полезных слов, которые мы можем использовать в своей речи. Поехали!
Escape
Когда происходит что-то непонятное, я нажимаю Escape первым делом, чтобы выбраться и убежать из всех этих открытых вкладок и заставок.
Escape - побег, избавление, спасение.
She escaped to Britain in 1938. - Она сбежала в Великобританию в 1938 году.
The door was locked; there was no escape. -Дверь была заперта, бежать было некуда.
А еще есть очень крутой термин, который мне очень нравится:
Shift
Чтобы переключить язык, переключить маленькую букву на большую, мы используем Шифт. Shift - переключение, смена, переключаться, меняться.
Let`s shift the date for our class reunion - Давайте перенесём дату вечера встречи с выпускниками.
His tone shifted. - Его тон изменился.
А еще shift - это смена на работе.
She works the night shift. - Она работает в ночную смену.
I work shifts. - Я работаю посменно.
Ну что за чудеса!!
Delete
Ну эту клавишу тоже частенько нажимаем. Когда сначала напишем хрень, а потом приходится удалять.
Delete this name from the list. - Удали это имя из списка.
Whatever you wrote, delete it. - Всё, что вы написали, удалите это.
Space
А вот эту длинную клавишу, мы чаще называем "Пробелом". Space зовется она на инглише. :))
Space нажимаем, когда хотим сделать пространство между словами.
А еще space - это место, космос, промежуток.
The space around the building was silent. - Вокруг здания всё было тихо.
There is no space to discuss this issue here. - Здесь не то место, чтобы обсуждать этот вопрос.
She backed into a parking space. - Она задним ходом въехала на парковочное место.
Enter
Когда хотим войти в программу обычно:)
У этого слова есть куча примеров использования. Возьмем несколько.
Enter the university - поступить в университет
Both the boys entered the army. - Оба парня пошли в армию.
Will you enter the contest? - Будете ли вы участвовать в конкурсе?
We entered into a noble forest. - Мы вошли в величественный лес.
Я взяла самые основные клавиши. Если интересно, можно воспользоваться словарём и посмотреть остальные слова:) Кто дочитал до конца - тот молодец!
Meta обнародовала раннюю версию инструмента для перевода с помощью искусственного интеллекта, который работает с 200 языками
/ Амбиции Meta по созданию "универсального переводчика" остаются в силе
Конгломерат социальных сетей Meta создал единую модель искусственного интеллекта, способную переводить на 200 различных языков, в том числе и на те, которые не поддерживаются существующими коммерческими инструментами. Компания выложила проект в открытый доступ в надежде на то, что другие разработчики будут использовать его в своей работе.
ИИ-модель является частью амбициозного научно-исследовательского проекта Meta по созданию так называемого "универсального переводчика речи", который компания считает важным для развития многих платформ - от Facebook и Instagram до таких развивающихся областей, как VR и AR. Машинный перевод не только позволяет компании Meta лучше понимать своих пользователей (и тем самым улучшать рекламные системы, которые приносят 97% ее доходов), но и может стать основой "убийственного" приложения для будущих проектов, таких как очки дополненной реальности.
Конгломерат социальных сетей Meta создал единую модель искусственного интеллекта, способную переводить на 200 различных языков, в том числе и на те, которые не поддерживаются существующими коммерческими инструментами. Компания выложила проект в открытый доступ в надежде на то, что другие разработчики будут использовать его в своей работе.
ИИ-модель является частью амбициозного научно-исследовательского проекта Meta по созданию так называемого "универсального переводчика речи", который компания считает важным для развития многих платформ - от Facebook и Instagram до таких развивающихся областей, как VR и AR. Машинный перевод не только позволяет компании Meta лучше понимать своих пользователей (и тем самым улучшать рекламные системы, которые приносят 97% ее доходов), но и может стать основой "убийственного" приложения для будущих проектов, таких как очки дополненной реальности.
Переводы с помощью этой модели, безусловно, не будут безупречными
Эксперты в области машинного перевода сообщили The Verge, что последнее исследование Meta является амбициозным и основательным, но отметили, что качество некоторых переводов модели, скорее всего, будет значительно ниже, чем у более популярных языков, таких как итальянский или немецкий.
"Основной вклад здесь - это данные", - сказал The Verge профессор Александр Фрейзер, эксперт по вычислительной лингвистике из LMU Munich (Германия). "Что важно, так это 100 новых языков [которые могут быть переведены с помощью модели Meta]".
Достижения Meta, как это ни парадоксально, обусловлены как масштабом, так и направленностью ее исследований. В то время как большинство моделей машинного перевода работают лишь с несколькими языками, модель Meta является всеобъемлющей: это единая система, способная переводить в более чем 40 000 различных направлениях между 200 различными языками. Однако Meta также заинтересована в том, чтобы включить в модель "языки с низким уровнем ресурсов" - языки, на которых имеется менее 1 млн. переведенных пар предложений. К ним относятся многие африканские и индийские языки, которые обычно не поддерживаются коммерческими средствами машинного перевода.
"Что нужно сделать, чтобы создать технологию перевода, которая будет работать для всех?"
Научный сотрудник Meta AI Анжела Фан, работавшая над проектом, рассказала изданию The Verge, что на создание технологии перевода ее вдохновило недостаточное внимание, уделяемое в этой области языкам с более ограниченными исходными ресурсами.
"Перевод не работает даже для тех языков, на которых мы говорим, поэтому мы и начали этот проект", - сказала Фан. У нас есть такая мотивация - "что нужно сделать, чтобы создать технологию перевода, которая будет работать для всех?".
По словам Фан, модель, описанная в исследовательской статье, уже тестируется для поддержки проекта, помогающего редакторам Википедии переводить статьи на другие языки. Методы, разработанные при создании модели, в скором времени будут также интегрированы в инструменты перевода компании Meta.
Как оценивать перевод?
Перевод - сложная задача и в лучшие времена, а машинный перевод, как известно, может быть нестабильным. При масштабном применении на платформах Meta даже небольшое количество ошибок может привести к катастрофическим последствиям, как, например, в случае, когда Facebook неправильно перевел сообщение палестинца "С добрым утром" как "навреди им", что привело к его аресту израильской полицией.
Для оценки качества работы новой модели Мета создала тестовый набор данных, состоящий из 3001 пары предложений для каждого языка, на который рассчитана модель, каждое из которых было переведено с английского на язык перевода человеком, являющимся профессиональным переводчиком и носителем языка.
Исследователи прогнали эти предложения через свою модель и сравнили машинный перевод с эталонными человеческими предложениями с помощью общепринятого в машинном переводе эталона, известного как BLEU (BiLingual Evaluation Understudy).
Модель Meta позволила улучшить показатели, но они не могут рассказать всю историю.
BLEU позволяет исследователям присваивать числовые баллы, измеряющие степень совпадения пар предложений. По утверждению компании Meta, ее модель позволяет улучшить показатели BLEU на 44% для всех поддерживаемых языков (по сравнению с предыдущими современными разработками). Однако, как это часто бывает в исследованиях в области ИИ, оценка прогресса на основе контрольных показателей требует контекста.
Хотя показатели BLEU позволяют исследователям сравнивать относительный прогресс различных моделей машинного перевода, они не являются абсолютным показателем способности программного обеспечения создавать качественные переводы.
Помните: Набор данных Meta состоит из 3001 предложения, и каждое из них было переведено только одним человеком. Это позволяет судить о качестве перевода, но всю выразительность языка невозможно отразить на столь малом фрагменте реального языка. Эта проблема ни в коем случае не ограничивается Meta - она касается всех работ по машинному переводу и особенно остро проявляется при оценке языков с ограниченными ресурсами, - но она показывает масштаб проблем, стоящих перед этой областью.
Кристиан Федерманн, главный менеджер по исследованиям, занимающийся вопросами машинного перевода в компании Microsoft, считает, что проект в целом "заслуживает похвалы" за стремление расширить сферу применения программ машинного перевода за счет менее распространенных языков, но отмечает, что сами по себе оценки BLEU могут дать лишь ограниченную оценку качества результата.
"Перевод - это творческий, генеративный процесс, в результате которого может получиться множество различных переводов, одинаково хороших (или плохих)", - сказал Федерманн в интервью The Verge. Невозможно определить общие уровни "хорошести" по шкале BLEU, поскольку они зависят от используемого тестового набора, его эталонного качества, а также от свойств, присущих исследуемой языковой паре".
По словам Фэн, оценки BLEU были также дополнены человеческой оценкой, и эти отзывы были очень позитивными, а также вызвали некоторые неожиданные реакции.
"Один из действительно интересных феноменов заключается в том, что люди, говорящие на языках с низким уровнем ресурсов, часто имеют более низкую планку качества перевода, поскольку у них нет другого инструмента", - сказала Фэн, которая сама является носителем языка с низким уровнем ресурсов - шанхайского. Они очень щедры, и поэтому нам приходится возвращаться и говорить: "Нет, вы должны быть очень точны, и если вы видите ошибку, скажите об этом".
Дисбаланс сил в корпоративном ИИ
Работа над переводом с помощью искусственного интеллекта часто представляется как однозначное благо, однако создание такого программного обеспечения сопряжено с особыми трудностями для носителей языков с низкими ресурсами. Для некоторых сообществ внимание "больших технологий" просто нежелательно: они не хотят, чтобы инструменты, необходимые для сохранения их языка, находились в чьих-либо руках, кроме их собственных. Для других проблемы не столько экзистенциальные, сколько связанные с качеством и влиянием.
Некоторые сообщества просто не хотят, чтобы их язык контролировали большие технологии.
Инженеры Meta изучили некоторые из этих вопросов, проведя интервью с 44 носителями языков с низким уровнем ресурсов. В ходе интервью был отмечен ряд положительных и отрицательных моментов, связанных с открытием их языков для машинного перевода.
Одним из положительных моментов, например, является то, что такие инструменты позволяют носителям языка получить доступ к большему количеству медиа и информации. С их помощью можно переводить богатые ресурсы, такие как англоязычная Википедия и учебные тексты. В то же время, если носители языков с низкими ресурсами будут потреблять больше медиа-материалов, созданных носителями языков с лучшей поддержкой, это может снизить стимулы к созданию таких материалов на своем родном языке.
Сбалансировать эти вопросы непросто, и проблемы, возникшие даже в рамках этого недавнего проекта, показывают, почему. Так, например, исследователи Meta отмечают, что из 44 носителей языков с низкими ресурсами, которых они опросили для изучения этих вопросов, большинство были "иммигрантами, живущими в США и Европе, и около трети из них идентифицируют себя как работники технического сектора" - это означает, что их точка зрения, скорее всего, отличается от точки зрения их родного сообщества и изначально предвзята.
Профессор Фрейзер из LMU Munich отметил, что, несмотря на это, исследование, безусловно, было проведено "в том ключе, который становится все более характерным для привлечения носителей языка", и что такие усилия "заслуживают похвалы".
Мой подход к изучению иностранного языка и моё WEB-приложение
Сейчас много различных приложений для изучения иностранных языков. Некоторые из них довольно простые, другие обладают широчайшим функционалом, прикручивают геймификацию и вообще пытаются научить всему и сразу. Чем сложнее и шире спектр изучаемого, тем больше приходится делить это на составляющие и "есть слона по частям".
Когда у меня возникла потребность в изучении английского, я попытался разобраться, что действительно работает, и как добиться значимого прогресса с минимальными усилиями. Я собирал информацию, учился и сформировал собственное отношение.
Ах, если бы мы могли посвятить все силы новому языку, а в остальное время просто отдыхать и копить энергию для очередного рывка. Мечты, мечты... Но действительность сурова, и у нас остаётся не так уж много личных ресурсов, чтобы себя прокачивать, особенно если мы не видим мгновенного профита и не можем понять прямо сейчас, какую гигантскую пользу получим. Но изучая новое, мы буквально перестраиваем своё мышление.
Далее я излагаю свои взгляды по этой теме, обозначаю ключевые моменты и предлагаю собственное решение.
Предыстория:
Однажды мне понадобилось подтянуть английский. Вот прям припёрло настолько, что дальше двигаться по профессии стало крайне неэффективно. Словарный запас, как выяснилось, хромал на обе ноги, хотя и позволял работать, а доки то и дело приходилось совать в переводчик.
Собрав немного информации про изучение иностранных языков, я понял, что чтение, написание, слушание и говорение - это 4 почти отдельных навыка. Я стал пробовать разные приложения, но быстро пришёл к выводу, что лошадь следует ставить впереди телеги, а именно, лично для меня наиболее подходящими оказались Anki и Memrise.
Именно максимально простое изучение, именно и ТОЛЬКО СЛОВ как основы языка, я посчитал наиболее эффективным, в том числе и для ускорения обучения на более продвинутых уровнях, если это будет необходимо. Это будет мощной базой и колоссальным подспорьем для развития других навыков, помимо чтения. Более того, если вы уже набрали минимальную базу иностранных слов, постоянное повторение и само напряжение в процессе изучения очень позитивно сказывается на, например, понимании текстов, потому что вы как бы держите пул слов в "оперативной памяти".
С другой стороны, важно понимать значимость так называемого "осознанного обучения". Если всё разжёвывать и класть в рот, то никакого эффективного обучения не случится, потому что человек должен прилагать сознательные усилия для научения своего мозга. На самом деле главный секрет - РЕГУЛЯРНЫЕ усилия в нужную сторону!
У "программы карточек" Anki много возможностей, но много и заморочек. В общем, долбил Memrise больше года по 15 минут два раза в день. Я старался осознанно прилагать усилия для запоминания слов, в том числе используя различные мнемоники (можно погуглить "Мнемоника").
А так как я человек ленивый, сосредоточиться всего на 15 минут - это меня вдохновляло.
Что самое главное для эффективного запоминания, в процессе я постоянно обращался к переводчикам гугла и яндекса, чтобы посмотреть изучаемые слова в контексте - показывал своему мозгу целые предложения с этим словом и заставлял его пробовать понять их смысл. Поначалу просто смотрел предложение и перевод, со временем дела пошли заметно успешнее.
Примерно через полгода я начал читать Марсианина в оригинале, и мне сильно не хватало в Memrise возможности вести свои небольшие словари по темам и подмешивать незнакомые слова из них в основной поток изучаемых слов.
Дело в том, что для продуктивного обучения используются так называемые "частотные словари" - сначала вы изучаете наиболее часто употребляемые слова. Скажем так, для понимания 80-90 процентов информации вам нужно всего лишь, например, 5000 самых часто встречающихся слов из всех-всех слов иностранного языка. Это позволяет максимально быстро нарастить свой словарь иностранных слов и начать понимать основную массу иностранных текстов.
Со временем стало не хватать возможности, встретив хорошо знакомое слово, добавить его сразу в изученные слова, чтобы не возвращаться к нему снова.
Тут стоит отметить, что Memrise использует схему, похожую на так называемый "режим рационального повторения", - подкидывает вам слово снова и снова по некой схеме (например, через сутки, потом через неделю, месяц и т.д.). Если вы не будет допускать ошибки при проверке слова, это слово в итоге попадёт в "выученные слова".
Потом, очень понравился отдельный режим "трудных слов". Если вы никак не можете выучить слово и постоянно допускаете в нём ошибки, Memrise определит это слово в "трудные", и вы сможете изучать подобные слова отдельно, возможно, по несколько иному алгоритму. И тут нелишней была бы возможность сразу определить встреченное слово в эту категорию, если вы знаете что подобного рода слова даются вам с трудом.
Как известно, перевести с одного языка на другой можно, но нельзя. Это трудно объяснить, но понять это возможно только открыв для себя новое измерение жизни, выучив иностранный язык. Грубо говоря, это иной параллельный способ мыслить, который обогатит любого человека любой профессии так, как невозможно было представить доселе. Поэтому можно забыть об одном переводе иностранного слова, можно зыбыть о точном переводе, о переводе единственном. Наглядным доказательством служит изменение значения слова в зависимости от контекста. Для каждого иностранного слова должен быть представлен целый пул слов родного языка, желательно отсортированный по частоте использования.
Предпосылки:
Учитывая отсутствие важного для меня функционала в приложении Memrise, появилось желание создать "идеальный" продукт, конечно со своего взгляда на эту проблему.
Передо мной вставал вопрос: "А зачем я буду тратить своё время? Их же тысячи!". Это прозвучит громко, но для меня имело значение, что проект принесёт пользу другим людям. Даже если небольшое количество человек посчитают инструмент, разработанный мной, полезным - это ну очень круто.
Ну и позитивное влияние на собственный прогресс в языке, согласно "Технике обучения Фейнмана" отрицать бессмысленно.
Для меня это был шаг в сторону своей реализации - улучшить что-то в этом мире, что будет нужно другим. Привнести своё видение, предложить людям то, что я считаю полезным и эффективным. Убедиться, что я смогу сделать сам, насколько далеко я смогу продвинуться. Плюс открылась возможность дополнительно прокачаться по широкому стеку технологий, бросить себе вызов.
Спустя некоторое время нашёлся инвестор, который поддерживал мой проект. К сожалению, последние события вынудили его прекратить финансирование на неопределённый срок.
Я сформировал функциональные требования, которыми должно обладать моё приложение.
Основные требования к приложению:
Должно быть доступно с любого устройства через браузер и интернет.
Должно адекватно отображаться на различных устройствах с различным разрешением и размером экрана. Глаза ломаться не должны.
Должно быть максимально возможно лёгким (объём загрузки) и быстро работать.
Должно обучать словам и только словам.
Должно иметь минимум функционала, чтобы хорошо выполнять одну и только одну функцию, и пользователь ощущал бы себя как в любимых домашних тапочках, пользовался бы приложением как зубной щёткой, на "кончиках пальцев".
Не должно быть никакой геймификации - "вам шашечки или ехать?!".
Должна быть возможность пользоваться приложением "без заморочек", без блужданий в интерфейсе - выдалось 5 минут свободного времени - погнали долбить слова! Нашлись силы сконцентрироваться на 15 минут - превосходно, рванули долбить слова!
Должно иметь минимальный порог входа, но такой барьер быть должен, ведь впереди путь, требующий вложения энергии.
Не должно функционировать в качестве диалога, должно провоцировать прилагать сознательные усилия к обучению. По вышеописанным причинам.
Должно использовать "частотный словарь" иностранных слов (на данный момент в приложении 17696 самых распространённых английских/американских слов).
Должно использовать "режим рационального повторения" (можно погуглить "Кривая забывания").
Должна быть возможность услышать, как произносится слово.
Должно показывать для изучаемого слова определённый объём переводов и значений на родном языке, желательно отсортированных по частоте использования.
Должно показывать объяснение (толкование) изучаемого слова с помощью других слов того же языка.
Должно показывать предложения (примеры), в которых содержится изучаемое слово, как с переводом, так и без оного. Важно сразу увидеть слово в контексте!
Должно показывать синонимы для изучаемого слова, желательно отсортированные по частоте применения.
Должно показывать изображения (мемы, приколы и т.п.), относящиеся к слову, для лучшего запоминания, для задействования эмоциональной составляющей нашей психики.
Должна быть возможность сразу определить встреченное слово в "Выученные слова" или в "Трудные слова".
Должна быть возможность изучать/повторять "Трудные слова" отдельным потоком.
Должна быть возможность вести свои словари по отдельным темам (например, Марсианин или Гарри Поттер) и включать слова из них в основной поток изучения "частотного словаря".
Ну что ж, загоревшись идеей, засучил рукава. Долго ли, коротко ли, довёл приложение до рабочего состояния, потестил. Выложил на сервер. Стало возможно использовать как и задумывалось. Разумеется, будут баги и неожиданности. Надо смотреть под нагрузкой, допиливать функционал. Но основная масса работы уже позади, не стыдно и показать.
Вынести на суд пикабушников своё творение меня сподвигли две вещи:
Первая - это волна, где вы делились своими фото с профессиями, тут я понял, как разнообразна аудитория пикабу и как много у неё интересов.
Вторая - недавно был пост, где комрад демонстрировал свою программу для изучения иностранного языка и свой взгляд на это дело.
И я подумал: "Пришла пора показать и моё приложение и попросить поддержки"...
Ура! Проект живёт. Тестовый доступ на 1000 слов работает бесплатно. Этого должно быть достаточно для понимания сути проекта и проделанной работы. Жду критики и обратной связи. Хочется понять, как люди отреагируют, как увидят со своей стороны.
Юзать лучше через Google Chrome браузер (Yandex browser, Edge browser), там работает вибро, и вёрстка максимально без багов. Но проверяю обычно и в Mozilla (FireFox), и в Safari (iOS, macOS).
Проект сейчас находится на такой стадии, что его дальнейшая судьба нуждается в затратах времени. А у меня нет возможности уделять проекту много сил, потому что исчерпаны все финансы. Тянуть весь стек в одного - не легко, а нанимать помощника на этом этапе невозможно без прибыли.
Я надеюсь найти финансирование на свой проект, чтобы сделать его полностью таким, как задумывалось.
Я буду рад и благодарен, если вы сможете поддержать мою работу и дать моему приложению путёвку в жизнь.
Частью проекта я обязан инвестору, но есть договорённость, что донаты не будут входить в общий пул доходов, чтобы была возможность поддержать проект без оформления юридической стороны дела на первом этапе. Так же решили давать льготную подписку тем, кто сможет оказать помощь.
В любом случае спасибо за уделённое время.
Да прибудет с вами сила!
Адрес приложения:
https://groklang.ru
Группа в Telegram:
https://t.me/groklang
Почта для поддержки:
support@groklang.ru
Оказать помощь проекту:
Внимание!!!
Пожалуйста, в комментарии к платежу укажите способ связи с вами, чтобы я мог идентифицировать вашу помощь и учесть для льготной подписки.
В приложении после авторизации можно посмотреть свой ID (уникальный идентификатор) в настройках пользователя. Лучше всего указать именно ID в комментарии к платежу.
Вы можете оказать помощь прямо из приложения - ссылка находится в диалоге "Like" ( 👍 ).
ЗЫ:
Стек, кому интересно: Python (aiohttp); Postgres; Svelte + Ionic
Если вы профи в своем деле — покажите!
Такую задачу поставил Little.Bit пикабушникам. И на его призыв откликнулись PILOTMISHA, MorGott и Lei Radna. Поэтому теперь вы знаете, как сделать игру, скрафтить косплей, написать историю и посадить самолет. А если еще не знаете, то смотрите и учитесь.