Babelfish.ai — это онлайн-сервис, который позволяет в реальном времени переводить речь в текст и переводить этот текст на более чем 200 языков.
Инструмент работает прямо в браузере и использует технологию Whisper от OpenAI для распознавания речи. Благодаря интеграции с Supabase Realtime, сервис обеспечивает мгновенную трансляцию результатов на несколько подключенных устройств, что круто для совместной работы.
Например, вы ведёте международную встречу: Babelfish.ai будет транскрибировать сказанное и мгновенно переводить это на нужные языки, всё это происходит прямо в браузере без необходимости в мощных серверах или сложных настройках.
Также сервис поддерживает работу локально, это обеспечивает высокую скорость обработки и конфиденциальность данных. Установить можно с GitHub
Инструмент хорошо подходит для бизнес-команд, студентов, журналистов и всех, кому нужно быстро и точно преобразовать речь в текст и перевести его на различные языки
Хотите узнавать о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подписывайтесь на телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
дорогие и уважаемые переводчики, мы (студенты) собираемся на профессиональный праздник бухать и кушать тортик (покупной). на тортик мы хотим налепить мемчик. типа такого
1/2
вот думаю, с подписью или без...
может кто-нибудь вспомнит и накидает любимых мемчиков, а... знаю, что еще целый месяц, просто нужно еще найти где печатают на... сахаре? фиг знает. заранее спасибо
блин, в сообщество опубликовать не даëт, говорит мол я лох. надеюсь хоть кто-нибудь увидит
Для многих людей по всему миру визит к врачу может оказаться исключительно сложным из-за языкового барьера в ситуации, когда точность и способность понимать и быть понятым имеют первостепенное значение.
(Фото: Pexels)
Но четверо бывших и нынешних студентов Техниона — Израильского технологического института в Хайфе — разработали новый инструмент, который может положить конец подобным ситуациям: это платформа автоматического перевода, созданная специально для общения пациентов и их врачей.
«Это синхронный переводчик между врачами и пациентами, которые сталкиваются как с языковыми, так и с культурными трудностями», — объясняет генеральный директор CommU , доктор медицины Хадар Элиад.
«Цель CommU — предложить пациенту и врачу свободное общение», — рассказала она NoCamels.
Израиль — это плавильный котел граждан из множества стран, и хотя основным языком является иврит, более 20 процентов населения составляют арабы, а еще 15 процентов являются носителями русского языка.
Стартап был основан Хадар Элиад вместе с финансовым директором Эфрат Ордан, техническим директором Ханной Бен-Йехуда и операционным директором Эллой Файницки. Элиад и Файницки оба были студентами-медиками, в то время как Бен-Йехуда изучала информатику, а Ордан — электротехнику.
Важно отметить, что платформа CommU учитывает культурные различия, которые могут как затруднять диагностику, так и соблюдение режима лечения.
Элиад приводит пример русскоязычной пациентки, которая сообщила врачу, что у нее болит левый бок.
Элиад объясняет, что в русском языке есть специальное слово для области вокруг ребер, но на иврите оно стало более общим обозначением левой стороны. Из-за этого врач изначально не понял, что пациентка имела в виду определенную область на левой стороне тела.
Приложение можно установить на все устройства, включая смартфоны (Фото: BigStock)
Инструмент представлен в виде приложения, которое можно установить на любое устройство, используемое врачом (телефон, планшет или компьютер), и обеспечивает текстовый и голосовой перевод.
Он предназначен в первую очередь для семейных врачей и врачей отделений неотложной помощи — двух мест, где пациенты, родившиеся в иностранных государствах, чаще всего взаимодействуют с медицинским персоналом.
Все четверо начали работать над переводчиком около полутора лет назад, после того как у Элиад случился инцидент во время дежурства в онкологическом отделении, когда ее лечащему врачу пришлось сообщить пациентке, что у нее рецидив рака груди.
Пациентка говорила только по-арабски, а врач не говорил, говорит Элиад. В результате врач была вынуждена адресовать свои замечания мужу пациентки, в то время как пациентка не принимала в этом никакого участия.
«Пациентка сидела там, совершенно не участвуя в разговоре, — говорит она. — Они говорили о ее раке, а она была совершенно отключена».
Элиад спросил мужа пациентки, понимает ли его жена хоть что-нибудь из того, что обсуждается, и тот ответил, что нет, но он сможет объяснить ей это позже дома.
«Мне было больно от того, что ему пришлось сообщить эту плохую новость своей жене дома, когда это была работа врача, который также мог ответить на любые ее вопросы», — вспоминает Элиад.
Затем Элиад пригласила коллегу, для которой арабский язык является родным, для помощи в переводе.
«Внезапно пациентка стала очень заинтересованной, — говорит она, — она стала задавать вопросы о своем лечении, прогнозе и других вещах, которые она хотела знать».
Элиад обсудила этот опыт со своими соучредителями, и они решили создать платформу для решения этой проблемы.
Они создали приложение с использованием ряда различных моделей машинного обучения ИИ, чтобы максимально использовать индивидуальные преимущества различных форматов.
Для создания платформы команда использовала ряд различных моделей машинного обучения ИИ (Изображение: Pexels)
Затем четверо ученых адаптировали новую платформу к своим собственным нуждам, добавив медицинский словарь и термины.
Они активно сотрудничали с антропологами из Хайфского университета с целью включения более 100 соответствующих культурных ссылок, а также сотрудничали с Министерством здравоохранения Израиля и тремя из четырех национальных организаций по поддержанию здоровья.
Приложение поддерживает иврит, арабский, русский и английский — четыре самых распространенных языка в Израиле — а также большинство европейских языков. Они работают над добавлением большего количества языков, говорят четверо, но хотят убедиться, что перевод будет на том же высоком уровне, прежде чем сделать их доступными.
Стартап появился на свет через BizTec , программу предпринимательства Техниона, и этим летом вошел в группу 2024 года программы ускорения раннего этапа MassChallenge Israel — четырехмесячного интенсивного курса в Иерусалиме, который помогает предпринимателям развивать свои зарождающиеся компании.
Недавно команда завершила разработку приложения, сотрудничая с несколькими клиниками, которые лечат пациентов из самых разных слоев общества.
«В последний раз, когда я был в одной из клиник, — говорит Файницкий, — там было шесть пациентов из шести разных стран».
По словам Элиада, сейчас приложение находится на «захватывающей» стадии использования его первыми пользователями, включая персонал неврологического реабилитационного центра в Хайфе, и они надеются быстро расширить охват.
В конце концов, говорит она, «пациент — это самое главное».
У меня есть предположение, что́ это было в оригинале, но да, даже гугл.переводчик вряд ли выдаст такой перевод.
А вообще зацепилась взглядом и мыслью, потому что такое превращение прилагательного в несуществующее причастие рождает новые интересные смыслы. Причём это страдательное причастие, то есть на общение оказывалось словарное воздействие... 😄
А вы словарите своё общение на иностранном языке?)
Люди на 52% чаще делятся видеоконтентом, чем любым другим типом контента, а в 2024 году 89% потребителей подтвердили, что хотят видеть больше видеороликов от брендов.
Инструмент доступен через D-ID Studio или API.( Фото: D-ID )
Компании, желающие расширить свое цифровое присутствие, и начинающие создатели контента, стремящиеся охватить аудиторию по всему миру, теперь могут использовать генеративный ИИ для адаптации своих видео на разных языках.
Video Translate — это новый инструмент от израильского стартапа D-ID, который позволяет пользователям загружать видео, которые затем автоматически переводятся на несколько языков, клонируя голос говорящего и адаптируя движения его губ из одной загрузки.
«Поскольку видеоконтент становится все более важным для цифровой коммуникации, важность взаимодействия с многоязычной аудиторией никогда не была столь значительной», — сказал Джил Перри, соучредитель и генеральный директор D-ID. «D-ID Video Translate — это игра-переворот для тех, кто хочет создавать увлекательный и доступный видеоконтент для глобальной аудитории без значительных затрат, переопределяя то, как мы общаемся по всему миру».
Видео быстро стало доминирующей формой современной коммуникации, и все, от крупных предприятий до молодых независимых создателей контента, используют его для распространения своих сообщений. По данным Vidico, 91% компаний «публикуют видео, подчеркивая свою важную роль в привлечении аудитории и стимулировании роста бизнеса», а 68% маркетологов, которые еще не начали использовать видео, намерены начать в 2024 году. По данным HubSpot, люди на 52% чаще делятся видеоконтентом, чем любым другим типом контента, и в 2024 году 89% потребителей подтвердили, что хотят видеть больше видео от брендов.
Его инструмент позволяет переводить английские видео на французский, испанский, немецкий, арабский, японский, китайский и другие языки, всего 30 вариантов. D-ID присоединилась к другим компаниям, таким как Wav2lip, которая предлагает библиотеку AI для дубляжа и синхронизации губ, и другим инструментам AI-перевода, таким как ElevenLabs, Descript, Veed, Camb.ai, Speechify, Captions.ai и Akool. Он также позволяет создавать видео с использованием AI-аватаров, которые могут говорить на нескольких языках, подобно таким компаниям, как Deepbrain AI, HeyGen и другим.
CTech пригласили поэкспериментировать с платформой и увидеть весь ее потенциал. Мы записали 30-секундный клип со следующим диалогом: «Привет, ребята, это Джеймс Спиро. Я говорю с вами на совершенно другом языке, чем тот, который вы слышите прямо сейчас. Я говорю по-английски, но с помощью инструмента D-ID Video Translator я могу говорить с вами на французском, испанском, арабском и многих других языках. Он использует генеративный ИИ, чтобы преобразовывать то, что я говорю, и представлять это различным компаниям и создателям контента по всему миру. Это очень круто».
Видео было загружено в его систему, где я мог перевести его на три языка из полного списка. Я выбрал арабский, французский и немецкий, а также второе видео, переведенное на греческий, русский и испанский — странно, что не было опции иврита, которая помогла бы мне с этой историей для наших кузенов-калькалистов. После загрузки я терпеливо ждал примерно пять минут, прежде чем видео были готовы (мой доступ ограничивал переводы 30 секундами, но инструмент доступен для видео от 10 секунд до 5 минут).
Два получателя моих греческих и арабских видео сказали мне, что инструмент перевода «на 90% там» с точки зрения акцента, точности и убедительности. Читатели, говорящие по-французски, могут оценить видео самостоятельно.
Компания предлагает инструмент по комбинированной цене, начиная с бесплатной и до $108 в месяц, где доступ расширяется и удаляются водяные знаки. Она также предлагает «Премиум и Стандартных докладчиков», которые доступны в цифровом формате для чтения сценариев, если нет доступных живых актеров. Для тех, кто хочет инвестировать во что-то, что поможет им расширить охват своего сообщения, для работы, удовольствия или иного, настоятельно рекомендуется использовать такой инструмент, чтобы сделать это.
В целом, Video Translator — это забавная разработка на пути к будущему, в котором создатели хотят публиковать видео, пользователи хотят их потреблять, а аккаунты хотят расширять охват своих сообщений. Он не выглядит идеально — синхронизация губ не идеальна, и люди, которые знают мой голос, сомневаются, насколько он похож на меня, — но это убедительное начало распространения видео следующего поколения.
Video Translate доступен через D-ID Studio или API, и пользователи могут зарегистрироваться на бесплатную пробную версию на один месяц или запросить демоверсию. На сегодняшний день D-ID выпустила более 180 миллионов видеороликов от более чем 280 000 разработчиков.
Компания была основана в 2017 году и в этом году названа Calcalist 13-м самым многообещающим стартапом за свою технологию, которая помогает с «очеловечиванием ботов». Она привлекла в общей сложности 48 миллионов долларов от Pitango, OurCrowd, Macquarie, Maverick, AXA Ventures и Y Combinator.
“Если вы захотите создать аватар с использованием Джо Байдена или Дональда Трампа, вы будете заблокированы”. | CTech