Gemini 3.5 Live Translate
Gemini 3.5 Live Translate
Новая аудиомодель для перевода речи в речь практически в реальном времени.
Генерирует речь непрерывно, отставая от говорящего на пару секунд. При этом модель автоматически определяет более 70 языков без ручной настройки; поддержка мультиязычного ввода работает «из коробки».
Сохраняет интонацию, темп и высоту голоса говорящего, устойчива к шуму и работает в любых акустических условиях.
Странно, что они реализовали это только сейчас, будто давно не хватало такого переводчика в реальном времени от создателей главного переводчика в мире.
Сейчас доступно превью через Gemini Live API и в Google AI Studio. Также есть на LiveKit и Pipecat.
Обновление в приложении Google Translate для Android и iOS: подключаем наушники и тестируем.
В Google Meet также внедрили.
Новая функция для Android. Режим listening mode: подносите телефон к уху, как при обычном звонке, и слышите перевод прямо через разговорный динамик. Может заменить гида на экскурсии на иностранном языке; да и в целом удобно, если нет наушников под рукой.
Google Blog
Космос! Сейчас в Турции пригодилось бы. Это миф, что тут все говорят по-русски или по-английски.
🟪 MAX ❤️ TG