Тернистый путь к нейросетям
Некоторое время назад я увлёкся нейросетями. Начиналось всё с попыток запуска готовых моделей на локальном железе и эксплуатированием для своих простых проектов а-ля телеграм бот или голосовой помощник со встроенной нейросетью. Спустя время я с этим наигрался и захотел попробовать создавать, а не созерцать. Тогда я пошёл изучать теорию для работы. Изучив теорию решил выбрать для себя инструмент и цель. Как инструмент мне больше подошёл pytorch. А как цель поставил себе сделать нейросеть-переводчик. И вот на моменте реализации у меня возникли проблемы: как вводить изображения(будь то фото для классификации или цветной шум для генерации фото) в интернете написано, а вот как вводить текст или хотя бы последовательность битов я найти не смог(да-да не смог, можно уже начинать кидать в меня помидорами и ссылками, за ссылки буду благодарить, а из помидоров сделаю томатную пасту); как выводить картинку или пару нейронов классификатора в интернете описали, в некоторых местах даже описали нейросети продолжающие текст на основе какого-либо книжного произведения, но как выводить сразу текст, а не вытягивать посимвольную информацию я не нашёл(да, опять); ну и под конец я не нашёл как разбивать свой датасет для нейросетей генерирующих что-либо не из рандомных чисел.
Если у кто-то знает как реализовать что-либо из вышеперечисленного, поделитесь пожалуйста знаниями, ссылками на гайды и помидорами в комментариях. Заранее спасибо!
Перевод презентации Nvidia Dell Technologies World 2024
💥 Новые технологии Nvidia и Dell, новый ИИ
⬇️Ссылка на перевод⬇️
Перевод видео на любой язык с сохранением голоса
В рядах нейродубляжа и видеопереводчиков пополнение.
BlipCut AI — переводит видео почти на все языки мира (в арсенале 35 языков) с охранением голоса на видео. Есть русский язык. Дублирует голоса очень натурально, похоже на Elevenlabs
Кстати, вам возможно будет интересно про Elevenlabs:
Так же, разработчики анонсировали новое улучшение - синхронизация губ. Да не просто липсинк как у цифровых аватаров, а прям идеальное попадание движения губ как у живого человека.
Кстати, пока такая функция есть у HeyGen
Возможно, вам будет интересно прочитать про HeyGen:
Кстати, я так же сравнила ElevenLabs и HeyGen - Сравнение ElevenLabs и HeyGen , чтобы вы могли выбрать сами
Что ж, перевод и дубляж видео на разные языки это очень хороший способ масштабировать личный бренд, YouTube и другие соц сети, контент, свои услуги.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? В своем телеграм канале НейроProfit, я рассказываю, как можно использовать нейросети для бизнеса.
Маковое поле / Сохраб Сепехри
images inspired by the poem without any text
Жизнь не пуста...
У нас есть доброта, у нас есть яблоко, у нас есть вера...
Да! жить нужно, пока цветут маки...
"Маковое поле..." (авт. Сохраб Сепехри, перевод с перс. языка)
Нейросеть - переводчик в реальном времени
Если вам вдруг срочно понадобился переводчик на переговорах, в кабинете юриста, врача в зарубежной стране и для прочих обстоятельств, есть нейросеть, которая переводит в live-режиме.
Anytalk - онлайн-переводчик с искусственным интеллектом, который работает в режиме реального времени
Легко подойдет для переводов стримов, онлайн-трансляций, лекций
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Трудности перевода
Никогда еще моё переводческое сердце не заходилось так сильно, как в последнее время, когда перспектива потерять профессию разливается кровавыми огнями заката под натиском искусственного интеллекта.
Не успели мы, преданные псы Иеронима, слететь с ног в 2022-м и, долго и мучительно отдыхиваясь, крутить по канувшему в бездну рынку головой, не веря смоим глазам, понять, что да, больше работы не будет, как теперь пришла новая смена. AI теперь пишет дипломные работы студентам, отвечает на вопросы школьникам, переводит прозу и стихи за считанные секунды. Наступило время кошмаров, прозорливо предсказанных экшнами 90-х.
Удивительно, что ВУЗам еще выделяют бюджетные места на переводческие отделения, еще более удивительно, что на эту профессию еще кто-то поступает. На что-то ведь они надеются, хочется верить, что не все абитуриенты туда приходят просто "ну потому что что куда ж еще, я совсем не определился, посижу пока тут". Страшно мне и горько, потому что я долго на это училась сама и долго вкладывала азы в подрастающее поколение...
Неужели не одухотворить нам больше ничьих страниц воспоминаний, не расшифровать на спор жутких договорных сокращений и не разложить по секундам субтитров...Так же, наверное, обидно было ненужным этой меняющейся планете тяжелым динозаврам. Эхехе- вздыхали они поди, пафосно восклицая: а точно лучше нас переведут? Ничего не упустят? А в Африку тоже поедут? Прямо в каске на стройку? Ну хоть сурдо-динозавры-то останутся?? (Недавно сходили на концерт симфонической музыки...со сцены работал переводчик, показывая на руках жестами события в сказке, по которой через минуту прозвучит музыка...Она очень старалась, я пришла в восхищение от ее экспрессии! А потом представила себя на месте глухих детей...Вот они посмотрели на нее, а потом оркестр начал играть...а они сидеть в тишине...какую музыку они сейчас себе представляют в голове по мотивам ее жестикуляции, интересно...)
Как же тоскливо смотреть на этот закат...И тот факт, что намечающиеся тенденции наверняка не пощадят представителей других профессий, меня лично не очень утешает.
Я так ни разу и не попробовала AI, ни в какой роли.. А вы?
Екатерина Ноури, переводчик, преподаватель
Подборка нейросетей для работы с текстом
CopyMonkey – нейросеть для обработки текста с удобным интерфейсом, поддерживает русский язык.
DeepL – лучший нейросетевой переводчик
aiSEO – инструменты для копирайта и SEO-оптимизации, работа с текстом, видео и изображениями.
GrammarChecker – проверит и поправит грамматику.
WhatLetter – проанализирует текст на фото, расшифрует, дополнит.
SmartWriter – генератор текстов для широкой аудитории с удержанием охвата и оптимизацией.
Gerwin AI – напишет хороший текст, в том числе рекламный
ChatD – для общения с файлами как с человеком.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.