
AgeOfIT
Утилита для создания субтитров
VideoLingo — Python утилита с открытым исходным кодом для создания субтитров.
Позволяет загружать видео с YouTube, поддерживает русский язык, устраняет жесткие машинные переводы и многострочные субтитры, добавляя высококачественный дубляж стирая языковые барьеры.
Основные функции:
💬 Загрузка видео YouTube через yt-dlp;
💬 Распознавание субтитров на уровне слов с помощью WhisperX;
💬 Сегментация субтитров на основе NLP и GPT;
💬 Терминология, сгенерированная GPT, для связного перевода;
💬 Двухэтапный процесс перевода, не уступающий профессиональному качеству;
💬 Только однострочные субтитры стандарта Netflix;
💬 Выравнивание дубляжа;
💬 Запуск и вывод одним кликом в Streamlit;
💬 Комплексная многоязыковая поддержка;
💬 Только однострочные субтитры, превосходное качество перевода.
GitHub
Источник
В Runway появились ключевые кадры
В Turbo-версии Gen-3 добавили возможность загружать первый и последний кадры видео. Просто закиньте 2 изображения и при желании добавьте текстовую подсказку, а ИИ органично соединит всё это в один ролик.
Доступно для всех пользователей, но есть нюанс: из-за высокого спроса бесплатно потестить пока не дают.
Подборка фреймворков для локального запуска LLM
Подборка фреймворков для локального запуска LLM на устройствах.
Проект, написаный на С++, позволяет запускать LLM, VLM, MMLM на СUDA, AMD, NPU, Metal. Наиболее распространенные реализации - ollama и LMStudio.
Развертывание LLM на WebGPU. Самая быстрая реализация LLM на WebGPU из существующих на сегодняшний день.
Самый быстрый фреймворк для Mac. Поддерживает GenAI (Flux, SDXL и др.), speech-2-text (Whisper), LLM.
Минималистичный кроссплатформенный ML-фреймворк от Huggingface, написанный на Rust. Поддерживает работу с GPU и прост в использовании.
Кроссплатформенный инструментарий от Huggingface для WebGPU/CPU инференса с поддержкой запуска квантованных версий моделей Whisper, Phi 2 & 3 и Moondream. Написан на Rust.
Кросплатформенный фреймворк с возможностью распределенного запуска модели на разных платформах (CUDA, ROCm и Cloud). Написан на Zig.
Простой и эффективный фреймворк для работы с GPU на C++.
OpenAI выпустила для кодеров — Canvas
Создание видео для блогеров с нейронкой
Крутейшие видосы за ОДИН КЛИК — нейронка лишит блогеров работы, ведь клепает вирусные ролики ЗА СЕКУНДУ.
• Вводим запрос — получаем мгновенный результат.
• ИИ выдаст визуал и надиктует текст. В примере ролик об истории Рима — получилась настоящая документалка с закадровым голосом и сочнейшими кадрами.
• РЕАЛЬНО в один клик.
Платная.