Вышла новая модель для оцифровки изображений DeepSeek-OCR
При создании модели DeepSeek-OCR (https://huggingface.co/deepseek-ai/DeepSeek-OCR) в DeepSeek исследовали сжатие длинных текстовых контекстов через их визуальное 2D-представление (оптическое сжатие).
В архитектуре использовали DeepEncoder, который сжимает высокоразрешающие изображения в малое количество визуальных токенов. А также Декодер (DeepSeek3B-MoE) для восстановления текста из сжатых визуальных токенов.
В результате при сжатии 10x точность распознавания (OCR) ~97%, а при сжатии 20x точность ~60%.
По тестам модель DeepSeek-OCR превышает производительность моделей GOT-OCR2.0 и MinerU2.0, используя в разы меньше визуальных токенов.
Может обрабатывать 200k+ страниц в день на одной A100-40G.
На заметку
Пит Додд - спаситель Gummybear International
Как многие знают, что Пит Додд (режиссёр-аниматор 30-секудного клипа «Gummy Bear») оцифровал клип «Gummy Bear» с Betacam SP в 4K качестве, который позже залил на свой Youtube канал: Немецкий, английский, и русский языки клипа. Но об этом узнали работники Gummybear International и решили также оцифровать музыкальное видео «Itsi Bitsi Bikini». Они взяли Betacam SP спросив Пит Додда, оцифровали, и получился такой результат, при этом же они рады, что многие песни восстановлены в студии.
VHS Upscale (OSSC, Framemeister, Retrotink)
Товарищи, кто в теме, подскажите пожалуйста.
Реально ли использовать OSSC или Framemeister для потокового апскейла записей с видеокассет?
Интернет рекомендует RetroTINK для этих целей, но его практически не достать. (Если кто-то доставал и пробовал - поделитесь впечатлениями)
Хочется получить из 576 качественно растянутую запись хотя бы до 720p (а лучше FHD) без использования AI апскейлеров типа Топаз.
Сейчас пишу со студийного SVHS JVC через MiniDV плеер Panasonic с Firewire(1394), потом в AI апскейлер. Получается неплохо, но долго и муторно. Ну и сведение звука по дорожкам иногда пляшет.
Может дадите советов начинающему оцифровщику? И расскажете про еще какие-нибудь способы получить качественную картинку?


