1064

Телеграм-бот, помогающий оформить фото на документы

Возникла у меня тут в очередной раз задача сделать фото для документов. Обычно, я в таком случае фотографируюсь на фоне холодильника на телефон, в ФШ поворачиваю, кадрирую и вырезаю фон. В этот раз мне даже на бумаге печатать фото было не нужно. Но блин, 2020 на дворе, нейросети там и AI, неужели я должен как 10 лет назад это делать руками? Иду в интернет, и что я там вижу: все сервисы подобного рода делятся на 3 типа:

1) Не вырезает фон впринципе, предлагает кадрировать и цвет покрутить

2) Предлагает вырезать фон руками в браузере инструментом аля MS Paint

3) Делает все как я хочу, но просит за одно фото 300р (!!!)

Приложения в Google Play примерно такие же.

Короче пришлось делать на коленке, самому. Находясь в короновирусной самоизоляции, освободилось прилично времени для таких вот проектов. Родилось вот что: https://t.me/PassportPhoto_bot

Пока что бот имеет довольно скромный функционал: на первом этапе распознаются глаза, подбородок и макушка, кадр поворачивается и зумится так, чтобы выполнялись требования большинства ведомств (ориентировался на шенген, но на загранник или паспорт РФ тоже должно проканать). Далее, нейросетью обрезается фон, и фото готово для скачивания. Элементов управления — по минимуму. Сейчас бот живет на довольно скромном железе, поэтому чутка задумчивый :) Гора возможных улучшений поселилась в беклоге, буду дорабатывать по мере появления времени.

Никаких денег за работу бот не берет, только добровольные донаты :)

Телеграм-бот, помогающий оформить фото на документы
Вы смотрите срез комментариев. Показать все
1
DELETED
Автор поста оценил этот комментарий

Бот с открытыми исходниками?

раскрыть ветку (12)
4
Автор поста оценил этот комментарий
В опенсорс ему рановато, но такой вариант рассматриваю.
раскрыть ветку (5)
2
Фанат Тёмы Лебедева
Автор поста оценил этот комментарий
В опенсорс ему рановато

Опенсорс опенсорсом, но 300р за фото - это 300р за фото)


Шучу конечно, крутой и полезный проект, удачи в развитии.

0
Автор поста оценил этот комментарий

почему рановато?

раскрыть ветку (3)
2
Автор поста оценил этот комментарий
Выведение проекта в опенсорс - это большая задача, включающая в себя генеральную уборку, проверку лицензий всех использованных либ, документацию. Пока что эта задача даже не начата)
раскрыть ветку (2)
0
Автор поста оценил этот комментарий

> включающая в себя генеральную уборку


кода? Это можно сделать в процессе.


> проверку лицензий всех использованных либ


Ты - коммерческая компания, которую сразу засудят, если вдруг что-то в лицензии будет не так? Даже если и да, то вряд ли ты использовал больше нескольких либ.


> документацию


опять же, можно добавить в процессе

раскрыть ветку (1)
7
Автор поста оценил этот комментарий
Все именно так как вы говорите. Но у меня есть свои, внутренние стандарты, которым продукт выводимый на всеобщее обозрение должен соответствовать. Мне придется многое с собой согласовать)
1
Автор поста оценил этот комментарий

Все что здесь описано, уже в открытом исходном коде называется dlib, в папках с примером вы найдете детекцию лица, оцентрирование и обрезку, написать бота не составляет проблем, убрать задний фон, можно через нейронку, которая найдете на просторах гитхаба, но насколько я знаю и видел, то нейросети не очень то хорошо справляются с задачей Background removal (с волосами частая проблема, можно конечно усреднять и фильтры Калмана допустим применить), да и честно говоря, даже после всех этих махинаций не факт что примут фотографию, насколько помнится есть некоторые критерии к документам (расстояние от верхнего края до макушки, нужны ли уголки, цветная или черно-белая, так же стоит поразмыслить на тему как убрать красные зрачки и еще множество нюансов).

раскрыть ветку (5)
0
Автор поста оценил этот комментарий

Вы это к чему? Проект слишком простой?)

раскрыть ветку (4)
2
Автор поста оценил этот комментарий

Да, я занимаюсь разработками в области компьютерного зрения, OpenCV, dlib, nvidia, MNN, MTCNN, tensorflow (не так часто, но в детекции лица и в связке с MTCNN (получает 5 координат лицевых, которые помогут в оцентровке лица)..По факту найти лицо, оцентрировать занимает на python буквально 30-40 строк (и то даже преувеличил)..
Пример вот здесь имеется http://dlib.net/face_alignment.py.html (можно установить через pip, а если имеется видеокарта, то лучше скомпилировать вместе с поддержкой CUDA, значительно скорости прибавит).

раскрыть ветку (3)
0
Автор поста оценил этот комментарий

Вы, безусловно, молодец. Но я все еще не понял к чему вы все это пишете)

раскрыть ветку (2)
0
Автор поста оценил этот комментарий

Дак я выше человеку отписался на его вопрос про opensource))

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Аааа, понял теперь) Спасибо)

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества