https://t.me/HonestPriceBot
Ночами он не работает пока, с домашнего пк трудится. 25-26 на сервер переедет, там круглосуточный будет.
Это бесполезно объяснять. Никто даже текст не читал, видимо, у всех одно - ААА, ЭТО В УМЕ СЧИТАЕТСЯ!!!
У меня только один вопрос. А существует ли практический смысл указывать литры вместо килограммов, если пересчёт для них всё равно одинаковый - что там 1000 единиц, что там?
Так об этом я тебе с самого начала и талдычу - нужная информация записана на ценнике по-разному и в разных местах даже в пределах одного и того же магазина. Что уж говорить о разных торговых сетях или маленьких магазинчиках у дома, где в каждом магазинчике свой формат ценника.
Ограничится ты поддержкой ценников условной пятёрочки, причём без обещаний работоспособности в случае смены формата ценника - я бы поверил. Но ты заявляешь о работоспособности на любых ценниках. В возможность сделать подобное одним любителем на коленке - не верю.
Так я и не убеждаю. Я сказал сделаю, ты не поверил, на этом можно разойтись. Зачем ты продолжаешь убеждать меня (или себя?) что у меня не получится - я не знаю.
Проблема не в том, чтобы вытащить информацию с фото. Проблема в том, чтобы понять, какая информация на фото - нужная, и в каком формате она записана.
Вот все перечисленные выше ценники, тебе для выборки.
Санкт-Петербург, перекресток, снято сегодня
Вишня кола
2023-11-26 00:33:08,982 - __main__ - INFO - Extracted weight: 450.0g/ml
shahdag - второй не нашёл.
2023-11-26 00:35:42,617 - __main__ - INFO - Extracted weight: 330.0g/ml
Легенда гор (не воспринял 0 перед, нужна корректировка на такой случай) второй ценник не увидел, да.
2023-11-26 00:36:50,559 - __main__ - INFO - Extracted weight: 75.0g/ml
Байкал то же самое
2023-11-26 00:38:10,788 - __main__ - INFO - Extracted weight: 45.0g/ml
Нужно просто время, ценники и терпение, терпение и ещё раз терпение) Я как раз никуда не тороплюсь
Проблема не в том, чтобы вытащить информацию с фото. Проблема в том, чтобы понять, какая информация на фото - нужная, и в каком формате она записана.
Вот все перечисленные выше ценники, тебе для выборки.
Санкт-Петербург, перекресток, снято сегодня
Но увы. Хорошо человек скинул два гига ценников, есть с чем поработать, понять, как идёт, куда двигаться дальше.
Вот сейчас в магазин зашёл, четыре соседних ценника на напитки - "0.45л", "450мл", "330м", "0.5" (без указания размерности). А в случае другого товара то же "0.5" может быть частью названия, а не объемом... Вот хотя бы мороженое "48 копеек" взять - это ведь вовсе не цена, а название такое!
Оно, конечно, под конкретный кейс регулярка легко пишется, но не зная об этом заранее ты такое не предскажешь. И таких непредсказуемых кейсов - вагон и маленькая тележка в одной только торговой сети. А в других - свои кейсы.
Яндекс Vision справляется на ура.
Проблема в цене, иногда она не помечается ни символом, ни словом, даже «цена» не написано.
Для этого мы делаем простую модель (воистину простую), учим где обычно находится цена.
Я на всякий случай использую три метки, лишним не будет - price, weight, millilitre.
Пока нормально. После останется решить беду с ценой - иногда она, скажем 159, иногда 159 00, иногда 159 99 и всё без разделителей. Но и это решится. При должном терпении всё возможно.
Ты так ничего и не понял. Сделать бота - это задача на час, из которого три четверти уйдёт на то, чтобы разобраться с апи телеграма. А вот спроектировать и обучить сеть, которая будет давать сколько-нибудь пригодные результаты на произвольном ценнике, а не на конкретном формате конкретной торговой сети - это задача уровня тех, решением которых занимаются топовые коллективы вроде гугла.
Для тебя нейросеть что, какой-то волшебный чёрный ящик, которому достаточно скормить произвольные данные, а дальше он сам всему научится?
"Сотни ценников" особенно умиляют. На хотя бы десять разных форматов ценников это, получается, по несколько десятков ценников на формат? И на этом ты собрался обучить что-то, что будет реально работать?
Я как пост с ботом сделаю, зайди, отметься, порадуйся может.
Тут такое дело... [см приложенное фото]
Если уж очень хочется распознавание, то я бы рекомендовал подумать в сторону отдельного приложения, где на картинке с камеры пользователь будет пальцем тыкать, где на ней цена, а где - количество (вес, объём), а там уже в заданном месте пытаться распознавать. Заодно будет защита от совсем плохих фото - если нет чётко читаемой области с ценой, то и тыкнуть пользователь на неё не сможет.
И это сломается как только попытаются отсканировать ценник с не предусмотренным заранее форматом. Новый магазин откроется, или банально формат ценника в условной пятерочки поменяется - и всё.
Текст выдернуть не получится, поскольку важно также его взаимное расположение.
И это я ещё не начал говорить про мир удивительных открытий, которые ожидают автора при попытке сравнить, скажем, "яйца, C1, дес", "яйца, 1 дюж" и "яйца, 30 шт, C1".
Не-не, тупиковый путь
Накидают тебе ценников, научишь распознавать
А потом пойдут сначала сообщения об ошибках: "А вот тут не распознали нормально" и т.д.
А после уже пойдут оскорбления и наезды: "Я из-за твоего бота 2 минуты лишние потратил", "Делай быстро, чтобы мелкий шрифт в пятерочке читался"
Такое требует многих тысяч человекочасов на создание, а не одного автора с найденной в гугле учебной сеткой для студентов.
Ну слушай, если бы все так бросали в начале пути, то в мире ничего бы не создали путёвого. Всегда есть хейтеры, но есть и те кому бы пригодилось твоё приложение.
Просто с кучей ценников с разных городов и магазинов было бы проще
Пусть начинают тогда. Зря я это затеял, 95% даже не прочитали, что мне нужно, зачем-то обсуждают работу бота со скрина.








