Как интернет-магазину экономить 2,3 млн в год с окупаемостью инвестиций менее 2 месяцев
В ход пошёл тяжёлый люкс: в этот раз речь пойдёт не о принципе «Написал промт — и вуаля, сократил кучу времени».
Будем говорить про интеграцию и обучение модели Gemma 3 4B.
1. Немного контекста
В одном интернет-магазине карточки товаров создавались вручную: Excel от поставщиков, генерация текста, SEO, форматирование, публикация. Процессом занимались 4 контент-менеджера. В среднем — 40 минут на одну карточку. В месяц — 500 новых SKU.
Что это значило в деньгах:
– Средняя зарплата: 80 000 рублей на сотрудника
– Общий ФОТ: 4 × 80 000 = 320 000 рублей в месяц
– Загруженность на карточки: около 65%
→ Только на карточки уходило: 208 000 рублей в месяц
→ В год — 2 496 000 рублей
К этому добавлялись:
– простои и правки
– ошибки (до 15 % карточек возвращались на доработку)
– текучесть (обучение новых сотрудников)
– непроизводительное время (созвоны, согласования)
С учётом всего — итоговая годовая стоимость задачи составила около 2,7 млн рублей.
2. Что сделали
Вместо масштабирования штата приняли решение внедрить GenAI. Не подписку на GPT, а локальное решение, встроенное в процесс.
Цель:
– убрать рутину
– ускорить цикл вывода карточек
– снизить стоимость
– сохранить контроль над данными (SKU, ценообразование, поставщики)
3. Текущее состояние (AS IS)
– 500 карточек в месяц
– 40 минут на одну карточку
– ФОТ команды: 320 000 рублей
– Загрузка на задачу: 65 %
– Прямые издержки: 208 000 рублей в месяц
– Полные годовые издержки: 2 700 000 рублей
4. Целевое состояние (TO BE)
– Excel или JSON с параметрами → GenAI → 2–3 варианта текста
– Верификация и публикация: 1 человек, 0,3 ставки
– Среднее время на карточку: 2 минуты
– Производительность: 500 карточек в день на одного сотрудника
– Уникальность: 85–95 %
– Ошибки: менее 3 %
– Новая стоимость одной карточки: 62 рубля (вместо 416)
5. Почему выбрана Gemma 3 4B
Рассматривались 3 сценария:
ChatGPT API: дешево (около 30 долларов в год), но нет контроля, RAG, SLA
DeepSeek R1: мощно, но требует RTX 3090 и fine-tuning
Gemma 3 4B: оптимальный баланс
Аргументы в пользу Gemma 3 4B:
– открытая, бесплатная, локальная модель
– лучший русскоязычный токенизатор
– быстрый инференс: до 10 токенов в секунду
– стабильно работает на RTX 3060
– интегрируется в пайплайн, а не в UI
– не зависит от VPN, API и токенов
При росте объёма можно перейти на Gemma 12B или DeepSeek R1 на той же инфраструктуре (3090 или 2×A10).
6. Оборудование и затраты
Нагрузка:
– 500 карточек × ~1000 токенов = 500 000 токенов в месяц
– Генерация одной карточки — менее 2 секунд
– Модель справляется на одном RTX 3060
Железо:
– GPU: RTX 3060
– CPU: i5
– RAM: 32 ГБ
– SSD: 1 ТБ
– DevOps + сборка
Стоимость: 133 000 рублей
CAPEX (разово):
– Сервер и железо: 133 000 рублей
– Интеграция с CMS и API: 50 000 рублей
– Промт-инжиниринг и пайплайн: 70 000 рублей
– Обучение команды: 20 000 рублей
– Резерв: 30 000 рублей
Итого: 303 000 рублей
OPEX (в год):
– Поддержка и обновления: 60 000 рублей
– Электроэнергия: 9 600 рублей
– Резервы: 20 000 рублей
Итого: 89 600 рублей
7. Экономика и эффект
До внедрения:
– 2 700 000 рублей в год
После внедрения:
– ФОТ: 288 000 рублей в год (1 человек × 0,3 ставки)
– OPEX: 89 600 рублей
– Совокупно: 377 600 рублей
Годовая экономия: 2 322 400 рублей
Чистый эффект с учётом CAPEX: 2 019 400 рублей
Окупаемость: менее 2 месяцев
ROI за первый год: более 660 %
8. Что получилось
– Снижение затрат на 6,7 раза
– Рост производительности на 25 раз
– Время на карточку: с 40 до 2 минут
– Ошибки: с 15 % до менее 3 %
– Уникальность: с 40–60 % до 85–95 %
– Полный контроль над процессом, масштабируемость, автономность
Вывод
Компания, которая тратила миллионы на ручной текст, за 4 недели построила собственный GenAI-модуль, запущенный внутри процессов и не зависящий от облачных провайдеров. Это не MVP, не эксперимент, а зрелый продукт, с чёткой окупаемостью, измеримым эффектом и бизнес-моделью, которую можно масштабировать.
Кейсы применения ИИ в работе.
Цифры, эффекты, визуализация.
Для тех, кто считает результат.
Как я в депутаты ходил
Раз уж вспомнилась эта история в комментах...
Итак, времена, когда президентом побыл немного не Путин, зато у нас кругом началась цифровизация(с), а блейзер стоил 50 рублей за полторашку. Будучи на тот момент МУПовским работником, я, ессна, ВНЕЗАПНО обнаружил себя членом Единой России, ибо начальник цеха всех ради выполнения плана туда записал. Ну, правда, все и хуй клали на партийные нужды, даже на митинг на казенной буханке нас вывозили всего один раз, потому что в бухаське есть стол, а ехать скучно, поэтому мы наебенились, в процессе оного только вспомнили, что сварщик вообще как был в робе, так и поехал, а Вова-Капитан обосрался.
И вот читаю местные новости как-то: етить, интернет-голосование в молодежное правительство области! А поскольку времена были еще дикие, в интернете можно было полнейшей хуетой страдать, ага. Тут я вспомнил, что формально могу выдвигаться не откуда-нибудь, а аж от ЕР.
Так, идем на сайт, грузим фоточку, стоп. Нужна предвыборная программа (ну или как тогда эта хуйня называлась, не помню уже). Похрен, написал. Ну, как написал - в лучших традициях дипломописания, когда в конце после тонны воды появляется "а поскольку эту хуйню никто читать не будет..."
Итак, на выборы в молодежное правительство я де-факто пошел с предложениями легализовать автоматическое оружие, марихуану и проституцию, причем гомосексуальная тоже разрешалась для депутатов. Ну и разослал ссылку на голосовалку знакомым по аське, благо что в те далекие времена знакомых по мототеме было по всей России, да и не только.
За сутки я стал самым поддерживаемым кандидатом. Через двое суток я уже был в абсолютных лидерах. На 5 день, похоже, мою предвыборную программу все-таки дочитали, ибо из голосования и из партии меня удалили нахрен.
Ответ на пост «Что я узнал 20 лет обслуживая светофоры (работа такая)»6
Многие не понимают алгоритм работы таймеров на светофорах. Возмущаются, что "на табло 3,2,1,0..." и продолжает гореть красный ещё неопределенное время. Это протому, что перепутана причинно-следственная связь.
Насколько мне известно, не таймер управляет основными сигналами, а таймер под них подстраивается. Контроллер таймера измеряет интервалы в течение нескольких циклов и на основе этих статистических данных показывает те или иные числа на табло. А если режим изменился, то контроллер таймера будет "удивлен" не меньше участников дорожного движения и будет показывать чёрточки или 0 до набора новой статистики по интервалам.
Так, что таймер – тот ещё предсказатель. По факту, у него информации о времени смены сигнала не больше, чем у людей, на него смотрящих.
Из Москвы в регионы. Как цифровизация шагает по стране
Москва не первый год занимается цифровизацией и делится опытом внедрения с регионами. Например, платформа МосМедИИ (17 ИИ-сервисов для расшифровки КТ, рентгенограмм, флюорограмм и маммограмм) уже работает в 69 субъектах РФ, а еще 6 регионов присоединятся в течение 2025 года.
Или Карта "Тройка", которую в 2022 году перевели на 100% российский чип. Транспортная карта работает в порядка трех десятков регионов, где проживают 45 млн человек. Только за прошлый год к "Тройке" присоединились Томская и Архангельская области, ХМАО и Приморский край.
Приложение "Парковки России", которое изначально называлось "Парковки Москвы" и работало только в столице, теперь есть еще и в Санкт-Петербурге, Московской области и Кисловодске. Количество подключенных городов будет увеличиваться.
Инвестиционная карта - проект, который помогает найти информацию о свободных площадках для создания и развития производств. Сегодня на карте представлено более 15 тысяч инвестплощадок по всей стране.
Mos.Hub - первоначально облачная платформа работала в качестве онлайн-хранилища исходного кода для столичных программистов. Однако после ухода с российского рынка крупных зарубежных сервисов Москва доработала платформу и сделала ее открытой для всей России. Сегодня в Mos.Hub работают уже более 24,2 тысяч специалистов.
RUSSPASS заработал в 2020 году и за несколько лет превратился в полноценную экосистему, которая помогает спланировать поездку по России, забронировать билеты и гостиницу, подобрать экскурсии и рестораны. Сервис работает в 85 регионах.
МЭШ - образовательная платформа для школ. На данный момент подключены 5 регионов: Калужская, Московская, Тюменская области, Республики Татарстан и Дагестан. Обсуждается внедрение Московской электронной школы в Ямало-Ненецком автономном округе и Чеченской Республике.
МИК - связующее звено между городом, крупным бизнесом, инвесторами, научными коллективами и стартапами. Статус партнера Московского инновационного кластера позволяет организациям участвовать в тренингах и образовательных программах, находить площадки для тестирования и производства и выстраивать кооперации с другими отраслевыми игроками. В МИК уже вошли свыше 27 тысяч компаний из Москвы и более 13 тысяч партнеров из 86 регионов России.
Портал поставщиков - с помощью сервиса предприниматели могут предлагать свою продукцию и оперативно заключать контракты с надежными заказчиками, а государственные и муниципальные учреждения приобретать необходимые товары и услуги по конкурентным ценам. Сейчас порталом пользуются более 365 тысяч поставщиков из 42 регионов страны.
Как итог, многие столичные технологии постепенно становятся всероссийским стандартом, объединяя регионы в единую цифровую экосистему.
Мир подождёт
Мир подождет, хотя он насел на нас весом своих задач и нерешенных вопросов, связал нас невидимыми нитями электронных сообщений и звонков. Попробуй-ка, выберись! Как только ты начинаешь задумываться, он раз, и подкидывает тебе новую загадку, а потом еще, продолжая держать в своих цепких лапах. Мы понимаем, что живем в некой зависимости и что зависимость – это плохо. Дальше он опять продолжает работать и говорит: «Отключишь меня на неделю, через неделю у тебя будет 10 новых задач и 100 сообщений со статусом срочно и важно.» Еще страшнее подумать, а что будет если отключиться на две недели, месяц…?
Мы часто требуем от других ответов именно сегодня, нам почему-то надо успеть все за один раз и никак иначе. Знаете, я привык с утра смотреть новости, чтобы понимать, что происходит в стране, мире, опять же Ковид… Решил для себя не слушать неделю, затем включить и посмотреть, что изменилось и что я упустил. Эффект оказался ожидаемым, только приобрел, в голове меньше ненужной информации и хорошо для зрения. Однако, с нами рядом и всегда доступен смартфон, вы всегда на связи, под контролем, а когда жить? Он тянет на себя из всех гаджетов больше всего внимания и требует ухода, обновлений,этот гладкий навязанный дорогой друг. А друг ли?
А теперь некий апогей, который я увидел у 21-летнего(!) юноши. В 14.00 он спал на своей кровати, рядом с изголовьем стоял ноут со включенной игрой, у щеки лежал смартфон, издававший непонятные звуки, а ночь была временем бдения, борьбы за свободу электронного героя в компании онлайн друзей-бойцов. С утра мы не хотим вставать, аппетита нет, но ближе к вечеру назначена новая встреча и путь в никуда продолжается.
Наверное, прочитав вышеизложенное ,вы, друзья мои, ожидаете развязки в виде совета, что делать и как быть. Все хорошие советы людям давно даны, мы про все если и не знаем, то наверняка догадываемся. Что отключать, а что держать включенным-это вопрос очень индивидуальный. От себя скажу, что бабушка 21-летнего юноши пишет великоленые стихи и прозу, собирает тематические марки, преподает, шьет прекрасных кукол своими руками, а для остального мир подождет.