Как интернет-магазину экономить 2,3 млн в год с окупаемостью инвестиций менее 2 месяцев
В ход пошёл тяжёлый люкс: в этот раз речь пойдёт не о принципе «Написал промт — и вуаля, сократил кучу времени».
Будем говорить про интеграцию и обучение модели Gemma 3 4B.
1. Немного контекста
В одном интернет-магазине карточки товаров создавались вручную: Excel от поставщиков, генерация текста, SEO, форматирование, публикация. Процессом занимались 4 контент-менеджера. В среднем — 40 минут на одну карточку. В месяц — 500 новых SKU.
Что это значило в деньгах:
– Средняя зарплата: 80 000 рублей на сотрудника
– Общий ФОТ: 4 × 80 000 = 320 000 рублей в месяц
– Загруженность на карточки: около 65%
→ Только на карточки уходило: 208 000 рублей в месяц
→ В год — 2 496 000 рублей
К этому добавлялись:
– простои и правки
– ошибки (до 15 % карточек возвращались на доработку)
– текучесть (обучение новых сотрудников)
– непроизводительное время (созвоны, согласования)
С учётом всего — итоговая годовая стоимость задачи составила около 2,7 млн рублей.
2. Что сделали
Вместо масштабирования штата приняли решение внедрить GenAI. Не подписку на GPT, а локальное решение, встроенное в процесс.
Цель:
– убрать рутину
– ускорить цикл вывода карточек
– снизить стоимость
– сохранить контроль над данными (SKU, ценообразование, поставщики)
3. Текущее состояние (AS IS)
– 500 карточек в месяц
– 40 минут на одну карточку
– ФОТ команды: 320 000 рублей
– Загрузка на задачу: 65 %
– Прямые издержки: 208 000 рублей в месяц
– Полные годовые издержки: 2 700 000 рублей
4. Целевое состояние (TO BE)
– Excel или JSON с параметрами → GenAI → 2–3 варианта текста
– Верификация и публикация: 1 человек, 0,3 ставки
– Среднее время на карточку: 2 минуты
– Производительность: 500 карточек в день на одного сотрудника
– Уникальность: 85–95 %
– Ошибки: менее 3 %
– Новая стоимость одной карточки: 62 рубля (вместо 416)
5. Почему выбрана Gemma 3 4B
Рассматривались 3 сценария:
ChatGPT API: дешево (около 30 долларов в год), но нет контроля, RAG, SLA
DeepSeek R1: мощно, но требует RTX 3090 и fine-tuning
Gemma 3 4B: оптимальный баланс
Аргументы в пользу Gemma 3 4B:
– открытая, бесплатная, локальная модель
– лучший русскоязычный токенизатор
– быстрый инференс: до 10 токенов в секунду
– стабильно работает на RTX 3060
– интегрируется в пайплайн, а не в UI
– не зависит от VPN, API и токенов
При росте объёма можно перейти на Gemma 12B или DeepSeek R1 на той же инфраструктуре (3090 или 2×A10).
6. Оборудование и затраты
Нагрузка:
– 500 карточек × ~1000 токенов = 500 000 токенов в месяц
– Генерация одной карточки — менее 2 секунд
– Модель справляется на одном RTX 3060
Железо:
– GPU: RTX 3060
– CPU: i5
– RAM: 32 ГБ
– SSD: 1 ТБ
– DevOps + сборка
Стоимость: 133 000 рублей
CAPEX (разово):
– Сервер и железо: 133 000 рублей
– Интеграция с CMS и API: 50 000 рублей
– Промт-инжиниринг и пайплайн: 70 000 рублей
– Обучение команды: 20 000 рублей
– Резерв: 30 000 рублей
Итого: 303 000 рублей
OPEX (в год):
– Поддержка и обновления: 60 000 рублей
– Электроэнергия: 9 600 рублей
– Резервы: 20 000 рублей
Итого: 89 600 рублей
7. Экономика и эффект
До внедрения:
– 2 700 000 рублей в год
После внедрения:
– ФОТ: 288 000 рублей в год (1 человек × 0,3 ставки)
– OPEX: 89 600 рублей
– Совокупно: 377 600 рублей
Годовая экономия: 2 322 400 рублей
Чистый эффект с учётом CAPEX: 2 019 400 рублей
Окупаемость: менее 2 месяцев
ROI за первый год: более 660 %
8. Что получилось
– Снижение затрат на 6,7 раза
– Рост производительности на 25 раз
– Время на карточку: с 40 до 2 минут
– Ошибки: с 15 % до менее 3 %
– Уникальность: с 40–60 % до 85–95 %
– Полный контроль над процессом, масштабируемость, автономность
Вывод
Компания, которая тратила миллионы на ручной текст, за 4 недели построила собственный GenAI-модуль, запущенный внутри процессов и не зависящий от облачных провайдеров. Это не MVP, не эксперимент, а зрелый продукт, с чёткой окупаемостью, измеримым эффектом и бизнес-моделью, которую можно масштабировать.
Кейсы применения ИИ в работе.
Цифры, эффекты, визуализация.
Для тех, кто считает результат.