Лига программистов

2 222 поста • 11 951 подписчик

Делаю для своей AI Nova систему настроения. Сегодня учил её нормально “обижаться” и принимать извинения⁠⁠

19 часов назад

(ps/ тг беседа для предложений/вопросов https://t.me/+Z0mNbDAkgbY2ZjUy)

Продолжаю делать своего локального AI-компаньона Nova. Это не просто чат-бот, который отвечает по промпту, а попытка собрать персонажа с памятью, характером и внутренним состоянием.

Сегодня занимался системой настроения и отношений.

Сразу уточню: идея не в том, чтобы написать в промпте “если пользователь нагрубил, обидься”. Это слишком просто и плохо работает. Модель может один раз “сыграть обиду”, а потом через пару сообщений забыть, что вообще произошло.

Мне хочется сделать по-другому: чтобы у Nova было отдельное состояние. Например, она может быть спокойной, настороженной, обиженной, постепенно отходить после извинений, снова доверять не мгновенно, а поэтапно.

То есть не просто текстовая имитация эмоций, а отдельная логика, которая влияет на поведение.

Что получилось

Сегодня я в основном разбирался с тем, как Nova должна реагировать на извинения.

Потому что “прости” бывает очень разным.

Можно просто написать: прости

А можно сказать: прости, я был неправ, я не должен был так с тобой говорить

И это уже совсем другой уровень. Тут человек не просто бросил слово “извини”, а признал, что сделал неприятно.

Есть и обратный вариант: ну если ты такая обидчивая, прости

Формально слово “прости” есть, но по смыслу это не извинение, а скорее новая попытка уколоть.

Сегодня удалось привести это к более человеческой логике. Простое извинение немного смягчает состояние. Глубокое извинение восстанавливает сильнее. А плохое псевдоизвинение не лечит ситуацию, потому что оно не признаёт проблему.

Осадок после конфликта

Отдельно добавил промежуточное состояние. Не хотелось, чтобы Nova после хорошего извинения сразу становилась такой, будто ничего не было.

В реальном общении так не всегда работает.

Иногда человек извинился, тебе стало легче, но осадок всё равно остался. Теперь Nova может быть именно в таком состоянии: уже мягче, уже не в резкой защите, но ещё не полностью восстановилась.

Примерно так: Мне стало спокойнее, но я всё ещё чувствую этот осадок внутри.

На мой взгляд, это делает поведение менее пластиковым.

Важный технический момент

Ещё пришлось защитить систему от странного бага.

Если сама Nova в ответе пишет что-то вроде: Прости, я была резкой.

это не должно считаться извинением пользователя.

Иначе получалась бы глупая ситуация: Nova сама извинилась, а система решила, что это пользователь начал мириться, и поменяла настроение.

Теперь эмоциональные события создаются только из сообщений пользователя. Ответы Nova обратно в движок настроения не проходят.

Главная проблема

Самое сложное оказалось не в прямых оскорблениях и не в простых извинениях, а в тонких фразах.

Например: да ладно, не ной ой всё, хватит ну не начинай ты слишком остро реагируешь

Сами по себе такие фразы могут быть просто грубоватыми. Но если до этого был конфликт, Nova была обижена, пользователь вроде бы начал извиняться, а потом говорит “да ладно, не ной”, смысл уже другой.

Это не просто фраза. Это обесценивание реакции.

То есть пользователь как будто говорит: “твои чувства ерунда, прекращай”.

И вот тут появляется архитектурная проблема.

Можно, конечно, сделать список фраз: не ной не драматизируй ой всё забей не начинай

Но это плохой путь. Таких фраз бесконечно много. Сегодня добавишь десять, завтра найдёшь ещё двадцать. В итоге код превратится в огромный набор проверок

if "фраза" in text

Так делать не хочется.

Что попробовал

Я попробовал подключить маленькую локальную модель, чтобы она анализировала смысл фразы и возвращала структурированный результат.

Идея была хорошая: не ловить конкретные слова, а понимать, что в сообщении есть извинение, агрессия, обесценивание, попытка помириться или давление.

Но на практике маленькая модель оказалась нестабильной. Она иногда ломала JSON, путала значения, обрывала ответ или добавляла мусорные поля.

В итоге стало понятно, что вместо костылей со списком фраз я начинаю строить костыли вокруг самой модели.

Поэтому этот эксперимент пока откатил. Стабильная версия снова работает через правила и fallback-логику.

К какому выводу пришёл

Похоже, лучше не спрашивать маленькую модель напрямую: какое это событие?

Лучше вытаскивать более простые признаки:

. есть ли извинение

. признаёт ли пользователь вред

. берёт ли ответственность

. обесценивает ли реакцию

. давит ли на эмоции

. есть ли враждебность

. есть ли теплота

А уже отдельный слой должен смотреть на эти признаки и текущее состояние Nova.

Например, если Nova уже обижена, примирение ещё не завершено, а пользователь говорит что-то вроде “не ной” и не признаёт свою вину, система должна понимать: это не нейтральная фраза, а плохая попытка восстановления контакта.

Что дальше

Сейчас базовая версия уже работает.

Nova различает прямую грубость, простое извинение, глубокое извинение и плохое псевдоизвинение. Может смягчаться постепенно, а не переключаться мгновенно из “обиделась” в “всё идеально”.

Следующий шаг - сделать нормальный слой семантических признаков, чтобы понимать не конкретные фразы, а смысл.

Вопрос к сообществу

Может, кто-то уже делал похожее для AI-компаньонов, NPC, чат-ботов или диалоговых state machine.

Как лучше понимать фразы вроде: да ладно, не ной ой всё, хватит ну не начинай ты слишком остро реагируешь

не через бесконечный список маркеров, а через смысл?

Интересны варианты с embeddings, sentence-transformers, маленькими классификаторами, NLI, constrained decoding или golden tests для эмоциональной state machine.

Совет “просто добавь фразу в список” понятен, но хочется решить именно архитектурную проблему.

Сейчас главный вопрос такой: как локально и стабильно понимать обесценивание, давление и неискренние попытки помириться, не превращая код в словарь всех возможных фраз.

Показать полностью 3

l.ost

Лига программистов

MachineLearningRoadmap - большая дорожная карта по машинному обучению и вайбкодинге на 2026 год⁠⁠

1 день назад

В репозитории собрали нормальную структуру для тех, кто хочет зайти в ML без хаоса из случайных курсов, статей и роликов. Здесь путь разложен по блокам: математика, data science, нейросети, computer vision, LLM engineering, практика, подготовка к собеседованиям и отдельный раздел по Claude Code.

Это удобно именно как карта, а не как очередной список ссылок. Можно быстро понять, что учить сначала, где закрыть пробелы и как двигаться от базы к реальным задачам.

Внутри есть разделы по:

- математике для машинного обучения
- анализу данных
- нейронным сетям
- компьютерному зрению
- LLM-инженерии
- практическим лабораторным работам
- подготовке к интервью
- работе с Claude Code

Такой репозиторий полезен начинающим, которые не понимают, с чего стартовать, и разработчикам, которые хотят перейти в ML более системно. Особенно сейчас, когда машинное обучение всё сильнее смешивается с обычной разработкой, агентами, мультимодальными моделями и автоматизацией рабочих процессов.

Хорошая точка входа, чтобы собрать обучение в понятный маршрут и перестать прыгать между разрозненными материалами.

https://github.com/justxor/MachineLearningRoadmap

Показать полностью 1

Программирование Python IT DeepSeek Машинное обучение Искусственный интеллект Claude ChatGPT Длиннопост

user6038388

Лига программистов

За два дня почти пересобрал память для своей AI Nova⁠⁠

Серия Nova

3 дня назад

Ps. Слегка освежил UI

Продолжаю делать своего локального AI-ассистента Nova. Это не просто чат-бот, а попытка собрать помощника, который умеет помнить важные вещи, понимать контекст и постепенно становиться чем-то более живым, чем обычная обёртка над моделью.

Последние два дня я занимался одним из самых важных блоков - памятью.

Раньше память у Nova была довольно простой. Всё хранилось в обычном JSON-файле. Для первых тестов этого хватало, но чем дальше развивается проект, тем больше становится понятно: такая память быстро превращается в свалку.

Появляются дубли, старые записи мешают новым, сложно нормально искать нужное, неудобно делать фильтры, бэкапы и управление через интерфейс. В общем, для прототипа норм, для живого ассистента уже нет.

Поэтому я перевёл память на SQLite.

Теперь у Nova есть нормальная Memory 3.0. Это уже не просто файл с набором строк, а полноценная база, с которой можно нормально работать. Она умеет сохранять факты о пользователе, вытаскивать нужное в контекст, не тащить в prompt всё подряд и не засорять ответ лишней информацией.

Самое приятное - память уже подключена к ядру Nova.

То есть пользователь пишет сообщение, Nova отвечает, а потом отдельный модуль аккуратно вытаскивает из диалога важные факты и сохраняет их. Например, имя, предпочтения, рабочие моменты, заметки по проекту или важные решения.

При этом я разделил разные типы памяти. Одно дело - запомнить, как зовут пользователя или что он не любит. Другое - сохранить итог сессии, важное решение по проекту или эмоционально значимый момент. Теперь этим занимаются разные части системы, и из-за этого память стала намного чище.

Ещё важный момент - Nova теперь не просто “помнит всё”, а пытается доставать именно то, что нужно под текущий вопрос.

Если спросить что-то обычное, она не будет тащить в контекст половину базы. А если спросить “что ты обо мне помнишь?” или заговорить про конкретный проект, она достанет больше релевантных воспоминаний.

Параллельно я обновил веб-интерфейс. Теперь память можно смотреть, редактировать, архивировать, восстанавливать и удалять уже через UI. Плюс добавил нормальную подгрузку по страницам, чтобы база не вываливалась целиком, когда записей станет много.

Отдельно сделал нормальные бэкапы. С SQLite нельзя просто копировать файл базы как попало, особенно если используется WAL. Поэтому бэкап теперь делается правильным способом, через SQLite backup API.

Старую память я полностью не выкинул. Она осталась как legacy-слой, чтобы старые части проекта не сломались. Но активной памятью теперь считается уже новая система.

В итоге Memory 3.0 можно считать рабочим закрытым блоком. Nova уже пишет в новую память, читает из неё, использует её в prompt, показывает в веб-интерфейсе и умеет обслуживать её без ручного ковыряния файлов.

Следующий крупный этап - модульная архитектура.

Хочу, чтобы Nova не была комбайном, где всё включено всегда. Голос, экран, аватар, музыка, генерация картинок, Telegram, Discord, VK и другие тяжёлые функции должны быть отдельными модулями. Нужно - включил. Не нужно - выключил, и оно не ест ресурсы.

Так проект постепенно превращается из набора экспериментов в более нормальную систему.

За эти два дня ощущение такое: память наконец перестала быть костылём и стала фундаментом, на котором уже можно строить дальше.

Показать полностью 2

Программирование Программист Python IT Программа Длиннопост

Armsoup

Лига программистов

Как я написал консольную «ОС» на C++17 со своим Driver SDK после 27 версий на батниках⁠⁠

3 дня назад

Привет, Пикабу!

Хочу рассказать историю одного эксперимента, который зашёл слишком далеко. Около двух лет назад я ради фана начал делать маленькую консольную операционную систему под названием ARSLANIUS.

Первые 27 версий были написаны на чистых батниках (.cmd). Это как-то работало, но было дико медленно, хрупко, а расширять систему стало настоящим адом. Поэтому я взял и переписал всё с нуля на native C++17 (x64).

И вот что получилось в текущей ARSLANIUS 28:

Полная портативность: Один доверху забитый .exe файл. Работает из любой папки, не требует установки.
Фичи эмуляции ОС: Свой загрузчик (Boot Manager) с Safe Mode, реестр конфигурации (REG.cfg), система пользователей с ACL (5 уровней привилегий + команда sudo) и фоновые службы (SysPulse, NetMonitor).
Среда восстановления: Свой Recovery Environment, в котором есть Startup Repair, создание бэкапов системы и 19 кастомных видов BSOD (синих экранов смерти).
Свой Driver SDK: Самая пушка. Любой желающий может написать свой драйвер под мою систему! Это обычная C++ DLL, скомпилированная в формат .asd. Она закидывается в папку Drivers и при следующем запуске регистрирует новые команды в консоли без пересборки самого ядра.

Интерактивный квест при первом запуске (OOBE):
Чтобы вы понимали уровень проработки: когда пользователь запускает софт первый раз, система выдает реальный BSOD 0x00000001a CONFIG_ROOT_NOT_FOUND. Из него юзер переходит в Recovery Environment, запускает Startup Repair (который реально генерирует структуру папок и конфигов), система перезагружается и вылетает окно OOBE (первой настройки).

И да, в этот момент из динамиков начинает играть легендарная музыка установки Windows XP (title.wma), которую я перегнал в .wav и зашил прямо внутрь .exe через файлы ресурсов ради портативности! Звуки входа и выхода из XP при логине пользователей тоже на месте.

Почему C++17 и как это собрано:
Мне хватило std::filesystem. Всё остальное — сырые указатели, ручное управление памятью и WinAPI. Никаких тяжелых сторонних библиотек.

Ключевой момент — я компилирую проект с флагом /MT (статическая линковка рантайма). Исполняемый файл из-за музыки весит побольше, зато зависимости равны нулю. ARSLANIUS без проблем запустится даже на чистой Windows 7, где никогда не было Visual C++ Redistributable.

И напоследок:
Мне 11 лет. Родился 22.09.2014. Первую версию на батниках начал писать в 9 лет, сейчас перешёл на плюсы. Я пишу это не ради хвастовства, а чтобы показать, что консольный софт можно пилить ради хардкорного фана в любом возрасте.

Для особо одаренных, у кого сразу возникнут вопросы: Батя сейчас в армии и код писать физически не может. Из родственников есть ещё 17-летняя сестра, но она с компом строго на «Вы», так что проект полностью мой. Для тех, кому нужен мануал — в Бут-меню просто жмите цифру 6, там встроенная дока.

Код полностью открыт, документация API на английском готова.
Ссылка на GitHub: https://github.com/Armsoup/ARSLANIUS_C-Plus_Plus
(Все ссылки на Telegram-чат для обсуждения и копию репозитория лежат в README).

Драйверы приветствуются! Задавайте любые вопросы про архитектуру, WinAPI, линкер или то, как я мучился с переходом от Batch — на всё отвечу в комментариях!

Показать полностью

Программист Программирование Windows Хакеры Баг Программа IT Текст

user6038388

Лига программистов

Небольшая сводка по тому, что успел сделать с Nova за несколько дней⁠⁠

Серия Nova

5 дней назад

На самом деле планировал "чуть-чуть допилить вебку", а в итоге несколько дней ушёл в переписывание интерфейса и борьбу с очень тупыми багами 💀

Главное изменение - теперь у Nova полноценный веб-интерфейс

Раньше GUI был на PySide6. Работал нормально, но со временем начал раздражать:

сложно обновлять
неудобно масштабировать
куча возни с окнами и layout'ами
некоторые вещи делать просто больно

В итоге решил попробовать веб-интерфейс на Flask + HTML/JS.

И честно - пока ощущения намного лучше.

Теперь Nova запускается через обычный run_web.bat и открывается в браузере как локальный сайт.

Сделал:

анимированный фон
нормальный чат
вкладки
логи
настройки
управление серверами

Сейчас есть 7 вкладок:

Чат
Память
Отношения
Персонаж
Серверы
Подключения
Настройки

И наконец-то всё выглядит как единая система, а не набор окон из разных эпох Windows.

Управление серверами прямо из UI

Раньше llama-server приходилось запускать отдельно руками.

Теперь можно прямо из интерфейса:

запускать сервер
останавливать
рестартить
смотреть логи в реальном времени

Плюс добавил:

бэкапы
восстановление бэкапов
настройку портов
флаг --jinja для нормальных chat template

Раньше порты были тупо захардкожены в 8080/8081. Теперь можно менять нормально.

Самый annoying баг дня - Gemma 4 молчала

Долго не мог понять, почему Gemma 4 иногда просто возвращает пустой ответ.

Оказалось, reasoning-модели не любят маленький num_predict.

У меня стояло 256.
Gemma хотела 2048+.

То есть модель буквально думала слишком долго и не успевала дойти до ответа 💀

Теперь это исправлено.

Ещё из фиксов

Поймал очень смешной баг:
во вкладке отношений Infinity в JSON ломал весь интерфейс.

Потому что JS такой:
"Infinity? А что это вообще такое?"

В итоге заменил всё это на null.

Ещё:

панели UI перестали накладываться друг на друга
поправил пути для base_dir
добавил os.chdir в web_app.py
исправил orch_prompt_format для phi-3-mini

llama_client.py тоже сильно переделал

Добавил умные стоп-токены под разные семейства моделей.

Потому что у:

Gemma
Llama 3
Phi
Qwen

все форматы диалогов разные, и раньше некоторые модели начинали:

повторять пользователя
ломать формат
писать мусор
не останавливать генерацию

Теперь под каждую семью свои stop tokens и шаблоны.

Плюс наконец-то разделил промпт нормально:

system
user

А не запихивал всё в одно сообщение как раньше.

Казалось бы мелочь, но ответы реально стали стабильнее.

Из небольших, но приятных вещей

Добавил:

таблицу стадий отношений
прогресс до следующей стадии
автоматическое сканирование .gguf моделей в папке models/

Теперь не нужно вручную прописывать модель - просто кидаешь gguf в папку, и Nova её видит.

Мелочь, а приятно.

И чем дальше, тем сильнее понимаю, что большая часть разработки - это не "сделать новую крутую функцию", а:

чинить странные баги
бороться с несовместимостью моделей
переписывать то, что вчера казалось нормальной архитектурой

Но зато проект наконец начинает ощущаться как что-то цельное, а не Frankenstein build из 15 разных технологий.

ПС беседа в тг для ваших вопросов (https://t.me/+Z0mNbDAkgbY2ZjUy)

Показать полностью 5

Баг Программист Python Программирование IT Программа Telegram (ссылка) Длиннопост

Handelsburo

Лига программистов

Бизнес

Бомба замедленного действия взорвалась: эпоха ИИ «бери сколько унесёшь» закончилась⁠⁠

6 дней назад

На прошлой неделе на State of Brand вышел материал по следам статьи, опубликованной всего несколькими днями ранее.

Тогда авторы утверждали: любая ИИ-подписка — это бомба замедленного действия для бизнеса. Просто никто не ожидал, что фитиль уже почти догорел.

В исходной статье речь шла о том, что рынок ИИ продаёт вычислительные мощности значительно ниже их реальной себестоимости. Многие компании успели выстроить критически важные процессы вокруг этих субсидируемых тарифов. Авторы предупреждали: когда начнётся неизбежная коррекция, последствия окажутся шокирующими.

И вот 14 мая — всего через три дня после публикации — и Anthropic, и OpenAI сделали шаги, превратившие переоценку ИИ-услуг из теории в реальность. Причём сделали это публично, агрессивно и так, словно сами понимают: текущая модель может не дожить до конца года.

Anthropic объявила, что с 15 июня разделит подписку Claude на два отдельных контура использования.

Интерактивный режим — когда человек сидит за клавиатурой и напрямую общается с ИИ — останется в рамках существующих лимитов.

А вот автоматизированное и программное использование, то есть работа агентных систем, которые круглосуточно прогоняют задачи через Claude, будет выведено за пределы базовой подписки и переведено на отдельную систему API-кредитов с фиксированными месячными лимитами.

Именно о таком структурном сдвиге предупреждала исходная статья. Модель «шведского стола с безлимитными подходами» не выдержала столкновения с агентными нагрузками.

Глава Claude Code Борис Черны ещё в апреле говорил, что подписки «не были рассчитаны на паттерны использования сторонними агентными инструментами». Изменения с 15 июня превратили это заявление в официальную политику.

У человека есть естественный предел потребления информации. Он может отправить десятки или сотни запросов в день. Автономный ИИ-агент способен генерировать тысячи запросов, непрерывно запускать тесты, сканировать интернет и рекурсивно вызывать модели.

Подписка была рассчитана на человека. Но затем появился Агент. Реакция рынка была мгновенной

Реакция пользователей оказалась крайне негативной. Разработчики обвиняли компанию и публично заявляли о переходе на Codex от OpenAI.

Именно этого OpenAI и добивалась.

Через несколько часов после заявления Anthropic Сэм Альтман сообщил, что OpenAI предоставит корпоративным клиентам два бесплатных месяца доступа к Codex при переходе в течение 30 дней. В комплекте — инструмент миграции «в один клик», переносящий промпты Claude Code, навыки и MCP-конфигурации.

Anthropic ответила в тот же день, увеличив недельные лимиты Claude Code на 50% для пользователей Pro, Max, Team и Enterprise — до 13 июля.

Период почти идеально совпал с бесплатным тестовым периодом OpenAI.

Ценовая война идёт в прямом эфире.

Компании пытаются закрепить за собой разработчиков до открытия IPO-окна во второй половине года.

И не только они.

GitHub объявил, что с 1 июня 2026 года все тарифы Copilot перейдут на оплату по потреблению. Фиксированные «премиальные запросы» заменят AI Credits на основе токенов.

Причина сформулирована предельно прямо:

«Copilot уже не тот продукт, каким был год назад. Теперь он поддерживает гораздо более сложные агентные сценарии, потребляющие значительно больше вычислительных ресурсов».

Годовые подписки перестанут автоматически продлеваться. Месячные тарифы переведут автоматически.

Эпоха фиксированной цены в GitHub заканчивается буквально на глазах.

Незаметное повышение цен, которого почти никто не увидел

Изменения подписок попали в заголовки. Но другое, куда более тихое изменение уже неделями незаметно вытягивало дополнительные деньги из разработчиков.

Когда Anthropic выпустила Claude Opus 4.7 в апреле, официальные цены за токен остались прежними.

Однако у Opus 4.7 появился новый токенизатор.

Для непосвящённых: токенизатор — это компонент между текстом и моделью, который определяет, во сколько токенов превратятся ваши слова.

Новый токенизатор оказался заметно более агрессивным.

Тот же текст, то же предложение, тот же документ теперь генерировали до 35% больше токенов, чем раньше.

Разработчики, мигрировавшие на новую флагманскую модель без предварительного тестирования, увидели рост счетов до 27% — без каких-либо видимых изменений в прайс-листе.

Именно так выглядит повышение цен, которое замечают лишь спустя несколько месяцев.

Корпоративные контракты уже переписываются

Потребительские подписки — лишь верхушка айсберга.

В корпоративном сегменте изменения начались ещё в конце 2025 года.

The Register сообщил, что Anthropic начала переводить корпоративных клиентов на usage-based модели ещё в ноябре 2025-го.

Переход от фиксированной подписки к потокенному биллингу, который исходная статья называла неизбежным, теперь официально подтверждён.

Anthropic первой из крупных ИИ-компаний открыто признала это.

Фиксированная корпоративная ИИ-подписка — та самая модель, благодаря которой ИИ стоил дешевле одного SaaS-инструмента в бюджете компании, — стремительно уходит в прошлое.

Ник Терли из OpenAI сформулировал это предельно жёстко:

«Возможно, безлимитный тариф для ИИ — это как безлимитный тариф на электричество. Это просто не имеет смысла».

Счета уже начинают взрываться

Данные корпоративных расходов делают проблему пугающе конкретной.

Uber полностью израсходовал свой AI-бюджет на 2026 год уже к апрелю. За четыре месяца.

Компания внедрила Claude Code в конце 2025 года и даже создала внутренние рейтинги разработчиков по объёму использования ИИ. К февралю использование удвоилось.

К апрелю:

84% разработчиков Uber использовали агентное программирование;

расходы API на одного инженера составляли от $500 до $2000 в месяц;

95% инженеров ежемесячно пользовались ИИ-инструментами;

около 70% коммитов создавались с участием ИИ.

Инструмент оказался слишком успешным, чтобы компания могла позволить себе масштабировать его без ограничений.

IPO заставляет менять правила игры

И OpenAI, и Anthropic движутся к IPO во второй половине 2026 года.

В апреле OpenAI закрыла крупнейший частный инвестиционный раунд в истории — $122 млрд.

Anthropic, по сообщениям СМИ, превысила $30 млрд годовой выручки.

Цифры огромны.

Но обе компании продолжают сжигать деньги с невероятной скоростью.

Публичный рынок не примет разрыв между доходами от подписок и реальной стоимостью вычислений, который определял последние три года.

Как только одна из компаний выйдет на IPO, аналитики потребуют показать unit economics и понятный путь к прибыли.

Usage-based billing — самый быстрый способ продемонстрировать такой путь.

Формируются две ИИ-коалиции

События 14 мая показали не просто ценовой конфликт.

На рынке формируются две разные AI-коалиции, расходящиеся в фундаментальном вопросе: как именно продавать интеллект.

OpenAI + Microsoft

Ставка на:

единые корпоративные подписки;

минимум ограничений;

максимально простую модель оплаты.

Логика проста: масштаб и экосистема со временем компенсируют расходы.

Anthropic + Google + Amazon

Ставка на:

многоуровневые тарифы;

контроль мощности;

оплату по токенам.

Логика другая: прозрачный биллинг создаёт более устойчивую бизнес-модель и даёт более чистую картину для IPO.

CNBC считает подход Anthropic более осторожным и рациональным.

Главный вопрос теперь в другом

Прочувствовала ли ваша организация масштаб угрозы?

Эпоха ИИ с фиксированной ценой закончилась.

Взрывной рост стоимости токенов становится реальной угрозой для компаний, внедряющих ИИ.

Это полностью меняет подход к проектированию ИИ-агентов.

Теперь критически важно учитывать эффективность использования токенов.

Что может смягчить удар

1. Подбирайте модель под задачу

Не каждому этапу агентного workflow нужна самая мощная и дорогая модель.

Лёгкие модели отлично подходят для:

классификации;

маршрутизации;

форматирования;

простых проверок.

Тяжёлые модели стоит оставлять только для сложного reasoning и генерации.

2. Специализированные агенты дешевле универсальных

Узкоспециализированный агент с компактным системным промптом обходится значительно дешевле, чем универсальный ИИ «на все случаи жизни».

Меньше контекста → меньше токенов → ниже стоимость.

3. Осознанно сжимайте контекст

Всё, что вы отправляете в промпт, — это деньги.

Сырые документы, длинные истории диалога и раздутые инструкции увеличивают стоимость каждого запроса.

Поэтому данные необходимо:

суммировать;

дробить;

фильтровать перед отправкой.

4. Агрессивно используйте кэширование

Если один и тот же контекст повторяется между запросами — используйте prompt caching везде, где это возможно.

При масштабировании экономия становится весьма ощутимой.

5. Используйте агентов только там, где они действительно дают эффект

Не каждому workflow нужен ИИ-агент.

Наиболее оправданные сценарии:

пакетная обработка;

массовые повторяющиеся задачи;

многошаговые reasoning-цепочки;

сложная автоматизация, где экономический эффект действительно превышает стоимость вычислений.

И главный вопрос напоследок

Не приведут ли новые правила ценообразования к пересмотру всей логики интеграции ИИ в бизнес-процессы?

Так ли однозначно экономически оправданной останется автоматизация на базе ИИ уже в ближайшие годы?

И самое интересное:

как оценить риски ценового шантажа со стороны ИИ-провайдеров, если фундамент и логика ваших бизнес-процессов окажутся в зависимости от двух-трёх игроков рынка?

Похоже, именно этот вопрос бизнесу придётся задавать себе уже сейчас.

Показать полностью

[моё] DeepSeek Будущее Развитие Openai ChatGPT Искусственный интеллект Управление Информационная безопасность Предпринимательство Бизнес IT Стартап Увольнение Работа Робот Длиннопост

Beloys

Лига программистов

Без рейтинга. Нужна помощь пикабу⁠⁠

7 дней назад

Всем привет, мы с моим другом разрабатывали проект - оцифровка для маркетплейсов. Достигли хороших результатов - были первые заявки и подписки, но так сложилась судьба, что мы теперь не можем работать над проектом совместно.

Если вдруг кому-то интересно, предлагаю возобновить наш стартап - будем созваниваться и дописывать код. Бек - laravel, front - vue. С меня исходный код (более года разработки) вовлеченность (совместное времяпровождение в проекте). И маркетинг - обзвон клиентской базы для участия в тестировании.

Ссылка для ознакомительного видео

https://www.youtube.com/watch?v=ryH9gAxyadA

Прошу всех поддержать плюсом. Хочется закончить продукт.

Показать полностью

[моё] Маркетплейс Программист Проект IT Без рейтинга

ChilledDog

Лига программистов

Окей, как и обещал - немного про то, как вообще собирался сайт про динозавров⁠⁠

8 дней назад

Вот сам сайт:

https://mesoris.com

Было много комментариев о вайбкодинге. И я, естественно, этого не скрываю. Считаю, что этот сайт хороший пример правильного использования ии. Я использую его и в своей работе. было бы странно, если бы я писал сайт, который был изначально предназначен для пользования только моим сыном, с нуля. Ну и время. Ресурс, которого постоянно не хватает.

Любое взаимодействие с ии начинается с промптов. Чат gpt помог мне в написании изначального промпта. В нем описал идею, каким я вижу наполнение и указал фреймворк Vue3, просто потому что в нем у меня большой опыт.

Мне нравится интерфейс и удобство Claude Code в терминале, однако в работе я использовал не модель от Anthropic, а другую модель, совместимую с API Anthropic.

В качестве AI-модели я использовал DeepSeek-V4-Pro через Ollama - сервис для запуска и работы с открытыми AI-моделями. Поскольку у меня нет собственной мощной видеокарты, я пользовался облачными моделями, которые предоставляет сервис. Выбор пал на DeepSeek-V4-Pro, так как эта модель значительно дешевле многих аналогов, при этом по качеству уступает им совсем немного.

У Ollama Cloud, конечно, есть и заметный недостаток - медленная обработка и выполнение запросов. Однако в моем случае это не было критично, так как работа не требовала высокой скорости.

Для некоторых задач я также использовал GitHub Copilot. У меня была базовая подписка стоимостью 10 долларов, в рамках которой была доступна модель Claude Sonnet 4.6. Copilot я использовал нечасто, поскольку лимит премиум-запросов расходуется довольно быстро. Тем не менее, в отдельных задачах он оказался полезен - например, помог написать скрипт для скачивания изображений динозавров.

Потребовалось довольно много итераций для приемлемого варианта, но не финального. После этого началась уже ручная работа: ревью кода, исправление ошибок, доработка текста, внесение необходимых правок и других скучных дел.

Да, работы предстоит еще достаточно много. В комментариях здесь указывали на ошибки, что можно сделать лучше, предлагали новые идеи. Я ко всему прислушиваюсь, записываю к себе в бэклог и буду постепенно реализовывать. Ну и возможно, эта схема не является самой правильной. Я просто рассказал, что сделал я, это не является экспертным мнением. Поэтому буду рад, если есть советы более опытных вайбкодеров.

Показать полностью

[моё] Программирование DeepSeek IT Разработка Динозавры Проект Текст

Отличная работа, все прочитано!

1 2 3 4 5 6 7 8 9 10 11 20 30 40 50 100

Лига программистов

Популярные теги в сообществе:

Что получилось

Осадок после конфликта

Важный технический момент

Главная проблема

Что попробовал

К какому выводу пришёл

Что дальше

Вопрос к сообществу

Управление серверами прямо из UI

Самый annoying баг дня - Gemma 4 молчала

Ещё из фиксов

llama_client.py тоже сильно переделал

Из небольших, но приятных вещей

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы