Я и нейросети (очень много букв)
Пикабу, привет!
Решил поделиться историей работы с нейросетями, может кому интересно и полезно будет :)
Генерация изображений:
Первое знакомство было в августе 2022 года, я решил попробовать Midjourney. Тогда еще генерация происходила в дискорд канале, где в одном чате генерировались изображения всех пользователей. т.е. пишешь в чат промт, отправляешь, ждёшь очередь, ищешь свой результат среди кучи других, нажимаешь кнопочки под результатом (4 изображения было на выходе), где можно выбрать что сделать с изображением (перегенерировать, увеличить и пр.). Изображения получались пугающие, поэтому долго там не сидел. А с выходом новых версий Midjourney, они и вовсе перекрыли бесплатную генерацию.
В январе следующего года, нужно было сделать обложку для ВК группы, идея: два котика, которые здороваются за лапы. Тоже всё еще крипово выходило, но уже лучше, чем в прошлом году. Еле добился примерно задуманного результата.
В марте этого же года, я занимался продажей аккаунтов для PlayStation, тоже для пабликов нужно было изображение котика, тут уже результаты получше были.
Месяцем позже, увидел промт, с помощью которого можно перенести себя с фото в любой мир. Решил сделать себе аватарку в стиле киберпанк или готическую. Но увы, на меня процентов на 40 похоже было.Плюс артефакты пугающие. Так и не вышло сделать себе аватарку.
Сразу в будущее перенесусь. В 2025 году всё же решил оплатить подписку через посредника, около 3к рублей вышло. Сгенерировал пару изображений перед сном (тогда хотел сделать игру, требовался главный герой-рыцарь(конечно же котик!)). Проснулся, решил еще парочку картинок сделать перед работой, но когда зашел на сайт, то мне пришло уведомление, что аккаунт заблокирован, т.к. банковская карта левого человека, а это запрещено.
В апреле 24 года нужно было сделать аватарку для паблика по поиску напарников и картинку боту. DALL-E 3 неплохие результаты показывал.
В этом же месяце делал для казино бота, нужны были картинки с тиграми. Тоже DALL-E 3 пришел на помощь, очень понравились изображения на выходе :)
В мае 24 года открыл для себя Stable Diffusion. Немного запарно было устанавливать его себе на ПК, но справился и начал делать аниме картинки. В основном аниме девушек (одетых). Просто нравилось этим заниматься, увлекательный процесс: придумываешь разные образы, окружение, ситуации.
Тогда еще была видеокарта Nvidia 2080ti. Одно изображение могло генерироваться около минуты, но радует, что там можно было выставить количество изображений и оставалось только ждать, пока видеокарта сделает своё дело.
В этом же году заменил на Nvidia 3090 (в том году цены на карты большие были из-за майнинга,но каким-то чудом удалось найти б/у карту,но как новую и ниже рынка). Скорость генерации увеличилась многократно, счастью не было предела.
Грок пробовал, хорошая штука, выдаёт сразу кучу изображений.
Пытался сделать картинку птички + онигири, но желаемого результата не вышло. (не помню зачем, хотел игру слов сделать, мол весна - онигири (снегири) прилетели :D
Qwen3: Делал для паблика в вк картинку в виде гик робота. Красиво вышло, с первого раза.
Еще он неплохо справляется с логотипами. Для приложения делал иконку+картинку для магазина приложений.
Кодинг:
Что-то первая часть слишком большой вышла, попробую тут очень кратко.
В апреле 24 года открыл для себя ChatGPT. В то время я вёл паблик в тг по поиску соседей, мне кидали в личку текст объявления, а я выкладывал в паблик. Заказать изготовление тг бота, чтобы автоматизировать процесс, стоило тогда в районе 10к рублей, но всё же хотелось немного облегчить себе работу. В итоге решил научиться делать тг ботов. Посмотрел пару гайдов на ютубе и решил повторить. Дня два учился, но в итоге понял, что даже если я сделаю всё как в видео, то под мои потребности он не подойдёт, а как его модернизировать - идей не было. Вот тогда-то и решил впервые спросить у чата GPT.
Бесплатная версия очень долго думала, а потом так же долго выдавала ответ. Часто забывала о чём речь идёт, часто утыкался в лимиты. В итоге решил попробовать платную версию. Небо и земля, как оказалось. Но в те времена писать код можно было только по частям. Целого бота он тебе не напишет, т.к. ограничение по символам было, плюс ему тяжело было на нескольких задачах сосредоточиться. Приходилось сначала делать очень короткую основу, а потом функции по одной вписывать в код. Шаг за шагом, делался бот. Много вечеров, много нервов потрачено (то он скобку забудет в коде, то перепишет полностью код), но бота для приёма объявлений сделали.
Первая версия бота умела принимать текст, отправлять мне объявление в отдельную группу для модерации, где я мог нажать "Опубликовать" или "Отклонить", плюс в отдельную группу уходили данные о новых пользователях.
Процесс создания был очень увлекательным. Я накидываю идеи, что и где должно быть, а ИИ выдаёт мне части кода и говорит куда вставить.
В тоже время познакомился с серверами: аренда, установка, заливка бота на сервер и настройка.
Позже выходили новые версии, GPT стал думать быстрее, печатать код быстрее, но всё равно часто "тупил" и приходилось искать в чём проблема.
Есть бот, он без моего подтверждения выкладывает объявления в тг канал барахолку. Я придумал идею: публикуется изображение товара, под фото теги, юзернейм для связи, а сам текст объявления бот публикует в комментариях под этим постом, чтобы минимизировать визуальный шум. GPT вроде понял чего я хочу, но реализовать он сразу не смог. То в комментариях в общую группу постит, то забудет что хотел и просто всё в пост суёт. В итоге несколько вечеров битвы и получилось от него добиться нужного результата.
Самое радостное событие со мной произошло осенью 2025 года - я познакомился с Cursor.
Он мог написать бота за 5 минут, когда с GPT у меня раньше уходило несколько полных вечеров.
Первым делом я модернизировал своих текущих ботов. Добавил функции, которые сложно было с GPT реализовать, исправил недочёты.
Бот объявлений: Берёт объявление, отправляет на модерацию в группу, где я могу "Опубликовать", "Отклонить" или "Заблокировать" пользователя.(еще я сделал бота, который "слушает" канал с объявлениями и при выходе нового поста он выкладывает в одноимённый паблик в ВК(я называл его ретранслятор), при этом преобразовывает под ВК: вместо контактных данных пользователя - ссылка на ТГ канал, ниже текст объявления, еще ниже тег объявления и добавляет теги города), но он оказался лишним, ведь теперь эту я смог вписать в основного бота.
Таким образом я снизил нагрузку на сервер, убрав два ретранслятора. Второй был у паблика GameMate, там поиск напарников для онлайн игр, такой же принцип почти работы бота, как и у совместной аренды.
Было время, когда пытался изучить Android Studio, это программа для создания андроид приложений, но опять же, пару вечеров и понял, что нужно очень долго учиться. И сейчас курсор пришел на помощь. За неделю мы создали приложение для поиска напарников в онлайн играх. Я выложил его в русторе только, потому что Плей Маркете немного запарно это делать, плюс дань за вход платить. Приложение не особо популярностью пользуется, т.к. я уже давно понял, что для продвижения чего-либо нужна реклама, а реклама стоит недешево, там страшные суммы, вспоминать больно.
Я продолжал пользоваться Stable Diffusion, но лишь в начале 26 года дошло, что можно автоматизировать создание ИИ картинок. Я попросил курсор написать скрипт, который будет рандомно вставлять промты из списка, а я буду любоваться результатами. Тонны аниме ИИ девушек начали генерироваться. Но минус оказался в том, что действительно красивые результаты получались примерно 1 из 20 изображений. Либо просто некрасивые или "простые" картинки, либо с артефактами, где рука утопает в ноге, много пальцев, лишняя рука, рот без зубов или абсурд, где например девушка сидит в библиотеке, а рядом стоит лейка от душа и поливает её.
В итоге накопилось 700+ приемлемых изображений. Потом пришла идея поделиться картинками с людьми, и я создал бота :D
Бот в группе принимает изображения и загружает на сервер, после загрузки сам удаляет из группы, чтобы мне не пришлось этого делать.
Потом я выбираю интервал и бот начинает выкладывать каждые несколько часов по изображению в паблик. (я могу менять интервал, перемешивать изображения в очереди, либо добавить подпись под картинкой).
На данный момент у меня 553 изображения в очереди и интервал 3 часа. Этого хватит на 69 дней и 3 часа публикации.
Популярностью тоже не особо пользуется :D Каким-то чудом насобирал 29 подписчиков. Сначала там были открыты комментарии и те, кто там писал, в основном писали, что это нейромусор. Но были и те, кто говорил, что красиво и нравится. Для таких ребят я и "старался". А комменты закрыл, чтобы хейтеры настроение не портили.
После блокировки ТГ я создал такой же паблик в ВК и бот сначала выкладывает в ТГ паблик, а потом в ВК.
В какой-то момент мне понадобилась обложка для ВК с аниме девочкой. Тоже попросил курсор сделать скрипт для разрешения под обложку. Включил, ушел спать, потом ушел на работу. А когда вернулся, то в папке было около 5000 обложек T_T Перебрал все, оставил 500 с копейками. Одну себе поставил в профиль. Остальные решил раздать людям. Тоже сделал связку ТГ+ вк, но чтобы не терять качество изображения, бот под картинкой в тг выкладывает оригинал. В вк так не получилось и бот в вк пишет, что оригинал можно найти в тг канале.
Еще случайно создал скрипт для 18+ аниме девушек. Тоже много получилось. Тоже автопостится.
Сейчас я переехал в Екатеринбург. Мне нравится публиковать объявления, а может просто привычка и не могу уже без этого. Решил сделать сайт совместной аренды в Екб. За неделю с курсором закончили его. Плюс еще сделал бота, аналогичный самому первому боту, но этот еще публикует в вк и на сайт. И настроил бота так, что с сайта приходит в группу объявление и там я принимаю решение, не заходя на сайт. Очень удобно.
Плюс чат города сделал на главной, может идея зайдёт, если мне не лень будет рекламировать сайт :)
Рекламу решил не покупать, а расклеить объявления по городу. Купил 20 листов клейкой бумаги а4. Сделал в фотошопе карточки объявлений, на лист а4 влезло 9 карточек. Даже сходил в ближайший копи-центр. Я так подумал, что обычно лист Ч\Б печати в среднем стоит 10р. На мои 20 листов это 200р. В итоге, в одном месте мне сказали, что на такой бумаге не печатают, а в другом, что они печатают только на своей, 250р/ лист. т.е. 5000 рублей за 20 штук. Зашел на авито и увидел, что в доме рядом парень печатает. Я объяснил ситуацию, он без проблем распечатал. По 3.5 рубля за лист :D Но я ему 200р дал, как и планировал. Сейчас их вырезать осталось и начать прогулку по городу.
Еще пытался комфи осилить, но эти воркфлоу понять не могу. Может попозже.
В свободное время с курсором делаем игру на движке Godot. Настроили управление, режим строительства, внедрили Hunyuan3D-2. На данном этапе игрой это назвать сложно. т.к. я с видом от первого лица просто генерирую 3д объекты с помощью Hunyuan3D-2 и мне это очень нравится ) т.е. нажимаю на горячую клавишу в игре, появляется окно, либо загрузить изображение и по нему сгенерируется объект, либо по описанию. Качество на удивление очень хорошее у созданных объектов. В итоге я изменяю размер объектов и ставлю на их места, тем самым создавая локацию.
У ТГ оказалось СТОЛЬКО возможностей, для меня он сейчас как третья рука, к которой привык. А Смак даже бота не даст создать, да и канал вряд ли получится. Хотя, из-за моих женщин мой канал в первый же день забанят. И меня.
На самом деле очень много всего еще охота рассказать, но столько много текста, боюсь, что это отпугнёт читателей.
С радостью отвечу на любые вопросы в комментариях. Рад буду помочь чем-то, если это будет в моих силах :)
Спасибо тем, кто дочитал )
https://t.me/purple_black_aura (это картинки, если кому интересно будет)
А, да, ищу работу в Екатеринбурге :D Я очень креативный, усердный, усидчивый и люблю красивые вещи делать )











































Искусственный интеллект
5.8K постов11.9K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан