molyanov

molyanov

Развиваю 3,5 бизнеса, путешествую по миру, рассказываю о том и об этом в блоге. Без успешного успеха, розовых очков и наставничества для наставников >> https://t.me/+DfhMulKJbfhkNjUy
Пикабушник
Дата рождения: 5 декабря
в топе авторов на 740 месте
70К рейтинг 130 подписчиков 7 подписок 149 постов 51 в горячем
Награды:
5 лет на Пикабу
5

Как сделать свой портрет с помощью ИИ — чтобы действительно было похоже

За последние пару недель я сгенерировал несколько тысяч ИИ-портретов — себя, друзей, родственников и даже случайных людей из интернета. Мне было интересно разобраться, как выстроить этот процесс так, чтобы нейрофотки получались похожими на человека.

Короче, я потратил около $200 на эксперименты и вроде как нащупал адекватный способ.

Нам понадобится:

  1. ChatGPT с платной подпиской (бесплатный не годится, он тупой). Можно заменить на Nano Banana (тоже платную), но она показала себя похуже.

  2. Несколько своих фотографий с разных ракурсов, снятых при хорошем освещении

  3. Фотография-референс, которую мы будем воссоздавать. Например, вы увидели в Пинтересте клевый портрет и хотите себе такой же.

Есть альтернативный вариант для тех, кто не хочет заморачиваться с оформлением подписки на сервис, который не принимает оплату из России, о нем расскажу в конце.

Сразу покажу пару примеров, что получается — а вы решайте, устраивает вас такое качество или нет. Если да — читайте дальше, я расскажу, как это делается.

Это все ии-портреты, настоящих фоток тут нет.

Я кидал эти фотке маме — она не поняла, что это не настоящий я. Считаю, что это показательно!

Фотографируемся

Качество ИИ-генерации ОЧЕНЬ сильно зависит от исходных фото. Невероятно сильно. Сильнее, чем от любого промта, который вы можете придумать.

Если фотки некачественные, ваше лицо плохо видно, освещение плохое или ракурс кривой — нейронка будет тащить все эти проблемы в генерации, и никак это не исправишь.

Поэтому ИИ-фотосет начинается с фотосета настоящего. Но не переживайте, он простой, фотограф не потребуется и никто идти не надо.

Нам нужно сделать 5-6 фотографий себя в разных ракурсах:

  1. Лицо крупным планом

  2. Лицо в 3/4

  3. Лицо в профиль

  4. Во весь рост (можно со штатива, или просто облокотите телефон на что-нибудь и поставьте таймер)

Ну и еще пару вариаций того же самого. Например, фото по пояс в пол оборота и какое-нибудь, где вы улыбаетесь, чтобы нейронка поняла, как вообще ваша улыбка выглядит.

Фотки надо делать при хорошем дневном свете. Можно выйти на улицу (только не в полдень на ярком солнце, чтобы не щуриться), но лучше — просто встать напротив окна.

С потолочным светом фоткаться плохо — будут тени под глазами, который нейронка будет упорно переносить в генерации.

Когда будете фоткаться в полный рост, постарайтесь подобрать одежду, которая не скрывает фигуру. Не оверсайз. Иначе пользы будет не очень много, нейронка не поймет реальные пропорции тела и начнет выдумывать.

Все ИИ-фото выше я получил с вот таким фотосетом. Сделайте что-нибудь подобное.

Ну и еще будет полезно сделать фото, примерно похожее на референс, который вы выбрали. Если вы хотите сгенерировать портрет, где вы сидите — то и сфоткайтесь сидя.

Просим нейронку описать ваши фото

Я провел много экспериментов и обнаружил, что генерации получаются стабильнее (нейронка реже косячит), если давать ей не только пачку своих фото, но и текстовое описание внешности.

Поэтому открываем ChatGPT, кидаем ему свой селфичный фотосет и просим описать внешность на 100-200 слов. Лучше на английском, ИИ все еще лучше работает с ним, чем с русским.

Попросите описать ваше лицо, прическу, цвет глаз и волос, фигуру, соотношение ширины плеч, талии и бедер, длины ног и туловища, размер груди, если вы девушка. Ну и особые примеры: очки, пирсинг, родинки, шрамы, татуировки.

Важный момент — явно запретите нейронки описывать вашу мимику, позу, одежду, освещение и так далее. Это все нам не надо, оно будет мешать.

Или еще проще, скопируйте этот промт и приложите к своим фоткам.

Create an identity card from these photos. Focus on stable visual traits that help preserve likeness, real age impression, body build, and proportions in later portrait generation. Return plain English only, one paragraph, 100-150 words. Describe visual traits only: face, hair, eye color if visible, facial hair, skin tone, age impression, body build, proportions, and distinctive visible traits. Do not describe expression, gaze, head turn, posture, or pose; those should come from the selected photoshoot reference.

Сохраняем результат и идем дальше.

Просим нейронку описать референс

Себя описали, теперь надо описать фотографию, которую хотим получить.

Вот с этим я экспериментировал больше всего.

Если отдать нейронке свои фото и референс и сказать «замени человека на этой фотке на меня, сохрани композицию», то результат будет ОЧЕНЬ сильно зависеть от похожести вашего телосложения на телосложение человека на референском фото. Если вы похожи — все сгенерируется отлично. Но если вы худее/толще/накаченнее, то в половине случаев получится шляпа.

Иногда нейронка будет переносить вашу фигуру на ИИ-фото правильно. А иногда она будет брать фигуру исходной модели и присобачивать к ней ваше лицо. Можно, конечно, придумать ситуации, когда именно такой эффект и нужен, но мы-то хотим сделать фото с собой, чтобы нейроболванчик был максимально похож на нас.

Поэтому такой вариант отметаем и действуем по-другому.

Не отдаем боту референское фото вообще, чтобы его не путать. Вместо этого снова идем в ChatGPT, показываем эту фотку и просим ее очень подробно описать:

  • где происходит сцена и какой фон

  • как кадр снят: крупность, ракурс, расстояние, что попадает в кадр

  • позу и размещение тела: как повернут корпус, где голова, плечи, руки, ноги

  • что делают руки и с чем человек взаимодействует

  • направление взгляда и выражение лица

  • одежду

  • свет, цвета, настроение и композицию

Например, вот наша фотка.

А вот ее описание от нейронки (можете показать своему ChatGPT как пример, чтобы он лучше понял, что вы от него хотите:

Scene and environment: Tight studio portrait against a smoky golden background with warm haze. The amber glow sits behind the centered head, while the edges fall darker so the forward hands read as the closest foreground layer.

Camera and crop: Close face-and-hands crop at eye level. The face sits in the center, while both hands extend close to the lens and appear intentionally larger and softer than the face.

Pose and body placement: The subject faces the camera directly while both arms thrust toward the lens. The camera-right hand occupies the upper-right foreground with thumb and index finger forming the top and side of a loose rectangle; the camera-left hand occupies the lower-left foreground with thumb and index finger forming the bottom and opposite side. The hands stay closer to the camera than the face, large and softly blurred, while the eyes remain centered through the open space. Avoid fists, peace signs, and hands that do not create a frame around the face.

Head, gaze, expression: Direct gaze into the lens with a focused, neutral expression. The head stays steady under the cap brim, with the eyes unobstructed.

Wardrobe: Black baseball cap with a plain front and black hoodie. The clothing is minimal and dark so the hand gesture and golden light carry the image.

Props and object interaction: No separate props. The foreground hands are the main interaction with the camera, framing the portrait space.

Lighting and color: Warm amber backlight and smoke create a glowing halo behind the cap and head. Cooler soft fill keeps the face readable, while the foreground hands catch warm highlights and slight blur.

Composition and details: Keep all thumbs and index fingers visible enough to read as a frame, even if the nearest fingertips are softly out of focus. Preserve the cap brim, eyes, face center, hoodie neckline, and golden haze behind the head.

Составляем финальный промт для генерации ИИ-фото

Итого у нас имеется: набор наших фоток, краткое текстовое описание нашей внешности и подробное описание композиции, которую мы хотим получить. Собираем все вместе.

Сначала инструкцию для нейронки:

Create one realistic photo of the person from the uploaded photos, placed into the photoshoot described below.

Use the uploaded photos as the identity source for the person: real facial likeness, age impression, skin tone, hair, visible body shape, body volume, proportions, and natural clothing fit. Do not copy the casual clothing, pose, lighting, or location from the uploaded photos.

Adapt the described outfit, pose, and camera framing to the person's real visible build from the uploaded photos. Keep their natural proportions and weight distribution; do not make the person slimmer, taller, more athletic, more model-like, or more conventionally polished than the uploaded photos show.

Затем добавляем свое описание:

Person: Adult man with light skin and a cool, slightly pink undertone. Hair is dark brown to black, cut very short with a slightly longer top and tapered sides. He has a full dense dark beard and mustache, with facial hair covering the chin, jaw, and cheeks. Eye color appears light, greenish-gray. The face is oval with a broad forehead, straight nose bridge, defined jawline, and moderately lean cheeks. He has a medium neck, slim-to-average build, moderate shoulder width, a lean torso with a flat-to-slightly rounded abdomen, slim arms, and slender legs with narrow thighs and calves. Overall proportions read compact and lean, with stable facial hair and short dark hairstyle as the most recognizable identity traits.

Ну и потом большое описание референса.

Scene and environment…
Camera and crop…

И так далее. Так как промт получился длинный, повторим в конце, что мы вообще от нейронки хотим:

Render it as a realistic photo in the visual style described above, with natural skin texture, believable fabric, coherent light, and accurate hands.

Генерируем

Получившийся огромный промт вместе со своими фотографиями относим в платный ChatGPT, включаем режим Thinking — и получаем ИИ-фотографии.

Не могу сказать, что с таким подходом мы будете получать шедевры в 100% случаев. Иногда придется перегененировать несколько раз. Но получить хорошую фотку за 5 минут вполне реально.

Если у вас нет подписки на ChatGPT или Gemini и не хочется заморачиваться с зарубежными картами, есть телеграм-бот, который умеет все это делать. Его разработал я, и заложил в него ровно этот подход к генерации ИИ-портретов, который тут описал. Присылаете свои фотки, выбираете идею из каталога — получаете нейрофотосет.

Внутри уже 300 идей для фото, и я каждую неделю добавляю какие-нибудь интересные новые. И для мужчин, и для девушек.

Пару фоток можно сделать бесплатно, дальше за деньги (мне надо API-токены оплачивать). Платить можно российской картой или СБП. Никаких подписок и автосписаний нет, оплата просто за токены. Еще раз ссылочка @imagine_picbot

Спасибо, что прочитали статью, надеюсь, вам она пригодится.

Показать полностью 15
2212

Давайте расскажу вам про статуи на острове Пасхи

1. 🗿Эти штуки называются моаи. На рапануйском языке это, внезапно, статуя.

2. Это не каменные головы. Это каменные челы без ног. У них есть плечи, руки, животы и даже ягодицы. Тольно ног нет. Просто так вышло, что многих хорошо сохранившихся изрядно засыпало землей.

3. Сначала рапануйцы делали маленькие статуйки, которые спокойно можно нести в руках. Но каждый старался сделать моаи побольше предыдущих — и вот дошли и многотонных истуканов. Самые большие — в районе 10 метров. В среднем на острове можно найти 3-5 метровых моаи.

4. По сути, моаи — это гробница. Рапануйцы верили, что у каждого человека есть мана (да, это полинезийское слово) — жизненная энергия. И больше всего маны у тех, кто много знает, много умеет и активно делится опытом с окружающими. Когда такие люди умирали, их высушивали на солнце, кости складывали в каменный ящик внутри платформы, а на саму платформу ставили моаи. Считалось, что так мана опытного чувака останется внутри племени, что он будет оберегать своих потомков.

5. Всех моаи вырезали из вулканического туфа, а затем кантовали через весь остров к месту установки. Обвязывали веревками, раскачивали, и так моаи «шагал» много километров. Если в процессе он падал, то почти навеняка ломался. На острове довольно много таких упавших, не дошедших до постамента статуй. Если это происходило, вырезали нового и тащили заново.

6. Большинство готовых моаи довольно побитые. Во-первых, на острове была война, и племена ломали предков-защитников друг друга. Во-вторых, тех, что установлены возле берега, трепали цунами. Когда приплыли европейцы, все статуи уже давно были опрокинуты, разломаны, засыпаны землей и поросли травой. Реставрировать и ставить обратно их начали только в конце 20-го века. Больше всех помогли японцы.

7. За это японцы удостоились чести принять одного моаи у себя. Его реально перевезли через океан, показывали на выставке, а потом вернули обратно. Вот он:

8. Лучше всего сохранились недоделанные и дефектные моаи, которых бросили возле горы, из которой их вырезали. Потому что во время войн никто их не трогал, стоят себе и стоят.

9. На создание и установку одного большого моаи уходило где-то полгода-год

10. Статуям примерно по 500-800 лет. Потом вышло так, что рапануйны сильно расплодились, истощили ресурсы острова, вырубили все деревья, начали голодать, воевать друг с другом — ну и как-то не до вырезания моаи стало.

11. Ах да, еще один факт забыл. У всех готовых моаи были глаза из кораллов со зрачками из обсидиана. Чтобы они могли наблюдать за своим племенем и делиться с ним маной. ВСЕ глаза спиздили европейские и американские археологи, на острове ни одного не осталось.

Показать полностью 3
3091

10 лет назад это была одна из самых опасных стран мира

103 убийства на 100 тысяч населения — больше только в зонах боевых действий.

Фактически, страну контроливали банды, а не правительство. Банды собирали налоги с жителей, выдавали пропуски на въезд в выезд в свои районы и устраивали лютый террор.

Но в 2022 году президент Найиб Букеле объявил бандам войну, ввел чрезвычайное положение, отменил тайну переписки и право на адвоката, отправил военных и полицию шерстить жилые кварталы и задерживать всех подозрительных. А еще построил огрооооомную такую тюрьму

Итого за несколько лет посадили 1.5% населения страны. И довольно много чуваков из криминального мира просто сбежали в соседние страны.

И вот сейчас это самая безопасная страна Латинской Америки. За весь 2025 год в ней произошло всего 82 убийства. Это меньше, чем раньше могло набраться за одни выходные.

А еще здесь биткоин — национальная валюта. Раньше даже налоги можно было платить в бетховенах, только недавно отменили.

Приехал в Сальвадор на пару дней, короче.

Страна невероятно доброжелательных и улыбчивых людей. Особенно улыбчив охранник ближайшего магазина, с дробовиком в руках. Он аж светится, когда я с ним здороваюсь.

Показать полностью
1279

Сколько вам было лет, когда вы узнали, что капча не просто фильтрует ботов, но и помогает обучать ИИ?

Я вот только пару лет назад об этом узнал 😆

В 2000 году математик из Гватемалы Луис фон Ан узнал, что Yahoo испытывает некоторые проблемы со спамом. И бесплатно придумал для них решение — показывать искаженные буквы, которые люди могут распознать, а роботы нет.

Yahoo сказали ему спасибо, внедрили — и все заработало. Миллионы людей начали вводить капчу.

Примерно тогда же команда фон Ана и придумала название CAPTCHA — Completely Automated Public Turing Test to Tell Computers and Humans Apart (полностью автоматический публичный тест Тьюринга для различения роботов от людей)

В 2007 году фон Ан прикинул, что человечество на ввод капчи тратит 500 000 часов в день, и хорошо бы это время использовать с пользой.

Он пришел к Гуглу и предложил им помощь в сканировании книг. Гугловские сервисы не могли распознать некоторые слова, и фон Ан предложил решение — reCAPTCHA

Берем нашу капчу и вместо бесполезной тарабарщины показываем 2 слова. Первое — которое мы уже распознали, контрольное, для проверки, человек ты или нет. А вот второе — это фотография слова из книжки, которое Гугл распознать не смог.

Кажное неизвестное слово показываем много раз разным людям и если 6+ человек распознали его одинаково — этот вариант считается верным.

Короче, еще в 2007 году роботы перевалили свою работу на людей, еще и ничего им за это не платили. К 2018 году больше 1 миллиарда людей бесплатно поучаствовали в оцифровке книг.

Ну а в 2009 Гугл выкупил у фон Ана рекапчу и немного ее допилил — теперь люди помогают роботам распознавать дорожные знаки, автобусы и прочую фигню, которую вы сами тысячи раз проходил.

Все эти данные идут на обучение ИИ для Гугл Карт и беспилотных автомобилей.

Когда я про это узнал, то пару дней ходил с мыслью «Гениально блин!»

Миллионы сайтов ставят себе капчу и дают Гуглу бесплатную рабочую силу для обучения ИИ. Идеальный бизнес

Кстати, на деньги с продажи Рекапчи Луис фон Ан создал компанию, которую вы все прекрасно знаете, — Дуолингво.

Показать полностью

Я не люблю новогодние каникулы

Вообще не понимаю этот прикол — полмесяца выходных посреди зимы. Ладно летом, когда все на моря гоняют, но зимой то зачем?

Неделю до НГ никто ничего не делает, потому что «давайте после праздников». Неделю после праздников тоже никто ничего не делает, потому что надо вспомнить, кто ты и чем вообще занимаешься

Итого целый месяц выпадает. Месяц, за который ты всем платишь зарплатки, но не получаешь никакой выручки

7 лет рулю маркетинговым агентством, и все 7 лет январь — убыточный месяц, без вариантов 😆

Моя бы воля — лучше бы новогодних праздников не было вообще, зато у каждого человека было 2 лишних недели отпуска в году. По дням отдыха то же самое, только ничего не умирает на целый месяц

1120

60 тысяч христиан работают на переработке мусора посреди мусульманской страны

Нормальные люди приезжают в новые страны, чтобы походить по красивым местам, полюбоваться памятниками архитектуры, вкусно покушать.

Я ехал в Египет с важной миссией — полазить по Маншият-Насиру. Или, как его называют в интернете, городу мусорщиков.

Итак.

Квартал на окраине Каира, где живет христианская община заббалинов. Община немаленькая, в районе 60 тысяч человек.

И все люди в этом квартале поколениями работают в индустрии переработки мусора. Такой массовый семейный бизнес.

Мужчины собирают мусор по всему городу на машинах, привозят домой, женщины его сортируют. Где-то руками, где-то есть семейные минизаводики с оборудованием.

Ну и потом все это идет на переработку. Пластик, металл, бумагу и картон продают заводам. Органикой кормят свинок. Да, свинки в мусульманской стране, все так. Это же христианская община, им можно.

Глядя на фотки вы можете подумать: «что за пиздец, как вообще такая нищета может существовать в мире»

И будете не совсем правы. Это, конечно, пиздец, но заббалины не нищие.

У них всех есть работа. И зарабатывают они немногим меньше среднего по Египту. Небогато живут, конечно, но не за чертой бедности.

У них всех есть жилье. И не ветхие лачуги, как в каком-нибудь гетто, а обычные квартиры в многоэтажных домах.

У них есть машины — как минимум мусор же надо на чем-то переводить.

Женщины наряжаются в красивые цветные платья, когда идут на рынок за фруктами. Дети с рюкзачками бодро топают в школу, перешагивая через вдавленные в помои трупики крыс.

Да и в целом район не выглядит депрессивным.

Ну то есть да, конечно, ты ходишь по гигантской помойке, но люди здесь приветливые. Они не смотрят на тебя волком, не бросаются в ноги просить милостыню, как в бедных районах Индии, и не тычут в тебя ножом, как в фавелах Бразилии.

Они тебе улыбаются.

Женщины, сидя посреди гор мусора, болтают друг с другом и приветливо машут, когда проходишь мимо.

Вокруг носятся дети, пинают мячи, гоняют котов, хохочут и делают все то же, что делают дети в любой другой стране.

Мужики после работы рубятся в нарды, покуривая кальян и попивая чай в многочисленных кафешках. Если подойти к ним, то пожмут тебе руку и скажут «welcome brother». Один даже пригласил меня внутрь своего заводика. Он там пластик крошит в труху и прессует в брикеты. А еще прямо внутри завода у него корова живет.

По улице ходит чувак и продает работягам свежевыпеченный хлеб. А на другой улице чувак продавал розовые воздушные шары.

И все это посреди гор мусора, напоминаю.

А знаете, в каком единственном районе Каира никто не пытался мне что-то впарить, показать свой магазинчик, попросить чаевые или милостыню? В Маншият-Насире!

Но, конечно, это не диснеевская мусорная сказка.

Люди поколениями живут в тотальной антисанитарии, здесь высокая детская смертность,  детский труд (мелкие помогают матерям сортировать мусор), проблемы с водой и канализацией.

А еще заббалинов активно стигматизируют остальные египтяне. Ну типа, мусорные люди, грязные. Такая вот ирония — ты всю жизнь очищаешь Каир от мусора и выдаешь самый высокий показатель переработки мусора В МИРЕ, а тебя все презирают и называют мусорщиком.

Короче, это одно из самых интересных и атмосферных мест, в которых я бывал в принципе. И уж точно самое интересное место в Каире.

Показать полностью 6
5881

Ночью у меня был очень сомнительный перелет9

Мне повезло сесть рядом с ОЧЕНЬ ОГРОМНЫМ мужиком, который занимал все свое кресло и еще треть моего. Его плечо и рука были уже в моей части пространства, поэтому как бы я не исхитрился сесть, все равно чувствовал себя как придавленная деревом жертва урагана.

Прямо перед нами был полностью свободный ряд

Я на него пересел

Подбеждал бортпроводник и начал возмущаться, что это это же места повышенной комфортности!!! за них надо доплачивать, нельзя просто так пересесть на место повышенной комфортности!!!

— Ну давай доплачу, сколько?

— А нельзя в полете доплатить, надо было в аэропорту доплачивать!

— Ну так раз нет шансов, что кто-то это купит за деньги, то я уж явно никому здесь не помешаю? Не причиню бедному Аэрофлоту убытки своими действиями, не?

— Нельзя, так не положено!!!

Собачились мы какое-то время, пришел второй бортпроводник, тоже начал рассказывать, что он ну никак не может мне помочь. Но потом сдался и согласился поискать мне другое место. И даже нашел. И я пересел.

Но вот вопрос. Я за свою жизнь летал довольно много. И по России, и по другим странам. Я видел, как бортпроводники старались разруливать дискомфортные ситуации пассажиров, видел даже как они пересаживали людей в бизнес — просто потому что там свободно, а человеку неудобно лететь.

Но чтобы бортпроводник занимался настолько нелогичной херней и не пускал пересесть на свободный ряд возле аварийного выхода — это я впервые вижу.

Аэрофлот разочаровал

Показать полностью
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества