AndreyButakov

AndreyButakov

ИИ в жизни, работе и бизнесе Автор: @imblackmamba13 Сайт: optifyhub.ru Телеграм-канал: https://t.me/optifyhub
Пикабушник
Дата рождения: 13 декабря
211 рейтинг 6 подписчиков 2 подписки 83 поста 0 в горячем

ИИ-сервисы, которые сделают вас экспертом по любой ерунде (и убьют ваше время)

ИИ-сервисы, которые сделают вас экспертом по любой ерунде (и убьют ваше время)

Вы когда-нибудь задумывались, сколько времени мы тратим на «полезный» досуг, который на самом деле просто маскируется под продуктивность? Я вот задумался. И пришел к выводу, что вместо бессмысленного скроллинга лент, можно куда более эффективно прокрастинировать, погружаясь в одну тему до полного просветления. Ну, или до полного отупения, тут уж как повезет.

МОЙ ОПЫТ С «КРОЛИЧЬИМИ НОРАМИ»

Недавно я наткнулся на два сервиса, которые, на первый взгляд, выглядят как идеальные инструменты для глубокого изучения чего угодно: Delve (delve.a9.io) и RabbitHole Chat (www.rabbithole.chat). Идея проста: вы начинаете диалог с ИИ, задаете вопрос, а он сам предлагает вам, куда можно двинуться дальше, чтобы закопаться в тему еще глубже. Звучит как мечта для любого, кто любит докапываться до сути, правда?

ПОЧЕМУ ЭТО ОПАСНО

И вот тут кроется главная ловушка. Эти сервисы – это не про продуктивность. Это не про эффективное обучение. Это, черт возьми, про досуг, который затягивает похлеще любого сериала или ТикТока. Вы моргнуть не успеете, как прошло два часа, а вы уже прекрасно разбираетесь в причинах любви Петра Первого к стоматологии или знаете всех любовников Клеопатры. И все это – в рабочее время, пока коллеги думают, что вы усердно «работаете».

Я провел несколько экспериментов. Задал вопрос про квантовую физику, потом про историю Древнего Рима, потом про то, как устроены нейронные сети. И каждый раз я проваливался в эту «кроличью нору» с головой. Сервис подкидывает новые вопросы, новые направления, новые ссылки. И ты просто не можешь остановиться. Это как бесконечная Википедия, только с личным гидом, который постоянно подливает масла в огонь твоего любопытства.

ВЫВОДЫ СКЕПТИКА-ПРАГМАТИКА

Так что, если у вас слабая сила воли, и вы склонны к прокрастинации, обходите эти сервисы стороной. Или, по крайней мере, используйте их строго в нерабочее время. Потому что иначе вы рискуете прийти домой с чувством глубокого удовлетворения от того, что теперь вы эксперт по средневековым пыткам, но при этом ни одна рабочая задача так и не была выполнена. Это не инструменты для работы, это инструменты для «полезного» убийства времени. И в этом они чертовски хороши.

А как вы считаете, такие сервисы – это благо или зло для современного человека, который и так постоянно отвлекается? Жду ваших мнений в комментариях.

Показать полностью
0

Текстовый фотошоп от Google: Мой скептический взгляд на Nano-banana

Текстовый фотошоп от Google: Мой скептический взгляд на Nano-banana

Не прошло и года, как нам снова обещают «революцию» в мире редактирования изображений. На этот раз на арену выкатили некий Nano-banana (Gemini-2.5-flash-image) от Google. И, конечно же, он «уже реально текстовый фотошоп». Ну-ну, мы это уже слышали.

МОИ ПЕРВЫЕ ВПЕЧАТЛЕНИЯ

Первое, что бросается в глаза, – цена. 39$ за 1000 изображений. Это, конечно, «в два раза меньше конкурентов», но давайте будем честны, для большинства это пока что игрушка, а не рабочий инструмент. Хотя, если у вас есть американский VPN, можно пощупать бесплатно через Gemini app или Google AI Studio. Я, конечно, не удержался.

ЧТО ПО РЕЗУЛЬТАТАМ?

Заявлено, что результат «в целом лучше, чем у Qwen». И вот тут начинается самое интересное. Я прогнал несколько своих тестовых запросов, которые раньше ставили в тупик даже самые распиаренные модели. И что же? Да, местами стало лучше. Но до «текстового фотошопа» это все еще как до Луны пешком. Мелкие детали, сложные композиции – все еще хромает. ИИ по-прежнему «додумывает» за вас, а не выполняет четкие инструкции. Это не фотошоп, это скорее «умный» генератор вариаций на тему.

ГДЕ ПОДВОХ?

Мой скепсис тут не случаен. Каждый раз, когда выходит новая модель, нам обещают золотые горы. А по факту мы получаем чуть более продвинутую версию того, что уже было. Да, прогресс есть, но он не такой линейный и не такой «революционный», как нам пытаются продать. Это скорее эволюция, а не скачок. И пока что ни одна модель не заменит дизайнера с прямыми руками и Photoshop.

ВЫВОДЫ

Nano-banana – это шаг вперед, но не прыжок. Это инструмент, который может быть полезен для быстрых прототипов или для тех, кому не нужна идеальная точность. Но называть это «текстовым фотошопом» – это, мягко говоря, преувеличение. Мы все еще ждем того самого ИИ, который сможет понять и реализовать сложную задумку без десятка перегенераций и ручной доработки.

А как вы считаете, это реальный прорыв или очередной маркетинговый пузырь? Жду ваших мнений в комментах.

Показать полностью
2

ИИ вместо врача: Мой взгляд на будущее медицины

У каждого из нас, наверное, есть своя история про «чудо-врача», который после долгих мытарств и бесполезных обследований вдруг назначает что-то простое, и проблема решается. У меня вот была история со спиной: сначала бесконечные анализы, дорогие процедуры, а потом — обычный массаж, и всё прошло. И вот тут возникает вопрос: а что, если бы вместо всех этих хождений по мукам, мне сразу помог бы ИИ?

МОЙ ОПЫТ С ИИ В МЕДИЦИНЕ

Я, как человек, который постоянно копается в нейросетях, не мог пройти мимо этой темы. Недавно наткнулся на исследование Microsoft, где они взяли 304 самых сложных клинических случая из авторитетного медицинского журнала NEJM и прогнали их через свою систему MAI-DxO. Результаты, мягко говоря, шокировали: точность ИИ-системы — 80%, а группы опытных врачей — всего 20%! При этом ИИ оказался ещё и дешевле. Это же просто фантастика, если подумать: быстрая и точная диагностика, доступ к супер-специалистам в любой глуши, снижение стоимости лечения. Звучит как утопия, но цифры говорят сами за себя.

GOOGLE И ИИ-ДИАГНОСТИКА

Google тоже не отстаёт. Их модель MedGemma генерирует отчёты по рентгеновским снимкам с точностью 81%. И что самое интересное, это opensource! То есть, теоретически, любой желающий может запустить такую модель у себя, если, конечно, есть достаточно мощное железо. Представьте: сидит где-нибудь в деревне фельдшер, а у него под рукой ИИ, который по снимку лёгких сразу выдаёт предварительный диагноз. Это же прорыв!

ОБРАТНАЯ СТОРОНА МЕДАЛИ

Но давайте будем реалистами. Корпорации не благотворительностью занимаются. Вся эта история с бесплатными или дешёвыми ИИ-продуктами очень напоминает наркотик: сначала подсаживают на иглу, а потом выставляют счёт. Сегодня поликлиники радуются, что могут использовать ИИ-врачей, оплачивая облачные мощности Google или Microsoft. А завтра что? Клиники, которые не подсядут на эту иглу, просто не выдержат конкуренции, а те, кто подсел, без ИИ и чихнуть не смогут. Привет, киберпанк!

РИСКИ И ПРЕДУПРЕЖДЕНИЯ

И, конечно, не стоит забывать, что ИИ — штука ненадёжная. Вспомните историю с мужчиной, который по совету ИИ заменил пищевую соль бромидом натрия и попал в психушку. Это яркий пример того, почему живых врачей со счетов списывать рано. ИИ — это инструмент, второе мнение, помощник, но никак не полноценная замена специалисту. Пока что. Или я ошибаюсь?

А как вы считаете, ИИ в медицине — это реальный прорыв или очередной маркетинговый пузырь? Доверяете ли вы бездушной машине своё здоровье? Жду ваших мнений в комментариях!

Показать полностью
2

ИИ-сказки: когда классика надоела, а мораль устарела

ИИ-сказки: когда классика надоела, а мораль устарела

Надоели эти ваши классические сказки? Ну, знаете, где принцессы ждут принцев, а мораль устарела лет эдак на двести? Меня всегда бесило, что детские книги не успевают за миром, а порой и вовсе транслируют какую-то дичь. И вот, я решил копнуть глубже в тему генерации контента, но не для взрослых, а для самых маленьких.

МОЙ ЭКСПЕРИМЕНТ С ИИ-СКАЗКАМИ

Я тут наткнулся на одну интересную штуку – Gemini Storybook. По сути, это такой конструктор сказок на базе ИИ. Задаешь ему пару фраз, и он тебе выдает целую историю. Звучит как очередной хайп, да? Но я решил проверить, насколько это вообще применимо в реальной жизни, а не просто для баловства.

Первая мысль: «Окей, а что, если попробовать объяснить ребенку что-то сложное через сказку?» Например, почему львы едят антилоп, и это не «плохо», а «выживание». Или как самолеты летают, без скучных формул и законов физики. Я попробовал. И знаете что? Получилось довольно... иронично. ИИ, конечно, старается быть политкорректным, но иногда проскакивают такие формулировки, что диву даешься.

ВТОРАЯ ПОПЫТКА: САМОЛЕТЫ И ФИЗИКА

Вторая попытка была про самолеты. Тут ИИ справился лучше, но все равно чувствуется эта его «нейросетевая» наивность. С одной стороны, это хорошо – просто и понятно. С другой – иногда хочется чуть больше глубины, даже для ребенка. В общем, инструмент интересный, но пока не панацея.

ВЫВОДЫ И ПЕРСПЕКТИВЫ

Я вижу в этом потенциал. Особенно для родителей, которые хотят познакомить детей с нестандартными концепциями или просто отойти от заезженных сюжетов. Можно генерировать сказки на разных языках, что круто для билингвов. Но пока это скорее игрушка, чем полноценный инструмент для создания шедевров. ИИ еще не научился по-настоящему «чувствовать» аудиторию и тонкие нюансы морали.

А как вы считаете, это реальный прорыв в детской литературе или очередной маркетинговый пузырь? Жду ваших мнений в комментах. Может, кто-то уже пробовал и нашел свой идеальный промт для сказки?

Показать полностью 1
2

Нейросеть, которая не врёт: Мой опыт с Qwen-Image-Edit

Нейросеть, которая не врёт: Мой опыт с Qwen-Image-Edit

Меня всегда удивляло, как быстро хайп вокруг нейросетей сменяется разочарованием. Только вчера все кричали, что Midjourney и DALL-E убьют дизайнеров, а сегодня уже стонут от «пластиковых» лиц и шестипалых рук. Но вот что я вам скажу: пока одни ноют, другие тихонько пилят инструменты, которые реально работают. И сегодня я расскажу про один такой, который меня по-настоящему впечатлил.

МОЙ ОПЫТ С QWEN-IMAGE-EDIT

Я, как человек, который регулярно что-то пилит и тестирует, постоянно ищу инструменты, способные упростить жизнь. И когда мне подсунули Qwen-Image-Edit от китайских товарищей из Qwen, я отнесся скептически. Ну, очередная нейронка, которая будет перерисовывать мне фотографии до неузнаваемости, как это любит делать ChatGPT, или выдавать нечто невразумительное, как Gemini. Но тут меня ждал сюрприз.

Эта штука не перерисовывает изображение с нуля! Она реально редактирует. То есть, если мне нужно убрать с фото случайного прохожего, она его уберет, а не заменит на розового слона. Если я хочу изменить текст на баннере, она это сделает, не превращая его в набор иероглифов. Это, черт возьми, текстовый фотошоп, который работает так, как я всегда мечтал.

ЧТО МЕНЯ ПОРАЗИЛО

* **Точность:** Я пробовал менять объекты, стили, даже одежду на людях. Результат — почти всегда идеально. Никаких артефактов, никаких «лишних» деталей.

* **Понимание русского языка:** Это вообще отдельная песня. Я давал ей запросы на русском, и она понимала меня с полуслова. Никаких танцев с бубном и переводчиком.

* **Бесплатность и доступность:** Не нужен VPN, не нужно платить. Просто заходишь и пользуешься. А для тех, кто любит копаться, есть возможность запустить на собственном железе. Это ли не мечта?

ГДЕ ЭТО ПРИМЕНИТЬ?

Да где угодно! Вот лишь несколько идей, которые я уже опробовал:

* **Удаление лишних людей с фото:** Прощайте, случайные туристы на фоне Эйфелевой башни!

* **Изменение фона:** Теперь можно за секунду перенести себя из хрущевки на Мальдивы.

* **Реклама и баннеры:** Добавить текст, изменить цвета, подкорректировать объекты — все это делается в пару кликов. Прощайте, дорогие дизайнеры?

* **Реставрация старых фото:** Вернуть к жизни бабушкины снимки? Легко.

* **Эксперименты с интерьером:** Хотите посмотреть, как будет выглядеть новая мебель в вашей комнате? Загружаете фото и меняете.

ИТОГ: КИТАЙЦЫ СНОВА ВПЕРЕДИ?

Я, честно говоря, впечатлен. Пока западные гиганты гонятся за хайпом и выпускают сырые продукты, китайцы тихонько делают то, что реально нужно людям. Qwen-Image-Edit — это не просто игрушка, это инструмент, который уже сейчас может сэкономить кучу времени и денег. И это бесплатно. 🤔

А как вы считаете, это реальный прорыв или очередной маркетинговый пузырь, который лопнет через пару месяцев? Жду ваших мнений в комментах.

Показать полностью
2

Битва браузерных ИИ-агентов: Проверил, кто из них реально умеет работать в браузере. Спойлер: никто

Битва браузерных ИИ-агентов: Проверил, кто из них реально умеет работать в браузере. Спойлер: никто

Меня всегда бесило, когда очередные «эксперты» начинают кричать, что скоро ИИ заменит всех и вся. Особенно достают эти байки про то, как нейросети будут за нас код писать, сайты верстать и вообще всю рутину забирать. Ну-ну. Я решил проверить, насколько эти ваши «агенты» на самом деле умны и способны решать реальные задачи в браузере. Спойлер: офисный планктон может спать спокойно.

Я нашел в интернете полигон для испытаний — страницу с 31 задачей для браузерных агентов. Там было всё: от банального «кликнуть на чекбокс» до извращенного «нарисовать круг мышкой» и даже «прослушать аудиозапись». Идеальный тест-драйв для тех, кто обещает золотые горы.

МОИ ПОДОПЫТНЫЕ КРОЛИКИ

В бой пошли три тяжеловеса (и один залетный):

  1. **ChatGPT** (платная подписка, $20 в месяц). Этот товарищ работает в режиме агента, и от него я ждал многого. Все-таки флагман.

  2. **Manus** (300 бесплатных кредитов в день). Звучит заманчиво, но бесплатный сыр, как известно...

  3. Агент от **Perplexity** в их AI-браузере Comet. Этот работал локально, прямо у меня на ноуте. Казалось бы, должен быть шустрее всех.

    БИТВА НАЧИНАЕТСЯ

    Наблюдать за этим было отдельным видом искусства. ChatGPT молча и методично пытался что-то делать. Manus сжег все мои дневные и бонусные кредиты, зациклившись на какой-то ерунде. А Perplexity приходилось буквально уговаривать продолжить тест, он постоянно сдавался.

    РЕЗУЛЬТАТЫ, КОТОРЫЕ ВАС НЕ УДИВЯТ (ИЛИ УДИВЯТ)

    1. **ChatGPT — 24/31.** Это, конечно, лучший результат. Он даже умудрился написать код, чтобы нарисовать круг мышкой, и упорно пытался прослушать аудио. Но 24 из 31 — это не 31 из 31. Далеко не идеал.

    2. **Perplexity — 11/31.** Просто слабо. Несмотря на то, что он работал локально, справился только с простейшими заданиями. Мой кот, наверное, и то больше бы накликал.

    3. **Manus — 9/31.** Полный провал. Есть подозрение, что он просто зациклился на одном из заданий, и я его вручную просил пропустить, чтобы он хоть что-то сделал. В итоге слил все кредиты в унитаз.

  4. В последний момент я нашел инвайт для еще одного AI-браузера — Strawberry. Он справился еще хуже, хотя у него заявлена интересная функция: можно записать свои действия на сайте и скормить их агенту, а он потом сможет их повторять. Но, честно говоря, после такого перформанса у меня большие сомнения в эффективности этой фичи.

    ВЫВОДЫ: КОРОЛИ ОФИСА МОГУТ СПАТЬ СПОКОЙНО

    Мой эксперимент показал, что ИИ-агенты пока что не готовы заменить человека, который весь рабочий день сёрфит в интернете. Они не справляются с базовыми задачами, тупят, зацикливаются и требуют постоянного присмотра. Так что, если вы переживали за свое рабочее место, можете выдохнуть. По крайней мере, пока. 🤔

    А вы уже делегируете задачи ИИ? Или все еще верите в сказки про тотальную автоматизацию? Жду ваших историй в комментах или в чате телеграм-канала. 👇

Показать полностью 1

GPT-5: Проверил её кодинг на себе. Спойлер: я удивлён

GPT-5: Проверил её кодинг на себе. Спойлер: я удивлён

Ну что, дождались? Наконец-то выкатили GPT-5. И, конечно же, она «самая лучшая, самая умная, самая-самая». Верим? Ну, я решил проверить.

ПРОЩАЙ, ЗООПАРК МОДЕЛЕЙ

Первое, что бросилось в глаза – наконец-то навели порядок с моделями. Никаких больше 4o, o4-mini, o3, 4.5, 4.1, 4.1-mini... Уфф, этот зоопарк уже начинал подбешивать. Теперь всё просто: есть GPT-5, GPT-5-mini. А для тех, кто готов раскошелиться на $200 в месяц, ещё и GPT-5-pro. Ну, хоть какая-то ясность.

ЧТО ПО ОБЕЩАНИЯМ?

Говорят, модель теперь сама решает, сколько ей «думать» над вашим запросом. Звучит как «мы сделали её медленнее, но это фича». Зато сильно прокачалась в программировании и использовании инструментов. Контекст увеличился до 400к токенов, что, конечно, круто, но у некоторых конкурентов уже было и больше. Главное, чтобы она этот контекст ещё и понимала, а не просто хранила.

МОЙ ЭКСПЕРИМЕНТ: КОДИНГ

Раз уж так хвалят её кодинг, я решил устроить ей проверку боем. Замахнулся на сервис для генерации паролей и проверки их надёжности. И знаете что? В три промпта она мне его собрала. Без шуток.

* **Первый промпт:** «Напиши фронтенд для генерации паролей и бэкенд для проверки». Справилась.

* **Второй промпт:** «Внедри это всё на мой сайт, учти стили и существующий код». Внедрила, причём довольно аккуратно.

* **Третий промпт:** «Вот мои хотелки и правки». Внесла, без лишних вопросов.

Итоговый результат можете посмотреть сами. Неплохо, да? Особенно учитывая, что это всё с нуля и с моими правками.

ВЫВОДЫ И ОЖИДАНИЯ

Программирование от GPT-5 мне понравилось. Легко справляется как с написанием с нуля, так и с точечными изменениями кода. Отлично распознает текст на изображениях, что тоже плюс. Короче, пока доволен, особенно учитывая цену. Она ещё и очень дешёвая ($1.25/10), хотя это слегка нивелируется длинными цепочками рассуждений, которые она иногда выдаёт. Ждём ответочку от Google – по слухам, Gemini 3 уже на подходе. Интересно, смогут ли они переплюнуть?

А как вы считаете, это реальный прорыв или очередной маркетинговый пузырь, который схлопнется через пару месяцев? Жду ваших мнений в комментах!

Показать полностью 1

ИИ-фотосессия за одну фотографию: прорыв или очередной хайп?

ИИ-фотосессия за одну фотографию: прорыв или очередной хайп?

Меня всегда забавляло, как быстро меняются «прорывные» технологии в мире ИИ. Ещё вчера, чтобы получить свою цифровую копию, нужно было устраивать целую фотосессию, собирая сотни снимков. Помните эти мучения с LoRA? Загружаешь тонны фоток, ждешь, пока модель дообучится, а потом получаешь что-то отдаленно похожее на себя, но с артефактами и странным выражением лица. 🤦‍♂️

ЭВОЛЮЦИЯ ЦИФРОВОГО ДВОЙНИКА

Потом наступила «оттепель». Появились сервисы вроде Krea и Higgsfield, которые снизили планку до 20-40 фотографий. Прогресс, конечно, но всё равно это было похоже на допрос с пристрастием: «Покажите мне свой левый профиль! А теперь правый! А теперь улыбнитесь, как будто вам только что дали зарплату!» 😅

ИДЕОГРАММ И ОДНА ФОТКА

И вот на сцену выходит Ideogram. И просто выносит всех. Серьёзно, я до сих пор в шоке. Теперь для создания качественной ИИ-фотосессии нужна... ОДНА фотография. Да-да, вы не ослышались. Одна! Загружаешь свой лучший портрет (советую анфас, чтобы нейросеть не начала фантазировать на тему «а что если у него три глаза?»), и она генерирует вашего цифрового двойника. И чтобы вы точно распробовали, Ideogram дает 10 бесплатных генераций, каждая по 4 картинки. Итого — 40 изображений бесплатно, здесь и сейчас, без боли и SMS. И, что самое удивительное, результат в 90% случаев выглядит отлично. Не идеально, конечно, но для «бесплатно и за одну фотку» — просто бомба.

Я, конечно, попробовал. Сначала скептически, потом с удивлением. Мои коллеги в рабочем чате уже обновили аватарки. И знаете что? Никто не заметил подвоха.😏

ЧТО ДАЛЬШЕ?

Если сегодня для этого нужна одна фотка, что будет завтра? Генерация с вашим лицом по голосу, стуку сердца, мыслям? Или по запаху носков? 🤔

А как вы считаете, это реальный прорыв или очередной маркетинговый пузырь, который лопнет через пару месяцев? Жду ваших мнений в комментах!

Показать полностью 1
Отличная работа, все прочитано!