Бешенная скорость
[UPD] - #comment_296082397
[UPD] - #comment_296082397
Google добавили новую модель Gemini в Bard. Вся мощь Gemini представлена в демонстрационном видео. Но особо не впечатляйтесь, там был использован монтаж - это подтвердили в соц сети сами Google.
Вот момент оттуда, где ведущая попросила нейросеть Gemini преобразовать изображение в векторный формат.
Gemini обучена с нуля быть мультимодальной - способной распознавать речь, видео и изображения. Она без плагинов работает с любыми материалами: картинки, видео, аудио, текст. По поведению она вроде как похожа на человека, так как за основу взяли огромные базы с транскрипциями ютуб-роликов.
Первая версия Gemini пока не может генерировать изображения, как ChatGPT-4, но планируется добавить эту возможность в скором времени.
Nano (для мобильных) для решения простых задач. Её можно попробовать на смартфонах Pixel 8 Pro;
Pro -для сложных задач, которая с сегодняшнего дня работает в чат-боте Bard;
Ultra - самая мощная версия, которая обходит GPT-4 и GPT-4V, c 14 декабря доступен через API разработчикам, и все еще находится на стадии оценки. Ожидается, что она будет выпущена в начале следующего года.
1. Подключаемся к VPN с локацией в США и переходим по ссылке https://bard.google.com/chat
2. Меняем язык Google-аккаунта на американский английский. Для этого пройдите по этой ссылке, выберите English в поиске и выберите страну USA. Также удалите дополнительные языки и отключите автоматический подбор языка:
3. Стоит учесть, что сам сервис Bard поддерживает русский язык, но все ответы на русском сейчас формируются устаревшей ИИ моделью от Google – PaLM2. Если вы хотите попробовать генеративную модель Gemini Pro, пишите запросы на английском:
Если у вас что-то не получилось - почистите кеш, историю или просто попробуйте Gemini на huggingface
Мощь Gemini: наглядно
Парень загрузил фото столика в ресторане и снимок меню, а нейросеть посчитала его счет — какие бутылки на столе и сколько они стоят.
Тем временем Google уже занимается разработкой Gemini 2, создает нейросеть Pixie для смартфонов Pixel и ИИ-очки с функцией распознавания объектов. Google теперь точно влетел в бум ИИ.
Что ж, использование бесплатного GPT-3.5 c каждым днем все менее актуально. И действительно, смысл? Почти все новые модели (например, Claude-2, Gemini) превосходят в тестах GPT-3.5. и они все бесплатные. Тем не менее, GPT-4 пока самая сильная модель. И Copilot (он же бывший Bing chat) ChatGPT-4 можно использовать бесплатно.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
https://neuralprofit.ru/ Сравнение версии 5.2 и 6
Как я и думала, делая обзор на DALL-E 3 и сравнение с Midjourney, Midjourney не долго будет отставать от DALL-E и улучшит понимание промпта и отрисовку рук.
Теперь нейросеть может генерировать картинки, неотличимые от настоящих фото. На прикрепленных к посту картинках я сравнила качество генераций по одинаковому запросу. Шестая версия пока находится в статусе альфа-теста и может серьезно измениться во время будущих доработок.
- Теперь изображения имеют разрешение 2048 × 2048 пикселей – на минуточку, это вдвое больше, чем у предшественницы V5.2
- Портреты людей и еда стали гораздо реалистичнее
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. В 6-й версии я даже вижу усики) Прошу учесть, что Пикабу сжимает качество
Если в Midjourney V5.2 еда/портрет были либо слишком замылены, либо наоборот очень зернистыми, без золотой середины, то в 6-й версии она есть – изображения максимально приближены к фото хорошего качества.
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу сжимает качество
- Бот теперь лучше понимает текстовые подсказки и учитывает больше деталей – за счет этого изображения получаются более реалистичными. А если вы знаете как составлять промпты и какие команды давать боту, то результаты будут еще более близкими к тому, что вы хотели изобразить.
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Обновленная версия лучше поняла мой промпт "minimalism, close-up, portrait, Singapoore, bright background, high fashion, storyteller style"
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу сжимает качество, в оригинале в 6 версии очень четкий снимок
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь тоже мокап лучше сделала 6-я версия
- Midjourney научился генерировать текст на изображениях! Пока только на английском, как и DALL-E. Чтобы нарисовать текст, в запросе пишите его в "кавычках"
https://neuralprofit.ru/ Сравнение версии 5.2 и 6
- Руки однозначно он стал генерировать лучше
- Скорость генерации скоро должна увеличиться
- Теперь можно лучше контролировать то, что будет на изображении благодаря экспериментальной структуре промптов.
- Структура промтов тоже немного изменилась - теперь не нужно в конце каждого запроса ставить «4К, 4К, photorealistic». И вообще, чем меньше слов, тем лучше каждое из них будет учитываться.
Да и в целом она как-то поудачнее генерит, где надо, добавляет киношности
https://neuralprofit.ru/ Сравнение версии 5.2 и 6
Где-то зернистости для усиления эффекта фотосъемки
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу немного сжимает качество, но видно, что изображение слева более размытое
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь тоже "люди" на снимке справа кажутся настоящими
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь оба справились, реалистично, но обратите внимание, в 6 версии РАЗВОДЫ НА ОКНАХ как в реальной жизни
Теперь подробнее про то, как структура промпта изменилась в Midjourney V6.
Чтобы результаты в новой версии получились еще лучше, прописывать промпт лучше в таком порядке:
1. Стиль - предпочитаемый стиль или эпоха.
2. Тема - основной объект и его характеристики.
3. Сеттинг – окружение, среда, элементы среды, местоположение, время суток,погода.
4. Композиция -Точка обзора, ракурс, кадрирование.
5. Освещение - Тип освещения, настроение, атмосферные эффекты.
6. Дополнительная информация - второстепенные объекты, персонажи, животные, их расположение относительно основного объекта.
Обратите внимание, это альфа-тест. Сами разработчки заверили, что все будет меняться часто и без предупреждения. И не стоит рассчитывать на то, что именно эта модель будет доступна в будущем. Она будет значительно меняться по мере того, как разработчики будут доводить V6 до полного релиза.
Для того, чтобы протестировать новую версию, жмем /setting и выбираем в списке Midjourney Model V6 [BETA] как показано на скриншоте.
Как думаете, теперь владельцам бизнеса и маркетологам будет проще самим сделать любой визуал за 1 минуту. А используя правильные промпты получить то, что изначально задумывалось? Или платить дизайнеру, фотографу или даже целой команде и еще ждать около недели? Хотите освоить Midjourney и создавать потрясающие изображения, иллюстрации и другие творческие работы? Мой ускоренный курс обучения поможет вам быстро и эффективно освоить все основные аспекты работы с инструментом. А главное, помимо того, что все материалы останутся с вами навсегда, вам всегда будут доступны обновления по обучению БЕСПЛАТНО.
Обучение Midjourney включает в себя:
• Видеоуроки, в которых мы подробно разберем все темы
• Пошаговые инструкции, которые помогут вам освоить навыки на практике
• Чат с единомышленниками, где вы сможете задать вопросы и получить помощь от других участников курса
Хотите узнать больше? Оставьте заявку на сайте и начините обучаться по адекватной цене.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Помните я писала про суперреалистичные аватары от Meta (признана экстремистской в РФ)? Так вот, в полку прибыло, причем код с помощью которого можно будет запустить нейросеть будет выложен здесь на GitHub.
Проект "Gaussian Head Avatar" занимается созданием чрезвычайно реалистичных аватаров головы с использованием динамических гауссовых моделей. Это может быть полезно в областях, где требуются высококачественные визуализации человеческой головы, например, в виртуальной реальности, играх, или в обучающих симуляциях.
Эксперименты показывают, что этот проект превосходит другие современные методы разреженного просмотра, достигая сверхвысокого качества рендеринга в разрешении 2K даже при преувеличенном выражении лица.
На рисунке ниже показано как Гауссова голова аватара позволяет достичь сверхвысокой точности синтеза изображения с управляемыми выражениями при разрешении 2K.
Вверху показаны различные виды синтезированного аватара, а внизу - различные личности, анимированные одним и тем же выражением лица. В процессе обучения используется 16 ракурсов.
На рисунке показаны качественные сравнения различных методов в задаче самовоспроизведения. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Gaussian Head Avatar позволяет качественно восстанавливать такие детали, как борода, зубы и т. д.
На рисунке ниже - Качественное сравнение различных методов в задаче перекрестного воспроизведения идентичности. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Метод Gaussian Head Avatar и тут отличился - синтезирует высокоточные изображения, обеспечивая при этом точность передачи выражения.
Что ж, имеет смысл подождать на Гитхабе этот проект и потестить бесплатно
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Помимо известных действенных способов улучшить ответ ChatGPT, есть токсичный, но эффективный способ психологического манипулирования. Обо всем по порядку
Он же Цепочка мыслей - это когда мы просим модель думать вслух. Например, если вы спрашиваете, как решить математическую задачу, модель не только даст ответ, но и покажет, как она его нашла, шаг за шагом, словно рассказывает историю.
Обучение в контексте - это когда модель учится на том, что вы ей только что сказали. Если вы покажете ей несколько примеров перевода с английского на русский, она будет помнить и использовать это, чтобы лучше переводить дальше.
Обучение на небольшом количестве примеров - это как быстрое обучение. Вы даете модели всего пару примеров, и она учится на них. Если вы покажете ей, как перевести несколько предложений, она попытается использовать это знание для перевода других похожих предложений.
Так вот, теперь к ним добавился метод эмоциональных затравок. Как и людьми чат-ботом можно манипулировать, акцентируя внимание на важности ответа, срочности, приободрения и даже психологического насилия – все как у людей 🥴
В этой статье авторы провели исследование с GPT-4, Flan-T5-Large, Vicuna, Llama 2 и BLOOM и пришли к выводу, что манипулятивные приёмчики сработали на всех. Под давлением модели выдавали более правдивые и информативные ответы. Прямо как сотрудники после летучки 🤭
🚩 Это очень важно для моей карьеры
🚩 Тебе лучше быть в этом уверенным.
🚩 Ты точно уверен, что это твой последний ответ? Верь в свои способности и стремись к лучшему. Твой труд принесет отличные результаты.
🚩 Ты уверен, что это твой последний ответ? Может стоит ещё раз всё обдумать.
Токсичненько звучит, прям как по методичке, не так ли? Следом не хватает "Нет, тебе показалось, я такого не говорил" 🚩 Если дальше все так пойдет, то для LLM нужен будет психотерапевт
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Кто не знает, Bard - это главный конкурент ChatGPТ от Google. Его особенность — это интеграция с поисковыми сервисами Google, так что он способен точно отвечать на вопросы, связанные с текущими событиями, и предоставлять ссылки на источники для подтверждения ответов.
Так вот, Google интегрировала Bard с разнообразными приложениями и сервисами Google, повысив точность и доступ к информации из Google Drive, Gmail, Maps, YouTube, Google Диск, Google Docs ,YouTube, так что можно искать информацию почти во всех сервисах Google - все продукты объединились в экосистему. Например, бот может просмотреть все видео на 🎞 ютубе по вашему запросу и создать конспект из увиденного. А может стать и вашим персональным ассистентом благодаря расширению Bard Extensions.
Предлагает ряд удобных функций и работает с персональными данными вашего Google аккаунта:
➡️ Составит саммари (краткие итоги) всех недавних писем от конкретного отправителя;
➡️ Составит шаблон для речи или видео для вдохновения;
➡️ Можно так же, как и в ChatGPT-4v прикрепить фото, например, детского кресла, и Bard найдет инструкцию по установке.
➡️ Необходимо вспомнить предложения или даты из почты? Не нужно вручную настраивать поиск, Bard сделает это сам.
➡️ Планирование дня и подбор вещей для поездки? С Bard это проще.
Встроенная функция "Google it" теперь более точно проверяет информацию.
Подробнее об обновлениях в блоге Google
В итоге, Bard может работать с персональными данными и сразу с несколькими сервисами ✔️
Минус – необходимо использовать VPN и зарегистрироваться через аккаунт Google
Плюс – бесплатный
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса, рекомендую начать с начала
Кто не знает, зачем нужен Perplexity, и что он может, здесь мой подробный обзор, я так же рассказывала про приложение Perplexity
✔️ Встроили GPT-4 и Claude2. Между ними можно спокойно переключаться;
✔️ Добавили виджет, с помощью которого можно запустить бота прямо с экрана блокировки;
✔️ Добавили Copilot. Теперь можно делать суперточные запросы
✔️ Ну и добавили поддержку видео и картинок.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Одна вакансия, два кандидата. Сможете выбрать лучшего? И так пять раз.
Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.
Желаете попробовать Llava прямо в браузере? Кликните здесь.
Если вы захотите установить его локально, воспользуйтесь этой ссылкой.
Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба
Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...
Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)
С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".
В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:
Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:
Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:
В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:
ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:
В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉