Сравнение + Технологии

Google добавили новую модель Gemini в Bard. Вся мощь Gemini представлена в демонстрационном видео. Но особо не впечатляйтесь, там был использован монтаж - это подтвердили в соц сети сами Google.

Вот момент оттуда, где ведущая попросила нейросеть Gemini преобразовать изображение в векторный формат.

Итак, из-за чего весь переполох и чем Gemini лучше gpt-4:

Gemini обучена с нуля быть мультимодальной - способной распознавать речь, видео и изображения. Она без плагинов работает с любыми материалами: картинки, видео, аудио, текст. По поведению она вроде как похожа на человека, так как за основу взяли огромные базы с транскрипциями ютуб-роликов.

Gemini превосходит GPT-4 почти по всем тестам, но всего на 5%

Gemini - "убийца" GPT-4V: Чем он лучше и как его использовать? Обзор Искусственный интеллект, Нейронные сети, Технологии, Полезное, ChatGPT, Google, Чат-бот, Сравнение, Обзор, Анализ, Инструкция, Альтернатива, Презентация, Бесплатно, Перевел сам, Видео, Длиннопост

Первая версия Gemini пока не может генерировать изображения, как ChatGPT-4, но планируется добавить эту возможность в скором времени.

Модель представлена в трех комплектациях:

Nano (для мобильных) для решения простых задач. Её можно попробовать на смартфонах Pixel 8 Pro;
Pro -для сложных задач, которая с сегодняшнего дня работает в чат-боте Bard;
Ultra - самая мощная версия, которая обходит GPT-4 и GPT-4V, c 14 декабря доступен через API разработчикам, и все еще находится на стадии оценки. Ожидается, что она будет выпущена в начале следующего года.

Как начать использовать Gemini

1. Подключаемся к VPN с локацией в США и переходим по ссылке https://bard.google.com/chat

2. Меняем язык Google-аккаунта на американский английский. Для этого пройдите по этой ссылке, выберите English в поиске и выберите страну USA. Также удалите дополнительные языки и отключите автоматический подбор языка:

3. Стоит учесть, что сам сервис Bard поддерживает русский язык, но все ответы на русском сейчас формируются устаревшей ИИ моделью от Google – PaLM2. Если вы хотите попробовать генеративную модель Gemini Pro, пишите запросы на английском:

Если у вас что-то не получилось - почистите кеш, историю или просто попробуйте Gemini на huggingface

Мощь Gemini: наглядно

Парень загрузил фото столика в ресторане и снимок меню, а нейросеть посчитала его счет — какие бутылки на столе и сколько они стоят.

Тем временем Google уже занимается разработкой Gemini 2, создает нейросеть Pixie для смартфонов Pixel и ИИ-очки с функцией распознавания объектов. Google теперь точно влетел в бум ИИ.

Вывод

Что ж, использование бесплатного GPT-3.5 c каждым днем все менее актуально. И действительно, смысл? Почти все новые модели (например, Claude-2, Gemini) превосходят в тестах GPT-3.5. и они все бесплатные. Тем не менее, GPT-4 пока самая сильная модель. И Copilot (он же бывший Bing chat) ChatGPT-4 можно использовать бесплатно.

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса

Показать полностью 4 2

[моё] Искусственный интеллект Нейронные сети Технологии Полезное ChatGPT Google Чат-бот Сравнение Обзор Анализ Инструкция Альтернатива Презентация Бесплатно Перевел сам Видео Длиннопост

Neurosonya

5 месяцев назад

Искусственный интеллект

Серия Полезность

Midjourney V6 вышла! Что нового? Полный обзор⁠⁠

https://neuralprofit.ru/ Сравнение версии 5.2 и 6

Как я и думала, делая обзор на DALL-E 3 и сравнение с Midjourney, Midjourney не долго будет отставать от DALL-E и улучшит понимание промпта и отрисовку рук.

Теперь нейросеть может генерировать картинки, неотличимые от настоящих фото. На прикрепленных к посту картинках я сравнила качество генераций по одинаковому запросу. Шестая версия пока находится в статусе альфа-теста и может серьезно измениться во время будущих доработок.

Что нового в Midjourney V6?

- Теперь изображения имеют разрешение 2048 × 2048 пикселей – на минуточку, это вдвое больше, чем у предшественницы V5.2

- Портреты людей и еда стали гораздо реалистичнее

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. В 6-й версии я даже вижу усики) Прошу учесть, что Пикабу сжимает качество

Если в Midjourney V5.2 еда/портрет были либо слишком замылены, либо наоборот очень зернистыми, без золотой середины, то в 6-й версии она есть – изображения максимально приближены к фото хорошего качества.

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу сжимает качество

- Бот теперь лучше понимает текстовые подсказки и учитывает больше деталей – за счет этого изображения получаются более реалистичными. А если вы знаете как составлять промпты и какие команды давать боту, то результаты будут еще более близкими к тому, что вы хотели изобразить.

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Обновленная версия лучше поняла мой промпт "minimalism, close-up, portrait, Singapoore, bright background, high fashion, storyteller style"

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу сжимает качество, в оригинале в 6 версии очень четкий снимок

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь тоже мокап лучше сделала 6-я версия

- Midjourney научился генерировать текст на изображениях! Пока только на английском, как и DALL-E. Чтобы нарисовать текст, в запросе пишите его в "кавычках"

https://neuralprofit.ru/ Сравнение версии 5.2 и 6

- Руки однозначно он стал генерировать лучше

- Скорость генерации скоро должна увеличиться

- Теперь можно лучше контролировать то, что будет на изображении благодаря экспериментальной структуре промптов.

- Структура промтов тоже немного изменилась - теперь не нужно в конце каждого запроса ставить «4К, 4К, photorealistic». И вообще, чем меньше слов, тем лучше каждое из них будет учитываться.

Да и в целом она как-то поудачнее генерит, где надо, добавляет киношности

https://neuralprofit.ru/ Сравнение версии 5.2 и 6

Где-то зернистости для усиления эффекта фотосъемки

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу немного сжимает качество, но видно, что изображение слева более размытое

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь тоже "люди" на снимке справа кажутся настоящими

https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь оба справились, реалистично, но обратите внимание, в 6 версии РАЗВОДЫ НА ОКНАХ как в реальной жизни

Как сделать идеальный промпт в Midjourney V6

Теперь подробнее про то, как структура промпта изменилась в Midjourney V6.

Чтобы результаты в новой версии получились еще лучше, прописывать промпт лучше в таком порядке:

1. Стиль - предпочитаемый стиль или эпоха.

2. Тема - основной объект и его характеристики.

3. Сеттинг – окружение, среда, элементы среды, местоположение, время суток,погода.

4. Композиция -Точка обзора, ракурс, кадрирование.

5. Освещение - Тип освещения, настроение, атмосферные эффекты.

6. Дополнительная информация - второстепенные объекты, персонажи, животные, их расположение относительно основного объекта.

Обратите внимание, это альфа-тест. Сами разработчки заверили, что все будет меняться часто и без предупреждения. И не стоит рассчитывать на то, что именно эта модель будет доступна в будущем. Она будет значительно меняться по мере того, как разработчики будут доводить V6 до полного релиза.

Как использовать Midjourney V6?

Для того, чтобы протестировать новую версию, жмем /setting и выбираем в списке Midjourney Model V6 [BETA] как показано на скриншоте.

Как думаете, теперь владельцам бизнеса и маркетологам будет проще самим сделать любой визуал за 1 минуту. А используя правильные промпты получить то, что изначально задумывалось? Или платить дизайнеру, фотографу или даже целой команде и еще ждать около недели? Хотите освоить Midjourney и создавать потрясающие изображения, иллюстрации и другие творческие работы? Мой ускоренный курс обучения поможет вам быстро и эффективно освоить все основные аспекты работы с инструментом. А главное, помимо того, что все материалы останутся с вами навсегда, вам всегда будут доступны обновления по обучению БЕСПЛАТНО.

Обучение Midjourney включает в себя:

• Видеоуроки, в которых мы подробно разберем все темы

• Пошаговые инструкции, которые помогут вам освоить навыки на практике

• Чат с единомышленниками, где вы сможете задать вопросы и получить помощь от других участников курса

Хотите узнать больше? Оставьте заявку на сайте и начините обучаться по адекватной цене.

Показать полностью 12

[моё] Полезное Технологии Искусственный интеллект Нейронные сети Арты нейросетей Картинки Обновление Обзор Новое Сравнение Midjourney Длиннопост

Neurosonya

6 месяцев назад

Искусственный интеллект

Серия Полезность

Нейросеть для очень реалистичных аватаров головы 2k бесплатно⁠⁠

Помните я писала про суперреалистичные аватары от Meta (признана экстремистской в РФ)? Так вот, в полку прибыло, причем код с помощью которого можно будет запустить нейросеть будет выложен здесь на GitHub.

Проект "Gaussian Head Avatar" занимается созданием чрезвычайно реалистичных аватаров головы с использованием динамических гауссовых моделей. Это может быть полезно в областях, где требуются высококачественные визуализации человеческой головы, например, в виртуальной реальности, играх, или в обучающих симуляциях.

Особенность

Эксперименты показывают, что этот проект превосходит другие современные методы разреженного просмотра, достигая сверхвысокого качества рендеринга в разрешении 2K даже при преувеличенном выражении лица.

На рисунке ниже показано как Гауссова голова аватара позволяет достичь сверхвысокой точности синтеза изображения с управляемыми выражениями при разрешении 2K.

Нейросеть для очень реалистичных аватаров головы 2k бесплатно Технологии, Искусственный интеллект, Полезное, Нейронные сети, Бесплатно, Инновации, Аватар, 3D, Копия, Идентичность, Сравнение, Обзор, Рендер, 2k, Видео, Без звука, Длиннопост

Сверхточная копия до мельчайших деталей

Вверху показаны различные виды синтезированного аватара, а внизу - различные личности, анимированные одним и тем же выражением лица. В процессе обучения используется 16 ракурсов.

Сравнение с другими технологиями

На рисунке показаны качественные сравнения различных методов в задаче самовоспроизведения. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Gaussian Head Avatar позволяет качественно восстанавливать такие детали, как борода, зубы и т. д.

Сравнение с конкурентами 1

На рисунке ниже - Качественное сравнение различных методов в задаче перекрестного воспроизведения идентичности. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Метод Gaussian Head Avatar и тут отличился - синтезирует высокоточные изображения, обеспечивая при этом точность передачи выражения.

Сравнение с конкурентами 2

Что ж, имеет смысл подождать на Гитхабе этот проект и потестить бесплатно

Показать полностью 3

[моё] Технологии Искусственный интеллект Полезное Нейронные сети Бесплатно Инновации Аватар 3D Копия Идентичность Сравнение Обзор Рендер 2k Видео Без звука Длиннопост

Neurosonya

7 месяцев назад

Искусственный интеллект

Серия Полезность

Улучшение качества ответов ChatGPT⁠⁠

Помимо известных действенных способов улучшить ответ ChatGPT, есть токсичный, но эффективный способ психологического манипулирования. Обо всем по порядку

https://t.me/NeuralProfit

Есть несколько способов улучшить качество ответа ChatGPT:

Chain-of-thoughts

Он же Цепочка мыслей - это когда мы просим модель думать вслух. Например, если вы спрашиваете, как решить математическую задачу, модель не только даст ответ, но и покажет, как она его нашла, шаг за шагом, словно рассказывает историю.

In-context learning

Обучение в контексте - это когда модель учится на том, что вы ей только что сказали. Если вы покажете ей несколько примеров перевода с английского на русский, она будет помнить и использовать это, чтобы лучше переводить дальше.

Few-shot

Обучение на небольшом количестве примеров - это как быстрое обучение. Вы даете модели всего пару примеров, и она учится на них. Если вы покажете ей, как перевести несколько предложений, она попытается использовать это знание для перевода других похожих предложений.

Так вот, теперь к ним добавился метод эмоциональных затравок. Как и людьми чат-ботом можно манипулировать, акцентируя внимание на важности ответа, срочности, приободрения и даже психологического насилия – все как у людей 🥴

Суть

В этой статье авторы провели исследование с GPT-4, Flan-T5-Large, Vicuna, Llama 2 и BLOOM и пришли к выводу, что манипулятивные приёмчики сработали на всех. Под давлением модели выдавали более правдивые и информативные ответы. Прямо как сотрудники после летучки 🤭

Примеры давления из статьи тоже очень жизненные, помечу их красными флажками 🚩:

🚩 Это очень важно для моей карьеры

🚩 Тебе лучше быть в этом уверенным.

🚩 Ты точно уверен, что это твой последний ответ? Верь в свои способности и стремись к лучшему. Твой труд принесет отличные результаты.

🚩 Ты уверен, что это твой последний ответ? Может стоит ещё раз всё обдумать.

Токсичненько звучит, прям как по методичке, не так ли? Следом не хватает "Нет, тебе показалось, я такого не говорил" 🚩 Если дальше все так пойдет, то для LLM нужен будет психотерапевт

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса

Показать полностью

[моё] Полезное Психолог Технологии Нейронные сети Искусственный интеллект Чат-бот Инновации ChatGPT Исследования Эксперимент Сравнение Манипуляция Психология Digital Будущее

Neurosonya

7 месяцев назад

Серия Полезность

Обновление Bard от Google: что нового⁠⁠

Кто не знает, Bard - это главный конкурент ChatGPТ от Google. Его особенность — это интеграция с поисковыми сервисами Google, так что он способен точно отвечать на вопросы, связанные с текущими событиями, и предоставлять ссылки на источники для подтверждения ответов.

Так вот, Google интегрировала Bard с разнообразными приложениями и сервисами Google, повысив точность и доступ к информации из Google Drive, Gmail, Maps, YouTube, Google Диск, Google Docs ,YouTube, так что можно искать информацию почти во всех сервисах Google - все продукты объединились в экосистему. Например, бот может просмотреть все видео на 🎞 ютубе по вашему запросу и создать конспект из увиденного. А может стать и вашим персональным ассистентом благодаря расширению Bard Extensions.

Расширение Bard Extensions

Предлагает ряд удобных функций и работает с персональными данными вашего Google аккаунта:

➡️ Составит саммари (краткие итоги) всех недавних писем от конкретного отправителя;

➡️ Составит шаблон для речи или видео для вдохновения;

➡️ Можно так же, как и в ChatGPT-4v прикрепить фото, например, детского кресла, и Bard найдет инструкцию по установке.

➡️ Необходимо вспомнить предложения или даты из почты? Не нужно вручную настраивать поиск, Bard сделает это сам.

➡️ Планирование дня и подбор вещей для поездки? С Bard это проще.

Улучшенная проверка информации

Встроенная функция "Google it" теперь более точно проверяет информацию.

Подробнее об обновлениях в блоге Google

В итоге, Bard может работать с персональными данными и сразу с несколькими сервисами ✔️

Минус – необходимо использовать VPN и зарегистрироваться через аккаунт Google

Плюс – бесплатный

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса, рекомендую начать с начала

Показать полностью

Перевел сам Нейронные сети Искусственный интеллект Технологии Инновации Digital ChatGPT Будущее Чат-бот Бесплатно Полезное Обновление Плюсы Минусы Плюсы и минусы Сравнение Расширение Google Конкуренция Видео Telegram (ссылка)

Neurosonya

7 месяцев назад

Серия Полезность

Мощное обновление Perplexity⁠⁠

Кто не знает, зачем нужен Perplexity, и что он может, здесь мой подробный обзор, я так же рассказывала про приложение Perplexity

⭐️ Что же крутого добавили:

✔️ Встроили GPT-4 и Claude2. Между ними можно спокойно переключаться;

✔️ Добавили виджет, с помощью которого можно запустить бота прямо с экрана блокировки;

✔️ Добавили Copilot. Теперь можно делать суперточные запросы

✔️ Ну и добавили поддержку видео и картинок.

Версия на iOS

Версия на Android

Версия для браузера

Плагин для Chrome

Показать полностью

Нейронные сети Искусственный интеллект Полезное Поисковик Поиск Информация Чат-бот ChatGPT Digital Инновации Технологии Будущее Приложение Маркетинг Анализ Перевел сам Сравнение Картинки Иллюстрации Вертикальное видео Видео Telegram (ссылка)

Партнёрский материал

specials

Поиграем в бизнесменов?⁠⁠

Одна вакансия, два кандидата. Сможете выбрать лучшего? ~~И так пять раз.~~

СДЕЛАТЬ ВЫБОР

Бизнес Игры Предпринимательство Работа Текст

Neurosonya

7 месяцев назад

Серия Полезность

Сравнение ChatGPT и Llava: кто лучше распознает изображения?⁠⁠

Не так давно, на сцену вышел ChatGPT-4v с возможностью распознавания изображений. Но на рынке есть и бесплатный аналог Llava, который также предлагает ряд уникальных функций. И, кстати, работает без VPN.

Желаете попробовать Llava прямо в браузере? Кликните здесь.

Если вы захотите установить его локально, воспользуйтесь этой ссылкой.

Почему Llava?

Этот инструмент распознает изображения, решает капчи и создает код на основе скриншотов. Преимущества Llava перед ChatGPT заключаются в том, что она бесплатна и работает без VPN. Русский язык понимают оба

Сравнение 1

Мои собственные эксперименты показали, что Llava может дать более лаконичные объяснения. Например, при анализе моего логотипа, который, к слову, был придуман с помощью ChatGPT (да, именно ChatGPT создал концепт моего телеграм канала!) Так вот, объяснение Llava мне понравилось больше, лаконичнее что ли...

1/2

Бесплатный Llava (рис 1) и ChatGPT-4 v (рис 2)

С другой стороны, при анализе оптической иллюзии, ChatGPT оказался более информативным, раскрыв принципы "амесовой комнаты" или "искаженной комнаты".

Сравнение 2

В этот раз я обоим скормила картинку, не говоря, что это оптическая иллюзия. Я спросила что это, и как такое возможно, Llava начал во всем видеть фотошоп и фотомонтаж:

Сравнение ChatGPT и Llava: кто лучше распознает изображения? Полезное, Искусственный интеллект, ChatGPT, Технологии, Чат-бот, Сравнение, Инновации, Digital, Нейронные сети, Бесплатно, Обзор, Будущее, Картинки, Иллюстрации, Иллюзия, Оптические иллюзии, Логотип, Капча, Код, Сайт, Видео, Длиннопост

https://t.me/NeuralProfit/391

Тогда я дала подсказку Llava убрать версию с Photoshop и фотомонтажом, но модель снова объяснила это спецеффектом камеры:

Llava

Я еще раз спросила как такое возможно в реальности, но Llava была непреклонна:

А ChatGPT просто сказал, что ничем мне помочь не может 🤷🏻‍♀

ChatGPT-4v

Далее я решила дать им обоим подсказку про иллюзию:

В ChatGPT я опять загрузила это изображение и спросила “Как такая иллюзия возможна? Версии с Photoshop и с фотомонтажом не принимаются” - вот тут он наконец мне выдал то, что я хотела:

ChatGPT-4v

ChatGPT расписал, что на картинке изображена оптическая иллюзия, которая часто называется "амесовой комнатой" или "искаженной комнатой” и описал принцип иллюзии, чего не скажешь про Llava, которая так конкретизировать не стала:

Llava

Вывод:

В итоге у обоих моделей -GPT-4v и Llava есть свои достоинства и недостатки, каждый по своему хорош. Так что Llava достойная бесплатная альтернатива платным функциям ChatGPT. А Dall-E 3 бесплатно (100 генераций в день) есть в Bing на русском, но работает с VPN

Показать полностью 8

[моё] Полезное Искусственный интеллект ChatGPT Технологии Чат-бот Сравнение Инновации Digital Нейронные сети Бесплатно Обзор Будущее Картинки Иллюстрации Иллюзия Оптические иллюзии Логотип Капча Код Сайт Видео Длиннопост

Посты не найдены

1 2 3 4 5 6 7 8