Компания Lenovo привезла на выставку CES 2024 единственные в своем роде модели клавиатуры и мыши, которые нужно заводить вручную. Устройства названы Mechanical Energy Harvesting Combo, что можно примерно перевести как «Комбинация сбора механической энергии». Пока это лишь прототипы: не совсем ясно, планируют ли их запускать в широкое производство.
Суть каждого устройства в том, чтобы преобразовать кинетическую энергию в заряд батареи. Для этого нужно вращать расположенный в верхнем левом углу клавиатуры регулятор, напоминающий переключатель звука. Пять минут завода конвертируются в полчаса работы.
Также у устройств предусмотрена возможность заряда при помощи солнечных батарей. Впрочем, это не новшество: подобные технологии уже применялись при создании клавиатур в прошлом.
Google добавили новую модель Gemini в Bard. Вся мощь Gemini представлена в демонстрационном видео. Но особо не впечатляйтесь, там был использован монтаж - это подтвердили в соц сети сами Google.
Вот момент оттуда, где ведущая попросила нейросеть Gemini преобразовать изображение в векторный формат.
Итак, из-за чего весь переполох и чем Gemini лучше gpt-4:
Gemini обучена с нуля быть мультимодальной - способной распознавать речь, видео и изображения. Она без плагинов работает с любыми материалами: картинки, видео, аудио, текст. По поведению она вроде как похожа на человека, так как за основу взяли огромные базы с транскрипциями ютуб-роликов.
Gemini превосходит GPT-4 почти по всем тестам, но всего на 5%
Первая версия Gemini пока не может генерировать изображения, как ChatGPT-4, но планируется добавить эту возможность в скором времени.
Модель представлена в трех комплектациях:
Nano (для мобильных) для решения простых задач. Её можно попробовать на смартфонах Pixel 8 Pro;
Pro -для сложных задач, которая с сегодняшнего дня работает в чат-боте Bard;
Ultra - самая мощная версия, которая обходит GPT-4 и GPT-4V, c 14 декабря доступен через API разработчикам, и все еще находится на стадии оценки. Ожидается, что она будет выпущена в начале следующего года.
2. Меняем язык Google-аккаунта на американский английский. Для этого пройдите по этой ссылке, выберите English в поиске и выберите страну USA. Также удалите дополнительные языки и отключите автоматический подбор языка:
3. Стоит учесть, что сам сервис Bard поддерживает русский язык, но все ответы на русском сейчас формируются устаревшей ИИ моделью от Google – PaLM2. Если вы хотите попробовать генеративную модель Gemini Pro, пишите запросы на английском:
Если у вас что-то не получилось - почистите кеш, историю или просто попробуйте Gemini на huggingface
Мощь Gemini: наглядно
Парень загрузил фото столика в ресторане и снимок меню, а нейросеть посчитала его счет — какие бутылки на столе и сколько они стоят.
Тем временем Google уже занимается разработкой Gemini 2, создает нейросеть Pixie для смартфонов Pixel и ИИ-очки с функцией распознавания объектов. Google теперь точно влетел в бум ИИ.
Вывод
Что ж, использование бесплатного GPT-3.5 c каждым днем все менее актуально. И действительно, смысл? Почти все новые модели (например, Claude-2, Gemini) превосходят в тестах GPT-3.5. и они все бесплатные. Тем не менее, GPT-4 пока самая сильная модель. И Copilot (он же бывший Bing chat) ChatGPT-4 можно использовать бесплатно.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Теперь нейросеть может генерировать картинки, неотличимые от настоящих фото. На прикрепленных к посту картинках я сравнила качество генераций по одинаковому запросу. Шестая версия пока находится в статусе альфа-теста и может серьезно измениться во время будущих доработок.
Что нового в Midjourney V6?
- Теперь изображения имеют разрешение 2048 × 2048 пикселей – на минуточку, это вдвое больше, чем у предшественницы V5.2
- Портреты людей и еда стали гораздо реалистичнее
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. В 6-й версии я даже вижу усики) Прошу учесть, что Пикабу сжимает качество
Если в Midjourney V5.2 еда/портрет были либо слишком замылены, либо наоборот очень зернистыми, без золотой середины, то в 6-й версии она есть – изображения максимально приближены к фото хорошего качества.
- Бот теперь лучше понимает текстовые подсказки и учитывает больше деталей – за счет этого изображения получаются более реалистичными. А если вы знаете как составлять промпты и какие команды давать боту, то результаты будут еще более близкими к тому, что вы хотели изобразить.
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Обновленная версия лучше поняла мой промпт "minimalism, close-up, portrait, Singapoore, bright background, high fashion, storyteller style"
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу сжимает качество, в оригинале в 6 версии очень четкий снимок
- Midjourney научился генерировать текст на изображениях! Пока только на английском, как и DALL-E. Чтобы нарисовать текст, в запросе пишите его в "кавычках"
- Теперь можно лучше контролировать то, что будет на изображении благодаря экспериментальной структуре промптов.
- Структура промтов тоже немного изменилась - теперь не нужно в конце каждого запроса ставить «4К, 4К, photorealistic». И вообще, чем меньше слов, тем лучше каждое из них будет учитываться.
Да и в целом она как-то поудачнее генерит, где надо, добавляет киношности
Где-то зернистости для усиления эффекта фотосъемки
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Пикабу немного сжимает качество, но видно, что изображение слева более размытое
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь тоже "люди" на снимке справа кажутся настоящими
https://neuralprofit.ru/ Сравнение версии 5.2 и 6. Здесь оба справились, реалистично, но обратите внимание, в 6 версии РАЗВОДЫ НА ОКНАХ как в реальной жизни
Как сделать идеальный промпт в Midjourney V6
Теперь подробнее про то, как структура промпта изменилась в Midjourney V6.
Чтобы результаты в новой версии получились еще лучше, прописывать промпт лучше в таком порядке:
1. Стиль - предпочитаемый стиль или эпоха.
2. Тема - основной объект и его характеристики.
3. Сеттинг – окружение, среда, элементы среды, местоположение, время суток,погода.
5. Освещение - Тип освещения, настроение, атмосферные эффекты.
6. Дополнительная информация - второстепенные объекты, персонажи, животные, их расположение относительно основного объекта.
Обратите внимание, это альфа-тест. Сами разработчки заверили, что все будет меняться часто и без предупреждения. И не стоит рассчитывать на то, что именно эта модель будет доступна в будущем. Она будет значительно меняться по мере того, как разработчики будут доводить V6 до полного релиза.
Как использовать Midjourney V6?
Для того, чтобы протестировать новую версию, жмем /setting и выбираем в списке Midjourney Model V6 [BETA] как показано на скриншоте.
Как думаете, теперь владельцам бизнеса и маркетологам будет проще самим сделать любой визуал за 1 минуту. А используя правильные промпты получить то, что изначально задумывалось? Или платить дизайнеру, фотографу или даже целой команде и еще ждать около недели? Хотите освоить Midjourney и создавать потрясающие изображения, иллюстрации и другие творческие работы? Мой ускоренный курс обучения поможет вам быстро и эффективно освоить все основные аспекты работы с инструментом. А главное, помимо того, что все материалы останутся с вами навсегда, вам всегда будут доступны обновления по обучению БЕСПЛАТНО.
Обучение Midjourney включает в себя:
• Видеоуроки, в которых мы подробно разберем все темы
• Пошаговые инструкции, которые помогут вам освоить навыки на практике
• Чат с единомышленниками, где вы сможете задать вопросы и получить помощь от других участников курса
Хотите узнать больше? Оставьте заявку на сайте и начините обучаться по адекватной цене.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
🔩 Обобщение и краткое изложение контента веб-страниц
🔩 Подсказки и рекомендации с продолжением контента на сайте
🔩 Создание резюме отснятых камерой материалов
4 новые функции Google Фото на Pixel 8 и Pixel 8 Pro
Вносить сложные изменения в фотографии и видео на телефоне стало проще благодаря четырем новым функциям редактирования на базе искусственного интеллекта в Google Фото на Pixel 8 и Pixel 8 Pro .
Эти новые функции позволяют вам сосредоточиться на том, что важнее всего в ваших фотографиях и видео: от создания идеального группового снимка, на котором все запечатлены с открытыми глазами, до уменьшения отвлекающих звуков в ваших любимых видео.
1.Функция Best Take
Совершенствуйте свои групповые фотографии.
Если вы пытаетесь сделать групповое фото, даже если вы делаете несколько снимков, скорее всего, кто-то постоянно отводит взгляд или моргает — это не новость, особенно если вы когда-нибудь пытались сфотографироваться с детьми. Чтобы избавить вас от стресса, связанного с получением идеального группового снимка, новая функция «Лучший дубль» в Google Фото использует серию похожих фотографий, сделанных близко друг к другу, чтобы помочь вам автоматически создать смешанное изображение с лучшим выражением лица каждого. Если вы предпочитаете другое выражение, вы можете вручную выбрать другой образ из других фотографий, которые вы сделали, чтобы получить желаемое групповое фото.
2. Magic Editor
Magic Editor — новый экспериментальный инструмент редактирования, который использует генеративный искусственный интеллект, чтобы помочь вам легко вносить сложные изменения и приводить ваши фотографии в соответствие с тем, как вы помните тот или иной момент. Хотите изменить размер или положение объекта? Просто коснитесь или обведите объект, который хотите отредактировать, затем перетащите его, чтобы изменить его положение, или сведите пальцы, чтобы изменить его размер. Вы также можете использовать контекстные предложения, чтобы улучшить освещение и фон, например изменить серое небо на закат в золотой час. Кроме того, после того, как вы выберете редактирование, Magic Editor предложит вам на выбор несколько вариантов результата, чтобы вы могли получить желаемый вид.
3. Audio Magic Eraser
Отвлекающие фоновые шумы в ваших видео отвлекают внимание от того, что вы пытаетесь запечатлеть. Используя передовые модели машинного обучения, Audio Magic Eraser может распознавать звуки — например, разговоры людей на заднем плане, музыку или ветер — и сортировать их по отдельным слоям, которыми вы можете управлять. Затем всего за несколько нажатий вы сможете уменьшить отвлекающие шумы, чтобы ваше видео звучало так, как вы хотите.
4. Zoom Enhance
Благодаря функции Zoom Enhance, которая появится позже в Pixel 8 Pro, вы сможете увеличить любую фотографию постфактум и обрезать ее до нужного размера. Используя генеративный искусственный интеллект, Zoom Enhance интеллектуально заполняет промежутки между пикселями и прогнозирует мелкие детали, открывая больше возможностей при кадрировании и гибкости для фокусировки на самой важной части фотографии.
Подписывайтесь на ИИшница🍳 - тут все самое интересное из мира новых технологий и нейросетей 🤖
В одном из своих постов я рассказывала о сервисах для общения с документами, в том числе в формате pdf. Все они позволяют общаться с любым PDF-документом. То есть, вы можете задавать вопросы, получать сводки, находить информацию и многое другое. Чтобы вручную не искать нужную информацию в документе, этот самый документ можно загрузить в любой из этих сервисов и общаться по нему с чат-ботом.
Например, вы загружаете юридическое соглашение или финансовый отчет и задаете вопросы по документу чат-боту, который быстро ищет ответ в документе. Так же легко можно извлечь информацию и легко резюмировать документы с помощью искусственного интеллекта.
Но что делать, если нужно задать вопрос не по одному документу, а сразу по нескольким?
Вот эта опция и выгодно отличает обновленный PDF.Ai - в него можно загрузить сколько душе угодно pdf файлов, и сервис так же в формате чата ответит на вопросы по ним. Но сразу скажу, эта опция платная - за 15$ в месяц можно загружать 100 документов в месяц, безлимитное число pdf можно загружать при подписке от 25$ в месяц.
Кому это пригодится?
Это обновление может быть полезным для пользователей, которые хотят общаться с несколькими документами одновременно. Например, если у вас есть несколько документов, связанных с одной темой, вы можете загрузить их все и задавать вопросы, извлекать информацию и резюмировать документы с помощью искусственного интеллекта. То есть буквально создать свою базу данных и осуществлять поиск по ней.
Вывод
С помощью подобных сервисов можно выделять главное из документов, делать итоги - так называемые саммари и искать информацию. В этом посте я перечислила в том числе бесплатные сервисы для общения с документами.
Но если необходимо создать свою базу данных, по которой необходимо искать информацию или работать сразу с несколькими PDF-файлами, то имеет смысл присмотреться к платной версии PDF.Ai, гдеможно загружать несколько документов (или безлимитное количество документов от 25$ в месяц). Но минус в том, что эта опция платная, а бесплатно в этом сервисе можно обработать только 1 документ в месяц. Подобные сервисы значительно ускоряют работу с документами, соглашениями и отчетами.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Помните я писала про суперреалистичные аватары от Meta (признана экстремистской в РФ)? Так вот, в полку прибыло, причем код с помощью которого можно будет запустить нейросеть будет выложен здесь на GitHub.
Проект "Gaussian Head Avatar" занимается созданием чрезвычайно реалистичных аватаров головы с использованием динамических гауссовых моделей. Это может быть полезно в областях, где требуются высококачественные визуализации человеческой головы, например, в виртуальной реальности, играх, или в обучающих симуляциях.
Особенность
Эксперименты показывают, что этот проект превосходит другие современные методы разреженного просмотра, достигая сверхвысокого качества рендеринга в разрешении 2K даже при преувеличенном выражении лица.
На рисунке ниже показано как Гауссова голова аватара позволяет достичь сверхвысокой точности синтеза изображения с управляемыми выражениями при разрешении 2K.
Сверхточная копия до мельчайших деталей
Вверху показаны различные виды синтезированного аватара, а внизу - различные личности, анимированные одним и тем же выражением лица. В процессе обучения используется 16 ракурсов.
Сравнение с другими технологиями
На рисунке показаны качественные сравнения различных методов в задаче самовоспроизведения. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Gaussian Head Avatar позволяет качественно восстанавливать такие детали, как борода, зубы и т. д.
Сравнение с конкурентами 1
На рисунке ниже - Качественное сравнение различных методов в задаче перекрестного воспроизведения идентичности. Слева направо: NeRFBlendShape, NeRFace, HAvatar и Gaussian Head Avatar. Метод Gaussian Head Avatar и тут отличился - синтезирует высокоточные изображения, обеспечивая при этом точность передачи выражения.
Сравнение с конкурентами 2
Что ж, имеет смысл подождать на Гитхабе этот проект и потестить бесплатно
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
В прошлой статье я обещала показать, как сделать такой ролик бесплатно в нейросети для генерации видео Pika Labs.
Pika Labs является передовым генератором видео на основе нейросетей, открывающим новые горизонты в мире цифровых медиа. Та же, это главный конкурент Gen-2.
Кстати, как сделать ролик в Gen-2 я показывала в этой статье
Соревнуясь с Gen-2, Pika Labs демонстрирует значительные улучшения в качестве генерации, предлагая решения, которые могут быть ключевыми для вашего бизнеса, особенно если вы интересуетесь интеграцией нейросетей в медиа-пространство или способами заработка через видеогенерацию.
Если раньше он уступал Gen-2 по частоте кадров – 8fps против 24 fps – именно столько кадров в секунду используется обычно в фильмах, то сейчас нет.
В нем так же как и Gen-2 предусмотрен text2video и img2video, то есть можно сгенерировать видео как с помощью референса, так и просто прописав текстом, что хочешь получить. Технологии text2video и img2video, позволяющие генерировать видео как на основе текстовых запросов, так и используя изображения-референсы, открывают новые перспективы для создания уникального контента.
Регистрация в Discord
Основное преимущество Pika Labs заключается в его доступности и легкости использования. Процесс регистрации в Discord, где работает официальный сервер Pika Labs, прост и понятен:
1. Переходите на официальный сайт.
2. Нажимайте "Join Beta".
3. Попадайте на канал Pika Labs для генерации видео.
Можно так же, как и в Midjourney добавить бота к себе на сервер-в данном случае через личные сообщения, и генерировать себе спокойненько ролики без лишних глаз 👀 Да и никто перебивать своими видосиками ваши шедевры не будет 🤭 Короче, удобно. Но и здесь будет ограничение - не более 10 генераций за 5 минут.
⚙ Способы генерации видео в Pika Labs:
1. Промпт + референс
Для генерации видео по исходному изображению, пишем команду /create prompt: [Прописываем, что хотим получить]
Нажимаем на появившуюся кнопку «Image», в открывшемся окне выбираем нужное изображение
2. Просто прописав промпт – все то же самое, только без картинки
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Стартап Humane выпустил гаджет AI Pin, предназначенный для взаимодействия с большими языковыми моделями. Устройство представляет собой значок-проектор под управлением ИИ, который крепится на одежду. Проектор оснащен динамиком, камерой, лидаром и датчиком движения. Дисплея нет — изображение выводится на ладонь пользователя.
Благодаря GPT-4, устройство может переводить речь в реальном времени, работать с почтой и, например, называть пищевую ценность еды, поднесенной к камере.
В целом AI Pin позиционируют как устройство, которым можно пользоваться как смартфоном, только без приложений и вообще графической оболочки. Управлять AI Pin можно голосом, жестами и касаниями, а необходимую информацию на ладонь владельца выводит проектор.
Встроенная камера умеет делать фото, а после будущего обновления ПО сможет записывать видео.
За работу AI Pin отвечает чип Qualcomm Snapdragon, а внутри установлена собственная ОС Cosmos.
Что еще может ❓
✅ Писать сообщение в стиле владельца;
✅ Озвучивать сводку входящих сообщений;
✅ Звонить/ принимать звонки;
✅ Анализировать предметы вокруг;
✅ Включать музыку;
✅ Проверять записные книжки и электронную почту.
✅ Искать информацию в интернете;
✅ Работать с базовыми утилитами: заметками, календарем, калькулятором и т. п.
AI Pin стоит 699$. Плюс к этой цене идет подписка на передачу данных стоимостью 24$ в месяц. Предзаказ откроется 16 ноября, а поставки начнутся в январе 2024 года.
Перевела и озвучила в ElevenLabs , во вкладке Dubbing, про их новую функцию клонирования и перевода голоса я рассказывала здесь, а заодно и сравнила с конкурентом
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса