Что можно сказать о продукте, если стоящая за его созданием компания не хочет им пользоваться? Как выяснилось, Microsoft запретила своим сотрудникам использовать популярный чат-бот ChatGPT, в разработке которого она принимает непосредственное участие.
Как стало известно, Microsoft временно запретила своим сотрудникам использовать ChatGPT, объявив об этом на внутреннем веб-сайте, а вместе с тем заблокировав доступ корпоративных устройств к чат-боту. Сделано это было «из соображений безопасности».
Интересно, что именно Microsoft является крупнейшим инвестором компании OpenAI, которая и ответственна за разработку ChatGPT. В начале года корпорация заявила о планах выделить на развитие чат-бота 10 миллиардов долларов в дополнение к уже вложенным 3 миллиардам. Более того, именно языковая модель ChatGPT лежит в основе Copilot — встроенного в Windows чат-бота, — а также чат-бота Bing и ряда других продуктов Microsoft.
По информации CNBC, блокировка длилась недолго, и объявление быстро удалили с внутреннего сайта, оставив лишь упоминание о запрете сервиса Canva. В то же время представитель Microsoft заявил, что это было ошибкой.
Парень создал автоматизированного ИИ-комментатора, который понимает, что происходит в игре.
Утилита каждые 5 секунд делает скриншот игры и отправляет GPT, он в свою очередь пишет комментарий происходящего и озвучивает (TTS). Все это в режиме реального времени.
OpenAI провела первую конференцию Dev Day для разработчиков, посмотреть можно здесь
Для своих подписчиков я собрала полную информацию о новинке. Итак, вчера вышла превью версия GPT-4 Turbo, доступная девелоперам по API. Это такой зафайнтюненный GPT-4 с большим количеством токенов и более дешевым API. Для обычных пользователей это никак не скажется на стоимости подписки, и новая версия будет доступна через несколько недель. Вкратце, GPT-4 Turbo лучше и быстрее GPT-4
Что нового ❓
Контекст
Контекст – 128 тыс. токенов! - в 16 раз больше чем в GPT-4! Теперь можно не опасаться, что ChatGPT-4 Turbo забудет, о чем вы писали до этого, в него поместится стандартная книга более 300 страниц! Эта модель более аккуратна при работе с длинным текстом, не забывает то, что было в середине
Обновление базы знаний
Обновление базы знаний -теперь информация обновилась до апреля 2023 года!
Мультимодальность
Теперь можно бесшовно работать ChatGPT. Не перепрыгивая из окна в окно между Code Interpreter, DALL-E 3 и плагинами, делать все задачи в одном окне не переключаясь, а можно вызвать несколько функций за раз. ChatGPT будет сама догадываться, чего вы от нее хотите
GPTs (на фото)
GPTs -это настраиваемые под определенную задачу ИИ-боты.
Теперь обычный пользователь без знаний программирования может создать своего GPT бота прямо в окне диалога. Ассистенты имеют доступ к Code Interpreter и сами смогут писать и исполнять код на языке Python. GPTs можно создать из промпта, нескольких вспомогательных маленьких файлов, на которые бот может опираться, и набора функций/инструментов. Помимо стандартных DALLE-3 и интерпретатора кода, можно свободно добавлять любые произвольные function calls к внешним сервисам.
Более того, OpenAI анонсировали Свой “AppStore” – GPTStore (выйдет в конце месяца). Это магазин, где можно выложить своих GPTs ботов и пользоваться чужими: теперь можно зарабатывать на создании своих AI - ассистентов 🤌🏼
Custom Models
Инженеры OpenAI адаптируют тренировку под проблемы вашей компании
Голосовое управление
Расширенный функционал для разработчиков:
- можно заставить модель писать ответы в JSON-формате
- очень крутые возможности для интеграции GPT в свои приложения благодаря контролю JSON на выходе
- Снижение стоимости токенов (на фото):
для разработчиков и тех, кто использует API- входные токены дешевле в 3 раза, выходные в 2 раза. Подробнее о ценах здесь
- DALLE-3 доступна через API. Подробнее
- Whisper V3 – обновленная модель для распознавания речи – доступна по API. Файлы будут транскрибироваться еще быстрее и качественнее
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
Это стартап Илона Маска, который собирается сделать очередную "модель лучше, чем GPT-4".
В текущей версии можно получить языковую модель с актуальными данными, но все упирается в ограничение обученности модели. В Grok-1 33млрд параметров и лимит на 8,192 токена для запроса. В будущем собираются улучшить ответы (кстати интересные тесты, можно по картинке узнать), добавить мультимодальность и расширить поиск в вебе.
Чтобы воспользоваться, надо оформить подписку X Premium Plus за $16 в месяц и подать заявку в лист ожиданий. Как одобрят, можно использовать Grok.
В октябре OpenAI представила Dall-E 3 в интерфейсе ChatGPTPlus и Enterprise и заверила, что новый Dall-E 3:
✔️ учитывает каждое слово в промпте;
✔️ на изображениях корректно выводится текст, кроме русского.
✔️ улучшена проработка сцены и взаимосвязь между объектами на изображении, отрисовка рук и других частей тела.
Генерировать изображения можно в самом диалоге с чат-ботом, что дает бесшовно переключаться между делами с текстом и изображениями, не покидая ChatGPT.
На видео пример такого взаимодействия между Dall-E 3 и ChatGPT -сказка про Лари, солнечного ежика, с иллюстрациями и прочим.
Я протестила Dall-E 3 и сравнила его с Midjourney
По исполнению реалистичных фото мне понравился больше Midjourney; в DALL-E 3 “все равно фото как компьютерные” - извините за каламбур 🤭
DALL-E 3 лучше отрисовывает руки, это однозначно! Так что если у вас студия маникюра, без напряга можно сгенерировать маникюр на пяти пальцах с первого раза 💅
Промпты DALL-E 3 тоже понимает лучше: для примера сгенерила изображения по одному промпту:
“Эфирная элегантность, изящный нейл-артистизм с бутылочками и украшениями из лака для ногтей, мягкие, приглушенные оттенки для легкой и нежной атмосферы, - без анатомической деформации рук” - Midjourney конечно обрисовала с присущей ей художественностью, только вот про руки забыла, зато DALL-E 3 точнопередал детали промпта:
Авторское право в DALL-E 3: пользователям запрещено генерировать изображение, если в описании указан ныне живущий художник или фотограф с целью защиты авторских прав. Однако,DALL-E 3 по-хитромупредлагаетпередать суть стиля художника, используя описательные термины и художественные направления:
DALL-E 3 предлагает решение
Перевод
Правда по достоверности передачи стиля художника мне ближе Midjorney.
Для примера, попросила DALL-E 3 и Midjorney сгенерировать изображения в стиле David Bailey по промпту:
1965 melodrama, New York in the style of David Bailey --ar 4:5 --s 350 --style raw
Вот оригинальные работы David Bailey
David Bailey
Вот как увидели стиль David Bailey Midjourney и DALL-E 3:
Все-таки лучше передал стиль фотографа Midjourney, изображения DALL-E 3 мало похожи на модельные фото, скорее на иллюстрации, и не передают почеркDavid Bailey, но это мое мнение
Вывод
Пока мне все же больше нравится Midjourney по исполнению и настройкам, не смотря на неоспоримые преимущества DALL-E 3. Я думаю, скоро мы с вами станем свидетелем гонки вооружений: Midjourney выкатит обновление, устранит баги с руками, улучшит понимание промпта, а DALL-E 3 улучшит исполнение и выпустит новые фишки, интересно будет понаблюдать) А вы что думаете? 🤔 Потестили уже DALL-E 3?
Хотите узнавать первыми о действительно полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как использовать нейросети для бизнеса 😉
Теперь работать с ChatGPT стало удобнее благодаря русскоязычному интерфейсу 😉
Правда, регистрация через российскую SIM-карту по-прежнему недоступна, и VPN все же нужно включать 😕 А как зарегистрироваться в ChatGPT из России я уже рассказывала
Ниже рассказываю про новые функции распознавания голоса и изображений 👇🏼
ChatGPT теперь может распознавать голос и изображения
Пользователи с подпиской Plus и Enterprise смогут общаться с помощью голоса с ChatGPT (iOS и Android)- система конвертирует голос в текстовый запрос, генерирует ответ и озвучивает его. Так же появилась возможность интегрировать изображения в разговор, распознавание изображений доступно на всех платформах. Вскоре доступ откроют для всех.
Распознавание голоса:
Можно взаимодействовать с ChatGPT с помощью голоса, вести обратную связь в разговоре. Работает на основе новой модели текста в речь, способной генерировать человекоподобное аудио из текста и нескольких секунд образца речи.
Функция включается в Настройках:
Настройки → Новые функции на мобильном приложении, затем включить голосовые разговоры. Далее нужно нажать на кнопку наушников в верхнем правом углу главного экрана и выбрать предпочитаемый голос из пяти различных вариантов.
Распознавание изображений:
Теперь можно показать ChatGPT одно или несколько изображений, описать проблему, например, чтобы решить неполадку велика или обсудить содержимое холодильника.
Как работает:
Необходимо нажать на кнопку фото, чтобы сделать снимок или выбрать изображение. На iOS или Android сначала нажмите на кнопку плюс.
Распознавание изображений работает на основе мультимодальных моделей GPT-3.5 и GPT-4.
То есть можно будет вести полноценный диалог и показывать то, о чем вы говорите через фотки или картинки из сети. Фотографируете памятник, отправляете фото ChatGPT, а тот голосом рассказывает всё, что о нём знает. А вы продолжаете задавать вопросы — тоже голосом.
Не смотря на то, что есть плагины WebPilot и LinkReader, лучше всего с поиском в интернете и переходом на сайты справлялась именно браузерная версия ChatGPT благодаря Bing. Раньше эту опцию убирали из-за того, что Bing мог заходить «куда не надо», например без проблем брал инфу из платных и закрытых источников. Сейчас это пофиксили и вернули ногмальгый поиск в инете, а значит информация не ограничивается 2021 годом.
Больше полезных сервисов с искусственным интеллектом в моем телеграм канале (ссылка в описании профиля), все инсайты и новости я размещаю в сторис, чтоб не захламлять ленту, и вы сразу могли найти полезные нейросети для работы, учебы и бизнеса
«Чат на чат» — новое развлекательное шоу RUTUBE. В нем два известных гостя соревнуются, у кого смешнее друзья. Звезды создают групповые чаты с близкими людьми и в каждом раунде присылают им забавные челленджи и задания. Команда, которая окажется креативнее, побеждает.
Компания OpenAI предоставила доступ ChatGPT к актуальным знаниям из интернета. Теперь чат-бот не ограничен информацией до сентября 2021 года и может давать прямые ссылки на источники.
Новая функция уже доступна подписчикам ChatGPT Plus и Enterprise. В ближайшее время она появится у всех пользователей. Для включения функции необходимо выбрать пункт Browse with Bing в селекторе под GPT-4.