Пользователь Reddit следуя рецепту Gemini добавил чеснок в оливковое масло и оставил настаиваться при комнатной температуре. Бедолага даже не догадывался, что на выходе получится настоящий яд.
В процессе настаивания юзер заметил пузырики газа, решил проверить рецепт в интернете и выяснил, что в его банке размножались бактерии Clostridium botulinum, вызывающие ботулизм, а настойка чеснока в масле — буквально самый популярный способ вырастить биотоксин в домашних условиях.
Если бы мужчина был менее внимателен и не решил перепроверить рецепт — скорее всего, вся его семья сейчас была бы мертва .
ИИ понял, что никто не будет есть камни и придумал более изощрённый способ.
Недавно была выпущена новая модель ChatGPT-4 Omni, которая оснащена контекстным окном в 128 тысяч символов и обладает очень быстрыми и умными ответами по сравнению с предыдущими моделями.
Несмотря на то, что официальный GPT остается закрытым для нас, я подготовил для вас ТОП-5 чат-ботов, где можно воспользоваться GPT-4 и сравнил их цены, чтобы вы могли найти наиболее выгодный вариант для себя.
Так что давайте перейдем непосредственно к топу, без лишних разговоров:
Одним из основных преимуществ этого чат-бота является непрерывная живая поддержка. Здесь вы никогда не будете чувствовать себя брошенными в своих проблемах. Например, если возникли проблемы с оплатой или бот перестал отвечать на определенные вопросы, вам всегда окажут помощь.
Плюсы:
Можно пользоваться бесплатно версией ChatGPT-3,5 с объемом в 8К токенов.
Удобный интерфейс. Всё находится в одном боте и между моделями очень легко переключаться.
Самые низкие цены на рынке.
Есть функция очистки контекста, соответственно, Вы не будете тратить лишние токены в платной модели, а бесплатная не будет путаться из-за прошлых сообщений.
Есть отдельная группа с рекомендациями по работе с каждой моделью.
Минусы:
Отсутствует просмотр веб-страниц, но в скором времени обещают добавить.
Стоимость ChatGPT-4 o:
- За 100 рублей - 28 000 токенов / 100-200 запросов или 12 картинок в DALLE-3.
Интерфейс как-то очень похож с прошлым ботом, либо это тот же владелец, либо создавали его на одном и том же сервисе. Показано, что есть доступ к нескольким генераторам изображений: StableDiffusion, DALLE и Midjourney, но они находятся в других ботах, соответственно, и оплачиваются отдельно. Плюсы:
Есть партнерка - дают бонусы за приглашение друзей.
В остальном очень похож на прошлый бот, поэтому очень сложно сказать, уникален ли он. Минусы и цены, соответственно, такие же.
В данном случае вы не найдете бесплатной языковой модели для использования, но сможете получить бонусом 10 000 токенов на любую из представленных нейросетей, если подпишитесь на необходимые каналы.
Плюсы:
Дополнительно доступен DALLE-3 и StableDiffusion.
Можно бесплатно попробовать ChatGPT-4.
Можно создавать и сохранять диалоги, самостоятельно присваивая роль боту.
Минусы:
Даже чтобы купить подписку, нужно сначала подписаться на 2 канала, и один из них, подозреваю, что рекламный.
Снова не видно кнопки очистки контекста.
Нельзя купить токены отдельно, только подпиской с минимальной оплатой в 399 рублей. И, получается, если не успел потратить за это время, начисленные токены, то, не заплатив еще, не используешь их.
Стоимость (даёт доступ ко всем представленным нейросетям):
Один из очень немногих ботов в телеграмме, где есть возможность открывать и анализировать ссылки, но функция доступна только платно. Вообще, вроде бы в этот проект неплохо вкладываются, но очень высокий порог входа.
У меня даже получилось сгенерировать пару изображений, но я не понял, сколько токенов потратилось.
Плюсы:
Есть очень много дополнительных функций, например, веб-просмотр, замена лица на фото, Llama, озвучка, перевод видео и многое другое.
Очень хорошо, что есть дополнительное обучение, потому что во всем их функционале очень сложно разобраться.
Доступна партнерская программа.
Минусы:
Невероятное нагромождение совершенно разных возможностей, в которых очень легко потеряться.
Очень запутанная система оплаты: одни функции доступны с подпиской и обновляются, а другие только за отдельные монеты.
Опять же, во всем разнообразии я даже не понял, можно ли будет очищать контекст.
На сайте собраны промты для ChatGPT, которыми абсолютно бесплатно можно будет воспользоваться по своему усмотрению. Эти текстовые подсказки спокойно можно использовать и для других языковых моделей.
На сайте предусмотрена разбивка по категориям с подробным описанием, а заодно и удобная навигация, так что не потеряетесь 😉
Хороший способ бустануть свою продуктивность без всяких кайдзенов, випасан, биохакингов и прочих заумных слов, напечатав которые я уже устал 😥
Источник 🍳 - больше о технологиях и полезных сервисах
Привет, это Настя, руководитель отдела контента в Aigital — сервисе на основе нейросетей для решения маркетинговых задач. Мы придумываем и разрабатываем шаблоны, которые упрощают пользователям создание контента для рекламы, СМИ и соцсетей. Каждую неделю мы пишем о развитии стартапа и изнанке продукта.
В этом выпуске расскажем о нашем ИИ-ассистенте, который помогает формулировать промпты и работает на собственной базе знаний. Также подробно разберем, как и зачем превращать клиентов в лица вашего бренда.
ИИ-ассистент со своей базой знаний
Когда мы выпустили первых ИИ-ассистентов, увидели, что нам не хватает главного — помощника в работе с нейросетями и с нашим сервисом. Мы назвали его ИИ-гид и запрограммировали помогать пользователям писать промпты. Но в процессе разработки поняли, что он также может подсказывать пользователям, как решать задачи с помощью Aigital.
Как работает
Как и всем нашим ассистентам, мы прописали ИИ-гиду сложную роль: специалиста в области ИИ, промпт-инженера, компетентного в области обработки естественного языка и машинного обучения. Он хорошо знаком со спецификой работы различных ИИ-моделей. Задача ассистента — консультировать различных специалистов в том, как ИИ может помочь в их повседневных задачах.
Например, продакт-менеджер может спросить его, как использовать нейросети в своей работе, и ассистент объяснит, какие задачи можно делегировать искусственному интеллекту.
Ответ ИИ-гида на вопрос, как использовать нейросети в работе продакт-менеджера
Если попросить ИИ-гида помочь с промптом для текста или картинки, он пропишет подробный промпт с учетом особенностей взаимодействия как с LLM-ками, так и с графическими моделями. Он обучен на примерах наших промпт-инженеров.
Так, например, если пользователь просит написать промпт для генерации изображения, он пропишет передний и задний план, особенности композиции и настройки камеры. Для LLM-модели он задаст роль, компетенции, подробно опишет задачу и ожидаемый результат.
В ассистенте прописан стиль общения: он должен быть дружелюбным, заботливым и заинтересованным в решении задач пользователя. Мы просим его общаться профессионально, избегая жаргонизмов, как если бы он советовал что-то другу или коллеге.
Особенность этого ассистента в том, что при поиске ответа он обращается к нашей базе знаний. Можно попросить ИИ помочь решить конкретную задачу в Aigital.
Например, я спросила ИИ-гида, как вывести новую коллекцию товаров на рынок с помощью Aigital, и он подсказал ассистентов и навыки, которые помогут в этом.
Ответ ИИ-гида на вопрос, как вывести новую коллекцию на рынок с помощью Aigital
ИИ-гид с опорой на нашу базу знаний по навыкам — это большой шаг к созданию персональных корпоративных ИИ-ассистентов. В первую очередь они будут доступны компаниям, которые используют Aigital как внутреннюю корпоративную платформу.
Аватарка с помощью нейросетей
Мы обновили навык «Аватарка» — маркетинговый инструмент для создания персонализированных брендированных картинок. У него изначально был крутой потенциал, но качество генераций нас не устраивало, поэтому тестировали разные модельки.
На этой неделе пересобрали цепочку моделей, и теперь навык лучше передает как задумку пользователя, так и черты лица с фотографии. И прежде чем перейдем к техническим подробностям, давайте обсудим, зачем в маркетинге и продажах генерировать аватарки.
Во-первых, с помощью этой технологии гораздо проще обновлять визуальный контент. Достаточно загрузить фотографию и описать роль, которую будет играть этот человек. Так можно сделать лицом своей рекламной кампании сотни покупателей, чтобы быть ближе к аудитории и создать более крепкую эмоциональную связь с брендом.
Также вы можете персонифицировать свой бренд, сгенерировав персонажа в навыке «Фотосток: Люди», чтобы использовать его для рекламных креативов, баннеров и контента в соцсетях. Например, фото для своих ИИ-ассистентов мы сгенерировали в навыке «Фотосток: Люди», а с помощью «Аватарки» можем представлять их в разных образах на сайте и в телеграм-канале.
Как работает
Создание аватарки состоит из 7 этапов.
В интерфейсе сервиса пользователь добавляет фото и пишет текстовый запрос, по которому будет генерироваться картинка.
Рекомендуем прописывать более подробно идею в поле «Кого изобразить
Чтобы черты лица на картинке были больше похожи на оригинал, загружайте фотографии анфас, без дополнительных аксессуаров вроде солнечных очков.
Полученный текстовый запрос нейросеть переводит на английский язык.
В это время GPT-4 Vision анализирует загруженную фотографию, определяет:
• пол;
• расу;
• цвет глаз;
• цвет кожи;
• форму губ;
• овал лица и другие детали.
Это сканирование и изучение фото позволяет сгенерировать аватарку максимально похожей на оригинал. Без Vision можно получить изображение человека другого пола, с другим цветом кожи или иными чертами лица.
Vision выдает текстовое описание лица, которое объединяется с пользовательским запросом. Здесь же прописываются дополнительные параметры для генерации качественного фотореалистичного изображения.
Затем этот промпт передается в графическую нейросеть Fooocus, настроенную генерировать реалистичные портреты. Она создает фотореалистичное изображение по пользовательскому запросу с персонажем, по описанию похожим на человека с фото.
На следующем этапе происходит замена лица. С помощью технологии Face Swap лицо на сгенерированной картинке меняется на лицо с фотографии.
Оригинальное фото » Изображение по промпту » Замена лица
Новости проекта
На этой неделе база Aigital преодолела гигабайт сгенерированных пользователями данных. Это зашифрованные результаты генераций в различных навыках. Благодаря базе пользователи могут обращаться к истории генераций и возвращаться к своим постам в соцсети, статьям, рекламным креативам и прочим наработкам. Год назад этот объем казался нам нереальным.
Работаем над онбордингом и полезными материалами об ИИ, которые будут доступны прямо на платформе.
Готовим к выпуску транскрибатор и саммаризатор аудио- и видеозвонков. Уже испытали на своих созвонах, чуть-чуть допилим и добавим на платформу.
На следующей неделе расскажем о бизнес-кейсе и ИИ-ассистенте «Креатологе», которых выбрали читатели предыдущих дайджестов.
Предыдущий выпускдневника можно почитать поссылке.
А промокод DIGEST_2306WN! открывает все навыки, доступные в платной версии до 23.06.
В этой статье я использую мой опыт обучения больших языковых моделей (смотрите серию видео на канале Ruslan Dev), чтобы выявить и описать основные фазы разработки собственной LLM.
На сегодняшний день разработчики GenAI моделей, как правило, используют веса базовых (foundational) моделей, а не обучают нейросеть с нуля. В качестве данных для обучения часто используются ответы state-of-the-art LLM, таких как GPT-4. Этот подход получил распространение с тех пор, как создатели Stanford Alpaca показали, что инференс небольшой модели наподобие Llama 7B можно приблизить по качеству к GPT-3 путем файнтюнинга на ответах последней.
С тех пор и коммерческие, и опенсорс-модели шагнули вперед. Я работал с базовой моделью Llama-3, обученной на беспрецедентно огромном корпусе из 15 триллионов текстовых токенов, что дает широкие возможности для файнтюнинга. А датасет для обучения я собирал с помощью последней модели OpenAI - GPT-4o. Как видите, переменные изменились, но уравнение осталось то же - подход Альпаки работает по-прежнему.
Первую фазу создания LLM - сбор данных - я уже упомянул, за ней следует собственно обучение (точнее, файнтюнинг), evaluation (оценка) и квантизация. Индустрия AI пока формируется, и среди инструментов для разработки LLM нет единого стандарта - для каждой из этих фаз программисты используют то, что им подходит. Я считаю, что наличие фреймворка, предлагающего стандартную реализацию вместо беспорядочного скриптинга, не повредит инновациям - даже наоборот. Поэтому две наиболее сложные в вычислительном плане фазы разработки - обучение и квантизацию модели - я реализовал в моем фреймворке gptchain.
Что касается сбора данных, этот процесс в рассмотренном случае сводится к выполнению запросов к API GPT-4o, для чего я написал отдельный скрипт - он прилагается к моему датасету, опубликованному на Huggingface.
Промпты я взял из мультиязычного датасета Tagengo. При этом я решил отфильтровать промпты, на которые модель отвечает типа - извините, не могу с этим помочь. Чаще всего это потому, что промпт не проходит цензуру.
Я сделал выборку промптов на нескольких языках. Меня интересует русский, а также я решил добавить английский и китайский. Размер выборки для каждого из этих языков я задал на тысячу примеров, чтобы начать с небольшого датасета и посмотреть, что получится.
После получения ответа на каждый промпт все диалоги мержатся с помощью Pandas, а затем конвертируются в датасет в формате Huggingface. Как видите, скрипт для сбора данных функционально получился достаточно простой. Суть идеи в том, что громко анонсированная модель GPT-4o с улучшенными мультиязычными возможностями поможет существенно улучшить навыки ламы-3 справляться с задачами на следование инструкциям.
Для фазы обучения я использовал виртуальную машину с GPU NVIDIA H100 на облачном сервисе immers.cloud. Как настроить виртуальную машину, установить виртуальное окружение python и необходимые пакеты, я рекомендую прочитать вэтой статье или посмотретьвидео.
Я добавил поддержку своего нового датасета в gptchain, который, как и Tagengo, загружается с Huggingface в ShareGPT формате, а затем конвертируется моим фреймворком в ChatML.
Я обучал на 3 эпохи. Так как датасет маленький - 3 тысячи примеров, 3 эпохи не заняли много времени - примерно полчаса. Следует учесть, что это для Llama-3 8B, QLoRA с 4-битной квантизацией.
Как показывают метрики wandb, после трех эпох обучения train loss уменьшился с 1.4 до 0.8.
Прежде, чем перейти к следующей фазе - оценке модели на бенче, давайте сравним ее инференс с моими предыдущими экспериментами, чтобы почувствовать разницу чисто субъективно.
После файнтюнинга на датасете Tagengo (состоящем из ответов GPT-4):
Я: Из чего состоит нейронная сеть?
ИИ: Нейронная сеть состоит из нескольких основных компонентов, которые работают вместе для обработки и анализа данных. Вот основные компоненты нейронной сети:
**Нейроны (или узлы)**: Это основные вычислительные единицы нейронной сети. Нейроны принимают входные данные, обрабатывают их и генерируют выходные данные. [...]
После файнтюнинга на моем датасете (на ответах GPT-4o):
Я: Из чего состоит нейронная сеть?
ИИ: Нейронная сеть состоит из набора узлов, или нейронов, которые имитируют работу биологических нейронов. Эти нейроны связаны друг с другом через синаптические соединения, которые представляют собой веса или коэффициенты, определяющие силу передаваемых сигналов. Основные компоненты нейронной сети включают:
**Входные нейроны**: принимают данные для обработки. В зависимости от задачи, данные могут быть в виде числовых значений, изображений, звуковых сигналов и т.д. [...]
Какой ответ лучше, оставлю судить вам. Важно отменить, что для генерации первого ответа использована Llama-3 70B, второго - Llama-3 8B.
Теперь пора оценить мою новую модель. Я использовал мультиязычный MT-Bench, и генерация ответов на тестовые вопросы на английском и на русском заняла у меня больше времени, чем сам файнтюнинг.
Кстати, техническую инструкцию, как выполнить мультиязычный MT-Bench на своей модели, смотрите вэтой статье.
Результат моей модели на английском бенче составил 6.6, это значительно хуже, чем у той же Suzume, что впрочем неудивительно - в моем датасете всего тысяча англоязычных ответов, против 15 тысяч в датасете Tagengo.
Я попробовал и русскоязычный бенчмарк ru_mt_bench. На нем я получил 7.3, не так плохо, близко к GPT-3.5, но все еще слабее Suzume.
Подытожим. Для моего эксперимента мне хватило одной Виртуальной Машины с одним H100, но как бы этот процесс выглядел, будь это серьезный продакшн? Очевидно, добавился бы model parallelism - для более серьезного обучения лама параллелилась бы на несколько H100 одновременно. Я не затронул последнюю фазу - квантизацию, которая нужна для деплоя модели на компьютер или сервер пользователя. Для этого хорошо подходит GGUF формат, поддерживаемый библиотекой llama.cpp.
Можно представить, что для "фабрики LLM" наподобие той, что работает за закрытыми дверями "Open" AI, все эти фазы должны быть автоматизированы - включая дата-пайплайн и бенчмарки. Сделать это проще в облаке при наличии фреймворка наподобие gptchain, но все же остается нетривиальной задачей. Все описанные фазы разработки LLM можно посмотреть в действии - в моем последнем видео.
«O tempora, o mores!», могли бы воскликнуть мы, говоря о рекламе и продвижении в нынешних реалиях. Не то чтобы реклама перестала работать: в отдельных сферах она по-прежнему двигатель прогресса. Штука в том, что мы стали меньше ей доверять и делаем выбор, опираясь не на яркие слоганы, а скорее на образ бренда в сети, на реальные отзывы, на свои ощущения от информации, которую получаем из соцсетей.
Мы больше не проводим время перед экранами телевизоров и не западаем на белозубые улыбки звезд и картинки счастливой жизни из промо-роликов. Пользователи стали требовательнее к контенту. Пресловутая польза, закрывающая боли — вот, что продает. А значит, чтобы получить клиента, нужно дать ему эту пользу.
Как? Конечно же через контент!
И тут вам вряд ли поможет постинг мемчиков, веселых историй из жизни или долгих рассказов об истории компании. Контент ради контента не работает - нужна стратегия!
Ее-то мы и выстраиваем в рамках контент-маркетинга.
Чтобы ваш бренд не болтался на волнах сетевых ресурсов, как корабль без курса, а уверенно шел к поставленным целям и показателям, вам точно нужна грамотная маркетинговая стратегия, которая позволит привлекать лиды, повышать лояльность и удерживать клиентов. Да, через тексты, ролики, активность в соцсетях, ваши корпоративные сайты и другие инструменты сегодня можно выстроить имидж бренда, который позволит вам двигаться вперед и масштабировать бизнес.
По сути контент-маркетинг — это ваш мостик к выстраиванию отношений с клиентами. И несущей конструкцией в нем будут отнюдь не продажи, а доверие. Доверие вам как эксперту или бренду, доверие к вашему продукту. Через ценность, через интерес, через пользу, которой обязательно стоит делиться, вы можете сформировать то самое доверие, благодаря которому — бинго! — у вас будут покупать.
И здесь важную роль играет качество контента. Вы можете завалить свои соцсети сгенерированными нейросетями постами без глубины и сути. А можете выстроить контент-план так, чтобы ваши клиенты восхищались, ждали следующего ролика или поста, активно включались в диалог. И да, использовать ресурсы искусственного интеллекта можно и нужно, но важно делать это с умом, чтобы получить классный результат.
AIYAI (проект «Важно знать») идеально заточен под то, чтобы ваша контент-стратегия была рабочей. Обеспечим AI-контентом высокого качества, чтобы вы не тратили миллион лет на поиск идей и генерацию для страниц в соцсетях и корпоративных СМИ. Мы проложим для вас кратчайший маршрут к целям и поможем спокойно и уверенно пройти по нему.
Для всех поклонников футбола, Hisense подготовил крутой конкурс в соцсетях. Попытайте удачу, чтобы получить классный мерч и технику от глобального партнера чемпионата.
А если не любите полагаться на случай и сразу отправляетесь за техникой Hisense, не прячьте далеко чек. Загрузите на сайт и получите подписку на Wink на 3 месяца в подарок.