ElevenLabs выпустили новую функцию Sounds Effect, которая положит конец аудиостокам. Теперь просто введя описание звукового эффекта можно мгновенно получить сэмплы звука — пение, дождь, взрыв, волны, искры и что угодно. Я затестила новую функцию:
Новая функция пока работает хорошо на английском, можно совместить чью-то речь и звуковые эффекты.
Например, я в своем примере соединила звуки дождя за окном и мужской голос, который говорит на английском “мой дом-моя крепость”.
Что крутого в новой функции ElevenLabs:
1) Пока бесплатно! Тестите
2) Можно настроить уровень креативности и уровень следования тестовой подсказке
3) Можно настроить время или предоставить ИИ самому выбрать наилучшую продолжительность
Что пока не может:
- По-русски пока не очень, если описывать действия на русском, то нейросеть просто озвучит все, что написано, посмотрите сами:
- Если совместить описание звуковых эффектов на английском, а саму речь на русском, получится вообще непонятный набор символов:
После того, как я в настройках установила следование промпту на максимум и автоматически определять длину, ситуация улучшилась, но не вау:
ElevenLabs молодцы, то студию дубляжа свою замутят, то радют своими новыми фишками. Классная возможность контентмейкерам не платить за soundstock, не тратить время на поиски, а просто самому сгенерировать то, что нужно и забыть про авторские права. Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпиcывайтесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Эта статья является продолжением прошлой статьи, уделяя больше внимания итоговому продукту, а не самому процессу хакатона.
Когда вы создаете ИИ-продукт о здоровье, всегда возникает вопрос этики, точности, ответственности и доверия. Именно поэтому важно разделять продукты для здорового образа жизни и настоящие медицинские продукты. Мы долго думали над тем, где проходит грань между ними и насколько близко мы можем к ней подойти. Это сложный вопрос, но мы нашли решение: создать два самостоятельных продукта, которые находятся далеко от этой черты, но по разные стороны.
«Лучший друг»
Первый — о здоровом образе жизни. Это ваш виртуальный лучший друг, и даже больше: помощник, тренер, мотиватор, иногда даже мама или мини-психолог. Собирая важную информацию о вас в чате и имея в памяти ваш анамнез, биографию и историю, лучший друг может просто слушать, как вы проводите день, комментировать его, помогать вам повседневными советами и рекомендациями или даже помогать вам двигаться к вашим целям и мечтам, используя индивидуальную мотивацию, человеческое сочувствие и понимание ваших чувств.
«Доктор Хаус»
Проблема
Второй продукт уже по-настоящему медицинский. Начнем с проблемы:
Сложность самого процесса диагностики из-за сложного строения человеческого организма и огромного количества возможных случаев, которые не всегда могут быть полностью вылечены врачом
Перегруженность систем здравоохранения и специалистов
Неэффективная и несвоевременная диагностика в здравоохранении, приводящая к ухудшению состояния пациентов.
Проблемы доступности для удаленных или малообслуживаемых групп населения
Нежелание людей посещать больницы, страх перед врачами.
Диагностика — это важно
Почему диагностика так важна? Эйнштейн сказал: «Если бы у меня был час на решение проблемы, я бы потратил 55 минут на обдумывание проблемы и пять минут — на поиск решений». Подготовка имеет огромное значение для решения проблем. То же самое верно и в медицине. Профессионалы говорят: правильный диагноз — это ~70% исцеления. И мы считаем, что можем улучшить 70 % современной медицины с помощью одного приложения.
Внедрение
Познакомьтесь с Dr. House — ИИ-диагностом в вашем телефоне. Мобильное приложение, которое за считанные минуты ставит диагноз.
Как мы собираемся этого добиться? С начала времен и по сей день мы считаем, что лучший способ коммуникации — это речь. Если вы хотите что-то узнать — задавайте вопросы. Задавая вопросы, я имею в виду задавать правильные вопросы. Итак, мы собираемся создать приложение, которое будет иметь полный анамнез вашего заболевания и задавать корректные персонализированные вопросы, и на основе ответов предлагать возможные диагнозы. Звучит довольно просто, но полезно, не так ли? И уж точно лучше, чем гуглить свои симптомы (у меня каждый раз рак).
И это помогает не только обычным людям. Врачи тоже могут использовать это для перепроверки, второго мнения или предварительного прогноза, например, в машине скорой помощи.
Кроме того, когда доктор Хаус рекомендует посетить больницу, процесс значительно ускорится, потому что в приложении уже есть полный анамнез, история болезни и заполненная анкета, так что и клиенту, и врачу нужно потратить значительно меньше времени. И это же приложение можно использовать в качестве карты экстренной помощи, если пользователь находится «вне сети».
Можно ли сделать лучше?
Можно ли сделать еще лучше? Мы говорим "да"! Как? Интеграции! Приложение может учитывать информацию из Apple HealthKit и медицинских устройств. Или наоборот, API может передавать данные в больницу (и обратно) даже без прямого контакта с человеком.
Если приложение будет следить за состоянием здоровья человека, это значит, что его можно будет отправить домой из больницы гораздо раньше и освободить место для того, кто в этом больше нуждается. Врачи будут следить за состоянием здоровья удаленно, а приложение уведомит их, если что-то не так.
Заключение
Как я уже писал, к сожалению, у нашей команды нет возможности работать над этим проектом фулл-тайм, поэтому мы опубликовали все результаты нашей работы в открытый доступ. Слайды вы можете найти здесь (написан по памяти неделю спустя). Полную информацию о проекте, включая все заметки и исходный код, можно найти на GitHub.
Не так давно Илон Маск искал добровольцев на чипирование. Предприниматель набирал парализованных людей, согласных на то, чтобы им в мозг вживили чип Neuralink.
1/3
Имплант позволяет управлять компьютером с помощью силы мысли. Можно даже отель забронировать.
В итоге такой доброволец нашелся, им стал Нолан Арбо, который полностью парализован ниже шеи из-за несчастного случая. Теперь же он может скролить запрещеннограм силой мысли, переписываться в твиттере(X), делать онлайн покупки и играть. Чип подключается по Bluetooth к компьютеру через специальное приложение «Neuralink».
С полным интервью можете ознакомиться здесь. Ниже приведу краткие итоги.
В целом, Нолан говорит, что доволен новыми возможностями и не чувствует себя бессильным. Сам имплант не вызывает болевых ощущений.
Пациент теперь активно пользуется соцсетями и почтой. Он сам заходит на сайт для изучения японского языка, читает комиксы.
Девайс прекрасно справляется с длительными нагрузками. Иногда парень использовал Neuralink с 7 утра до 11 вечера. Однажды Нолан заснул и не отключил курсор на компьютере. Чип продолжал отслеживать деятельность мозга Нолана и за 5 минут открыл около 10 различных приложений.
За месяц использования чип сдвинулся на три миллиметра, встал вопрос о новой операции, но в итоге компания смогла обойтись лишь поправками в программе.
Но не все так гладко было.
Чипирование пошло не по плану
Спустя месяц после вживления чипа возникли сложности. Поскольку ученые не приняли в расчет небольшие движения мозга в пределах одного миллиметра, Чип начал отсоединяться от черепа. Это снизило его эффективность в улавливании данных. И потребовалась повторная операция.
В общем и целом, прооперированный пациент чувствует себя хорошо, но иногда все же чип отключается от мозга, из-за чего часть функций временно пропадает. В новой операции Neuralink обещает учесть эту проблему. Да, вы не ослышались, недавно Neuralinkполучили разрешение на вживление ВТОРОМУ ПАЦИЕНТУ их чипа. Вторая операция ожидается в июне этого года. Американский регулятор FDA одобрил операцию по вживлению чипа Neuralink в мозг еще одному пациенту.
Некоторые люди с тяжелыми заболеваниями считают эту технологию своей последней надеждой. Однако сама процедура внедрения чипа выглядит как третья часть Пилы, слабонервных прошу не смотреть:
А как вы относитесь к подобным технологиям? Они вас пугают или наоборот восхищают? Надеюсь, моя статья вам понравилась, если вам интересны новые технологии и полезные сервисы, жду вас в своем телеграм канале ИИшница, где я регулярно публикую новости ближайшего будущего, переводы видео и полезные сервисы
Stable Diffusion 3 скоро выйдет на свет, и это будет настоящий прорыв. Держите календари открытыми на 12 июня, потому что тогда мы все погрузимся в магию создания изображений прямиком из текста.
Представьте себе кисть, которая рисует все, что угодно, просто по вашему слову. Вот так и Stability AI с их новым детищем — Stable Diffusion 3. Это не просто обновление, это революция в генерации изображений!
Запомните дату: прибытие Stable Diffusion 3
12 июня — это день X. Stable Diffusion 3 Medium с двумя миллиардами параметров выходит в свет. А еще есть Small и Large версии, так что каждый найдет что-то для себя.
Что нас ждет в Stable Diffusion 3 Medium?
Фотореализм на стероидах: забудьте про картинки с кривыми руками и лицами. Теперь все будет как настоящее.И молниеносная производительность, быстро, гладко, без тормозов. Для дома, для работы — для всего!
А тексты станут резкими и чистыми, как зимнее утро.
Stability AI не шутили, когда готовили этот релиз. Научная работа, заложенная в модель, обещает сделать ее царицей AI, способной на все. И да, она справится даже с самыми капризными заданиями.
И еще кое-что о доступе к Stable Diffusion 3
После релиза Stable Diffusion 3 встроится в yesAibot, доступный через Telegram. Уже сейчас там есть все лучшее от Stable Diffusion, SDXL до GPT-4 Omni.
Ну что, готовы к новым высотам генерации изображений через Stable Diffusion 3? Совсем скоро все начнется!
Apple на Всемирной конференции разработчиков подтвердила, что в новой iOS18 Siri получит встроенный ИИ.
Нейросети позволят Siri управлять большинством приложений. При помощи голосовых команд пользователи смогут открывать документы, перемещать заметки, удалять письма и делиться ссылками.
В involta.media добавили, что голосовой помощник сможет расшифровывать аудио и собирать саммари.
Привет, это Настя, руководитель отдела контента в Aigital — сервиса на основе нейросетей для решения маркетинговых задач. Мы придумываем и разрабатываем шаблоны, которые упрощают пользователям создание контента для рекламы, СМИ и соцсетей. Каждую неделю мы рассказываем о развитии стартапа и изнанке продукта.
Сегодня расскажу о создании Customer Journey Map (CJM) с помощью нейросетей, обновленном инструменте для удаления фона и генерации картинки на основе другого изображения.
Генерация картинки по референсу
На этой неделе мы добавили на платформу новый навык — генерация картинки на основе другого изображения. С помощью этого навыка можно решать множество прикладных задач: от генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей. Он учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации. Помимо этого навык учитывает и то, что указано в текстовом промпте.
Например, в поле «Референс» вы добавляете картинку — обложку с любого YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете картинку с шашлыками, подходящую по тематике для вашего блога, а по стилистике, палитре и композиции похожую на изображение, что вы добавляли в качестве референса.
Генерация изображения в навыке «В стиле референса»
Под капотом навык работает следующим образом:
На первом этапе ИИ анализирует референс — GPT-4o подробно описывает картинку с разных сторон, прорабатывает её стилистику.
В параллель с этим другая нода GPT-4o берет текстовый запрос пользователя и переводит его на английский.
На следующем шаге GPT формирует объемный промпт, объединяя описание референса и текстовый запрос пользователя. Веса в нем расставлены так, чтобы нейронка понимала, на что следует обратить больше внимания, а на что меньше.
Этот текстовый промпт отправляется в Fooocus.
Fooocus умеет работать с входящими изображениями, поэтому вместе с текстовым промптом приходит и картинка-референс. Получается двойной удар по задаче — и со стороны текстового описания референса, и визуально — с ориентиром на само исходное изображение.
Fooocus сохраняет не только цветовую палитру, но и пропорции картинки-референса. Это особенно удобно, если требуется определенный размер изображения.
Генерация изображения в навыке «В стиле референса»
1/2
Картинка-референс (первое изображение) и результат генерации по референсу и описанию (второе изображение)
Далее обученная нами модель улучшает черты лица на картинке и передает ее пользователю.
Мы решили поэкспериментировать и сгенерировать стол со стульями на основе скрина нашего лендинга. Нейронка сохранила пропорции, забрала темно-серый на фон, а зеленый и белый в акценты.
Скрин нашего лендинга
Изображение сгенерировано в навыке «В стиле референса»
Создание Customer Journey Map с помощью ИИ
Навык «Путь пользователя» или Customer Journey Map для сегодняшнего разбора выбрало большинство читателей пятого дайджеста.
CJM — это карта пути клиента, которая показывает все этапы взаимодействия пользователя с продуктом или услугой. Она помогает понять, как клиент воспринимает ваш продукт, какие у него возникают вопросы и болевые точки на каждом этапе.
В этом навыке Aigital выступает в роли специалиста по CJM, глубоко знающего психологию, маркетинг, продуктовую разработку.
Перед тем как приступить к разработке карты пути клиента, важно четко понять, кто будет использовать ваш продукт и каковы их цели. Для этого нужно описать сам продукт, услугу и пользователя. Если у вас еще нет четкого представления о пользователе, можно воспользоваться навыком «3 портрета пользователя». В результате вы получите подробные портреты пользователей с учетом их дохода и психографики (интересов и взглядов) на основе описания вашего продукта.
В основу промпта лег фреймворк по Customer Journey Map от нашего продакт-менеджера Юры. Одна из компетенций Юры — как раз создание CJM.
Вы можете забрать этот фреймворк в Figma-комьюнити и использовать для презентации своей команде сгенерированный в Aigital CJM.
CJM должна включать не только общие этапы взаимодействия с продуктом, но и детализацию каждого шага. Подробный ответ генерируется под каждый шаг CJM, чтобы детальнее проработать задачу. Шаги пользователей, которые сейчас учитываются в навыке:
Онбординг (Onboarding) — первое взаимодействие клиентов с продуктом или услугой, знакомство с основными функциями и преимуществами.
Обзор ценности (Value Discovery) — глубокое изучение продукта или услуги, понимание его уникальной ценности и соответствия потребностям.
Рассмотрение вариантов (Consideration) — оценка плюсов и минусов продукта или услуги, принятие решения о покупке.
Покупка (Purchase) — процесс покупки.
Формирование привычки (Habit Formation) — включение продукта или услуги в повседневные привычки, развитие лояльности.
Распространение (Advocacy) — рекомендация продукта или услуги.
Наш сервис генерирует подробное описание каждого шага, отмечая следующее:
Какой цели я хочу достичь на этом этапе?
Какие действия мне нужно предпринять для достижения цели?
Какие трудности могут возникнуть?
Какие вопросы или сомнения могут появиться?
Где я могу ошибиться?
Что мотивирует меня двигаться к цели?
Какие эмоции я могу испытывать на этом этапе?
Отдельным пунктом в каждом шаге прописываются возможности для улучшения пользовательского опыта. В промпте для этого навыка мы прописываем, что CJM создается, чтобы повысить вовлеченность и снизить отток пользователей.
Наш фреймворк близок к маркетинговой воронке, но поскольку видов CJM довольно много, мы не хотим ограничиваться одним. Поделитесь в комментариях, какие шаги проходит ваш клиент, взаимодействуя с продуктом? В этом навыке мы планируем сделать выпадающее меню с выбором типа CJM.
Небольшие, но важные обновления
Еще немного о том, какие изменения в сервисе мы реализовали или готовим в ближайшее время.
Обновили «Удаление фона». Новый инструмент, на котором работает навык, очень быстро и гораздо качественнее отрабатывает задачу. Особенно это заметно на мелких деталях, например, на волосах.
Обратите внимание на волосы девушки
В раздел истории списаний добавили названия навыков, в которых происходили генерации. Теперь стало удобнее отслеживать, сколько вы расходуете кредитов на те или иные генерации.
Результаты генерации в текстовых навыках теперь приходят с форматированием — подзаголовки в них выделены жирным, маркированные списки аккуратно оформлены, если позволяет задача — добавлены эмодзи. Кроме того, теперь вы можете получать результат в виде таблички, достаточно указать это в пункте «Что учесть» или в своем запросе.
Надеемся, вы уже успели протестировать «Маркетологуса» и «Чат с ИИ». Мы готовим к релизу 10 новых ИИ-ассистентов, среди них будут эксперты по HR, SMM и SEO.
UPD:
Предыдущий выпуск «Дневника стартапа» читайте здесь.
Пока все боятся, что ИИ уничтожит человечество, мамочки уже используют его в быту.
Так например одна находчивая дама создала дипфейковые новости, где ведущий рассказывает и стыдит беспорядок в комнате ее малышей. 😅🤪
Снедаемые чувством вины, карапузы дружно побежали наводить порядок, а то еще и Санта Клаус с подарками прокатит
Вот так чувство вины стоит на страже порядка в детских комнатах 👻
Видео для вас перевел телеграм канал ИИшница 🍳 Если вам интересны новые технологии, полезные сервисы и новости будущего, добро пожаловать на канал! А еще, если вы устали от новостей об играх, непонятных приколов, то вам тем более ко мне)
UDIO - пока еще бесплатная нейросеть для создания музыки, в том числе со словами. Мне очень понравился этот генератор песен, по простому промпту он создал мне прям достойный ню-джаз со всеми полагающимися. Кому интересно, статья про мой эксперимент с UDIO и обзор на эту нейросеть
Mubert - очень простой и понятный сервис для создания треков и аудиозаставок. Mubert использует базу сэмплов от разных электронных продюсеров и генерирует уникальные музыкальные потоки в реальном времени. Мой обзор на Mubert
Soundraw - тоже простая в использовании, во free версии можно создавать неограниченное количество треков, но нет возможности скачивания, поэтому диктофон в помощь. Платформа позволяет вам генерировать уникальные, студийного качества треки одним нажатием кнопки. Вы можете выбирать из разных жанров и настроений. Идеален для саундтреков к видео, трансляций или подкастов. Поскольку сэмплы обучены теории музыки, ИИ Soundful никогда не воспроизведет уже существующую песню, даже с собственной платформы.
Loudly - ИИ для профессионалов, где много настроек, и можно генерировать семплы с голосом.
Amper Music- AI для создания музыки из имеющихся сэмплов.
AIVA - нейросеть для сведения музыки: делает автоматический мастеринг. Есть куча шаблонов. Создает эмоциональную музыку для саундтреков к рекламным роликам, видеоиграм, фильмам и многому другому. Он помогает независимым разработчикам игр, начинающим музыкантам и профессиональным композиторам в их творческом процессе. Может создавать музыку с нуля или вариации существующих песен, не беспокоясь о процессах лицензирования, что делает его отличным вариантом для музыкантов и контент-мейкеров.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпиcывайтесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.