Крутые инструменты, жаль, что пока еще не до конца рабочие.
— Создание полноценных 3D-миров на krea.ai. Уходит в вечный цикл загрузки, скорее всего не хватает мощности на всех пользователей. Тут либо покупать подписку, либо ждать.
Сам по себе сервис дает много возможностей, планирую его изучить получше и сделать пост.
— Интеграция Gemini в Google.Таблицы. Работает для США и не для всех аккаунтов. Включить прямо сходу это нельзя: "Эта функция доступна в рамках программы раннего доступа Google Workspace Labs."
По инструкции написано, что нужно включить: "Экспериментальный режим", но такой кнопки просто нет с любой геолокацией. Остается просто ждать, но функция потенциально очень полезная!
Хотелось бы про них выпустить отдельные посты, рассказать, как это удобно, НО! Пока это не работает ...
Было скорее странно, что все ИИ-каналы сделали об этом пост, но никто даже не открыл и не проверил работоспособность.
📌 Если кому интересно, то пишу про лучшие ИИ в своем авторском канале (ссылка в профиле)
Каждый месяц появляются новые инструменты, а существующие становятся еще лучше. Решил составить свою личную подборку реально работающих на практике ИИ-инструментов.
Что может ИИ прямо сейчас?
Текст: От быстрых постов для социальных сетей до глубоких исследований на десятки страниц – ИИ стал незаменимым помощником в работе с текстом.
Графика: Генерация уникальных изображений по описанию, создание 3D-моделей, инфографики и даже прототипов дизайна для сайтов и приложений – все это доступно в несколько кликов.
Видео: Появляется все больше моделей для генерации видеоконтента, включая бесплатные варианты для экспериментов.
Аудио: Озвучка текстов реалистичными голосами и создание оригинальных звуковых дорожек – отличное дополнение к текстовому и видеоконтенту.
Аналитика: ИИ помогает находить скрытые закономерности, тренды и аномалии в больших объемах данных, будь то анализ таблиц, документов или PDF-файлов, с возможностью визуализации.
Рабочие задачи: Составление юридических договоров, разработка маркетинговых креативов, анализ данных (например, жалоб пациентов) – ИИ автоматизирует и упрощает множество рутинных и сложных процессов.
Код: Нейросети активно используются для написания, отладки и оптимизации кода, меняя ландшафт разработки ПО.
Дополнительные идеи от Джеминай
ИИ-чаты (Языковые модели)
Gemini 2.5 Pro: Отличный выбор для создания формул и интеграции с Google-сервисами. Огромное контекстное окно (2 млн токенов).
Grok 3: Подходит для широкого круга задач, включает режим редактирования фото и глубокий поиск.
Chat GPT o3 mini: Самая популярная модель на рынке с лучшим режимом глубокого поиска информации.
Qwen 2.5 max: Отличная модель, работающая без VPN. Умеет распознавать картинки и писать код.
Deep Seek r1 + v3: Доступно мобильное приложение, работает без VPN.
Сlaude 3.7: Лучшая модель для написания кода и решения математических задач.
Изображения
Imagen-3.0: ИИ для генерации картинок от Google с высочайшим качеством. Дополнительно – генерация музыки. (Обычно доступ через API или интегрированные продукты Google)
Kling: Качественная генерация контента, одна из лучших моделей для создания картинок и видео.
Napkin: Бесплатный инструмент для создания инфографики из текста.
Vizcom: Нейросеть для имитации 3D-концептов объектов.
Usegalileo: Дизайн мобильного приложения или сайта в один клик.
Visily: Удобный аналог Figma со встроенным ИИ.
Видео
Kling: Лидер по качеству генерации видео на данный момент (ограниченное число токенов).
Hailuo: Много настроек, 1500 бесплатных токенов, отличные результаты.
Genmo: Создает очень крутые видео (1 бесплатная генерация в день).
Sora: Модель от OpenAI, доступна в подписке Plus (требуется геолокация США).
Pika: Создание видео и "оживление" картинок. Бесплатные токены.
Synthesia: Множество опций: создание аватаров, ИИ-дубляж, гибкие настройки.
Звук
Openai: Озвучка текста от OpenAI с множеством настроек голоса.
Runwayml: Генерация аудио, плюс инструменты для фото и видео.
Minimax: Сервис создания аудио (связан с Hailuo), много голосов, быстрая генерация.
Сервисы / Платформы
Huggingface: Огромный репозиторий бесплатных нейросетей для разных задач, включая те, что можно установить локально.
Ollama: Более простой способ запускать ИИ-модели локально на вашем ПК.
lmarena (Chatbot Arena): Позволяет бесплатно протестировать и сравнить многие модели, включая платные (например, разные версии GPT).
Ссылок нет, но они в канале, который в шапке профиля. Такие правила площадки.
Сейчас пишу описания для товаров для одного продавца и пока искал, как создать свою нейросеть, наткнулся на интересную штуку. Оказалось, что можно использовать готовые модели бесплатно, и не через сайты, а через API. То есть можно написать свой код, который будет работать с нейросетью Я подключился к модели Meta-Llama-3.1-70B-Instruct… На секундочку, чтобы создать такую нейросеть, нужно потратить миллиарды рублей. А я просто подключился к ней. А потом) нашел целый сайт, где собраны все нейросети от распознавания фото до генерации текста. Некоторые модели могут делать и то, и другое
В своем тг канале я поделился ссылкой на этот сайт, уж извините, я люблю новых подписчиков)))
В Южной Корее разработали новые ИИ-учебники для 5 млн школьников всех классов – от начального до выпускного. Контент этих учебников адаптируется под текущий уровень знаний ученика.
Исследователи Google Deep Mind провели анализ сообщений о случаях мошенничества с использованием ИИ и выяснили, для каких преступлений чаще всего используются возможности GenAI. Спойлеры:
Самый популярный вид кибермошенничества с применением ИИ – имперсонация, когда злоумышленники с помощью дипфейк-технологий притворяются другими людьми.
Один из самых впечатляющих случаев мошенничества произошел в феврале 2024 года в Гонконге, когда злоумышленникам удалось убедительно подделать видеоконференцию с участием нескольких лиц. Все участники, включая фальшивого финансового директора, выглядели настолько естественно, что ничего не подозревающий сотрудник послушно перевел $25,6 млн на подставной счет.
Компания Groq, разработавшая уникальный супербыстрый LPU (языковой процессор), получила $640 млн инвестиций и оценку в $2,8 млрд, что свидетельствует о фундаментальном сдвиге в индустрии ИИ-инфраструктуры – Groq стал серьезным конкурентом для NVIDIA.
На опенсорсной платформе LMSYS Chatbot Arena, где ИИ-компании часто тестируют предстоящие релизы, появился некий anonymous-chatbot, который превосходит GPT-4o и остальные крупнейшие модели и, возможно, является секретным проектом Q*/Strawberry от OpenAI. На это намекнулАльтман.
Новая модель роботов-гуманоидов Figure 02 успешно прошла тестирование на заводе BMW. Робот поддерживает диалог благодаря генеративному ИИ от OpenAI, может поднимать до 25 кг, выполняет задачи автономно и работает 8 часов без подзарядки.
На платформе Mistral теперь можно создать собственных ИИ-агентов, имеющих такую же функциональность, как кастомные GPT.
Феноменальный успех ChatGPT сделал Сэма Альтмана одним из самых влиятельных людей в мире, и это должно внушать серьезное беспокойство всем нам. По наблюдениям Гэри Маркуса, которые он подробно изложил в разоблачительной статье, директору OpenAI и деятельности его компании нельзя доверять:
Во время слушаний по вопросам регулирования ИИ в сенате США Альтман предоставил неполную и неискреннюю информацию и солгал, отвечая на вопрос о том, получает ли он прибыль от OpenAI. Альтман буквально сказал, что получает денег «достаточно для оплаты медстраховки». При этом один автомобиль из его обширного автопарка, Koenigsegg Regera, стоит не менее $4 млн.
Несмотря на публичные заявления Альтмана о необходимости регулирования ИИ, на деле OpenAI активно лоббирует ослабление регулирования.
OpenAI не уделяет достаточного внимания вопросам безопасности ИИ, что подтверждается уходом нескольких ключевых сотрудников, занимавшихся безопасностью.
Деятельность OpenAI подразумевает использование огромных объемов электроэнергии, воды и других ресурсов. Такое же безответственное отношение к ресурсам переняли все конкуренты OpenAI – от Anthropic до Microsoft. Никто не пытается «озеленить» ИИ-индустрию.
Технологии OpenAI активно используются для создания политической дезинформации – компания признала несколько инцидентов, но не предпринимает видимых усилий для предотвращения подобных случаев.
Илон Маск снова решил судиться с OpenAI и ее основателями – Сэмом Альтманом и Грэгом Брокманом. Юридическая команда Маска утверждает, что Альтман и Брокман «усердно манипулировали Маском», убеждая его стать соучредителем их якобы благотворительной организации, обещая безопасность и прозрачность OpenAI, что отличало ее от альтернатив, ориентированных на прибыль. Иск выходит за рамки простых договорных споров, поскольку содержит серьезные юридические обвинения, включая финансовое мошенничество, нарушение договора, сетевое мошенничество и даже нарушение RICO («Закона о коррумпированных и находящихся под влиянием рэкетиров организациях»).
Привет!
Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.
В еженедельных письмах ты найдешь:
Новости о прорывных исследованиях в области машинного обучения и нейросетей.
Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
Статьи об этических аспектах развития технологий.
Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
Обзоры инструментов и библиотек для разработки нейронных сетей.
Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
Фильмы, сериалы и книги, которые заслуживают внимания AI-энтузиастов.
Semantic Scholar – бесплатный ИИ-поисковик по огромной базе (220,2 млн +) научных публикаций из всех отраслей науки. Имеет API для использования в собственных приложениях.
Napkin AI – визуализирует информацию в виде любой бизнес-графики – диаграмм, схем, графиков, презентаций и т. д.
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»
AIswers – платформа, на которой можно задавать вопросы множеству ИИ-моделей одновременно.
Spreadsite – превращает данные из CSV-файлов в интерактивные дашборды и сайты.
GummySearch – находит Reddit-сообщества, попадающие под описание целевой аудитории продукта.
На Hugging Face выпустили опенсорсную модель CogVideoX-2B для генерации видео, по качеству сопaоставимую с Sora.
MiniCPM-V – опенсорсная минимодель, которая имеет всего 8 млрд параметров и работает на смартфоне, но при этом превосходит GPT-4V в понимании содержимого изображений и видео в реальном времени.
MiniCPM-V отлично понимает смысл и контекст изображений
Flux – модель, разработанная командой, создавшей Stable Diffusion. По многочисленным отзывам, во многом превосходит Midjourney и DALL-E. И самое главное – ее можно установить на свой комп и даже на приличный игровой ноутбук. Протестировать можно на платформе NightCafe.
Примеры генераций Flux
🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»
25 опенсорных инструментов для использования в ИИ-проектах
Vanna – Python-библиотека, которая позволяет автоматически писать SQL-запросы и задавать базе данных вопросы на естественном языке.
Khoj – AI-помощник для поиска информации. Понимает разные форматы файлов, включая Word, PDF, Markdown и другие, а также интегрируется с платформами вроде Notion.
Flowise – визуальный конструктор для построения пользовательских потоков управления языковыми моделями и AI-агентами.
LLAMA GPT – локальный и автономный чат-бот, похожий на ChatGPT.
LocalAI – API-сервер, совместимый с API OpenAI, который позволяет запускать языковые модели, генерировать изображения и аудио локально или на своей инфраструктуре без использования GPU.
Continue – один из лучших AI-ассистентов для написания кода. Он позволяет подключать разные модели и контексты, чтобы создавать пользовательские автодополнения и чат-интерфейсы внутри VS Code и JetBrains IDE.
Chat2DB – ИИ-платформа для управления данными, разработки и анализа. Может конвертировать естественный язык в SQL (и наоборот), а также автоматически генерировать отчеты.
🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале
LibreChat – продвинутая платформа для создания собственного интерфейса для чат-ботов. Она предлагает множество настроек и поддержку разных AI-провайдеров, сервисов и интеграций, предоставляет единый интерфейс для общения с несколькими AI-ассистентами.
Lobe Chat – фреймворк для создания чат-интерфейсов с языковыми моделями. Он поддерживает речевой синтез, мультимодальность и расширяемую систему плагинов.
MindsDB – платформа для настройки AI на основе корпоративных данных. Она позволяет развертывать, обслуживать и настраивать модели в режиме реального времени, используя данные из баз данных, векторных хранилищ или сторонних приложений.
AutoGPT – полуавтономный агент, способный автоматизировать сложные процессы, выполняя последовательности действий без постоянного вмешательства человека.
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука»
reor – ИИ-приложение для ведения заметок. Автоматически связывает заметки, отвечает на вопросы и обеспечивает семантический поиск. Все данные хранятся локально, а редактирование заметок происходит в Markdown-редакторе, похожем на Obsidian.
Leon – персональный ассистент, который может работать на вашем сервере. Выполняет разные задачи по вашему запросу и может общаться голосом или текстом. Имеет модульную структуру навыков, которую при желании можно расширить.
Instrukt – терминальная среда с интегрированным ИИ. Позволяет создавать и инструктировать модульных AI-агентов, генерировать индексы документов для ответов на вопросы и назначать инструменты для любого агента.
Quivr – RAG-фреймворк для создания специализированных AI-ассистентов с разными возможностями.
Open Interpreter – интерфейс, который позволяет отдавать компьютеру команды на естественном языке в терминале и дает возможность LLM выполнять код (Python, JavaScript, Shell и т. д.).
CopilotKit – фреймворк для создания пользовательских AI-помощников в React-приложениях.
GPT Engineer – инструмент, который позволяет вам описать нужное приложение на естественном языке, а затем наблюдать, как AI пишет, выполняет и вносит улучшения в код.
Dalai – самый простой инструмент для запуска моделей Llama* и Alpaca локально на вашем компьютере.
🤖🎥 Все самое полезное про нейросети для генерации видео и дипфейки вы найдете на нашем телеграм-канале «Библиотека нейровидео»
OpenLLM – инструмент, позволяющий с помощью одной команды запускать любые опенсорсные LLM в виде API-эндпоинтов. Поддерживает множество моделей и оптимизирован для использования в высоконагруженных приложениях.
Unsloth – ускоряет процесс тонкой настройки больших языковых моделей (Llama-3*, Mistral, Phi-3 и Gemma). Позволяет проводить файнтюнинг в два раза быстрее, используя на 70% меньше памяти, без потери точности.
E2B – предоставляет безопасную среду (песочницу) для AI-агентов и приложений. Это особенно полезно при создании ИИ-приложений с возможностями выполнения кода.
Camel AI – фреймворк, предлагающий масштабируемый подход к созданию систем с несколькими AI-агентами, которые могут эффективно взаимодействовать друг с другом.
Aider – ИИ-напарник программиста, который работает в терминале. Он может начинать новые проекты, умеет редактировать файлы и работать с существующими Git-репозиториями. Aider совместим со всеми популярными моделями (GPT-4, Sonnet 3.5, DeepSeek Coder, Llama 70b и другими).
FastEmbed – быстрая и легкая Python-библиотекадля генерацииэмбеддингов (векторных представлений) документов. Она использует ONNX runtime вместо PyTorch, что и делает ее быстрее традиционных решений.
OpenAI провела первую конференцию Dev Day для разработчиков, посмотреть можно здесь
Для своих подписчиков я собрала полную информацию о новинке. Итак, вчера вышла превью версия GPT-4 Turbo, доступная девелоперам по API. Это такой зафайнтюненный GPT-4 с большим количеством токенов и более дешевым API. Для обычных пользователей это никак не скажется на стоимости подписки, и новая версия будет доступна через несколько недель. Вкратце, GPT-4 Turbo лучше и быстрее GPT-4
Что нового ❓
Контекст
Контекст – 128 тыс. токенов! - в 16 раз больше чем в GPT-4! Теперь можно не опасаться, что ChatGPT-4 Turbo забудет, о чем вы писали до этого, в него поместится стандартная книга более 300 страниц! Эта модель более аккуратна при работе с длинным текстом, не забывает то, что было в середине
Обновление базы знаний
Обновление базы знаний -теперь информация обновилась до апреля 2023 года!
Мультимодальность
Теперь можно бесшовно работать ChatGPT. Не перепрыгивая из окна в окно между Code Interpreter, DALL-E 3 и плагинами, делать все задачи в одном окне не переключаясь, а можно вызвать несколько функций за раз. ChatGPT будет сама догадываться, чего вы от нее хотите
GPTs (на фото)
GPTs -это настраиваемые под определенную задачу ИИ-боты.
Теперь обычный пользователь без знаний программирования может создать своего GPT бота прямо в окне диалога. Ассистенты имеют доступ к Code Interpreter и сами смогут писать и исполнять код на языке Python. GPTs можно создать из промпта, нескольких вспомогательных маленьких файлов, на которые бот может опираться, и набора функций/инструментов. Помимо стандартных DALLE-3 и интерпретатора кода, можно свободно добавлять любые произвольные function calls к внешним сервисам.
Более того, OpenAI анонсировали Свой “AppStore” – GPTStore (выйдет в конце месяца). Это магазин, где можно выложить своих GPTs ботов и пользоваться чужими: теперь можно зарабатывать на создании своих AI - ассистентов 🤌🏼
Custom Models
Инженеры OpenAI адаптируют тренировку под проблемы вашей компании
Голосовое управление
Расширенный функционал для разработчиков:
- можно заставить модель писать ответы в JSON-формате
- очень крутые возможности для интеграции GPT в свои приложения благодаря контролю JSON на выходе
- Снижение стоимости токенов (на фото):
для разработчиков и тех, кто использует API- входные токены дешевле в 3 раза, выходные в 2 раза. Подробнее о ценах здесь
- DALLE-3 доступна через API. Подробнее
- Whisper V3 – обновленная модель для распознавания речи – доступна по API. Файлы будут транскрибироваться еще быстрее и качественнее
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса