Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
#Круги добра
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Монстрикс — это динамичная стратегия, где ты собираешь, улучшаешь и сражаешься с могучими монстрами.

Монстрикс

Мидкорные, Стратегии, Мультиплеер

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • Animalrescueed Animalrescueed 36 постов
  • Oskanov Oskanov 7 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
12
ARCHiGAME
ARCHiGAME
7 месяцев назад
ChatGPT

Китайский стартап DeepSeek представил бесплатную модель нейросети R1 с открытым кодом⁠⁠

⚔️ Новинка превзошла модель O1 от OpenAI, несмотря на существенно меньший бюджет.

⚡️ На обучение R1 ушло менее 6 млн. $, а процесс занял два месяца, при этом у компании нет карточек от NVIDIA из-за санкций.

💥 Популярность R1 привела к падению акций ИИ компаний. Акции Advantest, связанной с NVIDIA, снизились на 8.6%, NVIDIA подешевела на 13%, а Softbank Group потеряла более 8%. На фоне этого наблюдается серьезное падение криптовалют — некоторые монеты из топ-100 по капитализации подешевели за сутки более чем на 20%.

💭 Инвесторы называют DeepSeek «черным лебедем» или оком, открывшим глаза на отмывание федерального бабла Курткой и Open AI.  Дальнейшее развитие R1 может вызвать обрушение акций крупнейших технологических гигантов и криптовалют.

Куртка наверняка в панике ❤️ Nvidia потеряла 400 млрд. $ США за сутки.

😭 — Если жалко Куртку
🔥 — Если новость пушка

#DeepSeek #OpenAI #ИИ

🎙 Подписывайтесь на ARCHiTECH | Чат

Китайский стартап DeepSeek представил бесплатную модель нейросети R1 с открытым кодом Инновации, Инвестиции, IT, Искусственный интеллект, Нейронные сети, Стартап, Бизнес, Nvidia, Тренд, Программа, Чат-бот, Telegram (ссылка), DeepSeek
Показать полностью 1
Инновации Инвестиции IT Искусственный интеллект Нейронные сети Стартап Бизнес Nvidia Тренд Программа Чат-бот Telegram (ссылка) DeepSeek
4
5
BigDataExclusive
BigDataExclusive
7 месяцев назад

Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете⁠⁠

Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете Программа, Нейронные сети, Искусственный интеллект, Инновации, Технологии, Китай, Android, Тренд, Будущее, iOS, Длиннопост, DeepSeek

Китайская компания DeepSeek представила чат-бота, который обеспечивает поиск информации в интернете без необходимости оформления специальной подписки и доступен для пользователей из России. В ноябре 2024 года DeepSeek запустила свою крупную языковую модель DeepSeek V3. Разработчики утверждают, что чат-бот на основе этой модели способен конкурировать с ChatGPT, а основатели компании стремятся создать "сверхразумный" искусственный интеллект. В этом посте мы рассмотрим, что представляет собой модель, какие функции она предлагает и как с ней работать.

❓ Что такое DeepSeek V3

DeepSeek V3 — это масштабная языковая модель с открытым исходным кодом, содержащая 671 миллиард параметров и обученная на 14,8 триллионах токенов. Она способна анализировать тексты, выполнять переводы, писать эссе, а также генерировать программный код.

Основные особенности модели заключаются в её архитектуре и методах обучения, а именно:

➡️ Архитектура Multi-token Prediction (MTP): Позволяет модели предсказывать несколько слов одновременно, анализируя различные части предложения параллельно. Это повышает точность и эффективность работы модели.
➡️ Mixture of Experts (MoE): Использует несколько специализированных и предварительно обученных нейросетей-экспертов для обработки различных входных данных, что ускоряет обучение и повышает производительность ИИ. В DeepSeek V3 задействовано 256 таких нейросетей, из которых восемь активируются для обработки каждого токена.
➡️ Технология Multi-head Latent Attention (MLA): Механизм внимания, который помогает выделять наиболее важные части предложения. MLA позволяет многократно извлекать ключевые детали из текста, снижая вероятность упущения важной информации.
➡️ Благодаря этим особенностям модель была обучена всего за 2,788 миллиона часов, что составляет примерно два месяца работы графических процессоров Nvidia H800, с затратами в 5,5 миллионов долларов. Для сравнения, OpenAI потратила на обучение GPT около 78 миллионов долларов.

Разработчики утверждают, что в тестах нейросеть превзошла GPT-4 от OpenAI, Llama 3 от Meta (которая признана экстремистской и запрещена в России) и Claude 3.5 Sonnet от Anthropic в задачах программирования и обработки текстов. Главная особенность новой модели — полностью открытый код, который позволяет разработчикам не только использовать технологию в коммерческих целях, но и адаптировать её для различных задач в сфере искусственного интеллекта.

💎 Возможности DeepSeek V3

Модель обладает контекстным окном в 128 тысяч токенов, аналогичным GPT-4, что позволяет ей анализировать до 300 страниц текста. Она способна:

✔️ Генерировать тексты разных объёмов и жанров;
✔️ Искать информацию в интернете;
✔️ Интерпретировать диаграммы и объяснять изображения;
✔️ Писать код, правильно его форматировать и решать сложные программные задачи на языках C++, Go, Java, JavaScript, Python и Rust. Модель также успешно интегрируется с редакторами кода;
✔️ Размышлять аналогично GPT-o1 и o1-mini в режиме DeepThink.

DeepSeek V3 поддерживает высокий уровень мультиязычности, а её глубокое понимание китайского и английского языков позволяет работать с текстами без потери качества перевода и смысла. Также модель поддерживает русский язык.

Недостатком нейросети является то, что она пока не может анализировать материалы по ссылкам и поддерживает только загрузку или извлечение фрагментов из текстов.

🇷🇺 Как пользоваться DeepSeek V3 в России

DeepSeek предлагает несколько способов доступа к модели, включая открытые модели на Hugging Face, бесплатную версию на собственном сайте с контекстным окном до 32 тысяч токенов, API для коммерческого использования, локальное развертывание и мобильные приложения для iOS и Android. При запуске DeepSeek-R1 пользователям предоставлялось 50 бесплатных запросов в день, но в настоящее время ограничения на сайте не указаны.

Показать полностью
Программа Нейронные сети Искусственный интеллект Инновации Технологии Китай Android Тренд Будущее iOS Длиннопост DeepSeek
3
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии