ИИ-ассистенты пока не способны улучшить код, написанный человеком
Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Цукерберга и КО решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.
В качестве задачи был взят реальный проект NanoGPT (https://github.com/KellerJordan/modded-nanogpt), где сообщество энтузиастов соревнуется в максимальном ускорении обучения GPT-2, небольшой языковой модели. Цель - не просто скопировать, а понять и применить конкретную оптимизацию, которую до этого внедрил человек.
🟡Суть эксперимента
ИИ-агенту дают исходный скрипт предыдущего рекордсмена и подсказку одного из 3 уровней: от псевдокода с описанием изменений до полноценной мини-статьи, объясняющей суть улучшения. Агент, получив эти данные, должен внести правки в код так, чтобы приблизиться к скорости обучения следующего рекордсмена.
Эффективность мерили метрикой FSR (Fraction of Speedup Recovered), это доля восстановленного ускорения. Если человек ускорил процесс на 10 минут, а ИИ смог добиться ускорения в 5 минут, его результат — 50% FSR. Такая система позволяет оценить не абстрактные способности модели, а ее умение работать с конкретными, практическими задачами по оптимизации.
🟡Результаты
Итоги оказались, мягко говоря, отрезвляющими. Даже топовые модели (Claude 3.7 Sonnet и Gemini 2.5 Pro), показали очень скромные результаты.
С лучшими подсказками (псевдокод и детальное описание) самые успешные агенты с трудом смогли воспроизвести хотя бы 40% от прироста производительности, достигнутого человеком. Без подсказок их производительность была и вовсе близка к нулю.
Разбор полетов бенчмарка показал, что ИИ-агенты часто генерируют либо просто неработающий код с ошибками времени выполнения, либо код, который компилируется, но не дает никакого прироста скорости, а иногда даже замедляет процесс.
🟡Фреймворк
Авторы не просто опубликовали статью, а выложили весь фреймворк в открытый доступ (https://github.com/facebookresearch/llm-speedrunner), так что любой желающий может самостоятельно погонять практически любые модели.
В основе фреймворка лежит гибкий агентский каркас, который имитирует рабочий процесс исследователя: генерация идеи, реализация в коде, запуск эксперимента и анализ результатов.
Каждая итерация ИИ-агента аккуратно сохраняется в отдельную версию, создавая полную историю всех правок, от удачных до провальных.
Установка максимально проста, а для тех, кто хочет воспроизвести эксперименты из статьи, авторы приложили (https://github.com/facebookresearch/llm-speedrunner/tree/mai...) готовые скрипты. Также можно легко добавить (https://github.com/facebookresearch/llm-speedrunner?tab=read...) и протестировать другие модели, просто создав для них конфиг или дать ИИ другую задачу, не связанную с NanoGPT - определять кастомные таски тоже можно (https://github.com/facebookresearch/llm-speedrunner?tab=read...).
📌Лицензирование: MIT License.
🟡Arxiv (https://arxiv.org/pdf/2506.22419)
#AI #ML #LLM #Benchmark
Обзор Google Pixel 9 Pro —производительность и характеристики
Google Pixel 9 Pro Obsidian: черная магия искусственного интеллекта
Когда берешь в руки Pixel 9 Pro в цвете Obsidian, сразу понимаешь — это не просто смартфон. Это концентрация семилетнего опыта Google в области мобильных технологий. Давайте разберемся, почему эта модель может перевернуть ваше представление о том, каким должен быть флагман.
Дизайн: минимализм с характером
Черный Obsidian — это не просто цвет, а заявление:
Матовое стекло с олеофобным покрытием
Алюминиевая рамка с сатиновой обработкой
Толщина 8.3 мм при защите IP68
Эргономические особенности:
Вес 212 г (на 8 г легче Pixel 8 Pro)
Удобное расположение кнопок
Тактильный отклик (5000 уровней вибрации)
Global версия поддерживает:
42 диапазона 5G
eSIM + nanoSIM
Все основные LTE-частоты
Дисплей: эталон цветопередачи
6.7" LTPO OLED с параметрами:
Разрешение 3120×1440 (512 ppi)
Частота 1-120 Гц (адаптивная)
Пиковая яркость 2500 нит
10-битный цвет (1.07 млрд оттенков)
Что действительно впечатляет:
Технология Super Actua — читаемость на солнце
Поддержка HDR10+ и Dolby Vision
Коэффициент контрастности 5 000 000:1
В тестах:
Delta E < 0.4 (эталонная точность)
Автоматическая калибровка под освещение
Углы обзора без цветовых сдвигов
Производительность: мощь Tensor G4
Чип Tensor G4 + 16 ГБ LPDDR5X RAM:
Geekbench 6: 2800/8200 (одно/многоядерный)
Графика: 60 fps в Genshin Impact (макс. настройки)
ИИ-производительность: 60 TOPS
128 ГБ UFS 3.1 памяти — это:
Скорость чтения 2100 МБ/с
Возможность записи 4K HDR видео
Достаточно для 300+ приложений
Камеры: магия вычислений
Основная тройка сенсоров:
Основная 50 МП (f/1.7)
Лазерный автофокус
5-осевая стабилизация
Пиксели 1.4μm
Телеобъектив 48 МП (5x оптический)
Перископная конструкция
Ночной режим с ИИ
Поддержка 8K@30fps
Ультраширик 12 МП (126°)
Коррекция дисторсии
Минимальная дистанция фокуса 2 см
Реальные тесты показывают:
Лучшая в мире HDR-обработка
Magic Editor творит чудеса с фото
Видео в 4K выглядит кинематографично
Автономность: день без тревоги
Батарея 4950 мАч + оптимизация Android 15:
13 часов экранного времени
28 часов разговора
9 часов игр
30-ваттная зарядка:
50% за 30 минут
Полный цикл за 85 минут
Беспроводная зарядка 23 Вт (полный цикл за 110 мин)
Экосистемные преимущества
7 лет обновлений ОС
Эксклюзивные AI-функции:
Call Screen
Direct My Call
Live TranslateИнтеграция с Google Фото
Поддержка Matter для умного дома
Вывод: кому подойдет?
Идеальный выбор для:
Мобильных фотографов
Поклонников чистого Android
Пользователей сервисов Google
Техноэнтузиастов
При цене $999 это один из самых интересных флагманов 2024 года. Если вам важны камеры и экосистема Google — Pixel 9 Pro достойный кандидат.
Где купить выгоднее?
Google Store (бонус: 3 месяца YouTube Premium)
Amazon US/CA (быстрая доставка)
Локальные реселлеры (гарантия 2 года)
P.S. Obsidian — самый популярный цвет, первые партии часто заканчиваются в течение недели после старта продаж. Если планируете покупку — не затягивайте с решением.
Имба: дизайнер-энтузиаст показал логотипы техно-компаний, если бы они существовали в восьмидесятых годах прошлого столетия
📱Google, 📱Facebook,📱Netflix и несколько других компаний представлены в качестве примера.
Классический ретро-стиль выглядит превосходно!
Источник
Изменения правил - новый специальный тег "Контент нейросетей"
На Pikabu новый тег - "Контент нейросетей". Но в эпоху ИИ реальна и растет потребность выделять уже человеческий креатив.
#MHBH = MADE HUMAN, BY HUMAN. FOR HUMAN.
Ставьте #MHBH на работы, созданные Человеком (без ИИ) для Человека. Искусство рождается в сердце, а не на сервере. Гордитесь человеческим трудом!
Google снова за своё — теперь учит роботов складывать футболки
На сцене — Gemini Robotics On-Device.
Новая модель от Google, которая позволяет роботам работать без облаков и вайфая — прямо на месте.
Что умеет:
➡️ VLA‑модель: видит, понимает и говорит роботу, что делать
➡️ Работает офлайн — без задержек и паники при потере сигнала
➡️ Гибкая: подходит и для тонкой моторики, и для сложных цепочек действий
➡️ Основана на датасете ALOHA — знает, как обращаться с разными типами роботов
➡️ Новые задачи? Достаточно 50–100 демонстраций, и бот уже в теме
🧦 Молнии, носки, сложные пакеты — забудьте.
Скоро у вас будет помощник, который всё сделает чётко. И, возможно, лучше вас.
Пока что звучит как фантастика. Но Google уже тренирует.
Источник: https://t.me/A4UAI/2497
5 телеграм-ботов, которые можно добавить в повседневную жизнь
Помощник для тех, кто не успевает читать все каналы в подписках, но хочет быть в курсе событий. Бот просматривает все посты в отмеченных каналах и присылает только самые популярные – те, которые набрали больше всего реакций, репостов и комментариев. Чтобы настроить подписку, достаточно переслать боту пост из нужного канала.
Andry – робот-учитель, который готов разговаривать с вами на английском в любое время. Помогает учить новые слова, объясняет правила грамматики, исправляет ошибки. Отличный вариант, если нужна помощь с практикой на английском, но говорить с иностранцами пока стесняетесь.
Keep Here bot – удобный фотохостинг на базе Телеграм. Отправляете картинку в чат, бот сохраняет её на своём сервере, выдаёт короткую ссылку и html-код для встраивания на сайт.
Хостинг бесплатный, на партнёров подписываться не просит, но сразу предупреждает об ответственности за публикуемый контент. Нельзя размещать порнографические и неприемлемые материалы.
Облачное хранилище, синхронизированное с ботом. Загружайте любые файлы, а потом получайте доступ к ним в любое время и с любых устройств. Хранилище безлимитное, бесплатное и полностью приватное, все загруженные материалы доступны только с вашей учётной записи.
Неофициальный чат-бот от Google, позволяющий быстро читать электронные письма и отвечать на них прямо из Телеграм. Интерфейс оформлен на английском языке, но интуитивно понятный. Чтобы начать работу, нужно запустить бота и авторизоваться в своей почте Gmail. После этого письма будут приходить в виде мгновенных сообщений.
Из минусов – пользователям из России для авторизации нужен ВПН. Потом письма будут приходить без него.
Объем данных для одного ответа взлетел до небес!
Привет, кодеры и продукт-манагеры! 🤞🏻
Всего за 10 лет «информационная плотность» ответов выросла в 900 раз:
▫️ 2014: Google сканировал ~2 страницы на запрос
▫️ 2024: Тот же Google — уже 18 страниц
▫️ ChatGPT-5: 1500+ страниц текстового эквивалента на ответ!
🤯 Где грань? Новые игроки:
- Gemini 2.5 Pro (Google):
— Анализирует до 2000 «страниц» за запрос;
— Видео + аудио + текст → мультимодальный перегруз.
DeepSeek-R2 (Китай):
— Скромнее: ~500 страниц;
— Но с фокусом на качество, а не объем;
— Open-source = прозрачность данных.
🔮 Тренд: ИИ жует терабайты, чтобы выплюнуть абзац. Эффективно? Да. Расточительно? Еще как!
💬 А вы заметили, что ответы стали детальнее?
👍 Да, но слишком много «воды»
👎 Нет, всё равно поверхностно
🚀 Жду ИИ, который думает, а не копирует
А мы в Vibe уже готовим новый жирный релиз в Google Chrome