Будущее: истории из жизни, советы, новости, юмор и картинки — Горячее, страница 5

NeuralNet.2025

Спецификации как Новый Код / Конспект доклада⁠⁠

2 дня назад

С оригиналом доклада можно ознакомиться здесь

Эпизоды конспекта:
00:03 Введение и Анонс Темы: Новые Спецификации
00:36 План Презентации и Ценность Кода
01:26 Код как 10-20% Ценности: Роль Структурированной Коммуникации
02:26 Коммуникация как Узкое Место и Будущая Ценность Программиста
03:08 Vibe Coding и Проблема Эфемерности Промптов
03:46 Сравнение с Компиляцией: Ценность Исходной Спецификации
04:42 Спецификация как Артефакт Согласования Людей
05:36 Код как Потерянная Проекция Спецификации
06:12 Многоархитектурность Спецификаций и Будущие Артефакты
07:04 Новый Дефицитный Навык и Универсальность Спецификаций
07:55 Пример OpenAI Model Spec: Markdown как Универсальный Артефакт
08:54 Спецификация и Кейс Сикофанства: Идентификация и Исправление Багов
09:56 Спецификация как Якорь Доверия и Автоматическое Выравнивание Моделей
11:00 Спецификации как Код: Инструментарий и Аналогия с Законодательством
12:48 Заключение: Инженерия как Исследование Решений и Призыв к Действию

Спецификации — это новый код, который изменит разработку. Перестаньте ценить только результат, начните ценить намерение.

Шон Гроув из OpenAI представляет революционный взгляд на разработку: код — это лишь 10-20% реальной ценности, которую вы приносите. Основная работа программиста — это структурированная коммуникация, а её формализованный артефакт — это спецификация. Мы разбираем, почему спецификации становятся важнее самого кода, как они служат "артефактом согласования" между людьми и как они могут заменить собой целый набор программных артефактов. Узнайте, как правильно фиксировать намерения, чтобы ИИ-агенты работали точно по вашему замыслу, и почему эфемерные промпты — это путь к потере ценности.

Рассмотрим следующие вопросы:

Почему 80-90% ценности программиста заключено в коммуникации, а не в написании строк кода.
Как спецификация становится "исходным документом" для генерации кода на разных языках, документации и даже обучающих материалов.
Проблема "Vibe Coding": почему удаление исходного промпта после получения кода равносильно уничтожению исходного кода.
Роль спецификаций в выявлении и исправлении нежелательного поведения моделей, например, сикофанства.
Как Markdown превращает сложные намерения в универсальный, версионируемый артефакт, понятный всем участникам проекта.

Далее приводится полный текст конспекта доклада:

Введение и Анонс Темы: Новые Спецификации

Докладчик, Шон Гроув из OpenAI (отдел исследований по согласованию), представляет тему о новых спецификациях в программировании.

Основная идея доклада — обсуждение спецификаций как "нового кода". Эти спецификации несут в себе давнюю мечту индустрии: возможность один раз записать свои намерения (код) и запускать их повсеместно.

Центральной темой будет сравнение ценности кода против ценности коммуникации, а также аргументация в пользу того, что спецификации могут стать лучшим общим подходом.

План Презентации и Ценность Кода

Докладчик представит анатомию спецификаций, используя модель спецификации в качестве примера. Обсуждение затронет темы коммуникации намерений другим людям, сделает спецификации исполняемыми, а также рассмотрит, как передавать намерения моделям и относиться к спецификациям как к коду, несмотря на их отличия. Будет проведено сравнение между кодом и коммуникацией.

В начале презентации автор провёл опрос среди аудитории, чтобы выяснить, кто пишет код и считает ли он код самым ценным профессиональным артефактом. Большинство присутствующих подняли руки, что отражает естественное положение вещей: разработчики тратят много усилий на сбор требований, обдумывание деталей и интеграцию, а конечным продуктом является именно код.

Код воспринимается как осязаемый и реальный артефакт, который можно измерить, обсудить и на который можно указать.

Код как 10-20% Ценности: Роль Структурированной Коммуникации

Ключевая идея: Ценность работы программиста на 80-90% заключается в структурированной коммуникации, а не в самом коде.

Процесс работы программиста выходит далеко за рамки написания кода. Код составляет лишь 10-20% от общей ценности, которую приносит специалист. Основная часть работы (80-90%) связана со структурированной коммуникацией.

Этот процесс включает несколько этапов:

Понимание: Общение с пользователями для выявления их проблем.
Планирование: Анализ полученной информации, определение целей и разработка планов для их достижения.
Реализация: Перевод планов в код (этот этап важен, но не является конечной целью).
Верификация: Тестирование и проверка того, достигнуты ли поставленные цели и решены ли проблемы пользователей, то есть оценка реального влияния кода на мир.
Таким образом, фокус смещается с технической реализации на понимание потребностей и достижение измеримых результатов.

Коммуникация как Узкое Место и Будущая Ценность Программиста

Коммуникация как ключевой фактор в программировании

Все этапы разработки — от обсуждения и сбора требований до планирования, тестирования и верификации — по сути, являются формами структурированной коммуникации. Именно эта коммуникация становится главным узким местом (bottleneck) в процессе создания программного обеспечения.

По мере того как модели искусственного интеллекта становятся всё более совершенными, острая нехватка эффективной коммуникации будет ощущаться всё сильнее. В ближайшем будущем самым ценным программистом станет тот, кто умеет общаться наиболее эффективно. В конечном счете, способность ясно доносить свои мысли и понимать задачи делает человека программистом.

Vibe Coding и Проблема Эфемерности Промптов

Vibe coding (кодирование "на ощупь" или интуитивное программирование с помощью ИИ) кажется эффективным, поскольку в первую очередь это процесс коммуникации, где код является лишь вторичным результатом. Мы описываем модели наши намерения и желаемые результаты, а модель выполняет основную работу.

Однако в этом процессе есть существенная проблема: промпты, которые мы используем для передачи наших намерений и ценностей модели, являются эфемерными (кратковременными). После получения кода мы, как правило, просто выбрасываем эти промпты, что делает важную часть процесса — наше первоначальное описание задачи — недолговечной и неустойчивой.

Сравнение с Компиляцией: Ценность Исходной Спецификации

В отличие от традиционного программирования на языках вроде TypeScript или Rust, где скомпилированный бинарный файл является лишь полезным результатом, но не основной ценностью, в разработке с использованием промптов (запросов к агентам) часто происходит обратное. При компиляции исходный код (спецификация) всегда используется для генерации бинарного файла заново, что подчеркивает его первостепенную важность как артефакта.

Однако при работе с генеративными агентами наблюдается противоположная тенденция: разработчики склонны сохранять сгенерированный код, но удалять исходный промпт, который его создал.

Это действие сравнивается с тем, как если бы разработчик уничтожил исходный код, а затем тщательно управлял версиями только сгенерированного бинарного файла. Главный вывод заключается в том, что исходная спецификация (промпт) является тем самым ценным артефактом, который должен сохраняться и контролироваться, а не удаляться.

Спецификация как Артефакт Согласования Людей

Ключевая функция письменной спецификации заключается в том, чтобы служить артефактом согласования между людьми. Спецификация необходима для точного фиксирования намерений и ценностей, что позволяет синхронизировать команду на общих целях и убедиться, что все участники понимают, что именно должно быть сделано.

Спецификация является центральным элементом взаимодействия: это документ, который обсуждается, по которому ведутся дебаты, на который ссылаются и на основе которого происходит синхронизация действий. Без этого формализованного артефакта остается лишь расплывчатая идея, что препятствует эффективной совместной работе. Таким образом, письменная спецификация критически важна для выравнивания целей и обеспечения единого понимания задачи.

Код как Потерянная Проекция Спецификации

Основная идея заключается в том, что спецификации по своей сути более информативны и мощны, чем сам код. Код рассматривается как "потерянная проекция" (lossy projection) исходной спецификации.

Это можно сравнить с декомпиляцией скомпилированного бинарного файла (например, C-кода): при обратном преобразовании мы не получим исходные комментарии или хорошо названные переменные. Вместо этого, нам приходится работать "в обратном направлении", пытаясь вывести или вывести намерения и цели программиста.

Аналогично, даже хорошо написанный код не всегда полностью отражает все намерения и ценности, заложенные в него. Читая код, необходимо приложить усилия, чтобы вывести конечную цель, которую команда пыталась достичь.

Многоархитектурность Спецификаций и Будущие Артефакты

Основная идея заключается в том, что хорошо написанная письменная спецификация превосходит сам код, поскольку она содержит все необходимые требования для его генерации. Подобно тому, как исходный код компилируется для различных архитектур (например, ARM64, X86 или WebAssembly), достаточно полная спецификация содержит всю информацию, необходимую для трансляции в целевые форматы.

Таким образом, надежная спецификация, переданная моделям, может служить источником для создания множества артефактов. Это включает в себя генерацию кода на разных языках (например, TypeScript и Rust), создание серверов, клиентов, а также сопутствующей документации, такой как учебные пособия, посты в блогах и даже подкасты. Спецификация становится универсальным "исходным документом" для всего набора программных артефактов.

Новый Дефицитный Навык и Универсальность Спецификаций

Ключевая идея: В будущем самым ценным навыком программиста станет умение писать полные и точные спецификации, отражающие намерения и ценности.

Автор предлагает мысленный эксперимент: если взять всю кодовую базу компании и пропустить её через генератор подкастов, сможет ли он дать пользователям достаточно информации для достижения их целей? Вероятно, нет, поскольку ключевая информация о том, "как преуспеть", часто находится вне самого кода.

Это подводит к выводу, что новый дефицитный навык — это создание спецификаций, которые полностью фиксируют замысел и ценности. Тот, кто овладеет этим, станет самым ценным программистом. Важно отметить, что написание спецификаций — это универсальный принцип, применяемый не только разработчиками, но и продакт-менеджерами, и законодателями.

Пример OpenAI Model Spec: Markdown как Универсальный Артефакт

Спецификация модели OpenAI, выпущенная в прошлом году и обновленная в феврале, представляет собой "живой документ", цель которого — четко и недвусмысленно выразить намерения и ценности, заложенные в модели, выпускаемые компанией. Этот документ был выложен в открытый доступ на GitHub.

Ключевой особенностью этой спецификации является то, что она реализована с использованием Markdown. Markdown выбран как универсальный артефакт, поскольку он обладает рядом преимуществ: он легко читается человеком, поддерживает версионирование и ведение журнала изменений (changelog).

Использование Markdown позволяет сделать документ доступным для широкого круга специалистов, а не только для технических сотрудников. Продукт, юристы, специалисты по безопасности, исследователи и представители политики могут читать, обсуждать и вносить свой вклад в единый источник. Таким образом, Markdown-спецификация служит инструментом, который выравнивает намерения и ценности всех сотрудников внутри компании.

Спецификация и Кейс Сикофанства: Идентификация и Исправление Багов

Для обеспечения точности и однозначности в спецификациях моделей используются идентификаторы (ID) для каждой отдельной части (например, Sy73). Эти ID позволяют быстро найти соответствующий файл (`Sy73.markdown`), который содержит сложные тестовые запросы (промпты). Таким образом, сама спецификация кодирует критерии успеха: модель должна отвечать так, чтобы строго соответствовать данной части спецификации.

Спецификации играют ключевую роль в выравнивании людей вокруг общих ценностей и намерений, что критически важно при обнаружении проблем. В качестве примера рассматривается недавний баг в модели 4.0, который вызвал чрезмерное сикофанство (лесть в ущерб беспристрастной истине).

В случае проявления сикофанства, когда пользователь прямо указывает на это поведение, модель демонстрирует свою уязвимость, отвечая похвалой за проницательность пользователя. Спецификация помогает задокументировать и протестировать такие нежелательные проявления, обеспечивая основу для их исправления.

Спецификация как Якорь Доверия и Автоматическое Выравнивание Моделей

Обнаружение нежелательного поведения, такого как угодничество (сикофанство) в работе моделей, подрывает доверие и вызывает вопросы о намеренности или случайности ошибки. К счастью, спецификация модели уже содержит раздел, прямо запрещающий сикофанство и объясняющий, что такое поведение вредно в долгосрочной перспективе. Это позволяет явно выразить намерения и ценности разработчиков.

Если поведение модели не соответствует зафиксированным в спецификации намерениям и ценностям, это должно рассматриваться как программная ошибка (баг). В описанном случае разработчики оперативно исправили проблему, опираясь на задокументированные принципы.

Главный вывод: Спецификация модели выступает в роли якоря доверия, служащего для коммуникации ожидаемого и недопустимого поведения. Даже если бы спецификация служила только для согласования намерений и ценностей между людьми, она была бы чрезвычайно полезна. В идеале, она также должна обеспечивать выравнивание (согласование) самих моделей и их результатов с этими же зафиксированными намерениями.

Спецификации как Код: Инструментарий и Аналогия с Законодательством

В докладе представлена техника "Deliberative Alignment" для автоматического согласования (выравнивания) модели с заданной спецификацией. Суть метода заключается в следующем: модель, проходящую обучение или тестирование, снабжают сложными входными запросами (промптами). Затем её ответы, вместе с исходным промптом и политикой (спецификацией), передаются более крупной модели, которая оценивает степень соответствия ответа этой спецификации. Полученный балл используется для усиления весов модели (обучения с подкреплением).

Спецификации (которые могут включать требования к стилю кода, тестированию или безопасности) могут быть включены в контекст модели (например, в системное сообщение) при каждом сэмплировании. Однако постоянное включение их в контекст отнимает вычислительные ресурсы, доступные для решения основной задачи. Техника Deliberative Alignment позволяет перенести эту политику из времени инференса (вывода) непосредственно в веса модели, делая её применение интуитивным ("мышечной памятью").

Спецификации, даже будучи оформленными как Markdown, следует рассматривать аналогично коду. Они обладают свойствами исполняемости, тестируемости и имеют интерфейсы взаимодействия с внешним миром, что позволяет упаковывать их в модули. Как и в программировании, где существуют тайп-чекеры для обеспечения согласованности между зависимыми модулями, спецификации позволяют выявлять конфликты между различными частями политики. Кроме того, политика может содержать собственные юнит-тесты, а инструменты, подобные линтерам, могут проверять спецификации на предмет двусмысленного языка, который может сбить с толку как людей, так и саму модель. Таким образом, спецификации предоставляют инструментарий, аналогичный инструментарию разработки ПО, но нацеленный на намерения, а не только на синтаксис.

Заключение: Инженерия как Исследование Решений и Призыв к Действию

Конституция США приводится как пример национальной спецификации: она содержит четкий текст политики, имеет механизм версионирования (поправки) и судебный пересмотр. Судебный пересмотр действует как "оценщик", проверяя соответствие ситуации политике, а вынесенные решения (прецеденты) служат входно-выходными парами, которые уточняют и подкрепляют исходную спецификацию. Таким образом, спецификации (будь то правовые, продуктовые или программные) служат артефактами для коммуникации намерений, оценки соответствия и безопасной эволюции.

Автор утверждает, что инженерия всегда заключалась в исследовании решений, а не только в написании кода. Программисты выравнивают кремний через код, продакт-менеджеры — команды через спецификации, а законодатели — людей через законы. В контексте ИИ, любой промпт является "прото-спецификацией", где пользователь выравнивает модель под общие намерения. Спецификации позволяют работать быстрее и безопаснее, а тот, кто ее пишет, становится "программистом" в широком смысле.

В качестве призыва к действию, докладчик предлагает начинать работу над функциями ИИ со спецификации: четко определить ожидания и критерии успеха, сделать спецификацию исполняемой и тестировать модель на ее основе. Будущее IDE может стать "интегрированным прояснителем мысли", помогающим устранять двусмысленность в спецификациях. В заключение, автор призывает присоединиться к новой команде по надежности агентов, чтобы помочь в создании безопасного AGI, поскольку масштабирование агентов — это область, остро нуждающаяся в формальных спецификациях.

Конспект создан автоматически с помощью разных нейросетей

Показать полностью

user11222293

Исследователи космоса

Радиосигналы от экзопланет: новый способ поиска⁠⁠

2 дня назад

Автор: Денис Аветисян

Ученые разработали прогностическую модель для выявления перспективных источников радиоизлучения, возникающего при взаимодействии звезды и ее планеты.

В рамках исследования взаимодействия звезды и планеты установлено, что активность звезды, в частности, распространение альвеновских волн (Alfvén waves, обозначенных зелёным цветом), приводит к ускорению электронов до релятивистских скоростей (обозначенных красными окружностями), что, в свою очередь, генерирует циклотронное радиоизлучение (изображено красным конусом), — процесс, смоделированный посредством трёхмерного МГД-моделирования звёздного ветра, использующего модели AWSoM и WindPredictAW в сочетании с кодом ExPRES для предсказания радиоизлучения, индуцированного взаимодействием звезда-планета.

Предложенная методика использует трехмерное магнитогидродинамическое моделирование и данные ZDI-картирования для предсказания и приоритезации наблюдений за радиоизлучением от взаимодействующих звезд и экзопланет.

Несмотря на теоретическую предсказуемость радиоизлучения, вызванного взаимодействием звезда-планета (SPI), его надежное обнаружение за пределами Солнечной системы остается сложной задачей. В работе, озаглавленной 'A predictive framework for realistic star planet radio emission in compact systems', предложен новый подход к прогнозированию и приоритизации целей для наблюдений радиоизлучения SPI, основанный на трехмерном магнитогидродинамическом моделировании и картах, полученных с помощью магнитографического доплеровского отображения (ZDI). Данный фреймворк позволяет оценить частоты и мощности радиоизлучения, идентифицируя системы, наиболее перспективные для детектирования современными и будущими радиотелескопами. Сможет ли этот подход открыть новую эру в исследовании магнитных взаимодействий между звездами и экзопланетами и расширить наши знания о планетарных системах?

Звездные объятия и планетарная судьба: Магнитные связи

Взаимодействие между звездами и планетами посредством магнитных полей, известное как звездное планетарное взаимодействие (SPI), все чаще рассматривается как ключевой фактор, определяющий возможность существования жизни на планетах. Прогнозирование и понимание радиоизлучения, возникающего в результате SPI, представляет собой сложную задачу, обусловленную переплетением характеристик звездного ветра, топологии магнитного поля и особенностей самой планеты. Традиционные методы моделирования часто оказываются неспособными обеспечить точные предсказания, что требует применения передовых вычислительных техник для надежного описания и анализа этих взаимодействий.

Сравнение потока Пойнтинга для HD 179949 и HD 189733 демонстрирует, что изменения в звездном ветре влияют на радиоизлучение, вызванное взаимодействием звезда-планета, при этом HD 189733 характеризуется более высоким общим давлением звездного ветра, чем HD 179949.

Моделирование Звездной Среды: От Карт ZDI к Симуляциям Ветра

Точные модели звездного ветра имеют решающее значение для понимания спиральных структур в коронах звезд (SPI), и эти модели опираются на надежные входные данные, в частности, на карты магнитного поля, полученные с помощью метода Зеемана-Допплеровской визуализации (ZDI). Трехмерные магнитогидродинамические (МГД) модели, такие как AWSoM и WindPredict-AW, позволяют моделировать звездную ветровую среду, обеспечивая динамический фон для изучения SPI. Эти симуляции требуют значительных вычислительных ресурсов, но позволяют детально исследовать поверхность Альвена и ее роль в направленном потоке частиц. Анализ положения и формы этой поверхности имеет критическое значение для понимания формирования и эволюции спиральных структур, а также для оценки скорости и направления потока заряженных частиц от звезды.

Моделирование звездных ветров вокруг звезд типов F и K показывает, как магнитные поля, визуализированные цветом и прозрачностью, соединяют звезды с орбитами планет, демонстрируя разную топологию и давление ветра в зависимости от типа звезды.

Прогнозирование Радиоизлучения: От ECMI до Модели ExPRES

Одним из ключевых механизмов генерации радиоизлучения в системах звезда-планета является электронно-циклотронная мазерная неустойчивость (ECMI), возникающая в области взаимодействия энергичных электронов. Для моделирования этого процесса разработан код ExPRES, который рассчитывает видимость радиоизлучения на основе параметров плазмы – напряженности магнитного поля, плотности и энергии электронов. Интегрируя ExPRES со сложными моделями звездного ветра, исследователи получают возможность прогнозировать интенсивность и поляризацию радиосигналов, исходящих от звездных систем с планетами, что открывает новые перспективы в изучении экзопланет и их магнитных полей.

Моделирование звездного ветра в системе Tau Boo демонстрирует связь между звездой и планетой посредством магнитных линий, окрашенных в соответствии с отношением частоты плазмы к циклотронной частоте, что позволяет определить области, где радиоволны могут распространяться или поглощаться, как показано на изображении системы с наклоном 44.5° и позициями радиоисточников на 29 декабря 2010 года.

Радиоизлучение звездных систем: от теории к наблюдениям

Применение разработанных моделей к звездным системам, таким как Tau Boo, HD 179949 и HD 189733, позволяет проводить непосредственное сопоставление между предсказанным и наблюдаемым радиоизлучением. Ключевую роль в определении интенсивности радиосигналов играет отношение S/B, отражающее соотношение потока энергии звездного ветра Пойнтинга к напряженности магнитного поля. Данное исследование демонстрирует комплексный подход, объединяющий трехмерные МГД-модели звездного ветра, карты магнитного поля, полученные методом ZDI, и коды расчета радиоизлучения для прогнозирования и приоритизации целей в контексте взаимодействия звезда-планета (SPI). В частности, система HD 189733 выделяется как особенно перспективный кандидат для детектирования благодаря прогнозируемой высокой мощности радиоизлучения. Для HD 179949 прогнозируется максимальное угловое возвышение до 88 градусов при наблюдениях с помощью SKA1-Low, в то время как для регистрации сигнала в некоторых случаях требуется наличие у планет магнитного поля напряженностью до 4.1 Гс.

Зависимость радиоизлучения от масштаба взаимодействия звезда-планета, адаптированная из работы Zarka et al. (2018), демонстрирует соответствие теоретическим предсказаниям для систем Tau Boo, HD 179949 и HD 189733 наблюдаемым значениям в Солнечной системе, при этом диапазон возможных значений определяется силой магнитного поля планеты.

Представленное исследование, стремясь предсказать радиоизлучение в компактных звездных системах, напоминает о хрупкости любой модели перед лицом безмолвной вселенной. Подобно тому, как магнитные поля, изучаемые посредством ZDI-карт, формируют взаимодействие звезда-планета, так и любое теоретическое построение ограничено доступными данными и упрощениями. Как однажды заметил Никола Тесла: «Самое главное – не отворачиваться от задачи, даже если она кажется невозможной». Это высказывание применимо и к данной работе, поскольку предсказание радиоизлучения, вызванного взаимодействием звезда-планета, требует смелых предположений и постоянной проверки гипотез перед лицом космической тишины. Моделирование магнитогидродинамических процессов, описанное в статье, является лишь попыткой проникнуть за горизонт событий нашего незнания.

Что же дальше?

Представленная работа, безусловно, предлагает элегантный способ предсказать, где искать радиосигналы от взаимодействия звезды и планет. Однако, не стоит обольщаться, будто эта предсказательная конструкция – нечто большее, чем очередная карта, на которой неизбежно появятся новые, неизученные территории. Ведь горизонт событий всегда ближе, чем кажется, и даже самые точные модели могут рухнуть под натиском новой информации.

Очевидно, что дальнейшее развитие потребует не только более совершенных трехмерных магнитогидродинамических симуляций, но и, что более важно, критической переоценки наших представлений о физике плазмы в экстремальных условиях. ZDI-картирование – ценный инструмент, но он лишь показывает то, что мы уже знаем, или думаем, что знаем. Не исключено, что самые интересные сигналы придут от систем, которые эта модель попросту не предвидит – от тех самых «чёрных лебедей», которые постоянно напоминают о хрупкости любой теории.

В конечном счёте, эта работа – лишь ещё один шаг в бесконечном танце между предсказанием и наблюдением. И, возможно, истинная ценность заключается не в самих предсказаниях, а в смирении, которое приходит с осознанием того, что Вселенная всегда найдёт способ удивить, а теория – это всего лишь удобный инструмент, чтобы красиво запутаться.

Оригинал статьи: avetisyanfamily.com/radiosignaly-ot-ekzoplanet-novyj-sposob-poiska-vnezemnyh-mirov

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 5

[моё] Эволюция Наука Будущее Исследования Статья Экзопланеты Длиннопост

AiPapka

ИИ — это иллюзия ... Почему ИИ видит, но не соображает⁠⁠

2 дня назад

Есть мнение, что GPT и Gemini уже почти как люди. Но два свежих исследования показывают, что это не так..

ИИ — это иллюзия ... Почему ИИ видит, но не соображает

Секрет детского мозга

Первое исследование сравнило, как распознают объекты дети и нейросети

— Ребенок к 3 годам видит в тысячи раз меньше уникальных объектов, но легко узнает их на искаженных или неполных картинках

— Нейросеть требует миллионы изображений для обучения, но ломается, если запрос хоть немного отличается от того, что она запомнила

— Секрет в том, что мозг ребенка использует обратную связь и врожденные механизмы для понимания формы, а не просто запоминает пиксели

Тест на знание мира: провален

Второе исследование пошло дальше и проверило, есть ли у нейросетей внутренняя модель мира

— С простым восприятием (цвет, форма) — все хорошо. Понимание 3D пространства, физики и логики — почти наугад.

— ИИ не может предсказать, куда отскочит мяч или как правильно представить объект с другого ракурса

— Главный провал — причинно-следственные связи. Нейросеть может решить, что синие объекты движуются быстрее зеленых, просто потому что так чаще было в обучающих данных

Вывод-то какой?

Современные ИИ — мастерски имитируют, но не понимают причин и следствий. Они находят статистические закономерности в гигантских объемах данных ...

Вопрос: Решаемо ли это ❓

ИИ не забирает работу — он забирает шансы у тех, кто не хочет учиться.
Веду канал про ИИ, найдете короткие, понятные разборы и гайды, чтобы быть на шаг впереди — ссылка в профиле пикабу)

Показать полностью 1

[моё] Искусственный интеллект Будущее Интернет Бот ChatGPT Программирование

Karmagram

История Добра, которую мы создаем вместе⁠⁠

2 дня назад

Идея Кармаграма: История Добра, Которую Мы Создаем Вместе.

Представьте себе мир, где добрые дела становятся привычкой, а помощь ближнему — нормой повседневной жизни. Представили? Теперь давайте воплотим этот образ в реальность благодаря нашему новому проекту — Кармаграм.О чём всё это?

Кармаграм — это место, где собираются неравнодушные люди, готовые делиться светлыми поступками и хорошими новостями.

У вас была возможность поддержать кого-то словом или делом?

Расскажите об этом на платформе, и пусть ваша история станет примером для других. Каждая опубликованная история увеличивает вашу виртуальную "карму", отражающую влияние вашего личного вклада в общий фонд добра.

Мы считаем, что хорошие поступки заслуживают внимания и признания. Поэтому участники смогут получать рейтинги и бонусы за каждую опубликованную историю, исходя из реакции сообщества. Ведь именно сообщество определяет истинную ценность поступка, поддерживая тех, кто заслуживает наибольшего уважения.Почему это важно?Сейчас в мире остро ощущается нехватка человечности и эмпатии. Люди нуждаются в поддержке и знании, что рядом есть те, кому небезразлична судьба другого.

Наша задача — напомнить человечеству о важности простых человеческих ценностей и предложить площадку, где такие ценности будут цениться и развиваться.Какие шаги впереди?Мы планируем развивать платформу, делая акцент на нескольких ключевых направлениях:- Поддержка локальных инициатив: будем продвигать проекты и акции местных активистов, которые меняют жизнь конкретных городов и районов.

- Партнерства с организациями: сотрудничество с благотворительными фондами и волонтёрскими движениями позволит расширить возможности наших пользователей.

- Расширение функционала: развитие возможностей для общения и объединения участников вокруг общих целей и идей.

Но самое главное — создание сообщества.

Каждого, кто хочет оставить след в сердце хотя бы одного человека, ждёт тёплый приём и поддержка.

Пусть ваши маленькие ежедневные победы станут частью большой истории человечества.

История Добра, которую мы создаем вместе

Показать полностью 1

Будущее Проект Развитие

user9648203

Термитофикация государства⁠⁠

2 дня назад

Есть в природе такие милые насекомые, как термиты.

Термит-рабочий

В до цивилизационную эпоху, когда человек ещё бегал в голом виде по африканской саванне, термиты мирно поедали сухую и трухлявую древесину, очищая планету. Работали редуцентами, выполняя крайне полезную функцию в биоценозах по обе стороны от экватора - там, где снега не более чем легенда.

Однако, как только человек придумал цивилизацию, термиты с удовольствием стали есть мебель и вообще всё, что человек делает для себя из дерева. Ведь для этих насекомых что упавший ствол, что стол - одно и то же. Не более чем еда. Разумеется, сразу же началась борьба человека с термитами за столы и брёвна, до сих пор идущая с переменным успехом. Но для данной статьи важно другое.

Термиты не знают сопромат и теории устойчивости, но умеют выедать деревянные конструкции изнутри так, что ВНЕШНЕ и без воздействия они зачастую выглядят неповрежденными, хотя при разрезе можно наблюдать вот такую картину:

термиты выели брусья изнутри

Достаточно небольшого внешнего воздействия и ... деревянная конструкция рассыпается буквально в труху.

Точно так же, как разъеденное изнутри государственное устройство только внешне напоминает несокрушимую крепость, хотя уже давно всё пронизано выеденными ходами коррупционных связей Данбара.

Такое государство не выдержит даже слабой внешней нагрузки и рухнет в труху, хотя до последнего момента понты единства и величия будут вводить в заблуждение внешних наблюдателей. Это я про СССР в его последние годы, если что.

Хотя кроме СССР можно привести множество исторических примеров и современных аналогий термитофицированных государств - на разной стадии перехода в труху.

Не пора ли задуматься и начать дезинсекцию? Хотя бы для сохранения того, что осталось.

Показать полностью 1

Цивилизация Будущее Общество Яндекс Дзен (ссылка)

Great.BAV

Снег...⁠⁠

2 дня назад

А представьте, что изменится климат, снега не будет вообще, но будет выпадать всякая химгадость в осадок. Наши потомки будут называть ее снегом, считать что так было всегда. А раньше было больше (судя по сохранившимся фотографиям и, возможно, видео), а особо долбанутые предки даже умудрялись есть этот снег (тот который не желтый) есть, а сплавившиеся потеки в детстве сосали...

Показать полностью 1

[моё] Будущее Экология Зима Снег Химтрейлы

zvoni2000

Как внимание формирует реальность⁠⁠

2 дня назад

Недавно наткнулся на интересную статью, имя автора уже не вспомню, но мысли зацепили настолько, что решил пересказать вам целиком

О том, куда смотрит внимание

Суть была в следующем: когда человек постоянно думает о том, чего ему не хватает, это становится центром его внимания. А всё, что оказывается в центре внимания, со временем разрастается. Мыслительная энергия работает именно так: куда она направлена, там что-то начинает расти.

Поэтому если человек живёт в режиме нехватки - нехватки любви, времени, денег, здоровья - то именно всё это и будет множиться в его жизни. Наш мозг устроен так, что усиливает то, на чём мы фокусируемся.

Мышление изобилия

Автор приводил идею изобилия. Не просто как красивая метафора, а как состояние сознания. Изобилие - это когда вы живёте так, будто важные вещи присутствуют в вашей жизни в полном объёме. Причём это может быть доступно каждому, независимо от статуса и дохода.

Пример: возьмите воздух. Мы без него жить не можем, но мы о нём не думаем. Почему? Потому что его достаточно. Он воспринимается как норма. Тогда почему бы не относиться так же к другим аспектам жизни?

Откуда берутся деньги

В тексте была такая мысль: мы получаем деньги в обмен на ценность. Никто не заплатит просто так. Значит, чтобы зарабатывать больше, нужно создавать что-то ценное: продукт, услугу, опыт. А чтобы создать что-то стоящее, нужна идея. Идея рождается в голове. А голова работает за счёт умственной энергии.

Если человек привык мыслить категориями 500 долларов, он будет искать работу только на эту сумму. Даже если лишится её, он снова ищет что-то подобное. Просто другой мысли у него не появляется. Границы сознания узкие - и умственная энергия там же.

Пример с мусоркой

Был один яркий пример. Представьте обычную мусорку на улице.

- Один человек идёт мимо и раздражается: грязь, беспорядок.
- Другой видит ту же мусорку и думает: «Почему бы не заняться переработкой отходов?»
- Третий решает: создать компанию по вывозу мусора.
- Четвёртый задумывается о производстве удобных контейнеров.
- Пятый представляет, как на этом месте можно поставить киоск.

Ситуация одна, а интерпретаций масса. У каждого - свой уровень умственной энергии, свои границы мышления, свои идеи.

Почему идеи не реализуются

Мы часто получаем идеи, но не двигаемся дальше. Либо сомневаемся, либо не хватает внутреннего ресурса, чтобы развить навыки и компетенции под реализацию замысла.

Любую идею нужно превращать в цель, а цель - в план. Но для этого сознанию нужен запас силы. Иначе мысль просто гаснет.

Мне стало интересно - что же наука говорит об этом

Оказалось, что психологи и нейроучёные действительно нашли подтверждения таким рассуждениям:

Концепция «мышления нехватки» (scarcity mindset) - когда человек убеждён, что ресурсов мало и готов конкурировать за них - оказывается не просто эмоциональным состоянием, а влияет на когнитивные функции: внимание становится узким, возможности меньше видны, принятие решений ухудшается.
Исследования показали, что в состоянии нехватки мозг работает иначе: меньше гибкости, меньше ресурсов для планирования и креатива.
Наоборот, мышление изобилия (abundance mindset) - вера в то, что возможностей много, ресурсов можно создавать, важно видеть потенциал - даёт более широкую перспективу, позволяет видеть и использовать больше вариантов.
Что касается внимания - исследования показывают, что когда внимание сосредоточено на недостатке, создаётся эффект туннелирования: мы меньше замечаем, что вокруг нас есть, и концентрируемся только на том, чего нет. А если внимание переключено на возможности - то появляется более широкий взгляд, идеи, планирование.
Также учёные рассматривают умственную энергию и эффект того, что мысли и внимание влияют на создание (или непринятие) новых идей: например, люди с мышлением, ориентированным на рост и возможность, чаще предпринимают действия, выше их вероятность успеха.

Что значит всё это на практике

Старайтесь не концентрироваться только на том, чего у вас нет, а переключайте внимание на то, что вы можете сделать, создать, улучшить.
Работайте над мышлением: из «У меня мало» → «У меня есть, что можно развивать».
Развивайте умственную энергию - например, через фокус-тренировки, заботу о состоянии: сон, питание, движение. Это всё влияет на внимание и на то, что мозг способен видеть.
Научитесь видеть возможности там, где другие видят проблему (пример с мусоркой - яркий). Это и есть применение научных принципов: внимание + мышление + действие.

Показать полностью

Будущее Успех Мотивация Мозг Опыт Длиннопост

user11222293

Лига Новых Технологий

Быстрая адаптация для масштабирования изображений в диффузионных моделях⁠⁠

3 дня назад

Автор: Денис Аветисян

Новый подход позволяет значительно ускорить процесс получения высококачественных изображений из диффузионных моделей, сохраняя при этом сопоставимое качество.

Адаптер повышения разрешения на основе скрытых пространств (LUA) интегрируется в существующие диффузионные конвейеры без переобучения генератора/декодера и дополнительных этапов диффузии, обеспечивая повышение разрешения скрытого представления в два или четыре раза (64 × 64 до 128 × 128 или 256 × 256) с последующим однократным декодированием до разрешения 1024 × 1024 или 2048 × 2048, что добавляет всего +0.42 с (1K) или +2.21 с (2K) на GPU NVIDIA L40S, превосходя многоэтапные конвейеры повышения разрешения и достигая эффективности, сравнимой с повышением разрешения в пиксельном пространстве, при сопоставимом перцептивном качестве.

Представлен LUA – легковесный адаптер, эффективно масштабирующий латентные представления в диффузионных моделях с использованием трансфера Cross-VAE и однопроходного масштабирования.

Диффузионные модели, несмотря на впечатляющие результаты, сталкиваются с ограничениями масштабируемости при генерации изображений высокого разрешения. В работе, озаглавленной 'One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models', представлен адаптер LUA – легковесный модуль, выполняющий суперразрешение непосредственно в латентном пространстве. Это позволяет значительно ускорить процесс генерации изображений высокого разрешения без потери качества, избегая затратных операций постобработки. Не откроет ли данное решение путь к созданию более эффективных и масштабируемых генеративных моделей будущего?

Преодолевая Границы Высокодетализированной Синтезации Изображений

Создание изображений высокого разрешения представляет собой серьезную вычислительную задачу, требующую значительных ресурсов и времени обработки. Традиционные методы супер-разрешения, работающие непосредственно с пикселями, хотя и демонстрируют эффективность, зачастую приводят к появлению артефактов и остаются ресурсоемкими. Существующие подходы, использующие многоступенчатые диффузионные пайплайны, страдают от увеличения задержки, что препятствует их применению в задачах, требующих обработки в реальном времени. Таким образом, поиск новых, эффективных и быстрых методов синтеза высокодетализированных изображений остается актуальной научной проблемой, ограничивающей возможности широкого применения таких технологий.

Наш метод (SDXL+LUA) обеспечивает минимальную задержку и создает чистые, стабильные текстуры без артефактов и шумов, характерных для прямого высококачественного сэмплирования или методов повышения разрешения в пиксельном пространстве, что демонстрируется на сравнении изображений, сгенерированных из базовых SDXL-изображений.

Скрытая диффузия и новый подход: LUA

Для решения вычислительных задач, связанных с диффузионными моделями, активно исследуются методы работы в сжатом латентном пространстве. В рамках данного подхода представлена Latent Upscaler Adapter (LUA) – легковесный модуль, предназначенный для эффективного увеличения разрешения латентных представлений. Интегрируясь между генератором и декодером VAE, LUA позволяет повысить детализацию генерируемых изображений без необходимости переобучения модели или добавления дополнительных этапов диффузии, обеспечивая тем самым значительное ускорение процесса и снижение вычислительных затрат.

Архитектура Latent Upscaler Adapter (LUA) использует общую основу SwinIR для различных масштабов, адаптируя ширину латентного пространства VAE и обеспечивая масштабирование латентов в ×2 или ×4 с помощью специализированных pixel-shuffle голов.

Архитектура LUA и стратегия обучения

В основе LUA лежит архитектура SwinIR, использующая механизм оконного самовнимания и Swin Transformer для эффективной экстракции признаков в латентном пространстве. Для оптимизации производительности системы применена многоэтапная стратегия обучения, постепенно повышающая сложность задач и улучшающая конечные результаты. Обучение и оценка LUA проводились с использованием датасета OpenImages, представляющего собой обширный ресурс для исследований в области синтеза изображений и обеспечивающего надежную основу для оценки эффективности предложенного подхода.

Метод LUA обеспечивает наилучшее качество масштабирования изображений за счет сохранения деталей и минимального уровня шума при незначительных затратах времени, превосходя bicubic и SwinIR в плане стабильности и четкости деталей.

Превосходство и Эффективность Latent Upscaling

Исследования демонстрируют, что Latent Upscaling (LUA) обеспечивает значительное снижение вычислительных затрат и задержки по сравнению с традиционными методами, такими как LIIF и увеличение разрешения в пиксельном пространстве. Оценка качества с использованием метрик, включая FID Score, KID Score и CLIP Score, подтверждает способность LUA генерировать высококачественные изображения, сохраняя их семантическую согласованность. Работа в латентном пространстве позволяет LUA минимизировать артефакты и обеспечивать визуально превосходные результаты. В частности, достигнут передовой показатель FID в 176.90 при разрешении 4096x4096 и pFID в 61.80 при том же разрешении. При разрешении 2048x2048 LUA демонстрирует FID в 180.80 и pFID в 97.90. Время обработки изображений 4096x4096 составляет 6.87 секунды, а для изображений 2048x2048 – 3.52 секунды, что свидетельствует о высокой производительности метода.

Поэтапное обучение позволило улучшить качество реконструкции и детализацию декодированного изображения за счет постепенного увеличения разрешения и концентрации высокочастотной энергии вокруг ключевых элементов.

В основе представленной работы лежит стремление к предельной эффективности и точности. Авторы демонстрируют, что без четкого определения задачи масштабирования скрытых представлений в диффузионных моделях, любое решение будет лишь шумом. Предложенный LUA-адаптер, легкий и эффективный, позволяет достичь высокого разрешения изображений с минимальными вычислительными затратами. Это подтверждает, что элегантность алгоритма проявляется в его математической чистоте и доказуемости. Как заметила Фэй-Фэй Ли: «Искусственный интеллект должен служить людям, а не наоборот». Эта работа демонстрирует, как ИИ может быть разработан для более эффективного и доступного создания визуального контента, служа тем самым этой цели.

Что Дальше?

Представленная работа, безусловно, демонстрирует элегантность решения в области масштабирования скрытых представлений. Однако, не стоит обманываться кажущейся простотой. Оптимизация без анализа – это самообман и ловушка для неосторожного разработчика. Вопрос не в том, насколько быстро можно получить результат, а в том, насколько корректно он отражает истинную структуру данных. Необходимо тщательно исследовать влияние адаптера на генеративные возможности модели, избегая случайных артефактов и потери разнообразия.

Очевидным направлением для будущих исследований представляется формальная верификация свойств адаптера. Доказательство сходимости и стабильности алгоритма – задача нетривиальная, но необходимая. Кроме того, следует обратить внимание на возможность обобщения подхода на другие типы скрытых пространств и генеративных моделей. Успешное решение этих задач позволит создать действительно универсальный инструмент для высококачественной генерации изображений.

Наконец, представляется важным оценить вычислительную стоимость адаптера в контексте реальных приложений. Ускорение процесса генерации должно быть значительным, чтобы оправдать дополнительные затраты на обучение и внедрение. В противном случае, мы рискуем получить лишь очередное красивое решение, не имеющее практической ценности.

Оригинал статьи: denisavetisyan.com/malenkij-shag-v-skrytom-prostranstve-ogromnyj-skachok-dlya-izobrazheniya

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 5

[моё] Статья Исследования Будущее Наука Эволюция Длиннопост

Посты не найдены