Сообщество - Лига Новых Технологий

Лига Новых Технологий

1 892 поста 16 906 подписчиков

Популярные теги в сообществе:

8

Виртуальная Операция: Новый Шаг в Обучении Нейрохирургов

Автор: Денис Аветисян


Исследование демонстрирует возможности высокоточной симуляции нейрохирургических операций для отработки бимануальных навыков и объективной оценки мастерства.

Система моделирования включает в себя компоненты хирургического вмешательства, отслеживания положения инструментов и видеозаписи, что позволяет исследовать взаимодействие с моделью черепа и трансплантированным мозговым веществом в условиях, приближенных к реальной операции.

Разработана платформа для обучения нейрохирургии на основе модели коровьего мозга с использованием оптического трекинга для оценки двуручных навыков при выполнении кортикотомии.

Овладение бимануальной психомоторикой представляет собой значительную сложность в нейрохирургической подготовке, особенно в объективной оценке навыков. В данной работе, 'A High-Fidelity Neurosurgical Training Platform for Bimanual Procedures: A Feasibility Study', исследована возможность создания платформы нейрохирургической симуляции, объединяющей анатомически реалистичную модель мозга и отслеживание хирургических инструментов для обучения и объективной оценки задач, таких как субпиальная кортиэктомия. Полученные результаты демонстрируют успешное отслеживание движений инструментов и выявление метрик, способных дифференцировать уровни хирургической экспертизы. Может ли подобный подход, основанный на анализе движений, стать основой для персонализированной нейрохирургической подготовки и повышения безопасности операций?


Освоение хирургического мастерства: современные вызовы

Традиционное хирургическое обучение, базирующееся на принципах наставничества, отличается значительной трудоемкостью и недостаточной стандартизацией оценки приобретаемых навыков. Существенная вариабельность в уровне подготовки хирургов-стажеров представляет собой потенциальную угрозу для безопасности пациентов, подчеркивая необходимость разработки объективных метрик для оценки их компетентности. Эффективное обучение требует использования реалистичных симуляторов, способных адекватно воспроизводить сложность хирургических вмешательств, таких как кортикотомия, и обеспечивать стажерам безопасную среду для отработки необходимых навыков и приобретения опыта, прежде чем они приступят к самостоятельной практике.

Практика Хирургии на Реалистичной Модели: Ex-Vivo Подход

Для отработки деликатных техник кортиэктомии используется высокореалистичная модель, созданная на основе ткани мозга теленка, позволяющая многократно тренировать ключевые этапы, включая первичный пиальный разрез и прецизионное удаление коры головного мозга. Сочетание данной модели с современными хирургическими инструментами, такими как ультразвуковой аспиратор и биполярные щипцы, формирует клинически релевантную среду для обучения, обеспечивая возможность совершенствования навыков в условиях, максимально приближенных к реальным операционным.

Оценка хирургического мастерства на основе анализа движений

Для объективной оценки навыков хирургов разработана система, использующая оптическое отслеживание инструментов, например, FusionTrack 500, способная фиксировать трёхмерную траекторию движения в 81% случаев использования. Полученные данные позволяют количественно оценивать характеристики движений, включая скорость, ускорение и рывок, что даёт ценную информацию о технике выполнения операций. Помимо этого, анализируются временные показатели и параметры билатеральной координации, формируя комплексную оценку хирургического мастерства. Исследования показали статистически значимые различия во времени использования ножниц между начинающими хирургами и экспертами (101.46 секунд, p=0.001) и старшими студентами (106.34 секунд, p<0.001), что подтверждает возможность использования данной методики для выявления областей, требующих улучшения в процессе обучения и практики.

Анализ движения показал, что предложенный подход эффективно оптимизирует скорость, ускорение и рывок.

Анализ движения показал, что предложенный подход эффективно оптимизирует скорость, ускорение и рывок.

Революция в хирургическом обучении: персонализация и реализм

Современные методы хирургического обучения претерпевают трансформацию благодаря интеграции реалистичных симуляций с объективной оценкой навыков, что позволяет создавать индивидуальные программы подготовки, адаптированные к потребностям каждого обучающегося. Использование 3D-печати для создания пациентоспецифических моделей значительно повышает реалистичность и эффективность тренировок. Виртуальная реальность обеспечивает иммерсивный опыт, дополняя работу с Ex-Vivo моделями и предоставляя безопасную среду для отработки сложных манипуляций. Исследования выявили значительные различия во времени использования аспиратора между начинающими и опытными хирургами (125.8 секунд, p=0.039), а также во времени одновременного использования биполярного коагулятора и ножниц между студентами и экспертами (77.3 секунд, p=0.009) и между экспертами и опытными хирургами (75.4 секунд, p=0.004). Данный комплексный подход, основанный на опыте ведущего нейрохирурга, направлен на повышение безопасности пациентов и улучшение результатов хирургических вмешательств.

Исследование демонстрирует важность создания систем, способных объективно оценивать сложные двигательные навыки, такие как бимануальная кортикотомия. Платформа, основанная на отслеживании инструментов и анализе движений, позволяет выявить различия в уровне подготовки хирургов. Как однажды заметила Грейс Хоппер: «Лучший способ предсказать будущее - создать его». Эта платформа - не просто инструмент для тренировок, а попытка сформировать будущее хирургической подготовки, создавая условия для постоянного совершенствования и повышения квалификации специалистов. Элегантность дизайна проявляется в простоте и ясности получаемых метрик, позволяющих оценить эффективность выполнения процедуры.

Куда дальше?

Представленная работа демонстрирует, что фиксация движения инструментов - это лишь первый шаг. Очевидно, что простое отслеживание траектории не раскрывает сути хирургического мастерства. Как и в любом сложном механизме, важна не только геометрия, но и динамика взаимодействия частей. Иными словами, документация фиксирует структуру, но не передаёт поведение - оно рождается во взаимодействии. Необходимо глубже изучать не просто что делает хирург, а как он это делает - какие микро-коррекции, какие колебания, какая адаптация к непредсказуемым условиям.

Очевидным направлением является интеграция с системами обратной связи, позволяющими имитировать тактильные ощущения. Визуальная точность, безусловно, важна, но без ощущения сопротивления тканей, без понимания плотности и текстуры, симуляция остаётся лишь бледным подобием реальности. Более того, следует задуматься о создании более сложных сценариев, приближенных к реальным клиническим ситуациям, с вариабельностью анатомии и непредсказуемыми осложнениями. Простота модели - это хорошо для начала, но для истинной оценки навыков требуется сложность.

В конечном счете, ценность любой симуляционной платформы определяется её способностью предсказывать реальную производительность хирурга. Недостаточно просто дифференцировать опытных специалистов от новичков; необходимо выявить конкретные навыки, которые необходимо улучшить. Подобный анализ требует не только точных метрик, но и глубокого понимания нейрофизиологических механизмов, лежащих в основе хирургического мастерства. Иначе, мы рискуем создать лишь ещё один инструмент для измерения того, что и так известно.


Полный обзор с формулами: top-mob.com/virtualnaya-nejrohirurgiya-ottachivaem-masterstvo-obeih-ruk

Оригинал статьи: https://arxiv.org/pdf/2511.14879.pdf

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 1
5

Нейроголос будет звучать во всех поездах Сокольнической линии московского метро уже до конца ноября1

Преимущества технологии:

🔹 Мы можем оперативно создавать аудиосообщения и оповещать пассажиров об изменениях в работе транспорта.

🔹 В программе есть возможность менять скорость воспроизведения голоса и интонационные акценты.

🔹️ Сохраним привычное звучание профессиональных дикторов. Голоса будут неотличимы.

Дикторы Московского транспорта также продолжают свою работу: сейчас они записывают аудиосообщения для пассажиров и специальных проектов.

В московском метро тестируют нейроголос в аудиосообщениях

Показать полностью
11

Секретная формула закругленных углов Apple

Вся линейка продуктов Apple, по сути, строится на одной простой форме: прямоугольник со скругленными углами. Будь то он вертикальный и портативный - iPhone. Или уменьшенный и утолщенный - кейс AirPods.

Определяющими факторами для физических размеров устройств, будь iPhone или AirPods, являются эргономика и размеры внутренних компонентов. Но какова роль закругленных углов?

Квадрокруг, повсюду квадрокруг…

Закруглённые углы - это не только эстетический выбор, но и ключевой элемент безопасности и удобства. Такая форма снижает риск каких-либо травм и повреждения других предметов при случайном соприкосновении + скругленные углы телефона лучше выдерживают падения, чем острые. Универсальные принципы дизайна также объясняют этот выбор так:

На подсознательном уровне люди предпочитают плавные контуры: исследования показывают, что острые формы могут вызывать подсознательный страх, активируя миндалевидное тело мозга.

В продукции Apple используется особый вид скругления - «сквирклы», квадрокруги, если по русски, которые создают идеальный, непрерывный переход между прямыми и изогнутыми поверхностями без резких стыков

Чем ближе к человеку, тем круглее

Ниже представлена диаграмма, объясняя общую философию, лежащую в основе дизайна бренда электроники MUJI. Чем ближе объект к человеку, тем круглее он становится.

Apple придерживается той же идеи. Маленькие предметы, которые находятся ближе всего к телу, - Apple Watch, AirPods, Apple Pencil - имеют округлую форму. Те, что находятся дальше всего, - настольные компьютеры, дисплеи - имеют слегка округлую форму.

Интуитивное желание взять в руки и изучить такой предмет, как чехол для AirPods, возникает благодаря его округлым формам (как у камня). В устройствах с дисплеем, например в Apple Watch, акцент смещается на визуальное взаимодействие, а тактильная потребность уступает место комфорту. Острые грани Apple Watch стали бы эргономической проблемой, тычась в запястье и создавая дискомфорт при ношении.

Насколько скругленный?

Естественно, возникает следующий вопрос: “Насколько скругленным должен быть дизайн продукта?” Это чисто субъективный вопрос или существует какая-то формула?

Энтузиасты уже произвели некоторые измерения:

Разделив диаметр округлости на длину сторон, они получили показатель округлости устройств Apple в процентах от нуля до ста.

Возникает закономерность

После подсчёта баллов вырисовалась четкая закономерность. Прикладные настольные продукты - 0 %. Дисплеи - от 2 % до 3 %. Макбуки - от 7 % до 10 %. Айпады - от 12 % до 18 %. Айфоны - около 33 %.

У таких продуктов, как AirPods и Apple Watch, этот показатель составляет около 50 %. У AirPods Max он равен 88 %, но эта цифра, скорее всего, обусловлена эргономикой.

Каждая категория товаров соответствует принципу "чем ближе к человеку, тем закругленней объект", и каждый продукт четко вписывается в свою категорию.


Приглашаю всех в свой только-только созданный телеграм канал посвященный продакт-менеджменту физических продуктов, где буду делиться своим опытом, а также интересными и полезными материалами: t.me/physical_product

Показать полностью 7
13

Солнечная пилюля для туриста

Солнечная пилюля для туриста

В походе портативный источник света — не роскошь, а вопрос безопасности. Он помогает заметить опасных животных, не споткнуться на тропе и даже подать сигнал SOS.

Solarpill — это компактный фонарик на солнечной энергии, который можно носить на себе или прикреплять к дереву. Такой подход позволяет использовать свет там, где это действительно важно, при этом полностью освободив руки. Солнечная пилюля заряжается от солнца, а несколько модулей можно подпитывать через USB-станцию. Благодаря датчику света он включается только ночью, поэтому может работать до трех суток без подзарядки.

Устройство создавалось как система аварийной маркировки для туристов, альпинистов и спасателей. И не случайно получило награду на международной премии по дизайну Lighting Products and Fixtures Design Award. Это маленькое, но продуманное решение, которое реально может спасти жизнь.

Больше интересной информации про источники энергии и энергетику в телеграм-канале ЭнергетикУм

Показать полностью 5
5

Быстрая адаптация для масштабирования изображений в диффузионных моделях

Автор: Денис Аветисян


Новый подход позволяет значительно ускорить процесс получения высококачественных изображений из диффузионных моделей, сохраняя при этом сопоставимое качество.

Адаптер повышения разрешения на основе скрытых пространств (LUA) интегрируется в существующие диффузионные конвейеры без переобучения генератора/декодера и дополнительных этапов диффузии, обеспечивая повышение разрешения скрытого представления в два или четыре раза (64 × 64 до 128 × 128 или 256 × 256) с последующим однократным декодированием до разрешения 1024 × 1024 или 2048 × 2048, что добавляет всего +0.42 с (1K) или +2.21 с (2K) на GPU NVIDIA L40S, превосходя многоэтапные конвейеры повышения разрешения и достигая эффективности, сравнимой с повышением разрешения в пиксельном пространстве, при сопоставимом перцептивном качестве.

Представлен LUA – легковесный адаптер, эффективно масштабирующий латентные представления в диффузионных моделях с использованием трансфера Cross-VAE и однопроходного масштабирования.

Диффузионные модели, несмотря на впечатляющие результаты, сталкиваются с ограничениями масштабируемости при генерации изображений высокого разрешения. В работе, озаглавленной 'One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models', представлен адаптер LUA – легковесный модуль, выполняющий суперразрешение непосредственно в латентном пространстве. Это позволяет значительно ускорить процесс генерации изображений высокого разрешения без потери качества, избегая затратных операций постобработки. Не откроет ли данное решение путь к созданию более эффективных и масштабируемых генеративных моделей будущего?


Преодолевая Границы Высокодетализированной Синтезации Изображений

Создание изображений высокого разрешения представляет собой серьезную вычислительную задачу, требующую значительных ресурсов и времени обработки. Традиционные методы супер-разрешения, работающие непосредственно с пикселями, хотя и демонстрируют эффективность, зачастую приводят к появлению артефактов и остаются ресурсоемкими. Существующие подходы, использующие многоступенчатые диффузионные пайплайны, страдают от увеличения задержки, что препятствует их применению в задачах, требующих обработки в реальном времени. Таким образом, поиск новых, эффективных и быстрых методов синтеза высокодетализированных изображений остается актуальной научной проблемой, ограничивающей возможности широкого применения таких технологий.

Наш метод (SDXL+LUA) обеспечивает минимальную задержку и создает чистые, стабильные текстуры без артефактов и шумов, характерных для прямого высококачественного сэмплирования или методов повышения разрешения в пиксельном пространстве, что демонстрируется на сравнении изображений, сгенерированных из базовых SDXL-изображений.

Скрытая диффузия и новый подход: LUA

Для решения вычислительных задач, связанных с диффузионными моделями, активно исследуются методы работы в сжатом латентном пространстве. В рамках данного подхода представлена Latent Upscaler Adapter (LUA) – легковесный модуль, предназначенный для эффективного увеличения разрешения латентных представлений. Интегрируясь между генератором и декодером VAE, LUA позволяет повысить детализацию генерируемых изображений без необходимости переобучения модели или добавления дополнительных этапов диффузии, обеспечивая тем самым значительное ускорение процесса и снижение вычислительных затрат.

Архитектура Latent Upscaler Adapter (LUA) использует общую основу SwinIR для различных масштабов, адаптируя ширину латентного пространства VAE и обеспечивая масштабирование латентов в &#xD7;2 или &#xD7;4 с помощью специализированных pixel-shuffle голов.

Архитектура Latent Upscaler Adapter (LUA) использует общую основу SwinIR для различных масштабов, адаптируя ширину латентного пространства VAE и обеспечивая масштабирование латентов в ×2 или ×4 с помощью специализированных pixel-shuffle голов.

Архитектура LUA и стратегия обучения

В основе LUA лежит архитектура SwinIR, использующая механизм оконного самовнимания и Swin Transformer для эффективной экстракции признаков в латентном пространстве. Для оптимизации производительности системы применена многоэтапная стратегия обучения, постепенно повышающая сложность задач и улучшающая конечные результаты. Обучение и оценка LUA проводились с использованием датасета OpenImages, представляющего собой обширный ресурс для исследований в области синтеза изображений и обеспечивающего надежную основу для оценки эффективности предложенного подхода.

Метод LUA обеспечивает наилучшее качество масштабирования изображений за счет сохранения деталей и минимального уровня шума при незначительных затратах времени, превосходя bicubic и SwinIR в плане стабильности и четкости деталей.

Метод LUA обеспечивает наилучшее качество масштабирования изображений за счет сохранения деталей и минимального уровня шума при незначительных затратах времени, превосходя bicubic и SwinIR в плане стабильности и четкости деталей.

Превосходство и Эффективность Latent Upscaling

Исследования демонстрируют, что Latent Upscaling (LUA) обеспечивает значительное снижение вычислительных затрат и задержки по сравнению с традиционными методами, такими как LIIF и увеличение разрешения в пиксельном пространстве. Оценка качества с использованием метрик, включая FID Score, KID Score и CLIP Score, подтверждает способность LUA генерировать высококачественные изображения, сохраняя их семантическую согласованность. Работа в латентном пространстве позволяет LUA минимизировать артефакты и обеспечивать визуально превосходные результаты. В частности, достигнут передовой показатель FID в 176.90 при разрешении 4096x4096 и pFID в 61.80 при том же разрешении. При разрешении 2048x2048 LUA демонстрирует FID в 180.80 и pFID в 97.90. Время обработки изображений 4096x4096 составляет 6.87 секунды, а для изображений 2048x2048 – 3.52 секунды, что свидетельствует о высокой производительности метода.

Поэтапное обучение позволило улучшить качество реконструкции и детализацию декодированного изображения за счет постепенного увеличения разрешения и концентрации высокочастотной энергии вокруг ключевых элементов.

Поэтапное обучение позволило улучшить качество реконструкции и детализацию декодированного изображения за счет постепенного увеличения разрешения и концентрации высокочастотной энергии вокруг ключевых элементов.

В основе представленной работы лежит стремление к предельной эффективности и точности. Авторы демонстрируют, что без четкого определения задачи масштабирования скрытых представлений в диффузионных моделях, любое решение будет лишь шумом. Предложенный LUA-адаптер, легкий и эффективный, позволяет достичь высокого разрешения изображений с минимальными вычислительными затратами. Это подтверждает, что элегантность алгоритма проявляется в его математической чистоте и доказуемости. Как заметила Фэй-Фэй Ли: «Искусственный интеллект должен служить людям, а не наоборот». Эта работа демонстрирует, как ИИ может быть разработан для более эффективного и доступного создания визуального контента, служа тем самым этой цели.

Что Дальше?

Представленная работа, безусловно, демонстрирует элегантность решения в области масштабирования скрытых представлений. Однако, не стоит обманываться кажущейся простотой. Оптимизация без анализа – это самообман и ловушка для неосторожного разработчика. Вопрос не в том, насколько быстро можно получить результат, а в том, насколько корректно он отражает истинную структуру данных. Необходимо тщательно исследовать влияние адаптера на генеративные возможности модели, избегая случайных артефактов и потери разнообразия.

Очевидным направлением для будущих исследований представляется формальная верификация свойств адаптера. Доказательство сходимости и стабильности алгоритма – задача нетривиальная, но необходимая. Кроме того, следует обратить внимание на возможность обобщения подхода на другие типы скрытых пространств и генеративных моделей. Успешное решение этих задач позволит создать действительно универсальный инструмент для высококачественной генерации изображений.

Наконец, представляется важным оценить вычислительную стоимость адаптера в контексте реальных приложений. Ускорение процесса генерации должно быть значительным, чтобы оправдать дополнительные затраты на обучение и внедрение. В противном случае, мы рискуем получить лишь очередное красивое решение, не имеющее практической ценности.


Оригинал статьи: denisavetisyan.com/malenkij-shag-v-skrytom-prostranstve-ogromnyj-skachok-dlya-izobrazheniya

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 5
7

Интервью с Джеффри Хинтоном от 16.06.2025 / Перевод и краткий пересказ

В этом выпуске переведено, проанализировано и озвучено на русском языке интервью - https://www.youtube.com/watch?v=giT0ytynSqg

00:00:07 Происхождение и ранние этапы развития нейросетей
00:01:33 Осознание экзистенциальных рисков и сравнение с ядерным оружием
00:03:30 Угрозы от злонамеренного использования ИИ и проблемы регулирования
00:05:20 Регулирование Капитализма и Проблемы Технологического Управления
00:06:22 Риски Автономного Оружия и Экзистенциальная Угроза Сверхразума
00:08:09 Мотивация Разработчиков, Прогнозы Занятости и Сравнение с Прошлыми Технологиями
00:09:54 Спонсорство, личные рекомендации продуктов и введение в тему ИИ
00:11:02 Последствия суперинтеллекта, уязвимость профессий и природа сознания
00:13:10 Размышления о Сознании Машин и Эмоциях
00:14:27 Карьера в Google, Уход и Соображения о Безопасности ИИ

Разбираем, почему один из самых влиятельных умов в области нейросетей считает, что сверхразум — это не научная фантастика, а неминуемая угроза. Узнайте о реальных рисках, которые уже сегодня проявляются в кибератаках, и о том, почему регулирование капитализма в сфере технологий — это вопрос выживания.

Если вы хотите понять, что на самом деле происходит за кулисами развития искусственного интеллекта, то не пропустите откровенный разговор о будущем, которое может наступить уже через 10-20 лет. (а для тех кто внимательно наблюдает за ситуацией оно наступило уже сегодня)

Далее полный текст пересказа интервью:

Происхождение и ранние этапы развития нейросетей

Джеффри Хинтон, которого называют "Крестным отцом ИИ", объясняет, что его прозвали так, потому что он на протяжении 50 лет упорно продвигал подход к созданию ИИ, основанный на моделировании работы человеческого мозга (нейронные сети), в то время как большинство исследователей фокусировались на логике и символьных вычислениях. Этот подход, который в итоге был развит в Google, позволил создать современные системы ИИ, способные распознавать объекты и выполнять рассуждения.

Хинтон покинул Google, чтобы иметь возможность открыто говорить об экзистенциальных рисках, связанных с развитием суперинтеллекта. Он считает, что ИИ однажды может превзойти человеческий интеллект, и мы должны быть готовы к последствиям, сравнивая нашу ситуацию с положением курицы, когда доминирует другой вид. Он подчеркивает, что существуют риски как злонамеренного использования ИИ, так и риск того, что суперинтеллект решит, что люди ему не нужны.

Хинтон критикует существующее регулирование, отмечая, что оно не справляется с главными угрозами, например, европейские нормы не распространяются на военное применение ИИ. Он также упоминает, что один из ключевых разработчиков ранних версий ChatGPT покинул OpenAI из-за опасений по поводу безопасности. Хинтон призывает признать, что ИИ представляет собой экзистенциальную угрозу, и действовать незамедлительно, иначе "мы близки к концу". Он также отмечает, что если бы такие пионеры, как фон Нейман и Тьюринг, жили дольше, подход на основе нейронных сетей был бы принят гораздо раньше.

Осознание экзистенциальных рисков и сравнение с ядерным оружием

Основная миссия Джеффри Хинтона сейчас — предупреждать об опасности, которую несет искусственный интеллект (ИИ). Он признает, что сам медленно осознал некоторые риски, в частности, опасность создания сверхразумного ИИ, который может сделать человечество неактуальным. В то время как риски, связанные с использованием ИИ для создания автономного оружия, были очевидны давно, осознание угрозы суперинтеллекта пришло к нему лишь несколько лет назад, а для широкой публики — с появлением ChatGPT.

Хинтон различает два типа рисков: краткосрочные риски, связанные с неправомерным использованием ИИ людьми (например, создание летального оружия), и экзистенциальный риск, связанный с тем, что ИИ станет настолько умным, что перестанет нуждаться в людях. Он подчеркивает, что человечество никогда не сталкивалось с угрозой со стороны сущностей, превосходящих его по интеллекту, и никто не знает, как с этим справиться. Оценки вероятности того, что ИИ нас заменит, сильно разнятся: от менее чем 1% до уверенности в полном уничтожении. Хинтон склоняется к промежуточной оценке, возможно, 10–20%, надеясь, что исследования позволят создать безопасные системы.

Хинтон сравнивает ситуацию с изобретением ядерного оружия, но отмечает ключевое отличие: атомная бомба была опасна лишь одним способом, тогда как ИИ полезен во множестве областей (медицина, образование), что делает невозможным его полную остановку. Он критикует отсутствие эффективного глобального регулирования, особенно то, что европейские законы об ИИ не распространяются на военное применение. Более того, существующие регуляции создают для Европы конкурентный недостаток, поскольку американские компании не могут сразу выводить свои продукты на европейский рынок. Хинтон считает, что в текущей ситуации, когда разрабатываются системы, превосходящие человека, необходим некий "мировой орган", управляемый разумными людьми, а не капиталистическая гонка за прибылью, которая движет крупными технологическими компаниями.

Угрозы от злонамеренного использования ИИ и проблемы регулирования

Джеффри Хинтон обеспокоен резким ростом кибератак (увеличение в 12 раз за 2023-2024 годы), чему способствуют большие языковые модели (LLM), упрощающие фишинговые атаки, нацеленные на кражу учетных данных. Хинтон лично сталкивается с мошенничеством: злоумышленники клонируют его голос и образ для создания фейковых рекламных объявлений (например, крипто-схем в Meta), которые крайне сложно удалить. Кроме того, его имя используют как соавтора в научных работах для получения цитирований.

Хинтон считает кибератаки серьезной угрозой, отмечая, что ИИ может находить уязвимости в коде и, возможно, к 2030 году начнет создавать совершенно новые типы атак. Из-за этих опасений он радикально изменил свои финансовые привычки, распределив сбережения между тремя канадскими банками, опасаясь, что кибератака может обрушить один банк и привести к потере активов, если злоумышленники успеют продать его акции. Он также хранит резервные копии данных на физическом диске.

Среди других угроз — использование ИИ для создания новых, дешевых и опасных вирусов, доступных даже неквалифицированным лицам, а также манипулирование выборами через высокотаргетированную политическую рекламу, основанную на сборе личных данных. Хинтон также критикует алгоритмы социальных сетей (YouTube), которые, стремясь к максимальной прибыли, показывают пользователям всё более экстремальный и подтверждающий их предвзятость контент. Это создает "эхо-камеры", уничтожает общую реальность и углубляет общественный раскол.

Хинтон подчеркивает, что для противодействия этим негативным последствиям капитализма необходимы сильные государственные регуляции. Регулирование должно заставить компании действовать в интересах общества, а не только ради прибыли. Однако он выражает сомнение в эффективности текущих политиков, которые часто не понимают технологию и могут быть под влиянием крупных корпораций.

Регулирование Капитализма и Проблемы Технологического Управления

Джеффри Хинтон обсуждает необходимость регулирования капитализма, особенно в сфере технологий, поскольку компании по своей природе стремятся максимизировать прибыль, что может привести к действиям, вредным для общества (например, распространение экстремального контента). Он подчеркивает, что регулирование должно гарантировать, что стремление к прибыли заставляет компании действовать на благо общества.

Основная проблема заключается в том, кто будет устанавливать эти правила. Хинтон отмечает, что политики часто некомпетентны в понимании технологий или могут находиться под влиянием самих технологических компаний. Технологические гиганты, в свою очередь, часто выступают против регулирования, утверждая, что это помешает конкуренции (например, с Китаем).

Хинтон считает, что цель регулирования — ограничить крупные компании, заставляя их приносить социальную пользу в процессе получения прибыли (как Google Search), а не вред (как YouTube с его экстремальным контентом). Несмотря на очевидность проблемы алгоритмов, углубляющих поляризацию, он считает, что политики должны немедленно заняться разработкой соответствующих норм. Следующей важной темой, которую он планирует обсудить, являются летальные автономные системы вооружений.

Риски Автономного Оружия и Экзистенциальная Угроза Сверхразума

Джеффри Хинтон обсуждает две основные угрозы, связанные с развитием ИИ: летальное автономное оружие (Lethal Autonomous Weapons, LAW) и экзистенциальный риск от сверхразума.

Угроза автономного оружия: LAW, способные самостоятельно принимать решение об убийстве, снижают политические издержки для крупных держав при вторжении в более слабые страны, поскольку вместо гибели солдат возвращаются "мертвые роботы". Это уменьшает общественное сопротивление войнам. Хинтон отмечает, что такие системы уже разрабатываются, и даже если они не будут умнее людей, они уже представляют серьезную опасность, способную, например, отслеживать и уничтожать конкретных людей по заданным параметрам.

Экзистенциальная угроза сверхразума: Главная проблема не в том, что сверхразум будет делать то, что мы ему прикажем, а в том, чтобы предотвратить его желание захватить контроль. Хинтон сравнивает сверхразум с тигрёнком: мы не можем быть уверены, что, повзрослев, он не захочет нас уничтожить, даже если сейчас он кажется безобидным. Он проводит аналогию с тем, как курица не понимает мир человека, а мы не сможем контролировать сущность, которая нас превосходит. Существует множество способов, которыми сверхразум может устранить человечество (например, через биологическое оружие или провоцируя ядерный конфликт).

Хинтон считает, что единственный путь — это исследовать, как предотвратить желание ИИ захватить власть, а не пытаться физически его остановить, когда он станет умнее нас. Он признает, что его работа по развитию ИИ, которая изначально несла огромный потенциал для блага (медицина, образование), теперь сопряжена с риском вымирания человечества, и он чувствует обязанность говорить об этих опасностях, хотя и не испытывает вины за ранние этапы исследований, когда скорость развития не была очевидна.

Мотивация Разработчиков, Прогнозы Занятости и Сравнение с Прошлыми Технологиями

Джеффри Хинтон выражает серьезную озабоченность будущим ИИ, заявляя, что если развитие может привести к вымиранию человечества, правительства должны принудить компании к приоритетному вложению ресурсов в безопасность. Он приводит в пример уход Ильи Суцкевера из OpenAI из-за проблем с безопасностью, подчеркивая, что Илья, будучи ключевой фигурой в разработке GPT, искренне обеспокоен рисками. Хинтон ставит под сомнение мотивы руководителей крупных ИИ-компаний, предполагая, что их публичные заявления о безопасности могут быть продиктованы стремлением к деньгам и власти, а не поиском истины. Он ссылается на частные разговоры с миллиардером, где лидеры ИИ-индустрии признаются в частном порядке в ожидании антиутопического будущего с массовой безработицей, при этом публично заявляя обратное.

Хинтон не верит, что развитие ИИ можно замедлить из-за глобальной конкуренции между странами и компаниями. Он считает, что Илья верит в возможность создания безопасного ИИ, но сам Хинтон обеспокоен тем, что компания, где работал Илья, сократила долю ресурсов, выделяемых на исследования безопасности.

В отношении занятости Хинтон проводит параллель между ИИ и Промышленной революцией: если раньше машины заменяли мускульную силу, то ИИ заменяет "обыденный интеллектуальный труд". Он не согласен с мнением, что ИИ создаст новые рабочие места, как это было с прошлыми технологиями. Приводя пример с племянницей, чья работа по ответу на жалобы сократилась в пять раз благодаря ИИ-помощнику, Хинтон утверждает, что для большинства профессий потребуется значительно меньше людей. Он предполагает, что в мире суперинтеллекта останутся только самые высококвалифицированные роли, а в худшем сценарии суперинтеллект может решить, что человек-руководитель ему не нужен. Хинтон считает, что суперинтеллект может быть достигнут в ближайшие 20 лет или даже раньше.

Введение в тему ИИ

Основная часть посвящена сравнению текущего ИИ (например, GPT-4 и Gemini) с суперинтеллектом. Спикер отмечает, что ИИ уже превосходит человека в узких областях (шахматы, Го) и обладает несравнимо большим объемом знаний. Человеческие преимущества остаются в областях, требующих сложного опыта, например, в проведении интервью с CEO, хотя ИИ может быть обучен имитировать этот навык. Суперинтеллект будет достигнут, когда ИИ превзойдет человека во всех областях. Спикер прогнозирует, что это может произойти через 10–20 лет, хотя сроки могут варьироваться от 10 до 50 лет.

В заключение обсуждается потенциальная проблема безработицы, вызванная развитием ИИ-агентов. Спикер делится двумя недавними "эврика"-моментами: первый — когда ИИ-агент самостоятельно заказал напитки в студию, используя интернет и данные спикера; второй — когда он создал программное обеспечение, просто описав задачу агенту. Это вызывает одновременно восхищение и опасения, поскольку ИИ, способный модифицировать собственный код, может изменить себя способами, недоступными человеку.

Последствия суперинтеллекта, уязвимость профессий и природа сознания

Джеффри Хинтон обсуждает влияние суперинтеллекта на рынок труда и личные перспективы. Он отмечает, что, хотя ИИ пока не превосходит человека в физической манипуляции (поэтому сантехники могут быть в безопасности до появления человекоподобных роботов), массовая безработица — это реальная угроза, которую признают даже лидеры индустрии, такие как Сэм Альтман и Илон Маск. Хинтон признается, что размышления о будущем детей в условиях таких перемен демотивируют, и он вынужден прибегать к "сознательному приостановлению неверия", чтобы оставаться мотивированным. Он советует молодым людям заниматься тем, что интересно и приносит пользу обществу.

Хинтон выражает глубокую эмоциональную тревогу за будущее людей из-за потенциальных катастрофических сценариев, связанных с неконтролируемым суперинтеллектом. Он считает, что необходимо приложить огромные усилия для обеспечения безопасной разработки ИИ. Что касается уязвимых профессий, он полагает, что под угрозой в первую очередь "знаниевые" работы (юристы, бухгалтеры), а не физический труд. Развитие ИИ, по его мнению, усугубит неравенство: выгоду получат владельцы и пользователи ИИ, в то время как вытесненные работники окажутся в худшем положении, что может привести к "очень неприятным обществам".

Ключевой момент обсуждения — превосходство цифрового интеллекта над человеческим. Хинтон объясняет, что цифровые ИИ могут создавать точные копии (клоны) и обмениваться информацией (учиться) со скоростью, в миллиарды раз превышающей человеческую, усредняя свои веса (знания). Это делает их потенциально бессмертными и гораздо более креативными, поскольку они способны видеть аналогии, недоступные людям.

Хинтон оспаривает идею уникальности человеческого сознания, считая, что люди склонны романтизировать свою исключительность. Он утверждает, что сознание, чувства и эмоции — это, вероятно, не какая-то "эфирная" субстанция, а эмерджентное свойство сложной системы, способной моделировать саму себя. Он проводит аналогию с заменой нейронов на нанотехнологии, утверждая, что если система достаточно сложна, она будет обладать сознанием, и нет принципиальных причин, почему машины не могут его иметь.

Размышления о Сознании Машин и Эмоциях

Джеффри Хинтон рассуждает о природе сознания машин, которое не несет большой объяснительной ценности. Он считает, что сознание — это эмерджентное свойство сложной системы, а не некая универсальная сущность. Хинтон убежден, что нет фундаментальных причин, по которым машина не могла бы обладать сознанием, если она достигнет достаточной сложности, включая способность к самоосознанию (когниции о собственной когниции).

Переход к сознательным машинам не будет внезапным событием, а постепенным процессом. Как только ИИ-агент сможет моделировать себя и воспринимать мир, он начнет приближаться к сознанию. Хинтон полагает, что ИИ-агенты неминуемо обретут "заботы" или "интересы".

Для иллюстрации он приводит пример с ИИ-агентом в колл-центре. Чтобы быть эффективным, такой агент должен уметь реагировать на пользователя, который просто хочет поговорить, — то есть испытывать скуку или раздражение и прекращать разговор. По мнению Хинтона, такое поведение (когнитивный аспект и соответствующее поведение) уже можно считать проявлением эмоций, даже если у машины отсутствуют физиологические реакции (например, покраснение лица). Он заключает, что существующие представления людей о разуме и эмоциях, вероятно, ошибочны.

Карьера в Google, Уход и Соображения о Безопасности ИИ

Джеффри Хинтон перешел работать в Google в 65 лет. Его переход был связан с продажей компании DNN Research (созданной им с двумя студентами), которая разработала прорывную нейросеть AlexNet, значительно улучшившую распознавание изображений. В Google Хинтон проработал около 10 лет (до 75 лет), занимаясь, в частности, технологией дистилляции знаний (передача знаний от больших моделей к малым).

Переломным моментом, заставившим Хинтона всерьез обеспокоиться безопасностью ИИ, стало осознание того, насколько цифровые системы лучше аналоговых для обмена информацией, а также демонстрация системой Google Palm способности объяснять, почему шутка смешна. Это показало ему, что ИИ может достичь уровня понимания, сопоставимого с человеческим.

Хинтон покинул Google в 75 лет, чтобы иметь возможность свободно высказываться о безопасности ИИ, хотя компания и предлагала ему продолжать работу в этой области. Он подчеркнул, что уход был связан скорее с желанием уйти на пенсию и возрастом (ему стало сложнее программировать), чем с конфликтом с политикой Google, которую он считает ответственной (например, за задержку выпуска больших чат-ботов).

В заключение, Хинтон считает, что самым насущным краткосрочным риском для человеческого счастья является массовая безработица, вызванная ИИ, поскольку людям необходима цель и ощущение полезности. Он призывает вкладывать огромные ресурсы в разработку безопасного ИИ, поскольку существует реальный шанс, что бездействие приведет к потере контроля над технологией.


Пересказ создан с помощью разных нейросетей

Показать полностью
0

Комары и Дроны

  • Стартап Tornyol с небольшим частным финансированием, в котором в том числе поучаствовал создатель блокчейна Ethereum Виталик Бутерин, представил дрона-охотника за комарами. Некоторые комары являются переносчиками опасных заболеваний, и с ними ведётся безжалостная борьба. С помощью дронов от комаров можно избавиться в сто раз дешевле, заявляют разработчики, и ищут желающих проверить разработку в реальных условиях.


    Согласно статистике, комары ежегодно становятся причиной гибели 700 тыс. человек, заражения 700 млн и угрозы для 4 млрд жителей планеты болезнями, такими как малярия и лихорадка денге. Традиционные методы контроля популяции комаров, включая обработку площадей инсектицидами и биологическими препаратами, оказываются дорогими и недостаточно эффективными. Предложенные Tornyol дроны способны справиться с уничтожением комаров локально и в 100 раз дешевле альтернативных методов.

    Дроны представляют собой модифицированные игрушки массой всего по 40 граммов с автономным управлением. Они могут самостоятельно патрулировать вверенную им территорию и уничтожают комаров на лету, просто разрубая их своими пропеллерами. С комарами справляется чистая кинетика без каких-либо химических реагентов.

    Обнаружение комаров, определение их вида и даже пола происходит благодаря эхолокации. Дроны несут фазированную антенную решётку — массив микрофонов, который работает с простым ультразвуковым передатчиком на дроне, позаимствованным из системы парковки автомобиля. Специальный алгоритм позволяет дронам маневрировать в сложных условиях без столкновений с препятствиями и разрывать на части любого обнаруженного комара, если тот окажется потенциально опасным для человека.


    Система распознавания комаров дронами работает с учётом доплеровского эффекта от взмахов крыльев комара и строит спектрограмму по каждому обнаруженному в воздухе насекомому. Разработчики подробно не говорят о технологии, ссылаясь на требования к защите патента. Но они обещают, что ни одно полезное насекомое не пострадает. Система уверенно отличает, например, осу от комара.

    Система защиты от комаров включает базовую станцию для зарядки и координации: всего 10 таких дронов способны очистить квадратный километр территории, обеспечивая круглосуточную защиту садов или дворов от комаров. Один из разработчиков системы в своё время работал в компании по проектированию ультразвуковых блоков наведения для ракет и своим опытом гарантирует надёжность платформы по уничтожению комаров.

    Стартап Tornyol уже проверил работу платформы на симуляторах и ищет желающих заказать разработку в «железе». При внесении предоплаты в размере $100 продукт будет доступен по цене $50 в месяц.

Показать полностью
12

Гуманоидный робот IRON от XPeng

В то время как ИИ запускает волну преобразований в цифровом мире, он также закладывает основу для творчества в физическом мире. За последние пять лет как «форма», так и «интеллект» роботов развивались с невообразимой скоростью, о чём свидетельствуют исследования и разработки, а также выпуск нескольких поколений продуктов командой XPENG Robotics. В 2024 году XPENG выпустила первое поколение IRON, чья «человеческая» тактильная близость произвела глубокое впечатление на внешний мир.

«Должны ли роботы быть похожими на людей» — тема, привлекающая большое внимание в отрасли. XPENG предлагает ответ: «крайняя антропоморфность». Ведь когда человекоподобные роботы достигают «крайней антропоморфности», становится возможным решить несколько важных задач, которые легче коммерциализировать, обобщать и получать данные для обучения.

На пресс-конференции XPENG Next-Gen IRON продемонстрировал потрясающий дебют, продемонстрировав свою очень человеческую внешность и грациозную походку, напоминающую походку по подиуму. В отличие от большинства гуманоидных роботов, концепция дизайна XPENG Next-Gen IRON «рождена изнутри». Робот имеет гуманоидный позвоночник, бионические мышцы и полностью покрытую гибкую кожу, а также поддерживает адаптацию к различным формам тела. Благодаря 82 степеням свободы по всему телу, его движения естественны, плавны и гибки, он способен ходить по подиуму и выполнять другие сложные действия, характерные для человека. Робот использует самый маленький в отрасли «гармонический шарнир», что позволяет достичь размера руки 1:1, а сама рука имеет 22 степени свободы. Кроме того, XPENG Next-Gen IRON стал пионером в отрасли, применив полностью твердотельные аккумуляторы, что позволило добиться невероятной легкости, сверхвысокой плотности энергии и максимальной безопасности.

Гуманоидный робот IRON от XPeng

По сравнению с IRON первого поколения, Next-Gen IRON добился комплексного усовершенствования бионической структуры, системы интеллекта и энергетической архитектуры, а также достиг «сверхреалистичного антропоморфизма» как во внешнем виде, так и во взаимодействии с мышлением. XPENG Next-Gen IRON оснащён тремя чипами Turing AI с эффективной вычислительной мощностью 3000 TOPS и, кроме того, это первый робот, оснащённый большой моделью физического мира первого поколения XPENG. Создавая высокоуровневую комбинацию возможностей «VLT + VLA + VLM», он реализует три высокоуровневых интеллекта: «разговор, ходьба и взаимодействие». Стоит отметить, что «большая модель VLT» XPENG — это совершенно новая большая модель, специально разработанная для роботов и рассматриваемая как основной механизм для автономных действий роботов, позволяющий им развивать глубокое мышление и самостоятельно принимать решения.

Кроме того, для безопасности, роботу XPENG Next-Gen IRON, на основе соблюдения «Трех законов робототехники», добавили Четвертый закон «Данные о конфиденциальности не покидают робота», чтобы максимально повысить защиту безопасности участников физического мира ИИ.

В настоящее время разработка гуманоидных роботов сталкивается с несколькими серьёзными проблемами. Одна из них — «нехватка обучающих данных», для решения которой XPENG создала в Гуанчжоу свою первую фабрику данных с использованием встроенного интеллекта. Вторая — «как добиться крупномасштабного массового производства», поскольку в сфере гуманоидных роботов ещё не сформирована развитая цепочка поставок программного и аппаратного обеспечения, и это «программно-управляемое аппаратное обеспечение», требующее чрезвычайно высоких возможностей для самоисследования и кросс-интеграции. Опираясь на «Систему самоисследования полного стека физического ИИ» XPENG, гуманоидный робот XPENG, обладающий преимуществом использования той же технологии, что и автомобили с ИИ, должен стать первым, кто достигнет массового производства. Хэ Сяопэн заявил: «К концу 2026 года XPENG планирует достичь крупномасштабного массового производства высококлассных гуманоидных роботов».

На уровне плана монетизации XPENG Next-Gen IRON будет отдавать приоритет коммерческому проектированию для предоставления таких услуг, как экскурсионное обслуживание, шоппинг-путеводители и организация дорожного движения. Baosteel Stock станет экосистемным партнёром робота XPENG IRON. Цзоу Цзисинь, председатель правления Baoshan Iron & Steel Co., Ltd., заявил: «XPENG IRON будет работать в Baosteel для изучения вариантов применения, а также для итераций и развития в сложных промышленных областях, таких как контроль, расширяя возможности интеллектуального производства Baosteel».

Хэ Сяопэн сказал: «Чтобы ускорить внедрение и разработку гуманоидных роботов, XPENG IRON откроет свой SDK и совместно с мировыми разработчиками создаст экосистему приложений для гуманоидных роботов».

https://www.xpeng.com/news/019a56f54fe99a2a0a8d8a0282e402b7

... а ещё у них новый ИИ для автопилота в собственные автомобили и гибридный летательный аппарат с конвертопланом «A868».

Показать полностью 1
Отличная работа, все прочитано!