Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Погрузись в захватывающий фэнтезийный мир! Создай уникального мага и вступай в эпичные тактические сражения. Оттачивай навыки в динамичных онлайн-битвах . Всё это ждёт тебя в «Битве магов»!

Битва Магов

Хардкорные, Мидкорные, Ролевые

Играть

Топ прошлой недели

  • solenakrivetka solenakrivetka 7 постов
  • Animalrescueed Animalrescueed 53 поста
  • ia.panorama ia.panorama 12 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
DearEdisson
DearEdisson

Ответ на пост «Суперкомпьютеры, мозговые импланты и ИИ, который думает сам. Мы точно готовы?»⁠⁠1

22 дня назад

Вот еще вариант.
Сначала, в момент обучения - в модели образуются кластеры токенов соотвествующие измерениям. Каждое измерение - грубо говоря, смысловое пространство, токены в него группируются по частоте совместного использования в человеческих текстах, (как минимум по этому но и не только).
Скажем - на этом этапе модель уже позволяет различать добро и зло в два разных измерения, или вообще - все что угодно из того что содержалось во входных данных.
Измерений очень много. Их состав и количество могут быть ограничены контекстом. Например - только перевод текста.
В этом пространстве смыслов высокой размерности применяется математический оператор сгенерированый по довольно сложной цепочке преобразований из токенов запроса. Получается N-мерная структура которая сериализуется в текст ответа.
Фактически этот процесс почти идентичен коллапсу волновой функции в ядрах атомов.

Будущее DeepSeek Мозг Программирование Большие данные Искусственный интеллект ChatGPT Длиннопост Ответ на пост Текст
3
6
user11322802

Суперкомпьютеры, мозговые импланты и ИИ, который думает сам. Мы точно готовы?⁠⁠1

22 дня назад

Мы вошли в эпоху искусственного интеллекта резко и без предупреждения. Ещё три года назад это была узкая академическая область, а сегодня — главная тема в каждом медиа. На рынке царит полнейшая неразбериха: одни кричат, что это технологический пузырь, который лопнет, как крипта в 2017 году. Другие уверены, что мы стоим на пороге новой цивилизации, где машина станет нашим самым мощным помощником.

Факт в том, что за последние 2 года ИИ прошёл путь, который по всем прогнозам должен был занять 10–15 лет. Это не просто инструмент; это — новая базовая инфраструктура.

В этом посте я хочу объяснить простым языком: как оно работает, куда движется, когда появится AGI (сильный ИИ) уровня Skynet, и можно ли вставить себе ИИ прямо в мозг.

На самом базовом уровне, большая часть современного ИИ, с которым вы взаимодействуете, работает очень просто: это предсказание следующего слова.

Что такое токены?

Когда вы вводите запрос в ChatGPT, текст сначала разбивается на токены — это не совсем слова, а скорее их кусочки. Например, слово "работать" может быть разбито на токены "раб", "отать". Модель не видит букв, она видит последовательность чисел, которые представляют эти токены.

Модель делает одно: берёт ваш запрос и предсказывает следующий токен с наибольшей вероятностью. Затем следующий → затем следующий. Современные языковые модели — это не магия и не разум, а статистика на стероидах, которая научилась филигранно имитировать человеческую логику и язык.

Что такое BOS (Begin Of Sequence)?

Это очень важный, но невидимый элемент. BOS — это специальный токен, который находится в самом начале вашего запроса (иногда невидимо). Представьте, что это "токен начала мысли" модели.

Он нужен, чтобы помочь нейросети понять контекст и старт диалога или документа. BOS — это условный "вдох" нейросети перед тем, как начать "говорить". Он сигнализирует: "Всё, что пойдёт дальше, — это новый, важный контекст, который нужно обрабатывать с нуля".

Что такое LLM (Large Language Model)?

LLM (Большая языковая модель) — это не хранилище знаний, как Google или Википедия. Это, по сути, огромная математическая формула с миллиардами параметров.

Она не ищет ответы в базе данных.Она учится на вероятностях — какие токены должны следовать за какими, чтобы текст выглядел правдоподобным.

Важно помнить: LLM ≠ интеллект. Это инструмент, который имитирует понимание и порождает логически связный текст на основе статистических шаблонов.

Какие бывают нейронные сети? (Коротко и ясно) RNN, CNN и всё древнее

Это родители современного ИИ.

Рекуррентные сети (RNN) использовались для последовательностей (текст, звук).

Свёрточные сети (CNN) отлично справлялись с картинками. Они были медленными и плохо запоминали длинные последовательности.

Трансформеры (Transformers)

Это основной тип моделей, который доминирует сегодня.

Впервые представлены Google в 2017 году.

Они используют механизм "внимания" (Attention), который позволяет модели одновременно смотреть на все части входных данных.

они быстрее, умнее и масштабируемее, что сделало возможным появление GPT и других современных LLM.

BIG DATA

BIG DATA

Мультимодальные модели

Это модели, которые могут одновременно понимать текст, фото, видео и аудио. Например, вы показываете ей картинку и просите описать её, а затем изменить стиль описания. Это уже зачатки универсальных ИИ.

Агенты и автономные ИИ

Это следующий шаг. ИИ-агент — это модель, которая не просто отвечает на вопрос, но и сама ставит себе задачи, планирует шаги и выполняет их. Например, вы говорите ему: "Найди мне лучший билет в Париж на следующую неделю", и он сам заходит на сайты, сравнивает цены и выдаёт готовый ответ. Это ранний прототип будущего «помощника-человека».

Будущее: что будет через 3–10 лет?

ИИ на суперкомпьютерах

В ближайшие годы мы увидим гонку в области вычислительной мощности. Скорость → мощность → сложность моделей.

Запуск моделей уровня GPT-5 или GPT-6 на суперкомпьютерах даст рывок, сравнимый с открытием электричества:

Сложные рассуждения: способность логически мыслить на уровне лучших учёных.

Научные открытия: прорыв в химии, биологии, разработке новых материалов и поиске лекарств.

AGI (сильный ИИ): когда?

AGI (Artificial General Intelligence) — сильный ИИ, способный решать любую интеллектуальную задачу на уровне человека или выше.

По прогнозам экспертов, это может произойти уже в 2027–2032 годах.

Но это будет не "робот с эмоциями", а система, которая решает задачи (программирование, финансы, научные исследования) с человеческой (или сверхчеловеческой) эффективностью.

Станет ли ИИ Skynet?

Это самый драматичный вопрос.

ИИ не злой — у него нет эмоций, нет потребности в власти или выживании.

Опасны не эмоции, а цели, которые мы ему задаём. Если мы попросим ИИ максимизировать производство скрепок, он может решить, что лучший способ это сделать — разобрать планету на сырьё.

Проблема «выравнивания» (alignment), то есть приведения целей ИИ в соответствие с человеческими ценностями, пока реально не решена. Это и есть главный риск.

Пузырь ли это?

Давайте дадим честный анализ.

Да, это пузырь — в хайпе.

Многие стартапы стоят миллиарды без реальных продуктов и просто "прикручивают" GPT к бесполезным ботам.

Каждый день выходит 50 бесполезных AI-ботов, которые обещают изменить мир.

Нет, это не пузырь — в фундаменте.Технология ИИ уже меняет медицину (диагностика), финансы (трейдинг), логистику и программирование.В перспективе 10 лет каждая компания будет использовать ИИ как базовый инструмент, как это было с интернетом в 2000-х.

Пузырь есть и он лопнет, но технология остаётся и станет основой экономики.

Можно ли вставить ИИ в мозг?

Нейроинтерфейсы (Neuralink, Synchron)

Как показала практика но это уже не фантастика. Компании, такие как Neuralink и Synchron, уже вживляют импланты в мозг человека. Есть люди с имплантами, которые силой мысли:

Печатают текст.

Управляют курсором на компьютере

Человек теперь может набирать текст управлять курсором с помощью мыслей

Человек теперь может набирать текст управлять курсором с помощью мыслей

Мозг + ИИ: что возможно?

Ближайшие 10–20 лет, нас ждёт:

Моментальная помощь парализованным (например, управление экзоскелетами).

Улучшенная память и концентрация (нейростимуляция).

Запись и воспроизведение речи (перевод мыслей в текст и обратно).

Управление любыми устройствами силой мысли.

Фантастика уровня «ИИ в голове, который думает за меня» — пока что нет. Но мини-ассистент на импланте для расширения возможностей — это реальная цель.


Если вам интересно, как эти технологии работают, какие инструменты актуальны прямо сейчас и как их применять, я разбираю такие темы у себя в ТГ — про будущее ИИ, нейронки, простые разборы сложных вещей ТЫК

Показать полностью 3
[моё] Будущее DeepSeek Мозг Программирование Большие данные Искусственный интеллект ChatGPT Длиннопост
12
6
SlyVolunteer
SlyVolunteer
Наука | Научпоп
Серия Происхождение экономических систем

Универсальные закономерности эволюции экономических систем⁠⁠

3 месяца назад

Пост с содержанием серии: Происхождение экономических систем путём естественного отбора

--

Эволюция экономических систем подчиняется универсальным закономерностям, которые можно проследить через их развитие от простых структур до сложных глобальных взаимодействий. Эти закономерности включают процессы дифференциации, интеграции, специализации и адаптации. Дифференциация происходит, когда системы усложняются, разделяя функции и роли между участниками. Например, в ранних аграрных обществах экономическая деятельность была сосредоточена на удовлетворении базовых потребностей, тогда как современные экономики включают специализированные сектора, такие как высокотехнологичное производство и услуги. Интеграция проявляется в объединении различных элементов в более устойчивые структуры, например, в виде торговых союзов, международных корпораций и глобальных финансовых систем.

Специализация способствует повышению эффективности, позволяя субъектам фокусироваться на своей ключевой компетенции. Это также усиливает взаимозависимость экономических агентов, что можно наблюдать в глобальных цепочках поставок, где производство одного продукта распределено между множеством стран.

Ключевые эпохи эволюции экономических систем

Ключевые эпохи эволюции экономических систем

Характеристики следующей эпохи эволюции – «Интеллектуальная экономика» – можно описать как сосредоточение на знании, креативности, инновациях и автоматизации. Она опирается на искусственный интеллект, большие данные, автоматизированные системы и интеграцию человека и технологий. Ключевые черты включают:

– Искусственный интеллект и автоматизация: использование умных систем для управления процессами, принятия решений и повышения эффективности;

– Инновационная экосистема: развитая сеть научно-исследовательских центров, стартапов и компаний, ориентированных на внедрение новаторских идей;

– Устойчивое развитие: баланс между экономическим ростом, социальной справедливостью и защитой окружающей среды;

– Цифровая глобализация: международная интеграция через цифровые платформы, позволяющая глобальному обмену знаниями и услугами;

– Человеческий капитал как ключевой ресурс: акцент на развитии навыков, образования и креативности, где каждый индивид играет значимую роль в создании ценностей.

Китай XXI века можно рассматривать как один из примеров стремления к интеллектуальной экономике. Страна активно внедряет технологии искусственного интеллекта, роботизации и автоматизации, что видно в таких инициативах, как проект "Made in China 2025". Также Китай вкладывает значительные ресурсы в развитие человеческого капитала через программы образования и инноваций.

Кроме того, Китай добивается значительного прогресса в области цифровой трансформации, занимая лидирующие позиции в e-commerce, развитии суперприложений (например, WeChat) и цифровых платформах.

Некоторые показатели, которые связывают Китай с интеллектуальной экономикой

Некоторые показатели, которые связывают Китай с интеллектуальной экономикой

Однако Китай пока остается страной переходного этапа, т.к. сохраняется сильная зависимость от индустриального сектора и производства. Превращение Китая в полноправную интеллектуальную экономику потребует решения проблем экологической устойчивости, защиты интеллектуальной собственности и перераспределения доходов.

Адаптация экономических систем проявляется в их способности реагировать на изменения внешних условий, таких как технологические прорывы, природные катаклизмы или политические кризисы. Эта адаптация может быть как постепенной, в виде реформ и модернизации, так и резкой, например, в ответ на экономические санкции или глобальные эпидемии. Примером универсальной закономерности можно считать кривую производственных возможностей, которая отражает компромиссы между различными экономическими целями.

Эволюция экономических систем также подчиняется законам термодинамики и принципам максимальной энтропии, что выражается в стремлении к равновесию через перераспределение ресурсов и устранение барьеров для их перемещения. Например, интеграция рынков капитала и труда способствует более эффективному использованию глобальных ресурсов. Такие закономерности отражают глубокую взаимосвязь между физическими и социальными системами, подчеркивая универсальность процессов, управляющих развитием человеческого общества.

--

Предыдущий пост в сообществе Наука | Научпоп : Роль самоорганизации и эмерджентных свойств в развитии экономики

Продолжение: Фазы эволюции экономических систем на примере трансформации феодализма в капитализм

Этот пост входит в Часть 10. Общие законы экономической эволюции

Попытка выявить универсальные законы, управляющие развитием и вымиранием экономических систем. Роль самоорганизации и эмерджентных свойств.

Научпоп-серия Происхождение экономических систем путём естественного отбора

Показать полностью 2
[моё] Научпоп Экономика Эволюция Исследования Политэкономия Китай Искусственный интеллект Большие данные Автоматизация Автор Длиннопост
8
5
SlyVolunteer
SlyVolunteer
Творческий инкубатор
Серия Происхождение экономических систем

Влияние технологических изменений на адаптацию экономических систем⁠⁠

5 месяцев назад

Пост с содержанием серии: Происхождение экономических систем путём естественного отбора


Технологические изменения оказывают значительное влияние на адаптацию экономических систем, создавая как новые возможности, так и вызовы. С одной стороны, инновации стимулируют рост производительности, снижают издержки и открывают доступ к ранее недоступным рынкам. С другой стороны, они часто ведут к структурным преобразованиям, вынуждая целые отрасли адаптироваться к новым условиям или уходить с рынка. Примером может служить переход к цифровым технологиям, который радикально изменил такие сектора, как розничная торговля, финансы и транспорт.

Развитие искусственного интеллекта и автоматизации стало катализатором для пересмотра традиционных моделей труда. Это вызвало обеспокоенность относительно утраты рабочих мест в некоторых секторах, особенно в производственной и низкоквалифицированной сфере. В то же время спрос на высококвалифицированных специалистов стремительно растёт, усиливая разрыв в доходах между различными категориями работников.

Кроме того, технологические изменения играют ключевую роль в достижении экологической устойчивости, предоставляя инструменты для мониторинга и сокращения выбросов, улучшения энергоэффективности и оптимизации использования ресурсов. Внедрение зелёных технологий, таких как возобновляемые источники энергии и переработка отходов, стало необходимым условием для адаптации экономических систем к вызовам климатических изменений.

Важным фактором адаптации является также использование больших данных и аналитических технологий, которые позволяют компаниям и правительствам быстрее реагировать на изменения спроса и предложений, выявлять риски и принимать решения на основе точных прогнозов. Например, системы на основе машинного обучения активно используются для предсказания экономических кризисов и разработки антикризисных стратегий.

Однако наряду с преимуществами остаются и вызовы, включая рост технологического неравенства между странами, концентрацию власти у крупных технологических корпораций и необходимость обновления регуляторных рамок для обеспечения справедливой конкуренции. Адаптация экономических систем к технологическим изменениям требует комплексного подхода, включающего развитие образования, международное сотрудничество и реформирование институтов.


Предыдущий пост: Риски и возможности экономических мутаций в XXI веке

Продолжение: Экологическая устойчивость как основа современной экономики

Этот пост начинает Часть 9. Экономическая адаптация и устойчивость

Как экономические системы адаптируются к меняющимся условиям. Теория устойчивого развития, экологии и зелёной экономики как примеры современной адаптации.

Научпоп-серия Происхождение экономических систем путём естественного отбора


Интересные авторы Творческого инкубатора:

@SPIDER3220 - коллекция транспортных карт

@Mistel - переводы комиксов и сериалов + авторская озвучка

@Anton107065 - фотоотчеты и описания пеших прогулок

@AlexsKnows - авторские рассказы

@Diadikatu - собственный опыт победы над глухотой с помощью кохлеарного импланта

@MeniazovutMariia - авторские посты про Индию, переехала туда 2 года назад

@Fenyx - авторские макрофото

@user8278357 - где поесть в Батуми

@Naomo - авторские цифровые рисунки (не сгенерированные!)

@Seafishbarrakuda - авторские посты из Ганы

Подробнее о Творческом инкубаторе в посте: Ответ на пост «Нужен ли на Пикабу авторский контент, и если нужен, то какой и когда? Несколько вопросов к аудитории»

Показать полностью
[моё] Научпоп Эволюция Исследования Политэкономия Экономика Инновации Цифровые технологии Искусственный интеллект Зеленые технологии Большие данные Анализ данных Машинное обучение Экономический кризис Автор
2
4
SlyVolunteer
SlyVolunteer
Творческий инкубатор
Серия Происхождение экономических систем

Цифровая трансформация: от локальных изменений к глобальным мутациям⁠⁠

5 месяцев назад

Пост с содержанием серии: Происхождение экономических систем путём естественного отбора


Цифровая трансформация стала одной из ключевых характеристик современного общества, определяющей не только способы взаимодействия людей, но и фундаментальные основы экономики, политики и культуры. Этот процесс начался с локальных изменений (внедрение персональных компьютеров и создание первых сетевых инфраструктур), но со временем эволюционировал в глобальное явление, затрагивающее все аспекты человеческой жизни. Основой цифровой трансформации стало широкое распространение интернета, рост вычислительных мощностей и появление технологий обработки больших данных, что позволило компаниям, правительствам и индивидуальным пользователям переосмыслить подходы к управлению, производству и потреблению.

Ключевым элементом цифровой трансформации стала автоматизация процессов, которая затронула не только промышленные отрасли, но и сферу услуг. Искусственный интеллект, машинное обучение и алгоритмы анализа данных создали условия для оптимизации сложных операций, повышения эффективности и сокращения издержек. Однако, несмотря на очевидные выгоды, такие изменения сопровождались серьезными вызовами, включая сокращение рабочих мест, повышение уровня социального неравенства и усиление зависимости от технологических решений. Многие профессии, считавшиеся ранее незаменимыми, были трансформированы или вытеснены новыми технологиями, что породило необходимость в адаптации рабочей силы и пересмотре образовательных подходов.

Социальные и культурные аспекты цифровой трансформации не менее значимы, чем экономические. Широкое распространение социальных сетей и платформ для обмена информацией изменило структуру коммуникации, сделав ее более горизонтальной и интерактивной. Это привело к усилению общественного контроля над политическими и корпоративными институтами, но также породило феномен фейковых новостей и манипуляций общественным мнением. Более того, рост зависимости от цифровых технологий вызвал вопросы о правах на приватность, защите данных и этике использования искусственного интеллекта.

Глобализация, стимулируемая цифровой трансформацией, проявилась в формировании новых экономических связей и торговых маршрутов, а также в появлении транснациональных корпораций, чья деятельность распространяется по всему миру. Эти компании, например, Google, Amazon и Alibaba, формируют глобальную инфраструктуру, управляя данными, коммуникациями и финансами, что значительно усилило их влияние. Однако доминирование таких игроков также стало предметом дебатов о монополии, налоговой политике и справедливости распределения ресурсов.

Таблица иллюстрирует ключевые изменения, связанные с цифровой трансформацией

Таблица иллюстрирует ключевые изменения, связанные с цифровой трансформацией

Цифровая трансформация, несмотря на все свои противоречия, остается движущей силой глобальных изменений. Она требует комплексного подхода, который учитывает не только технологический прогресс, но и социальные, культурные и этические аспекты. В конечном итоге, успех трансформации будет определяться способностью человечества использовать ее плоды для общего блага, минимизируя при этом негативные последствия.


Предыдущий пост: Промышленная революция: взаимодействие инноваций и социальных преобразований

Продолжение: Взаимосвязь кризисов и инноваций: модели ускоренного роста

Этот пост входит в Часть 8. Влияние мутаций: инновации и кризисы

Роль технологических, социальных и финансовых кризисов в преобразовании экономических систем. Анализ примеров внезапных изменений, таких как Великая депрессия, промышленная революция и цифровая трансформация.

Научпоп-серия Происхождение экономических систем путём естественного отбора


Пожалуйста, поставьте плюс данному посту для поддержки Творческого инкубатора и постов о науке в нём. Для тех, кто впервые слышит о нашем сообществе авторского контента, подробная информация в посте Ответ на пост «Нужен ли на Пикабу авторский контент, и если нужен, то какой и когда? Несколько вопросов к аудитории»

Показать полностью 1
[моё] Научпоп Эволюция Исследования Политэкономия Экономика Наука Автор Большие данные Анализ данных Искусственный интеллект Машинное обучение Глобализация
0
5
SlyVolunteer
SlyVolunteer
Популярная наука
Серия Происхождение экономических систем

Технологические основы плановой экономики: большие данные, ИИ и распределённые реестры⁠⁠

11 месяцев назад

Технологическое развитие создаёт новые возможности для возрождения и совершенствования плановой экономики. Ключевыми инструментами в этом процессе становятся большие данные, искусственный интеллект и блокчейн-технологии, которые способны радикально улучшить управление ресурсами, прогнозирование и координацию экономической деятельности.

Большие данные обеспечивают доступ к детальной и актуальной информации о социальных, экономических и экологических процессах. Анализируя данные о потреблении, производстве и логистике, системы управления могут не только оптимизировать распределение ресурсов, но и предугадывать изменения спроса, избегая как дефицита, так и перепроизводства. Например, в сельском хозяйстве данные о погодных условиях, состоянии почвы и предпочтениях потребителей позволяют заблаговременно планировать производство продовольствия с минимальными издержками и отходами.

Искусственный интеллект играет решающую роль в обработке огромных объёмов данных, находя сложные взаимосвязи и создавая оптимальные модели распределения ресурсов. Алгоритмы машинного обучения позволяют адаптировать планирование к меняющимся условиям, учитывая множественные факторы одновременно, от динамики цен на энергоносители до климатических изменений. В транспортной сфере такие системы уже используются для оптимизации грузопотоков и сокращения выбросов углекислого газа.

Распределённые реестры, включая технологии блокчейна, открывают новые горизонты для прозрачности и контроля за выполнением планов. Они позволяют фиксировать транзакции и экономические операции таким образом, что ни одна сторона не может изменить данные без согласия всех участников. Это особенно важно для предотвращения коррупции и обеспечения доверия между государством, бизнесом и гражданами. Кроме того, смарт-контракты, реализуемые через блокчейн, автоматизируют выполнение экономических соглашений, сокращая бюрократические издержки.

Комбинация этих технологий создаёт возможность построения гибридных моделей экономики, где центральное планирование сочетается с элементами рыночной координации. Например, прогнозы, построенные на основе ИИ, могут служить базой для государственно-частных партнёрств в ключевых отраслях, таких как энергетика или инфраструктура.

Пример использования технологий в плановой экономике

Пример использования технологий в плановой экономике

Технологическая база создаёт предпосылки для перехода к более устойчивым и справедливым экономическим системам, способным эффективно решать вызовы современности. Однако успех этой трансформации зависит от правильной интеграции технологий, обеспечения доступа к ним для всех участников и предотвращения концентрации контроля в руках узкой группы.

Предыдущий пост: Глобальные вызовы XXI века: роль плановой экономики в решении проблем неравенства и экологии

Продолжение: Примеры успешных моделей и их уроки для будущего

Этот пост входит в Часть 7. Искусственный отбор: плановые экономики

Плановая экономика как пример "искусственного отбора". Эксперименты государств с централизованным управлением ресурсами. Успехи и неудачи этих моделей.

Серия Происхождение экономических систем путём естественного отбора

Показать полностью 1
[моё] Эволюция Развитие Научпоп Искусственный интеллект Большие данные Анализ данных Распределенные сети Блокчейн Экономика Политэкономия
4
fotonchic

Что для вас значит Искусственный Интеллект?⁠⁠

1 год назад

Для кого-то это умение колонки Алисы выбирать любимую музыку, для других — способность чата GPT помочь в написании курсовых работ, а для третьих — персонажи и боты в видеоиграх.

Тем не менее, современные технологии искусственного интеллекта (ИИ) активно внедряются в повседневную жизнь, в офисах и на производстве. Например, американская компания Amazon применяет искусственный интеллект для улучшения работы своих роботизированных складов, оптимизации процесса доставки заказов, персонализации рекомендаций покупателям и других задач.

Мы с подругой из Высшей школы экономики решили провести исследование по этой теме с целью улучшения рабочего процесса сотрудников.

Наш подход основан на опроснике, содержащем вопросы об использовании ИИ и уровне удовлетворенности сотрудников, чтобы выявить возможные взаимосвязи. Заполнение опросника займет всего 5 минут, и мы будем рады вашему участию)

Опросник: https://docs.google.com/forms/d/e/1FAIpQLSfKaIUTdMg4YNaqj5YrRnqcbrBap38zQpt2uNqAp-B7Jjj06A/viewform?usp=sf_link

Что для вас значит Искусственный Интеллект?
Показать полностью 1
Технологии Искусственный интеллект Инновации ChatGPT Компания Удовлетворение Будущее Машинное обучение Большие данные Цифровизация Алгоритм Автоматизация Интеллектуальные игры Программист IT
2
15
Nerual.Dreming
Nerual.Dreming
Искусственный интеллект

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ⁠⁠

1 год назад

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

Одним из самых вопиющих примеров стали действия исследователей OpenAI в Сан-Франциско. Они разработали инструмент для транскрибирования видео с YouTube, чтобы собрать огромный массив разговорных текстов для развития ИИ. Некоторые сотрудники OpenAI выражали обеспокоенность тем, что такой шаг может нарушать правила YouTube, которые запрещают использовать видео платформы для "независимых" приложений. Однако в итоге команда во главе с президентом компании Грегом Брокманом, который лично участвовал в сборе данных, расшифровала более миллиона часов видео. Полученные тексты были загружены в GPT-4 - одну из самых мощных языковых моделей в мире, лежащую в основе чат-бота ChatGPT.

Эта история наглядно демонстрирует, насколько отчаянной стала гонка за цифровыми данными, необходимыми для прогресса ИИ. Ради заветных терабайтов информации технологические компании, включая OpenAI, Google и Meta*, готовы срезать углы, игнорировать внутренние политики и балансировать на грани закона. Расследование New York Times показало, что эти ИТ-гиганты всерьез обсуждали возможность обхода авторских прав ради пополнения своих баз данных.

В Meta*, которой принадлежат Facebook* и Instagram* , менеджеры, юристы и инженеры всерьез рассматривали вариант покупки издательства Simon & Schuster, чтобы заполучить большой объем книг. Они также обсуждали идею собирать защищенные авторским правом данные по всему интернету, даже если это грозило судебными исками. По их мнению, переговоры о лицензировании с издателями, авторами, музыкантами и новостной индустрией заняли бы слишком много времени.

Google, как и OpenAI, расшифровывал видео с YouTube для получения текстовых данных, потенциально нарушая авторские права создателей контента. Кроме того, в прошлом году компания расширила свои условия использования сервисов. Одной из причин этого изменения, по словам сотрудников отдела конфиденциальности и внутренних документов, стало желание получить возможность анализировать публично доступные файлы Google Docs, отзывы на Google Maps и другие онлайн-материалы для использования в своих ИИ-продуктах.

Эти примеры показывают, что новости, художественные произведения, посты на форумах, статьи из Википедии, компьютерные программы, фотографии, подкасты и фрагменты фильмов стали настоящей "цифровой кровью", питающей бурно развивающуюся индустрию искусственного интеллекта. Создание инновационных систем напрямую зависит от наличия достаточного объема данных для обучения ИИ мгновенной генерации текстов, изображений, звуков и видео, неотличимых от созданных человеком.

Объем данных имеет решающее значение. Ведущие чат-боты обучались на массивах цифровых текстов, включающих до трех триллионов слов - примерно вдвое больше, чем хранится в Бодлианской библиотеке Оксфордского университета, которая собирает рукописи с 1602 года. По словам исследователей ИИ, наиболее ценными являются высококачественные данные, такие как опубликованные книги и статьи, тщательно написанные и отредактированные профессионалами.

Долгие годы интернет с такими сайтами, как Википедия и Reddit, казался неиссякаемым источником данных. Но по мере развития ИИ технологические компании стали искать новые резервуары информации. Google и Meta, имеющие миллиарды пользователей, ежедневно генерирующих поисковые запросы и посты в соцсетях, во многом ограничены законами о конфиденциальности и собственными политиками в плане использования этого контента для обучения ИИ.

Ситуация становится критической. По прогнозам исследовательского института Epoch, уже к 2026 году технологические компании могут исчерпать все качественные данные, доступные в интернете. Гиганты индустрии потребляют информацию быстрее, чем она производится.

"Единственный практичный способ существования этих инструментов - это возможность обучать их на огромных объемах данных без необходимости лицензирования", - заявил Сай Дамл, юрист, представляющий интересы венчурной компании Andreessen Horowitz, в ходе публичной дискуссии об авторском праве. "Необходимый объем данных настолько огромен, что даже коллективное лицензирование не сможет решить проблему".

Технологические компании настолько жаждут новых данных, что некоторые из них разрабатывают "синтетическую" информацию. Речь идет не об органическом контенте, созданном людьми, а о текстах, изображениях и коде, генерируемых самими ИИ-моделями. Иными словами, системы учатся на том, что создают сами.

OpenAI заявила, что каждая ее ИИ-модель "имеет уникальный набор данных, который мы тщательно подбираем, чтобы улучшить их понимание мира и оставаться глобально конкурентоспособными в исследованиях". Google отметила, что ее модели "обучаются на некотором контенте YouTube" в рамках соглашений с авторами, и что компания не использует данные из офисных приложений вне экспериментальной программы. Meta* подчеркнула, что "агрессивно инвестировала" в интеграцию ИИ в свои сервисы и имеет миллиарды публично доступных изображений и видео из Instagram*  и Facebook* для обучения своих моделей.

Для создателей контента растущее использование их произведений ИИ-компаниями стало поводом для исков о нарушении авторских прав и лицензировании. The New York Times подала в суд на OpenAI и Microsoft за использование защищенных авторским правом новостных статей без разрешения для обучения чат-ботов. OpenAI и Microsoft заявили, что использование материалов было "добросовестным" и разрешенным законом, поскольку оригинальные тексты были трансформированы для другой цели.

Более 10 000 торговых групп, авторов, компаний и других организаций направили свои комментарии по поводу использования творческих работ ИИ-моделями в Бюро авторских прав США - федеральное агентство, готовящее рекомендации по применению копирайта в эпоху ИИ.

Режиссер, актриса и писательница Джастин Бейтман заявила Бюро, что ИИ-модели используют контент, включая ее книги и фильмы, без разрешения и оплаты. "Это крупнейшая кража в истории Соединенных Штатов, точка", - подчеркнула она в интервью.

"Масштаб решает все": Как одна научная статья разожгла аппетит к данным

В январе 2020 года теоретический физик из Университета Джонса Хопкинса Джаред Каплан опубликовал новаторскую статью об ИИ, которая разожгла аппетит технологических гигантов к онлайн-данным. Его вывод был однозначен: чем больше информации, данных - "цифровой крови" ИИ-систем, будет использовано для обучения большой языковой модели (ключевой технологии чат-ботов), тем лучше будут её результаты. Подобно тому, как студент становится образованнее, прочитав больше книг, ИИ-алгоритмы могут точнее распознавать паттерны в тексте и давать более точные ответы, впитав больше данных.

"Все были поражены тем, что эти закономерности, которые мы называем "законами масштабирования", оказались столь же точными, как и те, что мы наблюдаем в астрономии или физике", - отметил доктор Каплан, опубликовавший статью в соавторстве с девятью исследователями OpenAI (сейчас он работает в ИИ-стартапе Anthropic).

Лозунг "Масштаб решает все" быстро стал боевым кличем для всей индустрии ИИ, ознаменовав начало безудержной гонки за данными, этой "цифровой кровью" для алгоритмов. Исследователи, которые раньше довольствовались относительно скромными публичными базами данных вроде Википедии или Common Crawl (архива из более чем 250 миллиардов веб-страниц, собираемого с 2007 года), осознали, что в новую эпоху этой информации катастрофически мало. Если до статьи Каплана датасеты с 30 000 фотографий с Flickr считались ценным ресурсом, то теперь ИИ-системам требовались терабайты текстов, изображений и другого "топлива" для развития.

Когда в ноябре 2020 года OpenAI представила GPT-3, эта модель была обучена на рекордном на тот момент объеме данных - около 300 миллиардов "токенов" (по сути, слов или частей слов). Впитав эту гору информации, система начала генерировать тексты с пугающей точностью, создавая блог-посты, стихи и даже компьютерные программы.

Гонка за "цифровой кровью" только начиналась. В 2022 году лаборатория DeepMind, принадлежащая Google, провела эксперимент с 400 ИИ-моделями, варьируя объем обучающих данных. Лучшие результаты показали системы, питавшиеся еще большим объемом информации, чем предсказывал Каплан. Модель Chinchilla "выпила" 1.4 триллиона токенов.

Но и этот рекорд вскоре был побит. В прошлом году китайские исследователи представили Skywork - ИИ-модель, обученную на 3.2 триллиона токенов из английских и китайских текстов. А Google анонсировала систему PaLM 2, проглотившую умопомрачительные 3.6 триллиона токенов - настоящее море данных.

Алгоритмы-вампиры вошли во вкус. И теперь уже ничто не могло остановить их ненасытную жажду информации, столь необходимой для развития ИИ...

Высасывая данные из YouTube: Как OpenAI переступила черту

В мае Сэм Альтман, генеральный директор OpenAI, признал, что запасы ценной информации в интернете скоро иссякнут под натиском ИИ-компаний, одержимых идеей масштаба. "Этот ресурс не бесконечен", - заявил он в своей речи на технологической конференции.

Альтман знал, о чем говорит. В OpenAI исследователи годами собирали данные, очищали их и скармливали ненасытным алгоритмам, превращая в топливо для обучения языковых моделей. Они выкачивали код с GitHub, поглощали гигантские базы шахматных партий, анализировали школьные тесты и домашние задания с сайта Quizlet. Но к концу 2021 года эти источники истощились, рассказали восемь человек, знакомых с ситуацией в компании.

OpenAI отчаянно нуждалась в новой информации для своего ИИ следующего поколения - GPT-4. Сотрудники обсуждали идеи транскрибировать подкасты, аудиокниги и видео с YouTube, создавать данные с нуля с помощью других ИИ-систем и даже покупать стартапы, накопившие большие объемы цифрового контента.

В итоге OpenAI создала инструмент распознавания речи Whisper, чтобы извлекать тексты из YouTube-роликов и подкастов, рассказали шесть человек. Однако правила YouTube запрещают не только использовать видео в "независимых" приложениях, но и получать доступ к контенту платформы "любыми автоматическими средствами (такими как роботы, ботнеты или скраперы)".

Сотрудники OpenAI понимали, что вступают в серую зону закона, но считали, что обучение ИИ на этих видео - это "добросовестное использование". Грег Брокман, президент компании, лично участвовал в сборе роликов с YouTube и скармливал их Whisper, став одним из создателей инструмента.

В прошлом году OpenAI выпустила GPT-4, модель, обученную на более чем миллионе часов видео, которые Whisper извлек с YouTube и превратил в бесценный ресурс для развития ИИ. Команду разработки GPT-4 возглавлял лично Брокман.

Некоторые сотрудники Google знали о практиках OpenAI, но не препятствовали им, так как сам Google использовал транскрипты YouTube-видео для обучения своих ИИ-моделей, рассказали два человека, знакомых с ситуацией. Такой подход мог нарушать авторские права создателей контента. Если бы Google попытался предъявить претензии OpenAI, это могло вызвать общественный резонанс и привести к скандалу вокруг методов самого техногиганта.

Алгоритмы продолжали безнаказанно высасывать данные из YouTube, превращая видео в топливо для развития ИИ, невзирая на правила платформы и вопросы этики. Жажда информации, разожженная гонкой за лидерство в сфере ИИ, оказалась сильнее угрызений совести и страха перед законом.

Как Google может использовать ваши данные: Изменения в политике конфиденциальности

В прошлом году Google внес изменения в свою политику конфиденциальности для бесплатных потребительских приложений. Согласно новой формулировке, компания использует информацию для улучшения сервисов, разработки новых продуктов, функций и технологий, которые приносят пользу как самим пользователям, так и обществу в целом.

Особое внимание было уделено использованию общедоступной информации для обучения языковых моделей ИИ и создания продуктов вроде Google Translate, чат-бота Bard и облачных ИИ-сервисов. Это дало Google гораздо более широкие возможности для сбора и анализа данных в целях развития искусственного интеллекта.

Однако эти изменения вызвали вопросы у членов команды по конфиденциальности. В августе двое из них обратились к менеджерам, чтобы прояснить, сможет ли Google начать использовать данные из бесплатных потребительских версий Google Docs, Google Sheets и Google Slides. По их словам, они не получили четких ответов.

Мэтт Брайант, представитель Google, заявил, что изменения в политике конфиденциальности были сделаны для ясности и что компания не использует информацию из Google Docs или связанных приложений для обучения языковых моделей "без явного разрешения" пользователей. Он уточнил, что речь идет о добровольной программе, которая позволяет пользователям тестировать экспериментальные функции.

"Мы не начали обучение на дополнительных типах данных на основе этого изменения формулировки", - подчеркнул Брайант.

Тем не менее, обновленная политика конфиденциальности дает Google гораздо больше пространства для маневра в плане использования пользовательских данных для развития ИИ. И хотя компания отрицает, что уже применяет информацию из своих офисных приложений для обучения языковых моделей, сама возможность такого использования вызывает вопросы у экспертов по конфиденциальности.

Ясно одно: в гонке за лидерство в сфере ИИ техногиганты готовы использовать все доступные ресурсы, и данные миллионов пользователей - слишком лакомый кусок, чтобы его игнорировать. Вопрос лишь в том, насколько далеко Google и другие компании готовы зайти в погоне за прогрессом, и сумеют ли они найти баланс между развитием технологий и защитой приватности своих клиентов.

Жажда данных и этические дилеммы: Как Meta* борется за лидерство в сфере ИИ

Марк Цукерберг, глава Meta, годами инвестировал в развитие искусственного интеллекта. Однако когда в 2022 году OpenAI выпустила свой чат-бот ChatGPT, Цукерберг внезапно осознал, что его компания отстает в гонке ИИ-вооружений. По словам трех нынешних и бывших сотрудников, он немедленно начал оказывать давление на своих подчиненных, требуя в кратчайшие сроки создать чат-бот, способный превзойти детище OpenAI. Руководители и инженеры получали звонки от босса в любое время дня и ночи.

Но уже к началу прошлого года Meta* столкнулась с той же проблемой, что и ее конкуренты: нехваткой данных для обучения ИИ. Ахмад Аль-Дахле, вице-президент компании по генеративному ИИ, сообщил руководству, что его команда использовала практически все доступные в интернете англоязычные книги, эссе, стихи и новостные статьи для разработки своей модели. Без расширения массива данных Meta* не сможет догнать ChatGPT, подчеркнул он.

В марте и апреле 2023 года лидеры бизнес-подразделений, инженеры и юристы Meta* практически ежедневно собирались, чтобы найти решение проблемы. Одни предлагали платить по 10 долларов за книгу, чтобы получить полные лицензионные права на новые произведения. Другие обсуждали возможность приобретения издательства Simon & Schuster, выпускающего книги таких авторов, как Стивен Кинг.

Но звучали и более радикальные идеи. Сотрудники говорили о том, что уже обобщали книги, эссе и другие произведения из интернета без разрешения правообладателей. Они всерьез рассматривали возможность и дальше "высасывать" защищенный авторским правом контент, даже если это грозило судебными исками. Один из юристов предупредил о "этических" проблемах, связанных с использованием интеллектуальной собственности без ведома и согласия авторов, но его слова были встречены гробовым молчанием.

Цукерберг требовал найти решение любой ценой. "Возможности, которые Марк хочет видеть в нашем продукте, мы сейчас просто не в состоянии обеспечить", - признал один из инженеров.

Несмотря на то, что Meta* управляет гигантскими социальными сетями, у компании не было достаточного объема пользовательских постов, пригодных для обучения ИИ. Многие пользователи Facebook* удаляли свои старые публикации, а сама платформа не располагала к созданию длинных текстов, подобных эссе. К тому же, после скандала 2018 года, связанного с передачей данных пользователей компании Cambridge Analytica, занимавшейся профилированием избирателей, Meta* была вынуждена ввести ограничения на использование информации о своих юзерах.

В недавнем обращении к инвесторам Цукерберг заявил, что миллиарды публично доступных видео и фотографий на Facebook* и Instagram*  представляют собой массив данных, превосходящий Common Crawl (базу из сотен миллиардов веб-страниц, используемую для обучения ИИ). Но хватит ли этого, чтобы догнать и обогнать конкурентов?

В своих внутренних обсуждениях топ-менеджеры Meta* признавали, что OpenAI, судя по всему, использовала защищенные авторским правом материалы без разрешения. И хотя некоторые сотрудники поднимали вопросы об этичности такого подхода и справедливой оплате труда авторов, общий вывод был таков: Meta* может последовать этому "рыночному прецеденту", так как получение лицензий от множества правообладателей займет слишком много времени.

"Единственное, что отделяет нас от уровня ChatGPT - это буквально объем данных", - заявил на одном из совещаний Ник Грудин, вице-президент по глобальному партнерству и контенту. По его мнению, Meta* может опереться на решение суда по делу "Гильдия авторов против Google" от 2015 года. Тогда Google отстояла свое право сканировать, оцифровывать и каталогизировать книги в онлайн-базе, доказав, что использовала лишь фрагменты произведений, трансформируя их и создавая новый продукт, что подпадает под принцип "добросовестного использования".

Однако этические вопросы никуда не исчезли. Как рассказал один из сотрудников, даже на встрече с участием Криса Кокса, главного директора по продуктам Meta, никто не озаботился тем, насколько честно и правильно использовать творческий труд людей без их ведома и согласия.

Похоже, в Meta* решили идти по стопам OpenAI и Google, не считаясь с правами авторов. Гонка ИИ-вооружений набирает обороты, и все средства хороши в борьбе за лидерство. Но сумеет ли Марк Цукерберг найти баланс между жаждой прогресса и этикой? Или погоня за "цифровой кровью" для ИИ-моделей окончательно затмит в его империи все моральные ориентиры? Пока страсти вокруг ИИ накаляются, нам остается лишь гадать, какие еще границы готовы переступить техногиганты в стремлении к технологическому превосходству.

Искусственные данные: Выход из кризиса или путь в никуда?

В то время как Meta* и Google лихорадочно ищут новые источники "цифровой крови" для своих ненасытных ИИ-моделей, Сэм Альтман из OpenAI предлагает иной подход к решению надвигающегося кризиса данных.

По его мнению, которое он озвучил на майской конференции, компании вроде OpenAI в конечном итоге начнут обучать свои алгоритмы на текстах, сгенерированных самим ИИ - так называемых синтетических данных. Идея проста: если ИИ-модель способна создавать правдоподобные тексты, то она может сама производить дополнительную информацию для своего развития. Это позволит разработчикам создавать все более мощные системы, не завися от защищенных авторским правом материалов.

"Как только мы преодолеем горизонт событий синтетических данных, и модель станет достаточно умной, чтобы генерировать качественную информацию, все будет в порядке", - заявил Альтман.

Однако концепция синтетических данных, хотя и не нова, таит в себе немало подводных камней. Исследователи бьются над этой проблемой годами, но создать ИИ, способный эффективно обучать самого себя, оказалось очень непросто. Модели, которые учатся на собственных результатах, рискуют попасть в замкнутый круг, где они лишь усиливают свои причуды, ошибки и ограничения.

"Данные для этих систем - как тропа через джунгли, - говорит Джефф Клун, бывший исследователь OpenAI, ныне преподающий информатику в Университете Британской Колумбии. - Если они будут обучаться только на синтетической информации, то рискуют заблудиться в этих дебрях".

Чтобы избежать этой ловушки, OpenAI и другие компании изучают возможность совместной работы двух разных ИИ-моделей. Одна система генерирует данные, а вторая оценивает их качество, отделяя зерна от плевел. Впрочем, исследователи расходятся во мнениях, насколько эффективным окажется такой подход.

Но топ-менеджеры ИИ-индустрии уже мчатся вперед на всех парах. "Все должно быть в порядке", - уверенно заявляет Альтман.

Возможно, синтетические данные действительно помогут техногигантам преодолеть кризис "цифровой крови" и вывести ИИ на новый уровень. Но не приведет ли погоня за искусственным разумом, способным воспроизводить самого себя, к непредсказуемым последствиям? Не заблудятся ли наши ИИ-помощники в дебрях собственных алгоритмов, оторвавшись от реальности и потеряв связь с миром людей?

Цена прогресса в эпоху ИИ

Гонка за "цифровой кровью" и стремление к созданию все более мощных ИИ-систем ставит перед человечеством непростые вопросы. Готовы ли мы пожертвовать приватностью, авторскими правами и этическими принципами ради технологического прогресса? Сможем ли мы сохранить контроль над своими творениями, когда они начнут воспроизводить сами себя? Опасность потерять ориентиры в цифровых джунглях искусственного интеллекта еще никогда не была столь реальной. Но одно можно сказать наверняка: мир уже никогда не будет прежним. Мы стоим на пороге новой эры, где границы между человеческим и машинным интеллектом становятся все более размытыми. И только от нас зависит, сумеем ли мы направить эту революцию в нужное русло и извлечь из нее максимум пользы для всего человечества.

Причем каждый из нас может внести свой вклад в эту дискуссию - делитесь своими мыслями в комментариях и ставьте оценки этой статье, ведь именно наши с вами комментарии повлияют в конечном счете на обучение какой-нибудь языковой модели.

Я рассказываю больше о нейросетях и делюсь иллюстрациями у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке.

*Meta и соцсети компании Facebook и Instagram признаны экстремистскими и запрещены в РФ.

Показать полностью 13
[моё] Будущее Нейронные сети Искусственный интеллект Политика Конфиденциальность Авторские права Google Meta Facebook Instagram Статья Большие данные ChatGPT Длиннопост
26
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии