Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
#Круги добра
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Что спрятано в недрах Земли? Ад? Одному Аиду известно. А так же тем, кто пройдёт шахту до конца.

Эпичная Шахта

Мидкорные, Приключения, 3D

Играть

Топ прошлой недели

  • SpongeGod SpongeGod 1 пост
  • Uncleyogurt007 Uncleyogurt007 9 постов
  • ZaTaS ZaTaS 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
VMGYRAL
1 год назад

Instagram начал тестировать рекламу, которую нельзя пропустить⁠⁠

Ни для кого не секрет, что самый большой источник прибыли Meta — реклама. Однако, похоже, компания готова сделать рекламу более навязчивой, по крайней мере, в Instagram. Это потому, что Instagram тестирует новый способ показа рекламы, которую пользователи не могут пропустить.

Как заметили несколько пользователей Instagram, социальная сеть показывает «рекламные паузы» при навигации по приложению. Эти рекламные паузы длятся несколько секунд и их нельзя пропустить, поэтому пользователям приходится досматривать их до конца, чтобы продолжать прокручивать ленту. Один из пользователей, увидевших рекламную паузу в действии, назвал это решение «сумасшедшим ходом».

В сообщении на Reddit все больше пользователей Instagram сообщили, что видели рекламные паузы во время просмотра приложения. Но действительно ли это касается всех пользователей Instagram?

Пока нет, но со временем это может произойти. Об этом сообщил представитель «Мета» TechCrunch что компания всегда «тестирует форматы, которые могут принести пользу рекламодателям» и «предоставляет обновления», если эти тесты приведут к «каким-либо формальным изменениям продукта». Компания отказалась сообщить, проводятся ли тесты по всему миру и распространяются ли они также на Reels и Stories.

Если Instagram официально введет рекламные паузы в свое приложение, это сделает платформу более похожей на YouTube, который также показывает рекламу, которую нельзя пропустить, бесплатным пользователям. Однако, за исключением пользователей из Европы, платить за удаление рекламы из Instagram пока невозможно.

Реклама Марк Цукерберг Рептилоиды Instagram Meta Текст
2
15
Nerual.Dreming
Nerual.Dreming
1 год назад
Искусственный интеллект

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ⁠⁠

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

Одним из самых вопиющих примеров стали действия исследователей OpenAI в Сан-Франциско. Они разработали инструмент для транскрибирования видео с YouTube, чтобы собрать огромный массив разговорных текстов для развития ИИ. Некоторые сотрудники OpenAI выражали обеспокоенность тем, что такой шаг может нарушать правила YouTube, которые запрещают использовать видео платформы для "независимых" приложений. Однако в итоге команда во главе с президентом компании Грегом Брокманом, который лично участвовал в сборе данных, расшифровала более миллиона часов видео. Полученные тексты были загружены в GPT-4 - одну из самых мощных языковых моделей в мире, лежащую в основе чат-бота ChatGPT.

Эта история наглядно демонстрирует, насколько отчаянной стала гонка за цифровыми данными, необходимыми для прогресса ИИ. Ради заветных терабайтов информации технологические компании, включая OpenAI, Google и Meta*, готовы срезать углы, игнорировать внутренние политики и балансировать на грани закона. Расследование New York Times показало, что эти ИТ-гиганты всерьез обсуждали возможность обхода авторских прав ради пополнения своих баз данных.

В Meta*, которой принадлежат Facebook* и Instagram* , менеджеры, юристы и инженеры всерьез рассматривали вариант покупки издательства Simon & Schuster, чтобы заполучить большой объем книг. Они также обсуждали идею собирать защищенные авторским правом данные по всему интернету, даже если это грозило судебными исками. По их мнению, переговоры о лицензировании с издателями, авторами, музыкантами и новостной индустрией заняли бы слишком много времени.

Google, как и OpenAI, расшифровывал видео с YouTube для получения текстовых данных, потенциально нарушая авторские права создателей контента. Кроме того, в прошлом году компания расширила свои условия использования сервисов. Одной из причин этого изменения, по словам сотрудников отдела конфиденциальности и внутренних документов, стало желание получить возможность анализировать публично доступные файлы Google Docs, отзывы на Google Maps и другие онлайн-материалы для использования в своих ИИ-продуктах.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Эти примеры показывают, что новости, художественные произведения, посты на форумах, статьи из Википедии, компьютерные программы, фотографии, подкасты и фрагменты фильмов стали настоящей "цифровой кровью", питающей бурно развивающуюся индустрию искусственного интеллекта. Создание инновационных систем напрямую зависит от наличия достаточного объема данных для обучения ИИ мгновенной генерации текстов, изображений, звуков и видео, неотличимых от созданных человеком.

Объем данных имеет решающее значение. Ведущие чат-боты обучались на массивах цифровых текстов, включающих до трех триллионов слов - примерно вдвое больше, чем хранится в Бодлианской библиотеке Оксфордского университета, которая собирает рукописи с 1602 года. По словам исследователей ИИ, наиболее ценными являются высококачественные данные, такие как опубликованные книги и статьи, тщательно написанные и отредактированные профессионалами.

Долгие годы интернет с такими сайтами, как Википедия и Reddit, казался неиссякаемым источником данных. Но по мере развития ИИ технологические компании стали искать новые резервуары информации. Google и Meta, имеющие миллиарды пользователей, ежедневно генерирующих поисковые запросы и посты в соцсетях, во многом ограничены законами о конфиденциальности и собственными политиками в плане использования этого контента для обучения ИИ.

Ситуация становится критической. По прогнозам исследовательского института Epoch, уже к 2026 году технологические компании могут исчерпать все качественные данные, доступные в интернете. Гиганты индустрии потребляют информацию быстрее, чем она производится.

"Единственный практичный способ существования этих инструментов - это возможность обучать их на огромных объемах данных без необходимости лицензирования", - заявил Сай Дамл, юрист, представляющий интересы венчурной компании Andreessen Horowitz, в ходе публичной дискуссии об авторском праве. "Необходимый объем данных настолько огромен, что даже коллективное лицензирование не сможет решить проблему".

Технологические компании настолько жаждут новых данных, что некоторые из них разрабатывают "синтетическую" информацию. Речь идет не об органическом контенте, созданном людьми, а о текстах, изображениях и коде, генерируемых самими ИИ-моделями. Иными словами, системы учатся на том, что создают сами.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

OpenAI заявила, что каждая ее ИИ-модель "имеет уникальный набор данных, который мы тщательно подбираем, чтобы улучшить их понимание мира и оставаться глобально конкурентоспособными в исследованиях". Google отметила, что ее модели "обучаются на некотором контенте YouTube" в рамках соглашений с авторами, и что компания не использует данные из офисных приложений вне экспериментальной программы. Meta* подчеркнула, что "агрессивно инвестировала" в интеграцию ИИ в свои сервисы и имеет миллиарды публично доступных изображений и видео из Instagram*  и Facebook* для обучения своих моделей.

Для создателей контента растущее использование их произведений ИИ-компаниями стало поводом для исков о нарушении авторских прав и лицензировании. The New York Times подала в суд на OpenAI и Microsoft за использование защищенных авторским правом новостных статей без разрешения для обучения чат-ботов. OpenAI и Microsoft заявили, что использование материалов было "добросовестным" и разрешенным законом, поскольку оригинальные тексты были трансформированы для другой цели.

Более 10 000 торговых групп, авторов, компаний и других организаций направили свои комментарии по поводу использования творческих работ ИИ-моделями в Бюро авторских прав США - федеральное агентство, готовящее рекомендации по применению копирайта в эпоху ИИ.

Режиссер, актриса и писательница Джастин Бейтман заявила Бюро, что ИИ-модели используют контент, включая ее книги и фильмы, без разрешения и оплаты. "Это крупнейшая кража в истории Соединенных Штатов, точка", - подчеркнула она в интервью.

"Масштаб решает все": Как одна научная статья разожгла аппетит к данным

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

В январе 2020 года теоретический физик из Университета Джонса Хопкинса Джаред Каплан опубликовал новаторскую статью об ИИ, которая разожгла аппетит технологических гигантов к онлайн-данным. Его вывод был однозначен: чем больше информации, данных - "цифровой крови" ИИ-систем, будет использовано для обучения большой языковой модели (ключевой технологии чат-ботов), тем лучше будут её результаты. Подобно тому, как студент становится образованнее, прочитав больше книг, ИИ-алгоритмы могут точнее распознавать паттерны в тексте и давать более точные ответы, впитав больше данных.

"Все были поражены тем, что эти закономерности, которые мы называем "законами масштабирования", оказались столь же точными, как и те, что мы наблюдаем в астрономии или физике", - отметил доктор Каплан, опубликовавший статью в соавторстве с девятью исследователями OpenAI (сейчас он работает в ИИ-стартапе Anthropic).

Лозунг "Масштаб решает все" быстро стал боевым кличем для всей индустрии ИИ, ознаменовав начало безудержной гонки за данными, этой "цифровой кровью" для алгоритмов. Исследователи, которые раньше довольствовались относительно скромными публичными базами данных вроде Википедии или Common Crawl (архива из более чем 250 миллиардов веб-страниц, собираемого с 2007 года), осознали, что в новую эпоху этой информации катастрофически мало. Если до статьи Каплана датасеты с 30 000 фотографий с Flickr считались ценным ресурсом, то теперь ИИ-системам требовались терабайты текстов, изображений и другого "топлива" для развития.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Когда в ноябре 2020 года OpenAI представила GPT-3, эта модель была обучена на рекордном на тот момент объеме данных - около 300 миллиардов "токенов" (по сути, слов или частей слов). Впитав эту гору информации, система начала генерировать тексты с пугающей точностью, создавая блог-посты, стихи и даже компьютерные программы.

Гонка за "цифровой кровью" только начиналась. В 2022 году лаборатория DeepMind, принадлежащая Google, провела эксперимент с 400 ИИ-моделями, варьируя объем обучающих данных. Лучшие результаты показали системы, питавшиеся еще большим объемом информации, чем предсказывал Каплан. Модель Chinchilla "выпила" 1.4 триллиона токенов.

Но и этот рекорд вскоре был побит. В прошлом году китайские исследователи представили Skywork - ИИ-модель, обученную на 3.2 триллиона токенов из английских и китайских текстов. А Google анонсировала систему PaLM 2, проглотившую умопомрачительные 3.6 триллиона токенов - настоящее море данных.

Алгоритмы-вампиры вошли во вкус. И теперь уже ничто не могло остановить их ненасытную жажду информации, столь необходимой для развития ИИ...

Высасывая данные из YouTube: Как OpenAI переступила черту

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

В мае Сэм Альтман, генеральный директор OpenAI, признал, что запасы ценной информации в интернете скоро иссякнут под натиском ИИ-компаний, одержимых идеей масштаба. "Этот ресурс не бесконечен", - заявил он в своей речи на технологической конференции.

Альтман знал, о чем говорит. В OpenAI исследователи годами собирали данные, очищали их и скармливали ненасытным алгоритмам, превращая в топливо для обучения языковых моделей. Они выкачивали код с GitHub, поглощали гигантские базы шахматных партий, анализировали школьные тесты и домашние задания с сайта Quizlet. Но к концу 2021 года эти источники истощились, рассказали восемь человек, знакомых с ситуацией в компании.

OpenAI отчаянно нуждалась в новой информации для своего ИИ следующего поколения - GPT-4. Сотрудники обсуждали идеи транскрибировать подкасты, аудиокниги и видео с YouTube, создавать данные с нуля с помощью других ИИ-систем и даже покупать стартапы, накопившие большие объемы цифрового контента.

В итоге OpenAI создала инструмент распознавания речи Whisper, чтобы извлекать тексты из YouTube-роликов и подкастов, рассказали шесть человек. Однако правила YouTube запрещают не только использовать видео в "независимых" приложениях, но и получать доступ к контенту платформы "любыми автоматическими средствами (такими как роботы, ботнеты или скраперы)".

Сотрудники OpenAI понимали, что вступают в серую зону закона, но считали, что обучение ИИ на этих видео - это "добросовестное использование". Грег Брокман, президент компании, лично участвовал в сборе роликов с YouTube и скармливал их Whisper, став одним из создателей инструмента.

В прошлом году OpenAI выпустила GPT-4, модель, обученную на более чем миллионе часов видео, которые Whisper извлек с YouTube и превратил в бесценный ресурс для развития ИИ. Команду разработки GPT-4 возглавлял лично Брокман.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Некоторые сотрудники Google знали о практиках OpenAI, но не препятствовали им, так как сам Google использовал транскрипты YouTube-видео для обучения своих ИИ-моделей, рассказали два человека, знакомых с ситуацией. Такой подход мог нарушать авторские права создателей контента. Если бы Google попытался предъявить претензии OpenAI, это могло вызвать общественный резонанс и привести к скандалу вокруг методов самого техногиганта.

Алгоритмы продолжали безнаказанно высасывать данные из YouTube, превращая видео в топливо для развития ИИ, невзирая на правила платформы и вопросы этики. Жажда информации, разожженная гонкой за лидерство в сфере ИИ, оказалась сильнее угрызений совести и страха перед законом.

Как Google может использовать ваши данные: Изменения в политике конфиденциальности

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

В прошлом году Google внес изменения в свою политику конфиденциальности для бесплатных потребительских приложений. Согласно новой формулировке, компания использует информацию для улучшения сервисов, разработки новых продуктов, функций и технологий, которые приносят пользу как самим пользователям, так и обществу в целом.

Особое внимание было уделено использованию общедоступной информации для обучения языковых моделей ИИ и создания продуктов вроде Google Translate, чат-бота Bard и облачных ИИ-сервисов. Это дало Google гораздо более широкие возможности для сбора и анализа данных в целях развития искусственного интеллекта.

Однако эти изменения вызвали вопросы у членов команды по конфиденциальности. В августе двое из них обратились к менеджерам, чтобы прояснить, сможет ли Google начать использовать данные из бесплатных потребительских версий Google Docs, Google Sheets и Google Slides. По их словам, они не получили четких ответов.

Мэтт Брайант, представитель Google, заявил, что изменения в политике конфиденциальности были сделаны для ясности и что компания не использует информацию из Google Docs или связанных приложений для обучения языковых моделей "без явного разрешения" пользователей. Он уточнил, что речь идет о добровольной программе, которая позволяет пользователям тестировать экспериментальные функции.

"Мы не начали обучение на дополнительных типах данных на основе этого изменения формулировки", - подчеркнул Брайант.

Тем не менее, обновленная политика конфиденциальности дает Google гораздо больше пространства для маневра в плане использования пользовательских данных для развития ИИ. И хотя компания отрицает, что уже применяет информацию из своих офисных приложений для обучения языковых моделей, сама возможность такого использования вызывает вопросы у экспертов по конфиденциальности.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Ясно одно: в гонке за лидерство в сфере ИИ техногиганты готовы использовать все доступные ресурсы, и данные миллионов пользователей - слишком лакомый кусок, чтобы его игнорировать. Вопрос лишь в том, насколько далеко Google и другие компании готовы зайти в погоне за прогрессом, и сумеют ли они найти баланс между развитием технологий и защитой приватности своих клиентов.

Жажда данных и этические дилеммы: Как Meta* борется за лидерство в сфере ИИ

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Марк Цукерберг, глава Meta, годами инвестировал в развитие искусственного интеллекта. Однако когда в 2022 году OpenAI выпустила свой чат-бот ChatGPT, Цукерберг внезапно осознал, что его компания отстает в гонке ИИ-вооружений. По словам трех нынешних и бывших сотрудников, он немедленно начал оказывать давление на своих подчиненных, требуя в кратчайшие сроки создать чат-бот, способный превзойти детище OpenAI. Руководители и инженеры получали звонки от босса в любое время дня и ночи.

Но уже к началу прошлого года Meta* столкнулась с той же проблемой, что и ее конкуренты: нехваткой данных для обучения ИИ. Ахмад Аль-Дахле, вице-президент компании по генеративному ИИ, сообщил руководству, что его команда использовала практически все доступные в интернете англоязычные книги, эссе, стихи и новостные статьи для разработки своей модели. Без расширения массива данных Meta* не сможет догнать ChatGPT, подчеркнул он.

В марте и апреле 2023 года лидеры бизнес-подразделений, инженеры и юристы Meta* практически ежедневно собирались, чтобы найти решение проблемы. Одни предлагали платить по 10 долларов за книгу, чтобы получить полные лицензионные права на новые произведения. Другие обсуждали возможность приобретения издательства Simon & Schuster, выпускающего книги таких авторов, как Стивен Кинг.

Но звучали и более радикальные идеи. Сотрудники говорили о том, что уже обобщали книги, эссе и другие произведения из интернета без разрешения правообладателей. Они всерьез рассматривали возможность и дальше "высасывать" защищенный авторским правом контент, даже если это грозило судебными исками. Один из юристов предупредил о "этических" проблемах, связанных с использованием интеллектуальной собственности без ведома и согласия авторов, но его слова были встречены гробовым молчанием.

Цукерберг требовал найти решение любой ценой. "Возможности, которые Марк хочет видеть в нашем продукте, мы сейчас просто не в состоянии обеспечить", - признал один из инженеров.

Несмотря на то, что Meta* управляет гигантскими социальными сетями, у компании не было достаточного объема пользовательских постов, пригодных для обучения ИИ. Многие пользователи Facebook* удаляли свои старые публикации, а сама платформа не располагала к созданию длинных текстов, подобных эссе. К тому же, после скандала 2018 года, связанного с передачей данных пользователей компании Cambridge Analytica, занимавшейся профилированием избирателей, Meta* была вынуждена ввести ограничения на использование информации о своих юзерах.

В недавнем обращении к инвесторам Цукерберг заявил, что миллиарды публично доступных видео и фотографий на Facebook* и Instagram*  представляют собой массив данных, превосходящий Common Crawl (базу из сотен миллиардов веб-страниц, используемую для обучения ИИ). Но хватит ли этого, чтобы догнать и обогнать конкурентов?

В своих внутренних обсуждениях топ-менеджеры Meta* признавали, что OpenAI, судя по всему, использовала защищенные авторским правом материалы без разрешения. И хотя некоторые сотрудники поднимали вопросы об этичности такого подхода и справедливой оплате труда авторов, общий вывод был таков: Meta* может последовать этому "рыночному прецеденту", так как получение лицензий от множества правообладателей займет слишком много времени.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

"Единственное, что отделяет нас от уровня ChatGPT - это буквально объем данных", - заявил на одном из совещаний Ник Грудин, вице-президент по глобальному партнерству и контенту. По его мнению, Meta* может опереться на решение суда по делу "Гильдия авторов против Google" от 2015 года. Тогда Google отстояла свое право сканировать, оцифровывать и каталогизировать книги в онлайн-базе, доказав, что использовала лишь фрагменты произведений, трансформируя их и создавая новый продукт, что подпадает под принцип "добросовестного использования".

Однако этические вопросы никуда не исчезли. Как рассказал один из сотрудников, даже на встрече с участием Криса Кокса, главного директора по продуктам Meta, никто не озаботился тем, насколько честно и правильно использовать творческий труд людей без их ведома и согласия.

Похоже, в Meta* решили идти по стопам OpenAI и Google, не считаясь с правами авторов. Гонка ИИ-вооружений набирает обороты, и все средства хороши в борьбе за лидерство. Но сумеет ли Марк Цукерберг найти баланс между жаждой прогресса и этикой? Или погоня за "цифровой кровью" для ИИ-моделей окончательно затмит в его империи все моральные ориентиры? Пока страсти вокруг ИИ накаляются, нам остается лишь гадать, какие еще границы готовы переступить техногиганты в стремлении к технологическому превосходству.

Искусственные данные: Выход из кризиса или путь в никуда?

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

В то время как Meta* и Google лихорадочно ищут новые источники "цифровой крови" для своих ненасытных ИИ-моделей, Сэм Альтман из OpenAI предлагает иной подход к решению надвигающегося кризиса данных.

По его мнению, которое он озвучил на майской конференции, компании вроде OpenAI в конечном итоге начнут обучать свои алгоритмы на текстах, сгенерированных самим ИИ - так называемых синтетических данных. Идея проста: если ИИ-модель способна создавать правдоподобные тексты, то она может сама производить дополнительную информацию для своего развития. Это позволит разработчикам создавать все более мощные системы, не завися от защищенных авторским правом материалов.

"Как только мы преодолеем горизонт событий синтетических данных, и модель станет достаточно умной, чтобы генерировать качественную информацию, все будет в порядке", - заявил Альтман.

Однако концепция синтетических данных, хотя и не нова, таит в себе немало подводных камней. Исследователи бьются над этой проблемой годами, но создать ИИ, способный эффективно обучать самого себя, оказалось очень непросто. Модели, которые учатся на собственных результатах, рискуют попасть в замкнутый круг, где они лишь усиливают свои причуды, ошибки и ограничения.

"Данные для этих систем - как тропа через джунгли, - говорит Джефф Клун, бывший исследователь OpenAI, ныне преподающий информатику в Университете Британской Колумбии. - Если они будут обучаться только на синтетической информации, то рискуют заблудиться в этих дебрях".

Чтобы избежать этой ловушки, OpenAI и другие компании изучают возможность совместной работы двух разных ИИ-моделей. Одна система генерирует данные, а вторая оценивает их качество, отделяя зерна от плевел. Впрочем, исследователи расходятся во мнениях, насколько эффективным окажется такой подход.

Но топ-менеджеры ИИ-индустрии уже мчатся вперед на всех парах. "Все должно быть в порядке", - уверенно заявляет Альтман.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Возможно, синтетические данные действительно помогут техногигантам преодолеть кризис "цифровой крови" и вывести ИИ на новый уровень. Но не приведет ли погоня за искусственным разумом, способным воспроизводить самого себя, к непредсказуемым последствиям? Не заблудятся ли наши ИИ-помощники в дебрях собственных алгоритмов, оторвавшись от реальности и потеряв связь с миром людей?

Цена прогресса в эпоху ИИ

Гонка за "цифровой кровью" и стремление к созданию все более мощных ИИ-систем ставит перед человечеством непростые вопросы. Готовы ли мы пожертвовать приватностью, авторскими правами и этическими принципами ради технологического прогресса? Сможем ли мы сохранить контроль над своими творениями, когда они начнут воспроизводить сами себя? Опасность потерять ориентиры в цифровых джунглях искусственного интеллекта еще никогда не была столь реальной. Но одно можно сказать наверняка: мир уже никогда не будет прежним. Мы стоим на пороге новой эры, где границы между человеческим и машинным интеллектом становятся все более размытыми. И только от нас зависит, сумеем ли мы направить эту революцию в нужное русло и извлечь из нее максимум пользы для всего человечества.

Жажда "цифровой крови": Как Google, OpenAI и Meta переступают черту ради развития ИИ Будущее, Нейронные сети, Искусственный интеллект, Политика, Конфиденциальность, Авторские права, Google, Meta, Facebook, Instagram, Статья, Большие данные, ChatGPT, Длиннопост

Причем каждый из нас может внести свой вклад в эту дискуссию - делитесь своими мыслями в комментариях и ставьте оценки этой статье, ведь именно наши с вами комментарии повлияют в конечном счете на обучение какой-нибудь языковой модели.

Я рассказываю больше о нейросетях и делюсь иллюстрациями у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке.

*Meta и соцсети компании Facebook и Instagram признаны экстремистскими и запрещены в РФ.

Показать полностью 13
[моё] Будущее Нейронные сети Искусственный интеллект Политика Конфиденциальность Авторские права Google Meta Facebook Instagram Статья Большие данные ChatGPT Длиннопост
26
Dimonbee
1 год назад

Как я в Meta ходил.. Да так и не дошёл⁠⁠

Решил я несколько лет назад зарегаться в теперешнем нельзяграме. Зарегался, хочу загрузить фоточки. А нет такой кнопочки! Чёзанах? поспрашивал у завсегдатаев этой сети - говорят, надо со смартфона из приложки их грузить.

- Погодите! У меня профессиональный фотик, мне что, с компа сперва на телефон их надо перекинуть, а уже потом в инсту? - Ну да, а зачем тебе такой сложный путь? фоткай телефоном! Вот нахуй сразу!

Ладно, телеграмщик я с огромным стажем, был и Viber и Skype, до этого ICQ, точнее её альтернативный клиент миранда. К слову сказать, смартфона у меня тогда не было, а был планшет iPad, который покрывал все мои потребности. А для разговоров была и есть нокия. Держать смарт при разговоре как блюдце с чаем - это какой то пиздец товарищи!

А для iPad оказывается нету WhatsApp. Ок, беру смартфон жены, регаюсь кое как с него, ставлю декстопный вацап себе на комп. Вроде всё получилось, выхожу из вацапа на смарте, возвращаю аккаунт жены. Хуякс! - не работает теперь приложка на компе без смартфона!

Ладно, хер с вами, прошу жену пересылать мне сообщения из её вацапа мне в телегу. Отправляет мне товарищ джипег со схемой станка, жена мне тут же его пересылает в телегу. Увеличиваю изображение - всё рассыпается на квадратики. Чёзанах? Оказывается, вацап жмёт фотки не спрашивая, а у видосиков обрезает всё, что дольше двух минут!

КАК СУКАБЛЯТЬ ВСРАТЫЙ ВАЦАП НАБРАЛ ТАКУЮ ПОПУЛЯРНОСТЬ???? Его пользователи получают органическое поражение мозга в процессе использования? Мне просто дико любопытны причины этого феномена!

Личный опыт IT Телефон Instagram Meta WhatsApp Мат Текст
11
13
Mighty2000
Mighty2000
1 год назад

Павел Дуров прокомментировал сегодняшний масштабный сбой в работе сервисов Meta⁠⁠

Павел Дуров прокомментировал сегодняшний масштабный сбой в работе сервисов Meta Telegram, Социальные сети, Павел Дуров, Telegram (ссылка), Telegram каналы, Telegram бот, Блокировка Telegram, Instagram, Meta, Сбой, Facebook, Скриншот

По его словам, миллионы людей регистрировались и делились контентом в Telegram за последний час, пока Instagram и Facebook не работали.

Показать полностью 1
[моё] Telegram Социальные сети Павел Дуров Telegram (ссылка) Telegram каналы Telegram бот Блокировка Telegram Instagram Meta Сбой Facebook Скриншот
14
Neurosonya
Neurosonya
1 год назад
Полезные нейросети
Серия Полезность

Ожидаемые нейросети от Meta. Новая угроза Photoshop или хорошая альтернатива?⁠⁠

Компания Meta представила два новых инструмента для генерации и редактирования фото и видео, которые вскоре добавят в Facebook и Instagram* (Признан экстремистским на территории РФ)

Emu Video

Emu Video (на первой половине видео) - позволяет создать короткое 4-секундное видео по текстовому запросу. Пользователь вводит текст, а инструмент генерирует анимированное изображение на его основе. Видеоролик получается на уровне Pika Labs 16fps

Emu Edit

Emu Edit - позволяет редактировать изображение по тексту или его отдельные элементы, фон, цвета и прочее . Просто пишете, что хотите поменять и как, и получаете изменения на фото, даже область не надо будет выделять

Пока инструменты находятся на стадии тестирования, позже будут добавлены в Facebook и Instagram* (Признан экстремистским на территории РФ). Я уже с нетерпением жду возможности затестить.

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса

Показать полностью 1
[моё] Искусственный интеллект Полезное Технологии Нейронные сети Digital Meta Facebook Instagram Инновации Видео Без звука Длиннопост
1
DELETED
1 год назад

M**a предложила европейцам I******m и F******k без рекламы, но это не дешево⁠⁠

В ответ на новые правила ЕС по защите данных, которые не позволяют направлять целевую рекламу на потребителей, компания Meta** решила позиционировать свою модель как добровольный выбор пользователей. Она предложила жителям региона отключить рекламу в Facebook** и Instagram**.

От €9,99 в месяц - за первый раз.

Жителям ЕС сообщили, что у них будет возможность выбрать, как они будут дальше пользоваться этими сервисами: добровольно соглашаться на сбор персональных данных для показа им целевой рекламы или оформить подписку с ежемесячной платой, чтобы пользоваться ими в полном объеме, отказавшись от рекламы.

Стоимость подписки составляет от 9,99 евро - эта цена действует при регистрации через веб-интерфейс. Тот, кто предпочитает оплачивать услуги через мобильные приложения, т.е. через платежные системы магазинов приложений Google или Apple, должен дополнительно оплатить комиссию, при этом ежемесячная плата за отказ от рекламы в Facebook** и Instagram** возрастет до 12,99 евро.

Отмечается, что компания предлагает выбор "в связи с изменениями в законодательстве в вашем регионе". Для тех, кто хочет продолжать пользоваться Facebook** и Instagram** как и прежде, компания предлагает бесплатную информацию о "продуктах и брендах из персонализированной рекламы", для которой будут использованы "ваши данные".

M**a предложила европейцам I******m и F******k без рекламы, но это не дешево Новости, СМИ и пресса, Facebook, Meta, Instagram

businessinsider.nl

Источник

**Суд признал экстремистской и запретил в России деятельность корпорации Meta по реализации социальных сетей, а также ее платформ Facebook и Instagram.

Показать полностью 1
Новости СМИ и пресса Facebook Meta Instagram
5
mbest7
2 года назад

Плохая реклама тоже реклама⁠⁠

А вам не кажется, что надпись

Meta Platforms Inc запрещена в РФ

перед любым видео и фильмом офигенная реклама Meta Platfoms Inc.

Такого охвата можно добиться только при миллиардных рекламных бюджетах.

Кстати, Meta Platforms Inc запрещена в РФ

[моё] Политика Юмор Instagram Meta Реклама Текст
9
63
DELETED
2 года назад

Ответ gatto7 в «Совсем скоро 8 марта»⁠⁠2

Только в инстаграме (запрещен на территории РФ) не покупай цветы по цене кокаина: купи кокаин по цене кокаина!

«Мяу на 8 марта». Наркошопы тоже подготовились к празднику и под видом рекламы цветов ловко обхитрили модерацию креативов в Meta. Все названия и ссылки заблюрены.

Помните: наркотики — зло, а Meta запрещена в России.
(с)

Ответ gatto7 в «Совсем скоро 8 марта» 8 марта - Международный женский день, Цветы, Праздники, Мужчины, Картинка с текстом, Наркотики, Instagram, Meta, Ответ на пост, Длиннопост
Ответ gatto7 в «Совсем скоро 8 марта» 8 марта - Международный женский день, Цветы, Праздники, Мужчины, Картинка с текстом, Наркотики, Instagram, Meta, Ответ на пост, Длиннопост
Ответ gatto7 в «Совсем скоро 8 марта» 8 марта - Международный женский день, Цветы, Праздники, Мужчины, Картинка с текстом, Наркотики, Instagram, Meta, Ответ на пост, Длиннопост
Ответ gatto7 в «Совсем скоро 8 марта» 8 марта - Международный женский день, Цветы, Праздники, Мужчины, Картинка с текстом, Наркотики, Instagram, Meta, Ответ на пост, Длиннопост
Ответ gatto7 в «Совсем скоро 8 марта» 8 марта - Международный женский день, Цветы, Праздники, Мужчины, Картинка с текстом, Наркотики, Instagram, Meta, Ответ на пост, Длиннопост
Показать полностью 5
8 марта - Международный женский день Цветы Праздники Мужчины Картинка с текстом Наркотики Instagram Meta Ответ на пост Длиннопост
4
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии