OpenAI and Reddit

OpenAI and Reddit Тренд, Инновации, Искусственный интеллект, Нейронные сети, Полезное, ChatGPT, Reddit

Обучающая выборка данных, или датасет, является фундаментальным компонентом процесса обучения нейросетей.

Качество и количество представляемых данных определяют:

🟠производительность моделей;

🟠 количество выдаваемых ошибок и неточностей (галлюцинации)

🟠однотипность ответов

🟠репрезентативность и актуальность

😎В идеале мы ожидаем он нейросетей хуманизированный текст = детерминация + рандомизация (чувства). То есть текст, напоминающий мыcлидеятельность человека.

🔗Недавнее партнерство между Reddit и OpenAI— является важным шагом в данном направлении. Reddit - эта популярная "обсуждалка" в англоязычном сегменте, которая предоставляет огромное количество разнообразного контента — от научных споров до повседневных разговоров.

🙁Но не стоит забывать и про обратную сторону монеты - Reddit имеет очень, очень много контента низкого качества - токсичного, предвзятого и стереотипного. К тому же здесь остро стоит вопрос конфиденциальности - так как данные всех чатов и переписок будут использоваться без согласия пользователей.

😈Рассуждая глобально - что мы получим на выходе остается только догадываться. Машину - которая станет отражением наших пороков, или мета-организм со светлыми намерениями. Мы безумны... и каждый из нас безумен по своему — Сможем ли мы контролировать безумие искусственного интеллекта?