16

Ищу добровольцев с видеокартой. Обещаю не майнить

Привет, Пикабу!

Меня зовут Игорь, работаю в Институте математики и механики УрО РАН.

Мне иногда в голову приходят странные идеи на статистику. И я не могу уснуть, пока не проверю. 6 лет назад заинтересовало: а какой длины должна быть тема диссертации? Собрал названия всех диссертаций на тот момент и проанализировал. Результаты публиковал на Пикабу.

Вышло, что в среднем — 10 основных слов и 2 служебных.

Сам, кстати, вышел за рамки: 3 служебных и 12 основных. В прошлом году защитил тему: "Разработка алгоритмического и программного обеспечения для обработки сигналов программно-аппаратного комплекса измерения и сопоставления движений".

Да, я знаю, что это длинно

А сейчас зацепило другое

Какие когнитивные искажения у людей, когда никто не знает, что их анализируют?

Обычно в психологических исследованиях люди приходят к психологу — и уже готовы. Напряжены. Ведут себя "правильно".

А если клиническая выборка — то там вообще люди явно считают, что с ними что-то не так. Они в больнице. Или на приёме у врача. Контекст давит.

А что если взять комментарии из интернета?

Люди пишут анонимно. Расслабленно. Никто не оценивает. Собрал 1.8 миллиона комментариев. За пару месяцев успел обработать около 250 тысяч — и обнаружил интересную штуку.

Там сеть. Устойчивая структура связей.

Что там нашлось

Вот как выглядит карта когнитивных искажений в русскоязычном интернете (первая версия, не утверждаю, что это всегда и везде так, только на строго ограниченной выборке при определенных моделях нейронок, делать выводы рано):

Сеть всех 18 искажений

Стабильная сеть из 13 узлов, когда немного пошатал на устойчивость, осталось всего 13, и то с оговорками, но не суть

Искажения не работают поодиночке.

"Всё или ничё" (чёрно-белое мышление) в 67% случаев появляется вместе с катастрофизацией ("теперь всё пропало").

А персонализация ("это из-за меня") — центральный узел. Связана с 10 другими искажениями.

Как в эпидемиологии: есть суперраспространители, от которых идут цепочки заражений.

Только здесь — паттерны мышления.

Зачем это нужно?

В классических исследованиях люди заполняют опросники.

Проблема: они знают, что их оценивают.

Это меняет ответы.

Здесь другое. Человек пишет комментарий — и не думает про когнитивные искажения. Он просто думает вслух.

Представь: ты облажался на работе.

Включается сверхобобщение: "У меня НИКОГДА ничего не получается" (хотя вчера всё было нормально).

Следом катастрофизация: "Теперь меня точно уволят".

Потом персонализация: "Я полное ничтожество".

Цепная реакция.

Один триггер — три искажения автоматом.

И эти цепочки — устойчивы. Повторяются у разных людей.

А теперь представь:

Психотерапевт знает эту карту. Видит, что у тебя активна персонализация — центральный узел.

Бьёт по нему — и разваливается вся связанная цепочка. Вместо 10 симптомов лечишь 2 центральных.

Статью отправил в Frontiers in Psychology, на рецензировании.

В процессе стало понятно, что данных достаточно на вторую и третью статью — паттерны оказались богаче, чем думал изначально.

В чём проблема

Нужно обработать все 1.8 миллиона комментариев заново с уточнённой методологией.

На моей RTX 5080 — 10,000 комментариев в сутки.

Одному — полгода работы.

Хотелось бы ускориться. Данные интересные.

Что предлагаю

Разбил всё на куски по 5,000 комментариев.

Берёте файлик, обрабатываете у себя на компе, отправляете обратно.

Что нужно:

  • Видеокарта от 12 ГБ видео памяти

  • Время

  • Помогу настроить Ollama — это локальная нейросеть

Всё работает локально

Обещаю не майнить крипту. Код открытый на питоне

Что получишь

1. Участвуешь в исследовании

Огромная карта когнитивных искажений в естественной речи на русском языке. Масштаб — 1.8 миллиона текстов.

Такое редкость

2. Твоё имя остаётся

В открытом датасете, который будут использовать учёные по всему миру.

Каждый раз, когда кто-то будет работать с этими данными — увидит: "при поддержке [твой ник]".

3. Самые активные — в статье

В секции acknowledgements (благодарности). Индексируется в научных базах.

Твоя строчка в истории науки.

4. Узнаешь результаты первым

До официальной публикации.

Поможешь?

Пиши в комменты — отвечу, пришлю файл с инструкцией.

Если сложности с Ollama — помогу разобраться.

У тебя есть видеокарта с 12 ГБ и пара свободных вечеров?

Этого достаточно.


P.S.

Если у тебя 8 ГБ видеопамяти — тоже пиши.

Будет медленнее (модель начнёт использовать диск), но работать должно.

Психология | Psychology

28.6K постов61.8K подписчиков

Правила сообщества

Обратите особое внимание!

1) При заимствовании статей указывайте источник.

2) Не выкладывайте:

- прямую рекламу;

- спам;

- непроверенную и/или антинаучную информацию;

- информацию без доказательств.

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества