Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Разгадывайте увлекательные головоломки «три в ряд» и отправляйтесь в захватывающее приключение! Преодолевайте яркие и насыщенные уровни, чтобы раскрыть новую главу доброй и современной истории о мышонке и его верных друзьях!

Мышонок Шон

Казуальные, Три в ряд, Головоломки

Играть

Топ прошлой недели

  • cristall75 cristall75 6 постов
  • 1506DyDyKa 1506DyDyKa 2 поста
  • Animalrescueed Animalrescueed 35 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
2
Syavanap

Выбор арбуза. Статистика. Анализ данных⁠⁠

5 месяцев назад

Приветствую. Скоро осень и будут продавать много арбузов. Но каждый раз они попадаются разные. Есть арбузы кислые, есть рыхлые, есть бесвкусные.
Сейчас существуют нейросети. Они учатся по данным, которые им предоставляют люди. Так нейросеть принимает решение, исходя из анализа множества выборок. В связи с этим, у меня возникла мысль собрать статистику по арбузам с помощью пикабушников. Нейросеть учить не будем, но можно составить базу данных, из которой можно будет с помощью методов анализа данных составить описание хорошего арбуза. Идея заключается в том, чтобы создать на пикабу какой-то опросник, или сделать телеграм бота с опросом, может быть на гугл диске разместить опрос и выложить ссылку.

Суть опроса такова: человек покупает арбуз, оценивает его характеристики, пробует и проходит опрос. Его ответы, естественно, субъективны, но других у нас нет. Ответы должны выбирать из вариантов, чтобы была чёткая выборка. Без отсебятины.

Моё предложение - это оценивать арбуз по нескольким параметрам:
Внешний вид: вес, диаметр, сорт(Астраханский, Иран, ...), округлость(круглый, вытянутый), оттенок кожуры(светлый, средний, тёмный), контраст полосок(сильный, слабый), ширина полосок(тоненькие и короткие, длинные и широкие), яркость жёлтого пятна и его размер.
Дегустация: толщина кожуры(см), насколько резкая граница перехода кожуры в мякоть(резкая, широкая), рыхлость мякоти (рыхлый, средний, хрустящий), общая оценка сладости, насколько сильно отличается сладость в центре мякоти и у корки.

К некоторым вопросам можно приложить картинки, чтобы опрашиваемый смотрел на них и выбрал ту, что больше похожа на его вариант(оттенок кожуры, контраст полосок, ширина полосок, резкость границы кожуры).

По результатам оценки дегустации можно выбрать ответы, в которых дегустатор оценил арбуз как хороший. Из этих ответов посмотреть какие значения у параметров "Внешний вид" и найти закономерности. Если ответы будут довольно точными и получится сделать грамотный анализ данных, то мы сможем выделить параметры внешнего вида, по которым можно выбрать хороший арбуз. В дальнейшем могут вноситься корректировки.

Понятно, что действительно спелый арбуз в наших магазинах не найти, но может быть получится составить список параметров внешнего вида, чтобы из неспелых арбузов выбрать самый приятный.
Я бы хотел услышать как можно реализовать опрос и как потом грамотно проанализировать данные, чтобы выделить множество хороших арбузов, у которых схожи параметры и велика вероятность хорошего вкуса. У меня мало опыта в анализе данных, но может быть кто-то поможет или сможет сам сделать обработку информации в анкетах или даже сделать сам опросник.

Показать полностью
Анализ данных Арбуз Опрос Общественное мнение Помощь Статистика Вкусы Текст
11
kznalp
kznalp
Postgres DBA
Серия СУБД PostgreSQL

PG_HAZEL - статистический анализ производительности СУБД : корреляция ожиданий⁠⁠

10 месяцев назад

Взято с основного технического канала Postgres DBA

Начало и общее описание

PG_HAZEL - оперативно-тактический комплекс мониторинга производительности СУБД PostgreSQL .

Задача

Определение ожидания СУБД, оказывающего наибольшее влияние на производительность СУБД .

Эксперимент

Нагрузочное тестирование с использованием инструментария pg_stat_tester (Сценарий 2 : OLTP).

Анализируемые данные - коэффициент корреляции между операционной скоростью и ожиданиями СУБД .

Результаты эксперимента

Коэффициент корреляции между операционной скоростью и количеством ожиданий(все ожидания) .

Ось Y - коэффициент корреляции(все ожидания). Ось X - точка наблюдения.

Ось Y - коэффициент корреляции(все ожидания). Ось X - точка наблюдения.

Вполне ожидаемый результат - с ростом нагрузки коэффициент растет по модулю . Т.е. чем больше ожиданий, тем ниже операционная скорость.

Коэффициент корреляции между операционной скоростью и ожиданиями типа "Lock".

Ось Y - коэффициент корреляции(ожидания "Lock") . Ось X - точка наблюдения.

Ось Y - коэффициент корреляции(ожидания "Lock") . Ось X - точка наблюдения.

Коэффициент корреляции между операционной скоростью и ожиданиями типа "LWLock".

Ось Y - коэффициент корреляции (ожидания "LWLock"). Ось X - точка наблюдения.

Ось Y - коэффициент корреляции (ожидания "LWLock"). Ось X - точка наблюдения.

Корреляционный анализ

Графический анализ.

График коэффициента корреляции по ожиданию "Lock" более ближе к графику по ожиданиям , чем график коэффициента корреляции по ожиданию "LWLock" .

Ось Y - все ожидания(синий), ожидания "Lock"(красный). Ось X - точка наблюдения.

Ось Y - все ожидания(синий), ожидания "Lock"(красный). Ось X - точка наблюдения.

Ось Y - все ожидания(синий), ожидания "LWLock"(красный). Ось X - точка наблюдения.

Ось Y - все ожидания(синий), ожидания "LWLock"(красный). Ось X - точка наблюдения.

Статистический анализ

Значение стандартного отклонения разницы значений по всем ожиданиями и ожиданиям "Lock" = 0,08560839

Значение стандартного отклонения разницы значений по всем ожиданиями и ожиданиям "LWLock" = 0,339815

Значение стандартного отклонения для ожидания "Lock" ниже значения стандартного отклонения для ожидания "LWLock".

Итог

Для данного сценария нагрузки - ожидания типа "Lock" оказывают существенно большее влияние на снижение производительности, по сравнению с ожиданиями типа "LWLock".

Показать полностью 5
[моё] Субд Postgresql Мониторинг Производительность Статистика Анализ данных Длиннопост
0
kznalp
kznalp
Лига Новых Технологий
Серия СУБД PostgreSQL

PG_HAZEL - оперативный уровень анализа метрик производительности⁠⁠

10 месяцев назад

Взято с основного технического канала Postgres DBA

Начало и описание метрик производительности : PG_HAZEL - оперативно-тактический комплекс мониторинга производительности СУБД PostgreSQL .

Продолжение - анализ метрик производительности в ходе нагрузочного тестирования.

Сценарий нагрузочного тестирования

Стандартный сценарий аналогичный TPC-B.

Рост нагрузки , экспоненциально : --client=клиенты

Число имитируемых клиентов, то есть число одновременных сеансов базы данных.

Продолжительность тестового прохода = 10 минут.

Максимальная нагрузка = 100 клиентов.

Общее число проходов = 20

Результаты нагрузочного тестирования

Нагрузка на СУБД

Ось X - номер прохода. Ось Y - количество клиентов.

Ось X - номер прохода. Ось Y - количество клиентов.

Операционная скорость тестового SQL запроса

Ось X - количество клиентов. Ось Y - операционная скорость.

Ось X - количество клиентов. Ось Y - операционная скорость.

Медианное время работы тестового SQL запроса

Ось X - количество клиентов. Ось Y - медианное время работы SQL запроса

Ось X - количество клиентов. Ось Y - медианное время работы SQL запроса

Решение задач оперативного уровня

Как было определено в статье PG_HAZEL : оперативно-тактический комплекс мониторинга производительности СУБД PostgreSQL - общее описание.

В процессе анализа производительности СУБД , во-первых необходимо решить задачи оперативного уровня :

  1. В каком состоянии находится производительность СУБД в данный момент времени?

  2. Какая тенденция развития производительности СУБД на текущий момент или в прошлом?

  3. На сколько снизилась производительность СУБД по сравнению с выбранным промежутком из прошлого?

В каком состоянии находится производительность СУБД в данный момент времени? Какая тенденция развития производительности СУБД на текущий момент или в прошлом?

Для ответа на данные вопросы достаточно проанализировать график изменения комплексного индикатора производительности в ходе нагрузочного тестирования.

Ось X - точка времени снятия данных . Ось Y -комплексный индикатор производительности СУБД

Ось X - точка времени снятия данных . Ось Y -комплексный индикатор производительности СУБД

Ответ - функция комплексного индикатора производительности носит кусочно-непрерывный характер и уменьшается в ходе тестирования.

На сколько снизилась производительность СУБД по сравнению с выбранным промежутком из прошлого?

Снижение производительности в ходе нагрузочного тестирования составило -20,1969%

Итог

Использование оперативно-тактического комплекса pg_hazel позволяет решать задачи анализа производительности СУБД на оперативном уровне.

Показать полностью 4
[моё] Postgresql Субд Производительность Мониторинг Статистика Анализ данных Длиннопост
0
3
kznalp
kznalp
Лига Новых Технологий
Серия СУБД PostgreSQL

PG_HAZEL - оперативно-тактический комплекс мониторинга производительности СУБД PostgreSQL ⁠⁠

10 месяцев назад

Взято с основного технического канала Postgres DBA

PG_HAZEL - оперативно-тактический комплекс мониторинга производительности СУБД PostgreSQL

Предисловие и предыстория

Рgpro_pwr — инструмент стратегического мониторинга нагрузки на базу данных, который помогает DBA выявлять самые ресурсоёмкие операции.

pg_profile и pgpro_pwr: анализируем производительность БД

Однако, в ходе решения задач сопровождения СУБД PostgreSQL возникают не только стратегические , но и оперативные и тактические задачи для которых инструмент стратегического мониторинга довольно громоздкий , что не очень удобно для быстрого решения ряда задач.

Задачи решаемые на оперативном уровне:

  1. В каком состоянии находится производительность СУБД в данный момент времени?

  2. Какая тенденция развития производительности СУБД на текущий момент или в прошлом?

  3. На сколько снизилась производительность СУБД по сравнению с выбранным промежутком из прошлого?

Задачи тактического уровня:

  1. Какая База Данных оказывает наибольшее влияние на производительность кластера в целом?

  2. Какой/какие SQL запросы оказывают наибольшее влияние на снижение производительности ?

Предпосылки создания инструмента pg_hazel.

Производительность СУБД - как рассчитать ?

В ходе предварительных исследований были проверены разные способы расчета метрики производительности СУБД .

Подробнее здесь: Производительность СУБД PostgreSQL — расчет метрики, временной анализ, параметрическая оптимизация

Однако , методы описанные в статье , к сожалению имеют свои аномалии.

Теоретически, наиболее близким к физическому определению производительность системы будет объемная скорость информации переданной клиенту , или другими словами - объем строк переданных запросом. Но к сожалению, на текущий момент , получить такую информацию - нет технической возможности. Важно - количество строк в запросе это не объем. Длина строки внутри выборки может меняться в очень широких диапазонах.

Поэтому было принято решения - непосредственный расчет производительности СУБД как физической величины - отложить на будущее, до реализации механизма получения объема данных переданных запросом.

Для решения задач анализа производительности СУБД используются индикаторы производительности СУБД и комплексный анализ изменения значений метрик производительности СУБД.

Структура pg_hazel

Источником данных являются представления расширения pgpro_stats

G.3.4.1. Представление pgpro_stats_statements

Статистика, собираемая модулем, выдаётся через представление с именем pgpro_stats_statements. Это представление содержит отдельные строки для каждой комбинации идентификатора базы данных, идентификатора пользователя и идентификатора запроса

G.3.4.2. Представление pgpro_stats_totals

Агрегированная статистика, собранная модулем, выдаётся через представление pgpro_stats_totals. Это представление содержит отдельные строки для каждого отдельного объекта БД

Данные собираются ежеминутно и агрегируются на 3-х уровнях:

  1. Уровень Кластера

  2. Уровень Базы Данных

  3. Уровень SQL запроса

Дополнительные данные pg_hazel

Как было указано ранее данные о среднем времени выполнения запроса собираемые в расширениях pg_stat_statements или pgpro_stats имеют очень серьезную проблему - среднее арифметическое не устойчиво к выбросам.

Подробнее здесь О проблеме использования mean_exec_time при анализе производительности PostgreSQL

Поэтому для корректного расчета среднего времени выполнения запроса используется не среднее арифметическое , а медиана.

К сожалению, расчет проводимый на уровне БД требует специальной подготовки для тестового запроса и дополнительных ресурсов для хранения и статистического анализа данных. Поэтому применяется не для всех SQL запросов а только для конкретных тестовых запросов:

  1. Benchmark кластера - медианное время выполнения тестового запроса для оценки производительности кластера в целом.

  2. Тестовый запрос стресс-тестирования - медианное время выполнения запроса по выбранному сценарию в ходе проведения стресс-теста(нагрузочного тестирования)СУБД.

Данные собираемый pg_hazel

1. Уровень Кластера

  1. Операционная скорость - количество завершенных операций и сформированных строк за период .

  2. Объемная скорость - объем обработанных блоков распределенной/локальной/временной области за период.

  3. Активные сессии - количество активных сессий на точку времени.

  4. Ожидания - количество событий ожидания СУБД за период.

  5. BUFFERPIN - количество событий ожидания bufferpin за период.

  6. EXTENSION - количество событий ожидания extension за период.

  7. IO - количество событий ожидания io за период.

  8. IPC - количество событий ожидания ipc за период.

  9. LOCK - количество событий ожидания lock за период.

  10. LWLOCK - количество событий ожидания lwlock за период.

  11. WAITING_RATIO - относительная доля ожиданий СУБД в общем времени работы СУБД за период.

  12. CORRELATION - коэффициент корреляции между количеством активных сессий и операционной скоростью.

  13. BENCHMARK - медианное время выполнения тестового запроса.

  14. CPI - комплексный индикатор производительности = Операционная скорость / BENCHMARK .

2.Уровень Базы данных

  1. Операционная скорость - количество завершенных операций и сформированных строк за период .

  2. Объемная скорость - объем обработанных блоков распределенной/локальной/временной области за период.

  3. Активные сессии - количество активных сессий на точку времени.

  4. Ожидания - количество событий ожидания БД за период.

  5. BUFFERPIN - количество событий ожидания bufferpin за период.

  6. EXTENSION - количество событий ожидания extension за период.

  7. IO - количество событий ожидания io за период.

  8. IPC - количество событий ожидания ipc за период.

  9. LOCK - количество событий ожидания lock за период.

  10. LWLOCK - количество событий ожидания lwlock за период.

  11. WAITING_RATIO - относительная доля ожиданий БД в общем времени работы БД .

3.Уровень SQL запроса

  1. Операционная скорость - количество завершенных операций и сформированных строк за период .

  2. Объемная скорость - объем обработанных блоков распределенной/локальной/временной области за за период .

  3. Активные сессии - количество активных сессий на точку времени.

  4. Ожидания - количество событий ожидания SQL запроса за период.

  5. BUFFERPIN - количество событий ожидания bufferpin за период.

  6. EXTENSION - количество событий ожидания extension за период.

  7. IO - количество событий ожидания io за период.

  8. IPC - количество событий ожидания ipc за период.

  9. LOCK - количество событий ожидания lock за период.

  10. LWLOCK - количество событий ожидания lwlock за период.

  11. WAITING_RATIO - относительная доля ожиданий SQL запроса в общем времени работы SQL запроса .

Важное уточнение

Для данных используется медианное сглаживание - короткий период 10 минут , долгий период 60 минут.

Примеры практического применения и анализа на основе собранных данных - в следующих статьях.

Показать полностью 1
[моё] Postgresql Субд Производительность Мониторинг Длиннопост Статистика Анализ данных
0
4
fakir22
fakir22
Лига статистиков

Дед Мороз и латентное размещение Дирихле⁠⁠

2 года назад

На детский утренник пришел Дед Мороз с тремя мешками конфет от разных организаций. В каждом мешке разные конфеты и они перемешаны. Одних конфет много в одном мешке и нет в другом. Других конфет примерно поровну во всех мешках.

И решил дед Мороз раздать по быстрому конфеты и продолжить праздновать. Раскрыл он мешки и давай детишкам отсыпать конфеты горстями. А поскольку он праздновал уже с самого утра, то совсем не следил кому и сколько конфет он выдает. Потому кому-то досталось по горсти из каждого мешка, кому-то десяток горстей из одного - вообщем полный беспорядок.

Под конец раздачи пришла Мария Ивановна - заведующая детским садиком, чтобы для отчетности пересчитать конфеты в мешках. Но застала только счастливых детей, три пустых мешка и уснувшего деда мороза.

Заведующая была опытным статистиком. Взглянув на деда Мороза она сразу поняла, что он проделал с конфетами латентное размещение Дирихле. А потому есть хороший шанс восстановить сколько и каких конфет лежало в каждом мешке и по скольку горстей конфет из мешков было выдано каждому ребенку.

Вот например, у Машеньки десяток сникерсов, но нет чупа-чепсов, а у Сережи десяток чупа-чупсов и ни одного сникерса. Значит сникерсы и чупа-чупсы лежали в разных мешках. У Танечки примерно пять сникерсов и пять чупа-чупсов, значит дед мороз выдал Маше и Сереже по паре горстей из одного мешка а Тане по горсти из каждого. Вот таким образом что-то понять можно.

Мария Ивановна запустила компьютер, переписала в файл кто и сколько получил конфет и написала скрипт, который ищет максимум вероятности получить такой расклад конфет в пространстве множества параметров - количества конфет в мешках и количество горстей из этих мешков выданных каждому ребенку. Она запустила скрипт и увидела, что процесс поиска сходится. Happy End

Показать полностью
[моё] Теория вероятностей Статистика Анализ данных Текст
0
71
TheExplorer
TheExplorer
Наука | Научпоп

Большой скандал в научном мире прямо сейчас. Часть 4 – заключительная⁠⁠

2 года назад

Это перевод четвертой – и последней – статьи из серии расследований Data Colada про фальсификацию данных в статьях профессора Гарвардской школы бизнеса Франчески Джино.

Предыдущие части в моем переводе: первая, вторая и третья.

Напоминаю, что посты этой серии являются моим вольным пересказом расследований Data Colada; все картинки тоже оттуда. Авторы расследования уточняют, что в подготовке завершающей серии участвовали молодые исследователи, которые предпочли остаться анонимными, а соавторы Джино никак не участвовали в сборе и анализе данных для исследования ниже.

Часть 4: Забывая слова

В этой части речь пойдет о статье Джино, Коучаки и Кашаро «Зачем объединяться? Моральные последствия нетворкинга с фокусом на продвижении или предотвращении» [“Why Connect? Moral Consequences of Networking with a Promotion or Prevention Focus”] (2020), а именно об Исследовании 3(а).

Хочу от себя сразу добавить, что перевод терминов почти буквален и из-за этого может показаться стремным😬 Если вы знаете, как можно было бы лучше передать смысл терминов «networking», «mindset», «promotion focused», «prevention focused», пишите в комменты, интересно!

Также сама идея этого исследования Джино мне лично не кажется интересной, но чего только люди не изучают.

Для ЛЛ: в этот раз Джино прокололась не на сортировке данных, а на том, что подделала количественные данные, забыв исправить качественные – ответы на открытый вопрос.

Итак.

В этой статье Джино и соавторы предположили, что ментальные установки могут влиять на то, как люди относятся к нетворкингу. Установки, которые они изучали, известны как «ориентация на продвижение» и «ориентация на предотвращение». Первая включает в себя размышления о том, что человек хочет делать, а вторая – что должен. Гипотеза авторов была в том, что люди будут хуже относиться к нетворкингу, если будут настроены на «предотвращение».

То есть глобально суть в том, что настрой перед мероприятием будет влиять на то, как мы его воспримем.

Участников (599 человек) попросили выполнить короткое письменное задание, чтобы спровоцировать установку на продвижение, на предотвращение или на отсутствие каких-либо установок. Для этого их случайным образом распределили по группам и попросили написать об одной из трех вещей:

1.Надежда или стремление (установка на продвижение)

2. Долг или обязательство (установка на предотвращение)

3. Их обычные вечерние занятия (контрольное состояние)

После письменного задания участники попросили представить, что они находятся на социальном (нетворкинг-) мероприятии, где они установили какие-то профессиональные связи.

Затем участников просили оценить по 7-балльной шкале, насколько это мероприятие заставило их почувствовать себя: грязным, испорченным, неаутентичным, пристыженным, неправильным, неестественным, нечистым. Среднее этих семи определений представляло собой ключевую зависимую переменную, которую авторы расследования предложили назвать «моральной нечистотой» (1 – в нетворкинге нет ничего плохого; 7 – нетворкинг максимально «нечистый»).

Наконец, что очень важно для расследования, участников попросили перечислить 5-6 слов, описывающих их чувства по поводу мероприятия по нетворкингу. Джино и соавторов эти слова не особо интересовали, их даже никак не проанализировали. Но для Data Colada именно они стали ключиком к раскрытию фальсификации.

Результаты статьи

Как обычно, гипотеза авторов была убедительно подтверждена статистикой: участники чувствовали себя более нечистыми в отношении мероприятия по нетворкингу при установке на предотвращение, чем при установке на продвижение (F(2, 596) = 17,69, p < 0,0000001).

Но посмотрим на базу данных

Она была размещена в открытом доступе в 2020 году.

В верхней строке показан участник, который поставил «1» для всех элементов «нечистоты». То есть он совсем не чувствовал себя грязным, испорченным, неаутентичным и т. д., «находясь» на мероприятии по нетворкингу. Слова, которые он написал, также были положительными: «Комфортно», «Принимаемый», «Принадлежность», «Командная работа» и т. д.

Положительные оценки – положительные слова. Логично.

Рейтинг моральной нечистоты

На графике ниже показан средний рейтинг моральной нечистоты для каждого участника исследования.

В контрольном условии (слева) мы видим, что 92 участника поставили 1,0 балл, то есть они не чувствовали себя нечистыми ни по одному из пунктов шкалы. В целом, кажется логичным, что многие участники ответили бы таким образом. Возможно, нет ничего грязного или неправильного в установлении дружеских связей с коллегами.

Но посмотрим теперь на условие предотвращения (посередине), для которого авторы предсказали более высокие (более «нечистые») оценки. Действительно – там намного меньше единиц, но зато много двоек и троек.

И это кажется странным.

Если это среднее значение семи оценок, то самый простой и распространенный 2,0 получается, когда все семь оценок равны 2. Хотя авторам Data Colada не кажется удивительным, что многие люди ответили 1 на все пункты шкалы, для них странно, что так много людей поставили по всем пунктам 2 или 3, то есть они чувствовали себя немного грязными, немного неаутентичными, немного пристыженными и т. д.

Это вызвало подозрение, что данные в условии предотвращения были подделаны, а именно некоторые из «все 1» были заменены на «все 2» и «все 3».

Data Colada также заметили, что в условии продвижения отсутствуют очень высокие значения, зато много средних 1,0, что тоже позволило заподозрить, что некоторые из более высоких значений были вручную изменены на 1,0.

Попробуем проверить эти подозрения. Используя слова.

Джино и соавторам не были интересны слова, которые написали участники. Но именно они и раскрывают всю картину мошенничества.

Насколько известно Data Colada, эти слова никогда не анализировались. Они даже не упоминаются в разделе результатов исследования.

Почему это так важно?

Потому что тот, кто хочет подделать результаты, может изменить оценки, забыв изменить слова.

И, похоже, так и произошло. Далее в анализе будут противопоставлены подделанные оценки мероприятия по нетворкингу и описывающие его слова, которые подделать забыли.

Для анализа слов нужно было количественно определить, что они выражают. Для этого было нанято три человека, которые не знали, что конкретно проверялось и которые независимо оценили общую позитивность/негативность словосочетаний каждого участника по шкале от 1 – крайне негативно до 7 – крайне позитивно. Эти оценки затем усреднялись, чтобы получить для каждого участника общий показатель позитивности/негативности их слов.

Посмотрим внимательнее на фальсификацию №1 – подозрительные 2,0 и 3,0 в условии предотвращения

Первое (и самое сильное) подозрение заключалось в том, что морально «нечистые» 2,0 и 3,0 в условии предотвращения исходно были 1,0, то есть совершенно «чистые». Если это правда и если их слова не были изменены, тогда мы должны увидеть, что слова, связанные с этими 2,0 и 3,0, слишком позитивны.

Чтобы убедиться, что это так, давайте сначала просто посмотрим на необработанные данные.

Строки на снимке отсортированы по степени положительности слов, так что самые отрицательные словосочетания находятся сверху. Синим цветом выделены получившие положительную оценку (выше среднего). Слева – предположительно подделанные 3,0, справа – предположительно настоящие оценки от 2,0 до 3,0.

Поскольку 3,0 по «нечистоте» выше, чем значения между 2,0 и 3,0 мы должны увидеть, что для 3,0 написали больше негативных вещей. Но вместо этого мы видим намного больше положительных. И это очень странно. Если только эти 3,0 исходно не были 1,0.

Попробуем проверить это подозрение количественным анализом.

По оси Y представлены оценки слов, которые написали участники и которые оценивали независимые эксперты (чем больше, тем позитивнее), а по оси X – те количественные оценки, которые поставили сами участники. Четыре синие точки на линии или рядом с ней представляют средний рейтинг слов для участников, которые дали оценки моральной нечистоты 1,0; от 1,0 до 2,0; от 2,0 до 3,0; и выше 3,0. И все они логичны.

Но обратите внимание на красные точки, которые обозначают средний рейтинг, связанный слов со «всеми 2» и «всеми 3» в условии предотвращения. Они не имеют смысла, так как ассоциируются со слишком позитивными словами. Действительно, они так же положительны, как и «все 1» в остальной части набора данных. Это дополнительное свидетельство того, что эти «все 2» и «все 3» раньше были «всеми 1».

Теперь перейдем к фальсификации № 2: подозрительные 1,0 в условии продвижения.

Второе (и более слабое) подозрение заключалось в том, что некоторые рейтинги высокой моральной нечистоты в условии продвижения были изменены на 1,0.

Чтобы проверить это, Data Colada внимательнее изучили подгруппу участников, которых они условно назвали «любители нетворкинга». Это участники, которые поставили «1» по всем семи пунктам моральной нечистоты (и, таким образом, не нашли ничего нечистого в нетворкинге), а также поставили «7» четырем последующим пунктам, которые оценивали, насколько вероятно, что они добровольно будут участвовать в нетворкинге в следующем месяце (то есть предельно вероятно).

Эти «любители нетворкинга» были максимально позитивно настроены в отношении нетворкинга по всем доступным им шкалам оценки. И поэтому логично ожидать, что они напишут положительные отзывы о мероприятии. Но если некоторые из этих 1,0 были подделаны и в реальности оценили нетворкинг плохо, то некоторые из этих «любителей нетворкинга» должны были бы использовать довольно негативные слова для описания сети.

И это так.

В условии продвижения было 38 «любителей нетворкинга» (слева), а в контрольном условии и условии предотвращения – 22 (справа). На рисунке ниже показаны 15 «любителей нетворкинга» в каждой из этих двух групп, которые написали больше всего негативных слов. Каждое словосочетание, получившее отрицательную оценку (ниже средней точки шкалы), выделено красным.

Что же мы видим?

В наблюдениях, которые предположительно не подделывались (условия контроля и предотвращения – справа), только один из 22 «любителей нетворкинга» написал о нем негативные слова, и то, что он написал, было лишь слегка негативным (на 3,3 из 7). Однако в наборе наблюдений, которые предположительно включают фальсифицированные данные (условие продвижения), 8 из 38 написали отрицательные отзывы о нетворкинге, и во многих случаях эти слова были очень негативными.

С одной стороны, таких людей довольно мало, и только на основании этого анализа однозначных выводов сделать нельзя. С другой стороны, должно быть очень немного любителей нетворкинга, пишущих о нем негативные вещи, не говоря уже о целых 8 в одном условии.

Это принимается как косвенное доказательство того, что некоторые из этих 1,0 в условии продвижения раньше имели более высокие оценки моральной нечистоты.

Что, если мы просто проанализируем слова?

Если подозрения в фальсификации оценок верны, то эффект авторов должен исчезнуть при простом анализе слов. И он уходит.

Даже не просто уходит – он почему-то переворачивается. Люди использовали больше положительных слов для описания мероприятия по нетворкингу в условии предотвращения (M = 5,14, SD = 1,67), чем в условии продвижения (M = 4,74, SD = 1,92), что может означать, что фокус на продвижении вреден для самопрезентации.

Неизвестно, почему это так. Возможно, это случайность, поскольку значимость (p-value) не особо впечатляет. Возможно, данные были сфальсифицированы как-то еще. Или на самом деле верна гипотеза, противоположная той, что выдвинули авторы. Какой бы ни была причина, такой результат является дополнительным доказательством того, что данные были cфальсифицированы.

Комментарий Data Colada:

«Мы получили подтверждение извне Гарварда, что сотрудники Гарварда просмотрели исходный файл данных Qualtrics и что данные действительно были изменены».

Мой комментарий

Если честно, само исследование Джино какое-то дурацкое, но было интересно прочитать про еще один способ раскрытия фальсификаций.

Показать полностью 5
[моё] Наука Исследования Фальсификация Анализ данных Статистика Длиннопост
5
20
sterblich
sterblich
klein, aber oho!
Книжная лига
Серия Критическое мышление

Не доверяй интуиции (1)⁠⁠

2 года назад

Мы часто верим интуиции. Стоит ли постоянно полагаться на столь неуловимое чувство? Вряд ли. Ведь может и обмануть. Об этом свидетельствует бездушная статистика. Эта статистика является темой новой книги Сета Стивенса-Давидовица. В ней он демонстрирует (якобы) неожиданные выводы, которые следуют из анализа больших объёмов данных.

Не доверяй интуиции. Использование данных вместо инстинкта чтобы сделать лучший выбор.

Это не первая книга Сета. Предыдущая, которая называется «Все лгут», стала бестселлером и была переведена на ряд языков, включая русский. Всё верно, все лгут, но только не поисковой машине. Ей признаются и в настоящем размере своего члена. Во всяком случае, статистика поиска фразы «мой пенис 5 дюймов» это подтверждает.

По заголовку второй книги сразу видно, что автор погнался за длинным долларом, решив написать книгу по самопомощи. Он это и не скрывает, указывая, что этот жанр нон-фикшена пользуется наибольшей популярностью – 42% всех бестселлеров. Он даже добавил слово «Вы» в первое же предложение. Мы любим поучения, если верить статистике подчёркнутых фраз в электронных книгах.

Чему же призывает верить Стивенс-Давидовиц, если не не интуиции? Данным. Статистике. Цифры не лгут. Новая религия – датаизм – захватывает умы наших современников. Вполне в канонах датаизма написана и наша книжка: автор берётся ответить на важные вопросы нашей жизни при помощи статистики.

Вопрос 1: за кого выйти замуж, чтобы быть счастливой?

Канадский учёный Самманта Джоэль в команде с другими исследователями изучала влияние демографии, предпочтений, ценностей и прочих факторов на счастье в супружестве. Результаты оказались не столь оптимистичны: ощутимого влияния обнаружено не было. На вопрос «Каким должен быть супруг?» большинство отвечает, что характер должен быть надёжный. Врут, конечно. Сами-то ищут симпатичную или высокого (в зависимости от пола кандидата). Посудите сами: для компенсации недостатка внимания на онлайн-бирже знакомств мужчине примерно путинского роста потребуется дополнительный доход в 175 тысяч долларов в год! Тогда у него будет столько же запросов на знакомство, сколько у претендента ростом в 182 см. Каждый сантиметр добавляет всё больше кликов. Особой популярностью пользуются светлокожие соискатели и соискательницы, причём у всех рас. Очень уважают также состоятельного партнёра, а также «крутую» его профессию типа адвоката, военного или врача. Ещё предпочитают знакомится с похожими на себя в смысле возраста, образования, дохода или даже внешнего вида.

Вероятность ответного желания познакомиться в зависимости от внешнего вида отправительницы.

И всё же пословица гласит, что хорошо бы родиться не красивой, а счастливой. Какие перспективы у счастья в браке? Ответ учёных в этом смысле прост и очевиден: тот чаще счастлив в браке, кто был счастлив и до него. Ну а как насчёт красоты, расы, роста, денег, профессии и прочего? Если верить Саманте Джоэль, влияние этих факторов далеко не очевидно. Зато можно смотреть на другие качества. Помимо удовлетворения жизнью, это безопасный тип привязанности, добросовестность и установка на рост.

Типы привязанности

Безопасный тип привязанности формируется у ребёнка, который доверяет и полагается на помощь своих родителей. Хотите узнать о своём типе? Здесь можно протестироваться. Хотите узнать о своей добросовестности? Вам сюда. А как насчёт установки на рост? Вы стараетесь в жизни достичь большего? Узнаете здесь.

-------------------------

Ну и чем это отличается от «надёжного характера», который на словах ищет большинство? Мало чем, откровенно говоря. Ну а что заглядываются на красивых – это биология. Встреча – это ведь не проводы замужество. По одёжке встречают, а провожают по уму. Одним словом, выводы автора довольно тривиальны. А чему удивляться – народная мудрость знает всё и до него.

Я убеждён: счастье в браке (и не только) исследовало великое множество учёных. Наш автор взял несколько статей и тиснул себе в книжку. Ну и чем он лучше других подобных авторов? Лишь тем, что он, всё же, опирается на науку и эмпирические данные, а не на интуицию. Здесь он прав. Но опираться – это не значит безоговорочно доверять. Наука тоже может ошибаться.

Показать полностью 3
[моё] Книги Обзор книг Критическое мышление Статистика Анализ данных Нон-фикшн Длиннопост
5
81
TheExplorer
TheExplorer
Наука | Научпоп

Большой скандал в научном мире прямо сейчас. Часть 3⁠⁠

2 года назад

Это перевод третьей статьи из серии расследований Data Colada про фальсификацию данных в статьях профессора Гарвардской школы бизнеса Франчески Джино.

Первую часть можно прочитать тут, вторую – тут.

Напоминаю, что этот пост является моим вольным пересказом расследования Data Colada; все картинки тоже оттуда.

Погнали.

Часть 3: Обманщики вне порядка

В этот раз речь пойдет о статье Джино и Вильтермута «Злой гений? Как нечестность может приводить к большей креативности» [“Evil Genius? How Dishonesty Can Lead to Greater Creativity”], опубликованной в 2014 году, а именно об Исследовании 4.

Авторы расследования из Data Colada уточняют, что, по имеющейся у них информации, соавтор Джино не проводил и не помогал со сбором данных для эксперимента, о котором пойдет речь. База данных получена несколько лет назад напрямую от профессора Джино.

Что изучали?

Эксперимент проводился онлайн. Участники (178 человек) сначала выполняли задачу, в которой подбрасывали виртуальную монету и в которой можно было смошенничать. После этого участникам предлагалось два творческих задания. Далее сосредоточимся на результатах задачи «использования», в которой нужно было в течение 1 минуты придумать как можно больше творческих способов использовать газету (эта задача ранее применялась другими учеными как способ оценки креативности).

Что получили?

Гипотеза авторов подтвердилась: участники, которые сжульничали при подбрасывании монеты, придумали больше вариантов использования газеты (M = 8,3, SD = 2,8), чем участники, которые не обманывали (M = 6,5, SD = 2,3, p <,0001).

Но снова аномалия: неупорядоченные наблюдения

Как и в первой части расследования, фатальный признак фальсификации связан с сортировкой данных.

База практически идеально отсортирована по двум столбцам: сначала по столбцу «Обманывали», указывающему, обманывали ли участники в задаче на подбрасывание монеты (0 – не обманывали; 1 – обманывали), а затем по столбцу «Количество ответов», в котором указано, сколько вариантов использования газеты придумал участник.

Как и в первом расследовании, тот факт, что сортировка почти идеальна, и палит всю контору.

Давайте посмотрим, как сортируются данные. На приведенном ниже скриншоте показаны первые 40 наблюдений. Поскольку данные сначала сортируются по столбцу «Обманывали», все эти наблюдения представляют НЕмошенников, у которых, соответственно, в этом столбце 0 баллов. И далее они прекрасно сортируются по столбцу «Количество ответов» – все 135 человек.

Посмотрим теперь на обманщиков.

О нет: несмотря на то, то 43 обманщика также отсортированы по числу ответов, среди них есть 13 наблюдений, расположенных не в том порядке, в котором они должны быть.

Это дает основание заподозрить, что эти 13 наблюдений были изменены вручную после сортировки для получения желаемого эффекта.

Здесь важно отметить три вещи

1. Не представляется возможным отсортировать набор данных таким образом, чтобы получить порядок, в котором находились данные. Они либо были первоначально введены таким образом (что маловероятно, поскольку данные исходно были файлом Qualtrics [онлайн-платформы для исследований], который по умолчанию сортируется по времени), либо они были изменены вручную.

2. Напомним, что строки сортируются по столбцу «Количество ответов». Если значения, которые находятся не по порядку, были изменены, несложно выяснить, какими они были исходно. Например, в строке №141 есть «13». Строка над ней имеет «4», а первое по порядку значение после нее — «5». Следовательно, если данные были изменены, то можно предположить, что эта «13» раньше была либо «4», либо «5».

3. Появится чуть дальше, а сначала

Попробуем догадаться, как выглядели исходные данные

Ниже вы можете увидеть два новых столбца — «Предполагаемый минимум» и «Предполагаемый максимум», в которых есть два предполагаемых значения. В некоторых случаях точно известно, какое число менялось, в некоторых – оно находится в пределах ±1.

Посмотрим, есть ли различия между выложенным-сфальсифицированным датасетом (слева) и предположительно-реальным (справа) на графиках:

И переходим к пункту

3. Существенная связь между мошенничеством и творчеством исчезает, когда вы анализируете предположительно-реальные значения, а не выложенные Джино и соавтором. Значение p меняется от < ,0001 до ,292 (для предполагаемых минимальных значений) и p = ,180 (для предполагаемых максимальных).

То есть

Если бы значения не изменили вручную, никакой существенной разницы между мошенниками и немошенниками бы не было.

Далее будет более хардкорный анализ для интересующихся

Представим, что на самом деле нет никакой разницы между мошенниками и немошенниками в их способности придумать, как можно использовать газету.

При отсутствии фальсификации данных мы ожидаем не только, что среднее количество ответов будет одинаковым, но и что распределения целиком для обеих групп будут одинаковыми. Например, значение, которое находится на 20-м процентиле, должно быть одинаковым как для мошенников, так и для немошенников. И это также верно для 50-го процентиля, 80-го, 90-го и так далее.

Что ж, посмотрим на распределения обеих групп после фальсификации (слева) и предположительно-реальные (справа).

Тест Колмогорова-Смирнова для непараметрического сравнения целых распределений показывает p = ,456, что не позволяет отклонить гипотезу о том, что эти два распределения одинаковы (то есть они одинаковы).

Хорошо, но насколько впечатляет этот нулевой результат? Он принимается в качестве доказательства, что 13 наблюдений, «возвращенных к реальности» – на самом деле были сфальсифицированы.

Но, возможно, это неправда. Может быть, не имеет значения, какие 13 наблюдений вы измените? Что, если вы измените любые другие 13 наблюдений (из мошеннической группы) на ту же величину? Получим ли мы такие же похожие распределения и, например, такое же высокое значение p в тесте Колмогорова-Смирнова?

Краткий ответ: нет.

Data Colada провели несколько консервативных симуляций миллион раз. Каждый раз оценивалось сходство мошенников и немошенников с помощью теста Колмогорова-Смирнова и отслеживалось его p-значение.

Посмотрите на красную точку, обозначающую p-значение после изменения тех самых 13 наблюдений. Нужно было быть чрезвычайно, невероятно удачливым, чтобы выбрать именно их и получить настолько похожие распределения по группам исключительно случайно.

То есть

Не существует (почти) никакого другого набора из 13 значений, которые вы могли бы изменить на ту же величину, чтобы получить два настолько похожих распределения. Этот результат довольно убедительно подтверждает, что сфальсифицированные ячейки и их исходные значения были определены правильно.

Комментарий Data Colada

«Мы считаем, что у Гарвардского университета есть доступ к файлу Qualtrics, который мог бы полностью подтвердить (или опровергнуть) наши опасения. Мы сообщили им, какой файл получить, какие ячейки проверить и какие значения они найдут в файле Qualtrics, если мы окажемся правы. Мы не знаем, сделали ли они это, и что они нашли, если сделали. Все, что мы знаем, это то, что 16 месяцев спустя они потребовали отозвать статью».

Спасибо, что прочитали.

Четвертая часть расследования пока не вышла, но ждем с нетерпением!

Показать полностью 6
[моё] Наука Обман Фальсификация Анализ данных Статистика Ученые Длиннопост Негатив
2
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии