Медицинская статистика, начало, 3
Всем здравствуйте!
Поехали дальше?
Графики
Цель исследования ясна, выборка сформирована, а данные об изучаемых объектах собраны. Пришло время считать показатели и строить графики!
Что бы посмотреть на основные ошибки рассмотрим реальный пример и пока начнем с графиков, т.к. в некоторых случаях нужны нативные характеристики, или же они посчитаны кем-то другим.
Недавнее исследование об уровне тревожности студентов перед экзаменационной сессией, проводившееся в одном из медицинских Университетов.
После сформирования выборки (Университет) было решено использовать уже готовый опросник измерения уровня тревожности: шкалу проявления тревоги Тейлора (1953), в редакции Немчинова. Этот опросник находится в свободном доступе, можете с ним ознакомиться.
Так как большинство людей не любят бумажки, а ходить с набором анкет – времязатратно, было принято решение провести опрос в онлайн форме. Для этого был выбран сервис – Google Forms. Там всё интуитивно понятно, он бесплатен, дает нам возможность работать в электронной среде, а не переводить всё с бумаги в компьютерные таблицы.
К основным вопросам анкеты были добавлены следующие вопросы: “направленность Университета” – в целях удаления группы лиц, которые будут не в нашем университете, “на каком Вы курсе?” – что бы узнать уровень тревожности от курса к курсу, а также “сколько времени Вы потратили на тестирование?” – в целях удаления людей, которые слишком долго думали над ответом.
Несколько дней погодя и набрав данных, с сервиса форм была получена таблица вида:
Теперь следует приступить к фильтрации. Согласно верхним утверждениям мы удалили людей которые указали что-то кроме “медицинского Университета” (или не ответили вовсе) на вопрос “направленность Университета”. Удалили всех людей, которые проходили тестирование слишком долго (более 10 минут).
Далее распределяем все данные по группам (ранговым переменным): 1 курс/2 курс/3 курс и так далее. Теперь можно посчитать несколько характеристик (среднее по совокупности, стандартное отклонение и стандартную ошибку), но в методы высчитывания пока вдаваться не будем. Самое главное сейчас понять общий принцип работы.
После подсчёта уже можно строить график, который будет отражать изменение среднего балла тревожности от курса к курсу. В этом кроется зло. Многие думают, что построить график – указать пару цифр в Excel. С одними и теми же данными можно построить совершенно разные графики. Зачастую многие недобросовестные исследователи, либо другие люди (рекламщики и т.д.) разрывают шкалы, меняя их в свою сторону.
К примеру: было решено построить график среднего количества больных в стационаре за каждый месяц года. Посмотрим внимательнее. Каждый месяц среднее, на первой и второй таблице, растет с шагом "2" до сентября, а после падает так же на "2" единицы за месяц. Но на первом графике шкала слева отражает происходящее лучше, она начинается с 0, а максимум её достигает на отметке 60 - всего на 10 единиц больше максимума графика. На втором графике шкала слева начинается не с нуля, и заканчивается выше, что опускает наш график, делает его приплюснутым. К тому же, снизу есть разрыв, из-за чего он выглядит как "больше снижения - меньше возрастания". Этот пример достаточно глуп, но в целом такое бывает часто. Особенно на графиках с экспоненциальными и параболическими графиками, где, масштабируя происходящее можно показать реальную картину, или же нужный отрезок (падение, возрастание, в зависимости от Вашей цели).
Вернемся к тревожности.
Мы построили график средних арифметических баллов за курс:
Кроме основной линии мы добавили линию тренда, которая обозначает тенденцию графика к возрастанию или убыванию.
Теперь нужно охарактеризовать увиденное и сделать выводы. Говорим что видим:
1) Согласно нашей выборке, среднее выборочное по совокупности для курсов составило: 22 на I, 25 на II, 25 на III, 24 на IV, 26 на V, 21 на VI баллов/курс соответственно.
2) Уровень тревоги студентов на всех курсах превышает 15 баллов, т.е. является средним, с тенденцией к высокому.
3) Как показывает линия тренда, уровень тревожности несколько падает с первого курса к шестому.
4) Тревожность в основном держится на постоянном уровне, но максимальный уровень тревожности наблюдается у студентов пятого года обучения и резко падает по сравнению с пятым курсом на шестом курсе.
Здесь мы старались не врать. Но когда мы будем писать выводы, в наши утверждения закрадутся множество ошибок. Давайте попробуем написать вывод:
1) Как показали проведенные исследования, в опросе приняли участие 394 человека, что составляет ≈21% от общего количества обучающихся на всех курсах данного факультета. Таким образом выборку можно считать репрезентативной.
2) Высокий процент обучающихся принявших участие в опросе показывает, заинтересованность студентов в таких опросах, и готовность принимать в них участие.
3) Результаты проведенного опроса показывают, что больший уровень тревожности наблюдается у студентов 5 (превышает 25 баллов, т.е. в соответствии со шкалой Тейлора является высоким) курса, что можно объяснить озабоченностью молодых людей успешным окончанием университета.
Но!
1) У нас не было контроля тестирования. Один и тот же человек мог пройти тест сколько угодно раз. Как и ответить на вопрос “как долго вы проходили тестирование” ложно. Для этого нужно создать ограничители в виде таймера в опроснике и регистрации участников, в целях получения точных ответов и пресечения повторных прохождений теста. Выборка - не репрезентативна.
2) Опросник, который мы выбрали, был не показательным. Там не было шкалы лжи, чтобы дифференцировать людей, который отвечали не впопад, или скрывали от нас своё состояние умышленно. Для такого узконаправленного тестирования нужен отдельный опросник, так как уровень тревоги в данный момент может быть связан с чем угодно: плохой погодой, простудой или же соседом, сверлящим стену. Нужен опросник, который будет направлен на отношение ученика к учебе, а не обобщать все жизненные переживания тестируемого. Еще лучше – несколько опросников. Первый – узконаправленный, второй – общий.
3) Делая какие-либо выводы, нужно сравнивать их с чем-то другим. Для более точного исследования нужно провести несколько таких исследований: в начале и конце осеннего семестра, в начале и конце зимнего семестра. Набрать группу контроля (аналогичные возрастные группы, которые не обучаются в данном университете). Тогда можно будет увидеть какую-то зависимость между учебным годом/уровнем тревожности и общей популяцией (при условии подходящих опросников).
Но, не смотря на все сказанное выше, нас нельзя опровергнуть, так как ничего другого нет, а статистика – лишь язык представлений.
by Imdelok
P.S.
Первая часть - https://pikabu.ru/story/meditsinskaya_statistika_nachalo_1_5...
Вторая часть - https://pikabu.ru/story/meditsinskaya_statistika_nachalo_2_5...














