Консультация № 187008
21.12.2012, 10:43
100.51 руб.
0 3 1
Добрый день, уважаемые эксперты!

Прошу помощи в решении следующего вопроса:
Есть две контрольные группы, представленные на листе 1 первая на листе 2 вторая. От каждой группы получены результаты по трем методикам. Они сведены в одну таблицу по одной группе и по второй. Мне нужно их коррелировать между собой (сделать статистику). На сколько я знаю кто то делал это в программе spss вроде, кто то считал по формуле Манна Уитни кажется.

Собственных знаний каким образом это сделать не хватает.
Кто может произвести данные вычисления и объяснить как это сделать в Excel по формуле Манна Уитни?

Каким образом я могу приложить Excel файл?

Обсуждение

Неизвестный
21.12.2012, 10:51
общий
Добавил файл с результатами. по которым нужно произвести вычисления
Прикрепленные файлы:
c438b1092bc6066490dc825a5b72fa4a.xls
давно
Мастер-Эксперт
17387
18345
22.12.2012, 14:49
общий

Здравствуйте, Иван! Чтобы помочь Вам, нужно знать, что именно нужно получить в итоге. Откуда взялось задание и как оно формулируется? Если Вы будете молчать, то Вам вряд ли кто-то из экспертов поможет.
Об авторе:
Facta loquuntur.
давно
Мастер-Эксперт
17387
18345
22.12.2012, 18:02
общий
это ответ
Здравствуйте, Иван!

Вы не захотели дать пояснения в мини-форуме консультации. Поэтому отвечаю на своё усмотрение. Сначала позволю себе дать небольшое теоретическое введение в решение задачи, учитывая, что в математической статистике Вы не обладаете нужными знаниями, по Вашим же словам.

Следующей задачей статистического анализа, решаемой после определения основных выборочных характеристик и анализа одной выборки, является совместный анализ нескольких выборок (в нашем случае - двух). Важнейшим вопросом, возникающим при анализе двух выборок, является вопрос о наличии различий между ними. Обычно для этого проводят проверку статистических гипотез о принадлежности обеих выборок одной генеральной совокупности или о равенстве генеральных средних.

Для решения задач такого типа используются так называемые критерии различия. Для проверки одной и той же гипотезы можно использовать разные критерии. Выбор критерия определяется как спецификой данных и проверяемых гипотез, так и уровнем статистической подготовки исследователя.

Статистические критерии различия подразделяются на параметрические и непараметрические. Параметрические критерии служат для проверки гипотез о параметрах распределения генеральной совокупности (чаще всего нормального распределения). Непараметрические критерии для проверки гипотез не используют предположений о законе распределения генеральной совокупности и не требуют знания параметров распределения.

Параметрические критерии служат для проверки гипотез о положении и рассеивании. Из параметрических критериев наибольшей популярностью при проверке гипотез о равенстве генеральных средних (математических ожиданий) используется t - критерий Стьюдента.

Критерий Стьюдента наиболее часто используется для проверки гипотезы: "Средние двух выборок относятся к одной и той же совокупности". Критерий позволяет найти вероятность того, что оба средних относятся к одной и той же совокупности. Если эта вероятность p ниже уровня значимости (p < 0,05), то принято считать, что выборки относятся к двум разным совокупностям.

При использовании критерия Стьюдента можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t - критерий). В этом случае есть контрольная группа и опытная группа, состоящие из разных респондентов, количество которых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t - критерий. Выборки при этом называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определённой дозой облучения.

В обоих случаях в принципе должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп и равенства дисперсий в сравниваемых совокупностях. Однако на практике по большому счёту корректное применение t - критерия Стьюдента для двух групп часто бывает затруднительно, поскольку достоверно проверить эти условия удаётся далеко не всегда.

Для оценки достоверности отличий по критерию Стьюдента принимается нулевая гипотеза, что средние выборок равны между собой. Затем вычисляется значение вероятности того, что изучаемые события произошли случайным образом.

В MS Excel для оценки достоверности отличий по критерию Стьюдента используется специальная функция ТТЕСТ и процедуры Пакета анализа. С их использованием удаётся определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее. В Пакете анализа предусмотрены следующие процедуры: Парный двухвыборочный t - тест для средних, Двухвыборочный t - тест с одинаковыми дисперсиями и Двухвыборочный t - тест с различными дисперсиями. В общем случае используют последнюю из указанных процедур.

Рассмотрим применение этой процедуры для анализа двух выборок по показателю А (по методике Кеттеля):
1) на листе Т электронной таблицы введём данные для группы 1 - в диапазон А1:А15, для группы 2 - в диапазон B1:B15;
2) для реализации процедуры в пункте меню Сервис выберем строку Анализ данных и укажем курсором мыши на строку Двухвыборочный t - тест с различными дисперсиями;
3) в появившемся диалоговом окне зададим интервалы переменных согласно пункту 1 (см. выше);
4) поставим переключатель в положение Выходной интервал, затем наведём указатель мыши на правое поле ввода и щёлкнув левой кнопкой мыши, указатель мыши наведём на левую верхнюю ячейку выходного диапазона (С1). Щёлкнем левой кнопкой мыши и нажмём кнопку ОК.

В выходном диапазоне С1:Е12 появятся результаты процедуры. Интерпретируем их результаты: средние значения показателя А по методике Кеттеля для двух групп (12,9333 и 12,26667) несколько отличаются. Но нулевая гипотеза о том, что разницы между двумя группами нет (то есть средние выборок равны между собой) отвергнута быть не может. Это следует из того, что вероятность случайного появления анализируемых выборок (P(T<=t) двухстороннее [$8776$] 0,6126) больше, чем уровень значимости 0,05. А это позволяет говорить о том, что различия между выборками могут быть случайными, то есть различия недостоверные.

Электронную таблицу Вы можете загрузить, воспользовавшись этой ссылкой.

Действуя аналогичным образом, можно применить критерий Стьюдента для анализа двух выборок и по другим показателям всех трёх методик.

Можно, конечно, использовать и критерий Манна - Уитни. Для этого предлагаю прочитать статью "Критерий Манна - Уитни". Но для автоматизации вычислений в среде MS Excel нужно владеть навыками программирования, поэтому расчёт придётся вести вручную. Если для Вас актуален именно автоматический расчёт по критерию Манна - Уитни, то предлагаю обратиться с вопросом в эту рассылку: Программное обеспечение / Пакет Microsoft Office.

С уважением.
Об авторе:
Facta loquuntur.
Форма ответа