U-критерий Манна-Уитни: что это такое и как его рассчитывать
В мире статистики часто возникают ситуации, когда нужно сравнить две группы, но данные не соответствуют требованиям для стандартных параметрических тестов. Именно здесь на помощь приходит U-критерий Манна-Уитни — мощный непараметрический инструмент, который не требует нормального распределения данных. Давайте разберемся, что это за критерий, когда его применять и как интерпретировать его результаты.
Немного истории: почему два имени?
История критерия интересна и отражает вклад нескольких ученых. В 1945 году американские статистики Генри Манн и Дональд Уитни разработали и формально описали метод, который теперь носит их имена. Однако почти одновременно, в 1947 году, другой американский статистик Фрэнк Уилкоксон предложил по сути очень похожий подход, основанный на рангах, для двух независимых выборок.
Поэтому иногда можно встретить название «критерий Уилкоксона для двух выборок» или двойное название «Манна-Уитни-Уилкоксона». Это синонимы, отражающие вклад разных исследователей. Название «U-критерий» происходит от статистики U, которая является центральной в этом тесте.
Суть метода: что мы на самом деле сравниваем?
В отличие от t-критерия Стьюдента, который сравнивает средние значения двух групп, U-критерий Манна-Уитни сравнивает распределения. Он отвечает на вопрос: «Можно ли считать, что одна выборка стохастически больше другой?». Проще говоря, склонны ли значения в одной группе систематически превышать значения в другой.
Гипотезы критерия:
-
Нулевая гипотеза (H₀): Распределения двух независимых групп одинаковы.
-
Альтернативная гипотеза (H₁): Распределения двух групп различаются (двусторонняя проверка) ИЛИ значения одной группы систематически больше/меньше значений другой группы (односторонняя проверка).
Когда применять U-критерий?
Критерий идеально подходит для случаев, когда:
-
Данные имеют порядковую шкалу (ранги) или интервальную шкалу, но...
-
Распределение данных отличается от нормального.
-
Объем выборок невелик (n < 30).
-
Есть выбросы, которые сильно влияют на среднее значение.
-
Выборки являются независимыми (например, группа пациентов, получавших препарат, и группа плацебо).
Пошаговый алгоритм расчета вручную
Представим, что у нас есть две независимые группы: Группа A и Группа B.
Шаг 1: Объединить все данные и проранжировать
-
Все значения из обеих групп объединяются в один общий ряд.
-
Этому общему ряду присваиваются ранги — от 1 (наименьшее значение) до N (наибольшее значение), где N — общее количество наблюдений (n₁ + n₂).
-
Если встречаются одинаковые значения (ранги), им присваивается средний ранг. Например, если три значения занимают 4-е, 5-е и 6-е места, каждое из них получает ранг (4+5+6)/3 = 5.
Шаг 2: Рассчитать сумму рангов для каждой группы
-
Вычислите сумму рангов для всех значений в Группе A (R₁).
-
Вычислите сумму рангов для всех значений в Группе B (R₂).
Шаг 3: Рассчитать статистики U для каждой группы
Используйте формулы:
U₁ = n₁ * n₂ + (n₁(n₁ + 1)) / 2 - R₁
U₂ = n₁ * n₂ + (n₂(n₂ + 1)) / 2 - R₂
где:
-
n₁ — объем первой выборки
-
n₂ — объем второй выборки
-
R₁ — сумма рангов первой выборки
-
R₂ — сумма рангов второй выборки
Шаг 4: Определить расчетное значение U
-
В качестве расчетного значения U берется наименьшее из двух полученных значений: U₁ и U₂.
Uрасч = min(U₁, U₂)
Шаг 5: Определение критического значения и принятие решения
-
По специальной таблице критических значений U-критерия Манна-Уитни найдите значение, соответствующее вашим n₁ и n₂, и выбранному уровню значимости (обычно α=0.05).
-
Если Uрасч ≤ Uкрит — нулевая гипотеза отвергается. Распределения групп статистически значимо различаются.
-
Если Uрасч > Uкрит — нет оснований отвергать нулевую гипотезу.
Пример для наглядности
Группа A (n=3): 10, 12, 15
Группа B (n=4): 5, 7, 8, 9
-
Ранжируем: Общий ряд: 5(1), 7(2), 8(3), 9(4), 10(5), 12(6), 15(7).
-
Суммы рангов:
-
R₁ (для 10,12,15) = 5 + 6 + 7 = 18
-
R₂ (для 5,7,8,9) = 1 + 2 + 3 + 4 = 10
-
-
Рассчитываем U:
-
U₁ = (3*4) + (3*4/2) - 18 = 12 + 6 - 18 = 0
-
U₂ = (3*4) + (4*5/2) - 10 = 12 + 10 - 10 = 12
-
-
Uрасч = min(0, 12) = 0
-
Сравниваем: Для n₁=3, n₂=4 и α=0.05 Uкрит = 0.
-
Uрасч (0) = Uкрит (0) -> отвергаем нулевую гипотезу. Распределения групп статистически значимо различаются на уровне значимости 0.05.
-
Важные замечания на практике
-
Программное обеспечение: В реальных исследованиях с большими выборками расчеты проводятся в программах (SPSS, R, Python). Они автоматически считают U-статистику и, что важнее, точное p-value, которое является более информативным, чем сравнение с критическим значением.
-
Интерпретация: Помните, что критерий показывает различие в распределениях, но не говорит, в чем именно оно заключается (разброс, медиана, форма). Всегда визуализируйте данные (ящик с усами, гистограмма) для понимания сути различий.
-
Эффективность: Мощность U-критерия (его способность обнаруживать реальные различия) лишь ненамного ниже, чем у t-критерия, и часто выше для данных с выбросами или не нормальным распределением.
U-критерий Манна-Уитни — это надежный и элегантный инструмент, который должен быть в арсенале каждого исследователя, работающего с данными, нарушающими предположения о нормальности.