головна
cv/contacts
@facebook

лекції з нервової системи
публікації

Загальні принципи перевірки статистичних гіпотез

Після того, як ми охарактеризували структуру нашої вибірки (чи вибірок), часто виникає потреба порівняти вибіркове значення (середнє чи медіану) з певною стандартною величиною або ж з іншою вибіркою. Ця задача (як і більшість інших) вирішується шляхом перевірки статистичних гіпотез.

При цьому формулюється нульова гіпотеза - твердження, яке ми перевіряємо (вона позначається Н0). Твердження, сформульоване як антитеза до нульової гіпотези, називається альтернативною гіпотезою. Справедливість нульової гіпотези означає, що альтернативна гіпотеза є невірною, і навпаки.

Для перевірки нульової гіпотези ми повинні використати певний статистичний тест або критерій, тобто за певним алгоритмом обчислити спеціальну величину - статистику критерію. Далі ми розглянемо кілька найбільш поширених тестів, наразі розберемо загальні принципи оцінювання.

Припустимо, ми виміряли зріст школярів 14 і 15 років. Трохи знаючи біологію, ми можемо очікувати, що старші діти є дещо вищими. Для перевірки цього припущення нульова гіпотеза буде формулюватися:
"зріст учнів 14 і 15 років є однаковим",
альтернатива:
"зріст учнів 14 і 15 років є різним".
Зауважимо, що можливо сформулювати і так звані односторонні альтернативи: "зріст учнів 15 років є більшим за зріст учнів 14 років" або "зріст учнів 15 років є меншим за зріст учнів 14 років". Проте, у більшості випадків альтернативи формулюються як двосторонні ("не рівні", без припущення напрямку змін), це є більш точним.

Статистики критеріїв розроблені таким чином, що їхні значення при справедливості та несправедливості нульової гіпотези сильно відмінні. Як правило, при повній відповідності наших даних нульовій гіпотезі, тестова статистика набуває значення 0. Чим менше наші дані узгоджуються із нульовою гіпотезою, тим більше значення приймає тестова статистика. Можна виділити дві основні причини такої розбіжності: випадковість або вплив певного фактору.

У відповідності до теорії ймовірності, ми ніколи не можемо виключити можливість того, що наші дані відрізняються від значень нульової гіпотези лише в силу випадку. А це значить, що ми завжди ризикуємо відхилити нульову гіпотезу навіть якщо насправді вона є справедливою (а зареєстровані відміни випадкові). Ситуація, коли ми зробимо такий висновок (про невірність Н0 при її справедливості), називається статистичною помилкою першого роду. За допомогою теорії можемо оцінити її ймовірність для нашого набору даних. Вона визначається за певним алгоритмом і позначається літерою р. Таким чином, чим нижчим є р, тим менше є ймовірність помилитися, відкинувши нульову гіпотезу (відповідно, визнавши справедливою альтернативну). На практиці ми приймаємо рішення про відхилення нульової гіпотези тоді, коли обчислене р є меншим за певний поріг - рівень значущості. Він позначається літерою α і для більшості експериментальних задач становить 0.05. Іншими словами, якщо р ≤ 0.05, ми визнаємо справедливість нульової гіпотези; якщо р ≤ 0.05, ми визнаємо справедливість альтернативної гіпотези (відкидаємо нульову). В деяких випадках рівень значущості може приймати значення, відмінні від 0.05. Наприклад, якщо конструктор розраховує технічну надійність вузлів автомобіля, ймовірність їх відмови в 5% випадків є надзвичайно великою, і в подібних випадках p може сягати 10-6 і менше. При визначенні рівня p у конкретному дослідженні слід спиратися на існуючі публікації з відповідної проблематики. Проте, у більшості випадків достатнім є рівень p=0.05.

Зауважимо, що використання односторонніх альтернатив як правило призводить до зменшення рівня значущості, проте, для їх використання потрібні змістові підстави - ми повинні аргументувати, чому ми очікуємо саме збільшення або зменшення досліджуваного параметра.

Отже, основними етапами перевірки статистичних гіпотез є:

  • формулювання нульової і альтернативної гіпотез;
  • вибір статистичного критерію;
  • розрахунок статистики критерію та рівня значущості;
  • прийняття рішення про справедливість нульової гіпотези або її відхилення.

Відмітимо, що окрім описаної помилки першого роду, існує помилка другого роду - прийняття нульової гіпотези у випадку, якщо вона в дійсності є невірною. Ймовірність здійснити таку помилку залежить від типу статистичного критерію, яким ми перевіряємо наші гіпотези. Наприклад, вона дуже висока, якщо ми будемо застосовувати параметричні критерії до ненормально розподілених даних або ж критерії, орієнтовані на кількісні дані, до порядкових. Зрозумівши структуру наших даних та підібравши найбільш адекватний статистичний критерій ми мінімізуємо ймовірність здійснення цієї помилки. Даний посібник, власне, містить інструкції, як це зробити.


Український біологічний сайт Фізіологія в Україні Українське товариство нейронаук