|
Визначення нормальності розподілу
Для того, щоб коректно представити отримані кількісні результати, на першому кроці аналізу
потрібно визначити нормальність їхнього розподілу. Найбільш просто це зробити, оцінивши "на око" характер розподілу -
якщо він сильно асиметричний або має кілька максимумів, це є ознакою ненормальності.
Проте, щоб бути певними у цьому, слід використовувати числові статистичні характеристики.
Застосування параметрів асиметрія та ексцес.
![](content/images/stat07-01.png)
Нормальному розподілу відповідають значення коефіцієнтів асиметрії та ексцесу, рівні 0.
Позитивні та негативні значення цих параметрів свідчать про порушення форми розподілу; відповідно, чим більшими є
їхні абсолютні значення, тим меншою є ймовірність того, що дані розподілені за нормальним законом.
"Нормальними" вважаються значення в межах [-2, 2]. Вихід параметрів за ці межі свідчить про те, що наші дані розподілені не нормально.
Застосування спеціалізованих критеріїв
У багатьох статистичних програмах реалізовані процедури перевірки даних на нормальність:
критерій Шапіро-Вілка, критерій Ліллієфорса, критерій Колмогорова-Смірнова.
Про принципи перевірки статистичних гіпотез ми поговоримо детально далі, а зараз зазначимо, що
в результаті виконання алгоритму тесту ми отримуємо величину р, яка відображає ймовірність того, що наші дані походять
з нормального розподілу. Якщо ця ймовірність низька, ми не можемо вважати, що наші дані є нормальними.
Пороговим рівнем величини р вважається значення 0.05. При р ≤ 0.05 ми вважаємо (в цьому тесті)
наші дані не нормальними.
![](content/images/stat07-02.png)
Приклад даних, розподіл яких не задовольняє критеріям нормальності.
В програмі PSPP перевірку даних на нормальність можна здійснити, обчисливши коефіцієнти асиметрії та ексцесу,
а також за допомогою тесту Колмогорова-Смірнова в меню "Аналіз" - "Непараметричні критерії" - "Одновибірковий Колмогорова-Смірнова".
Вивід процедури перевірки виглядає наступним чином:
![](content/images/stat07-03.png)
Нижній рядок містить обчислене р, яке в даному випадку рівне 0.885, що більше порогового рівня (0.05),
отже ми вважаємо, що наші дані розподілені нормально.
|
|