|
Кореляція не означає причинність
Інтерпретуючи результати кореляційного аналізу, слід пам'ятати, що наявність статистично
значущого зв'язку між величинами не означає наявності між ними причинно-наслідкового зв'язку.
Загалом, між досліджуваними параметрами А і Б можуть бути такі зв'язки:
- А є причиною Б;
- Б є причиною А;
- А і Б є незалежними наслідками спільної причини;
- А обумовлює Б, але одночасно Б обумовлює А;
- А є причиною В, а В в свою чергу є причиною Б;
- А і Б ніяк не пов'язані, кореляція між ними є випадковою.
Наприклад, діти з більшою вагою демонструють кращі результати в тесті на розумові здібності.
Напрошується висновок, що вага пов'язана з інтелектом, і для виховання більш розумної дитини, її слід багато годувати.
Проте, обидва параметри є наслідком третьої причини - процесу росту і розвитку організму із збільшенням віку,
а тому безпосереднього зв'язку між ними немає. Більш анекдотичні результати дають параметри кількості церков у місті
та рівень злочинності - вони позитивно корелюють. Зрозуміло ж, що не церкви є джерелом злочинності,
а обидва показники є наслідком кількості жителів у місті.
Навіть, якщо між аналізованими величинами існує реальний причинно-наслідковий зв'язок,
за коефіцієнтом кореляції ми не можемо встановити його напрямок (А обумовлює Б, або ж навпаки).
В деяких випадках справедливим є і обернене твердження - відсутність значущої кореляції не є гарантією незалежності змінних.
Наприклад, розглянемо дві змінні
(джерело):
Наявність взаємозв'язку між цими величинами є очевидною, проте коефіцієнт кореляції в даному випадку дорівнюватиме 0.
|
|