Когато новите лечения стават достъпни, клиничните изследователи могат да се подадат на изкушението да ги изпробват върху онези пациенти, които са най-болни. Това разбираемо желание да се помогне на най-силно засегнатите от дадена болест обаче може да предизвика погрешната представа, че новото лечение е дори по-добро именно сред такива пациенти, докато всъщност подобрението на пациентите да не е обвързано с него.

 

Феноменът е познат като „регресия към средната стойност”. Първоначално документирана през 1886 г. от първия братовчед на Чарлз Дарвин - Френсис Галтън, регресията към средната стойност представлява разпространено статистическо явление със сериозни последици за здравеопазването.


 

Накратко, тя се появява винаги, когато избираме група с екстремни стойности за една променлива и след това извършваме повторно измерване, при което променливата се оказва по-близка до средната стойност за популацията. И тъй като участието в клиничните изследвания обикновено е позволено само ако пациентите се отличават с екстремни стойности (да кажем, диастолично кръвно налягане над 95 mmHg или пък резултат по скалата за депресия на Хамилтън по-голям или равен на 22), регресията до средната стойност е проблем, който вероятно засяга масово клиничните резултати.

 

В медицинската практика са налични множество измервания, при които ниските или високи стойности могат да бъдат интерпретирани като признаци за някое заболяване. Хората, чиито стойности са екстремни, например високо кръвно налягане, могат да преминат през лечение, за да приближат стойностите си до средните. Ако те бъдат измерени повторно след определен период от време, ще видим, че средната стойност на проблематичната група вече е по-близка до средната за цялото население - тоест тя е била редуцирана. Това обаче не бива да се тълкува непременно като успешно лечение, защото дори ако пациентите не се лекуват, средното кръвно налягане ще спадне поради регресията към средната стойност.

 

За да разберем този феномен, трябва първо да разберем какво представлява корелацията r между две променливи Х и У. Коефициентът на r може да варира между -1 и 1 и представлява мярка за относителното тегло на факторите, които Х и У споделят. Съществуват малко познати на естествените науки явления с коефициент на r равен на 1. Има множество обаче, при които r варира от слаба до умерена. Например, височината може да бъде сравнително добър предсказател за нечие тегло, но последното, със сигурност, зависи и от допълнителни фактори, което говори, че корелацията между двете мерки е по-малка от перфектна. В случай че се опитваме да установим причинно-следствена връзка между два фактора и корелацията е по-малка от 1, трябва непременно да се оглеждаме за ефекта на регресията до средната стойност.

 

Това е така, защото, освен ако r = 1, регресията към средната стойност винаги се появява в практиката. В математически термини, ако променливите X и Y имат стандартни отклонения sX и sY и корелация r, наклонът на регресионната линия може да бъде записан като rsy/sx. По този начин промяната на едно стандартно отклонение в X се свързва с промяна на r стандартни отклонения в Y. Освен ако X и Y не са линейно свързани, r е по-малка от 1. Като резултат, колкото по-малко са свързани двете променливи, толкова по-голям е ефектът от регресия до средната стойност.

 

Ако се върнем на примера с високото кръвно налягане, първото и второто измерване ще имат корелация r<1 поради неизбежното наличие на грешка в измерването и поради биологичните изменения по време на състоянието. Изчислимо е, че регресията към средната стойност ще бъде по-голяма за пациентите с най-високо първоначално кръвно налягане, така че бихме могли да очакваме да наблюдаваме постулирания ефект дори при нелекувани пациенти. Поради тази причина практикуващите са задължени да разграничат всички реални изменения, дължащи се на лечението, от ефекта на регресията към средната стойност. Това се постига най-добре посредством рандомизирана контролна група – такава, която се очаква да се подобри единствено чрез регресия (естествения ход на състоянието). В този смисъл, целта на клиничното проучване е да се определи дали лекуваната група се подобрява повече, отколкото може да обясни регресията.