Studentův t-test
Studentův t-test je často používaná metoda testování statistických hypotéz. V závislosti na situaci, kdy se používá, se rozlišuje:
- jednovýběrový t-test, který slouží k porovnání střední hodnoty μ s konstantou (H0: μ = μ0);
- dvouvýběrový (nepárový) t-test, který slouží k porovnání střední hodnoty μ1 jedné skupiny se střední hodnotou μ2 jiné skupiny (H0: μ1 − μ2 = konst);
- např. střední hodnota systolického tlaku u kuřáků a nekuřáků;
- nebo střední hodnota systolického tlaku u skupiny, která bere placebo, a skupiny, která bere β-blokátory
- párový t-test, který slouží k porovnání středních hodnot mezi prvními a druhými prvky uspořádaných dvojic (H0: μ1 − μ2 = konst).
- např. střední hodnota systolického tlaku u kuřáků před ukončením kouření a po ukončení kouření;
- nebo střední hodnota hladiny oxytocinu v krvi u matek a u jejich dětí
Jednovýběrový Studentův t-test[upravit | editovat zdroj]
Data[upravit | editovat zdroj]
Máme data x1, …, xn ~ N(μ, σ2). Z nich získáme výběrový průměr a výběrovou směrodatnou odchylku .
Hypotézy[upravit | editovat zdroj]
- H0: μ = μ0 (konstanta)
- HA: μ ≠ μ0 (oboustranná alternativa; jednostranné: μ < μ0, μ > μ0)
Nulové rozdělení[upravit | editovat zdroj]
tn−1 (Studentovo s n−1 stupni volnosti)
Testová statistika[upravit | editovat zdroj]
Kritická hodnota testu pro hladinu α[upravit | editovat zdroj]
tn−1, 1−α/2[† 1]
Výpočetní technika[upravit | editovat zdroj]
- Program STATISTICA: Statistiky → Základní statistiky → t-test, samostatný vzorek
- Program EXCEL:
- Je nutné použít párový t-test, jako data do páru je nutné vytvořit sloupec s testovanou konstantou
- Nástroje → Doplňky → Analýza dat (zaškrtnout)
- Nástroje → Analýza dat → Dvouvýběrový párový studentův test na střední hodnotu
Dvouvýběrový Studentův t-test[upravit | editovat zdroj]
- Data
, směrodatná odchylka
, směrodatná dochylka
- Nulová hypotéza
H0: μ1 = μ2 (obecněji H0: μ1 − μ2 = konstanta)
- Alternativní hypotéza
- HA: μ1 ≠ μ2 (oboustranná alternativa)
- HA: μ1 > μ2; μ1 < μ2 (jednostranná alternativa)
- Testová statistika
se dá chápat jako:
- Předpokládáme , „t-test pro shodné rozptyly“ (klasická varianta)
- Uvažujeme i možnost , „t-test pro neshodné rozptyly“ (tzv. Welchův test, Satterthwaiteův test)
K rozlišení vhodnosti daných variant lze použít např. F-test shody rozptylů.
Použití na testování na shodu rozptylů není ovšem univerzální. Testy na rozptyl mohou vyjít falešně signifikantní pouze díky velkému počtu dat, či falešně nesignifikatní kvůli malému množství dat.
T-test pro shodné rozptyly[upravit | editovat zdroj]
Označován jako pooled variance t-test. Předpokládáme:
Společný rozptyl se odhaduje jako
- Nulové rozdělení
Při H0 platí:
T-test pro neshodné rozptyly[upravit | editovat zdroj]
Občas označován jako Welchův test, Satterthwaitův test či separed variance t-test. Předpokládáme:
- Nulové rozdělení
Při H0 má přibližně rozdělení . Počet stupňů volnosti odpovídá n, m, s1, s2. Nemusí to být celé číslo.
Párový Studentův t-test[upravit | editovat zdroj]
- Data
, průměr
, průměr
- Párové diference
je SD párových diferencí.
- Nulová hypotéza
H0: μ1 = μ2 (obecněji H0: μ1 − μ2 = konstanta)
- Alternativní hypotéza
- HA: μ1 ≠ μ2 (oboustranná alternativa)
- HA: μ1 > μ2; μ1 < μ2 (jednostranná alternativa)
- Testová statistika
, jsou realizace náhodné veličiny, je tedy také realizace náhodné veličiny, je její směrodatná odchylka
(Obecněji )
- Nulové rozdělení
Při platnosti H0:
Pravděpodobnost, že přesáhne hodnotu nebo bude nižší než je
- Kritická hodnota
Výpočetní technika[upravit | editovat zdroj]
- Program STATISTICA: Statistiky → Základní statistiky → t-test, závislé vzorky
- Program EXCEL:
- Nástroje → Doplňky → Analýza dat (zaškrtnout)
- Nástroje → Analýza dat → Dvouvýběrový párový studentův test na střední hodnotu
Výpočetní technika[upravit | editovat zdroj]
- Program SAS: Tasks → ANOVA → t Test…
- Program STATISTICA: Statistiky → Základní statistiky → Vhodný typ testu
- Program Excel: funkce TTEST()
- Program Excel, alternativní způsob:
- V Excelu, který nemá data ve formě objekty × veličiny, je nutné data vhodně uspořádat
- Nástroje → Doplňky → Analýza dat (zaškrtnout)
- Nástroje → Analýza dat → Vhodný typ testu
Poznámky[upravit | editovat zdroj]
- ↑ (1−α/2)-kvantil rozdělení tn−1
Odkazy[upravit | editovat zdroj]
Související články[upravit | editovat zdroj]
Použitá literatura[upravit | editovat zdroj]
- KLASCHKA, Jan. Testování statistických hypotéz [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. lékařská fakulta Univerzita Karlova]. Praha. 26.4.2011.
- KLASCHKA, Jan. Studentův t-test [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. LF Univerzita Karlova]. Praha. 3.5.2011.
- KLASCHKA, Jan. Studentův t-test [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. LF Univerzita Karlova]. Praha. 10.5.2011.