Statistický soubor
Feedback

Z WikiSkript

Statistická indukce

(induktivní statistika) Def.: Část statistiky, která svými metodami založenými na poznatcích teorie pravděpodobnosti umožňuje z empirických poznatků formulovat vědecky zdůvodněné obecné závěry.

Principy induktivní statistiky jsou založeny na induktivním myšlení (jedna ze základních složek lidského myšlení, opak deduktivní), které z jednotlivých pozorování vytváří obecné závěry. Jeho nedostatkem je však subjektivita a z ní vyplývající možnost vytvoření chyby, jejíž velikost nelze objektivně stanovit. Induktivní statistika (statistická indukce) umožňuje za určitých předpokladů vytvářet obecné závěry, jejichž stupeň spolehlivosti lze objektivně vyčíslit. Za tímto účelem vypracovává různé postupy, které jsou založeny na pojmech teorie pravděpodobnosti. Centrální úlohu v nich mají také pojmy základní soubor a výběr.

Základní soubor (populace)

Základní soubor je zadán přesným vymezením jeho prvků. Tyto prvky jsou určeny buď výčtem, nebo stanovením jednoznačného pravidla (např. určité společné vlastnosti), které je pak kritériem příslušnosti daného prvku do daného základního souboru. Prvky základního souboru mohou být různé objekty – osoby, rodiny, pokusná zvířata, biologický materiál, záznam EEG apod. Např. základní souborem může být soubor obyvatel určitého území v daném časovém období, soubor dětí s určitou vrozenou vadou, soubor vzorků tkáně pokusných zvířat, ...

Rozsah základního souboru může být konečný (např. demografické soubory), nebo nekonečný, což je spíše ideální soubor, existující pouze hypoteticky (např. soubor všech možných výsledků pokusů proveditelných za daných experimentálních podmínek nebo soubor všech osob s danou nemocí).

Výběr

Metodami statistické indukce lze vyvozovat závěry o základním souboru ze zjištěných vlastností u části jeho prvků tzv. výběru. Aby to bylo možné, je nutné zvolit výběr, který je reprezentativní tj. výběr, který odráží svým složením vlastnosti všech prvků základního souboru. Výběr, který není reprezentativní, je označován jako selektivní. Např. při zjišťování průměrné výšky chlapců v populaci ve věku 10 let může být výběr složený z chlapců, kteří hrají basketbal, značně selektivní.

Abychom vyčíslili stupeň nejistoty, že výběr není reprezentativní, a tak podpořili vědeckost závěrů statistické indukce je nutné vytvářet výběr technikou náhodného neboli pravděpodobnostního výběru. Tyto metody mají zaručit, že každý prvek základního souboru má stejnou možnost, že bude zařazen do výběru a každý další prvek je vybírán nezávisle na těch, které jsme již vybrali. Podle způsobu provedení rozlišujeme různé techniky náhodného výběru např.:

  • Prostý náhodný výběr:
    • je prováděn vhodnou technikou losování. Existuje řada technik losování, včetně použití tabulek náhodných čísel. Nevýhodou tohoto postupu je však nezbytnost předchozí identifikace prvků (např. očíslování), což není v praxi u rozsáhlejších souborů proveditelné.
  • Mechanický (systematický) výběr:
    • je podmíněn určitým, předem daným uspořádáním prvků základního souboru. Do výběru zařadíme všechny prvky, které jsou od sebe vzdáleny o určitý výběrový krok k, přičemž první prvek vybereme náhodně z k prvků na začátku souboru.
  • Oblastní (stratifikovaný) výběr:
    • Provádí se tehdy, když lze soubor rozdělit do takových oblastí, které jsou uvnitř homogenní (ve sledovaných znacích se příliš neliší) a mezi sebou heterogenní (mezi sebou se mohou lišit).
  • Skupinový výběr:
    • se provádí v případech, kdy záhladní soubor je velmi početný. Zde nevybíráme jednotlivé prvky, ale skupiny prvků, které tvoří přirozená či umělá seskupení (např. rodina). Je žádoucí, aby byly skupiny pokud možno stejně velké a prvky uvnitř skupin různorodé.
  • Vícestupňový výběr
    • Je založen na existenci určitého hierarchického uspořádání prvků základního souboru. K těmto prvkům se postupně dostáváme přes vyšší výběrové jednotky

(např. města – domy – domácnosti).

Znaky

Jako znaky označujeme vlastnosti sledované na prvcích. Znaky mohou být kvalitativní a kvantitativní.

  • Kvalitativní znaky: Jejich hodnoty mohou být dány slovním vyjádřením.
    • Hodnoty nominálních znaků dokážeme pouze vyjmenovat (např. rodinný stav muže: svobodný, ženatý, rozvedený, vdovec)
    • Ordinální znaky umožňují uspořádat jejich hodnoty podle velikosti (např. dosažené vzdělání: základní, středoškolské, vysokoškolské).
  • Kvantitativní znaky:
    • spojité – nabývají libovolných hodnot např. výška hmotnost;
    • diskrétní – nabývají jen oddělené číselné hodnoty např. počet dětí.

Intervalová stupnice kvantitativních znaků umožňuje uspořádat pozorování vzhledem ke stupni vyšetřované vlastnosti a umožňuje určit jejich přesnou vzdálenost. Na intervalové stupnici s měnlivým začátkem je nulová pozice věcí volby (např. libovolná časová stupnice). Nulová pozice na intervalové stupnici s pevným začátkem je přesně dána a vyjadřuje nepřítomnost měřené vlastnosti (např. měření hmotnosti v kg).


Odkazy

Použitá literatura

  • BENCKO, Vladimír, et al. Epidemiologie : výukové texty pro studenty 1. LF UK. 2. vydání. Praha : Karolinum, 2002. s. 70-73. ISBN 80-246-0383-7.