NEJVĚTŠÍ DATABÁZE
STUDENSTKÝCH REFERÁTŮ V ČESKU

Najdi si dokument, který potřebuješ v jiném jazyce: SK CZ HU

Celkem referátů: (9260)

Přihlášení Přihlášení Registrace
Přidej svou práci

Základné štatistické pojmy. (pre lákarstvo)

Odeslat známému Stáhnout Nahlásit chybu Buď první, kdo se vyjádří k tomuto příspěvku (0)

Oblast:Zdravověda

Autor: antiskola@antiskola.eu

Počet slov:5535

Počet písmen:31,386

Jazyk:Slovenský jazyk

Orient. počet stran A4:17.44

Počet zobrazení / stažení:5323 / 9

Velikost:41.64 kB

(sem. c. 3, bioštat. metódy, MUDr. E. Chandogová CSc.)

Štatistika - je vedná disciplína, ktorá sa zaoberá hromadnými náhodnými javmi.
Zaoberá sa ich zberom, klasifikáciou, analýzou a interpretáciou
s použitím matematickej teórie pravdepodobnosti.


Jav je výsledok pozorovania alebo pokusu. Javy, ktoré sú výsledkom pozorovania rozsiahlych súborov vzájomne rovnocenných prvkov, nazývame hromadnými javmi. Hromadné javy (výsledky), ktoré nevieme pred pozorovaním, resp. pokusom presne predvídat, nazývame hromadnými náhodnými javmi.


Zdravotnícka štatistika - sa zaoberá plánovaním a vyhodnocovaním pozorovaní a pokusov v súvislosti s vedeckou a odbornou cinnostou v zdravotníctve.



Štatistické metódy: 1. popisná štatistika
2. induktívna štatistika

Popisná štatistika sa zaoberá prehladným zobrazením kvantitatívnych aspektov
pozorovaných javov a ich vzájomných vztahov. Zaradujeme sem tvorbu
tabuliek, grafov, výpocty rôznych charakteristík získaných údajov.

Induktívna štatistika umožnuje zovšeobecnenie pozorovania na výberových
súboroch a poskytuje objektívne predpoklady pre rozhodovanie v prípade
neistoty.





ŠTATISTICKÝ SÚBOR.

Rozoznávame dva typy štatistických súborov: 1. základný súbor
2. výberový súbor

Základný súbor je súhrnom všetkých prvkov (štatistických jednotiek), ktorých
vlastnosti chceme poznat.

 presne vymedzit základný súbor je základným predpokladom úspešnej realizácie každého štatistického skúmania.

 základný súbor je vymedzený niektorými spolocnými vlastnostami svojich prvkov - napr. pohlavím, vekom, diagnózou, zamestnaním a pod., ciže presným definovaním štatistickej jednotky - definovaním jej urcujúcich znakov.




ŠTATISTICKÁ JEDNOTKA je základným prvkom štatistického súboru.
Jej definovanie je urcené cielom štatistického skúmania. Štatistickou
jednotkou môže byt: pacient, ochorenie, pokusné zviera, zdravotnícke
zariadenie, štát....


Vlastnosti štatistickej jednotky, ktorými je vymedzená sú z n a k y u r c u j ú c e


Vlastnosti štatistickej jednotky, ktoré sú predmetom skúmania sú
z n a k y s k ú m a n é.


Príklad: Chceme zistit výskyt ochorenia diabetes mellitus u mužov nad 60 rokov,
ktorí majú trvalý pobyt v Bratislave.
Riešenie: základný súbor definujeme pomocou urcujúcich znakov:
pohlavie (do výskumu zaradujeme len mužov), veku (viac ako 60 rokov)
a miesta trvalého bydliska (Bratislava).
Záver: základný súbor pre výskum tvoria všetci muži z Bratislavy nad 60 rokov.
- znak skúmaný: výskyt diabetu
Ak by sme ich oslovili všetkých a zaradili do výskumu, išlo by o vycerpávajúce šetrenie.


U základných súborov s velkým poctom štatistických jednotiek sa vycerpávajúce šetrenie nedá realizovat, v takomto prípade vytvárame v ý b e r o v ý s ú b o r.

Výberový súbor (výber) je cast vybraná zo základného súboru.

Výberový súbor by mal byt co najlepším reprezentantom základného súboru. Na základe poznania vlastností výberu totiž usudzujeme na vlastnosti základného súboru.
Takýto spôsob uvažovania nazývame štatistickou indukciou.


Ak chceme zaistit dobrú reprezentatívnost – musíme:
 co najpresnejšie definovat vlastnosti základného súboru – definovat urcujúce znaky
 použit vhodnú metódu výberu – náhodný výber
 vybrat dostatocný pocet štatistických jednotiek.

Dobrú reprezentatívnost zaistujú vzorky získané metódami náhodného výberu.
Za náhodný považujeme výber, získaný postupom, ktorý zarucuje, že každý prvok základného súboru má na zaciatku výberu rovnakú šancu (pravdepodobnost), že bude vybraný.

V prípade, že výberový súbor nie je reprezentatívny, vyhýbame sa zovšeobecnujúcim tvrdeniam.





Metódy náhodného výberu:
1. Jednoduchý náhodný výber: losovanie, tabulky náhodných císiel;
2. Mechanický (systematický) náhodný výber: napr. zo zoznamu osôb zoradených podla abecedy, vyberieme do výberu každého desiateho;
3. Oblastný (stratifikovaný) výber: základný súbor rozdelíme na podsúbory (napr. žiakov školy na jednotlivé triedy) a potom z každého podsúboru náhodne vyberieme (napr. vylosujeme) potrebný pocet štatistických jednotiek



V klinickom výskume sa stretávame aj s inými metódami náhodného výberu:

Randomizácia (znáhodnovanie) - súbor pacientov náhodne (napr. losovaním) rozdelíme na dve rovnaké skupiny - experimentálnu a kontrolnú;

Párový výber (macovanie) - k osobám s urcitou vlastnostou X (napr. urcitou chorobou) vyberáme osoby, ktoré túto vlastnost nemajú, ale zhodujú sa s prvými vo všetkých ostatných vlastnostiach, ktoré by podla nás mohli ovplyvnit výsledok výskumu (vek, pohlavie, zamestnanie a pod.)

Slepý pokus – osoby, zaradené do výskumu nevedia, ci sú zaradené do skupiny
experimentálnej, alebo do skupiny kontrolnej;

Dvojitý slepý pokus - nielen osoby, ale ani obslužný personál nevie, ktoré
osoby sú zaradené v skupine experimentálnej a ktoré v kontrolnej;



ŠTATISTICKÉ ZNAKY.

Štatistický znak je zistitelná, meratelná vlastnost štatistickej jednotky

Znaky delíme na:
• urcujúce - sú to vlastnosti štat. jednotky, ktorými vymedzujeme
základný súbor
• skúmané - tie vlastnosti štatistickej jednotky, ktoré skúmame

. Skúmané znaky delíme do dvoch základných kategórií:
1. znaky kvalitatívne (nominálne)
2. znaky kvantitatívne, ktoré môžu byt a) poradové (ordinálne)
b) císelné (kardinálne) * spojité
* nespojité

Kvalitatívne znaky:
Za kvalitatívne považujeme také znaky, ktorých varianty nie sú císelne vyjadrené, ale sú urcené s l o v n e.
Kvalitatívne znaky môžu byt:
• Alternatívne - majú len dve obmeny (napr. pohlavie- mužské alebo ženské)
• Viacobmenné (množné) - majú viac ako dve obmeny (napr. ukoncené vzdelanie: základné, stredné bez maturity, stredné s maturitou, vysokoškolské)

Kvantitatívne znaky:
• Poradové znaky sú také kvantitatívne znaky, ktorých varianty možno
usporiadat do urcitého poradia a v tomto poradí urcit ich miesto
(napr. stupen bolesti)

• Císelné znaky sú kvantitatívne znaky, ktorých varianty možno merat;
Delíme ich na :
1. spojité - môžu nadobúdat všetky hodnoty z urcitého reálneho
intervalu, jednotlivé varianty znaku na seba spojito nadväzujú (napr.
TK, hmotnost, teplota, sérové parametre)
2. nespojité - nadobúdajú len niektoré hodnoty, varianty znaku sú vyjadrené len celými císlami - napr. pocet dní liecenia, pocet postelí na oddelení, pocet leukocytov)


Príklad: Chceme zistit vitálnu kapacitu mužov, starších ako 50 rokov;
Urcujúcimi znakmi budú: pohlavie a vek
Skúmaný znak : vitálna kapacita plúc - je to znak kvantitatívny spojitý




ETAPY ŠTATISTICKÉHO VÝSKUMU.


1. Plán štatistického výskumu
 Formulovat problém (štatistickú hypotézu)
 Štúdium literatúry (literárny rešerš)
 Stanovit ciel výskumu
 Vymedzit štatistickú jednotku, pomocou urcujúcich znakov
 Definovat základný súbor
 Urcit metódu výskumu
 Príprava, overenie spolahlivosti prístrojov
 Urobit pilotnú štúdiu (nie je nevyhnutná)


2. Zbieranie štatistických údajov (realizácia pokusu, resp. pozorovania)
V tejto fáze výskumu sa môžeme dopustit nasledovných chýb:

- náhodné chyby - sú rozdielom medzi výsledkami merania toho istého objektu, tým istým pozorovatelom, prístrojom a metódou - nedajú sa vylúcit,
(pri sledovaní kvantitatívnych znakov sa náhodná chyba hodnotí mierou
variability výsledkov získaných opakovaným meraním tej istej štatistickej
jednotky);
- systematické chyby - zatažujú v rovnakej miere všetky merania toho istého
objektu, tým istým pozorovatelom, prístrojom a metódou (zmenia sa pri
zmene pozorovatela, alebo zmenou prístroja, resp. metódy);


Cím je náhodná chyba menšia, tým je meranie p r e s n e j š i e.
Cím je systematická chyba menšia, tým je meranie s p r á v n e j š i e.


Pri sledovaní kvalitatívnych znakov sa správnost merania (metódy) hodnotí jeho
v a l i d i t o u - schopnostou metódy merat skutocne to, co chceme merat.

Validita má dve zložky: senzitivitu a špecificitu.



3. Spracovanie a popis zozbieraného materiálu.

Základné spracovanie údajov pozostáva zo štatistického triedenia, usporiadania údajov
do tabuliek a grafov a výpoctu vhodných charakteristík sledovaných znakov.


Spracovanie zacína kontrolou získaných údajov.

Formálna kontrola – cielom je overit úplnost údajov;

Vecná kontrola – posudzujeme výskyt chýb merania a logickú správnost
odpovedí (ci hodnota zodpovedá logicky možným hraniciam);


Triedenie – je usporiadanie prvkov (štatistických jednotiek) štatistického súboru :
 do skupín - pri sledovaní kvalitatívnych znakov alebo
 tried (triednych intervalov) - pri sledovaní kvantitatívnych znakov.

Znaky triedime tak, aby co najlepšie vynikli charakteristické vlastnosti skúmaných javov a ich štruktúra.

- metóda triedenia nám umožnuje skúmat predovšetkým štruktúru sledovaného súboru a urcit typ rozdelenia sledovaných velicín.

Znak, podla ktorého triedime prvky štatistického súboru sa nazýva triediaci znak.

Druhy triedenia:
a) jednostupnové - triedime iba podla jedného znaku
b) viacstupnové – triedime podla viacerých znakov

Zásady triedenia:
a) zásada jednoznacnosti – každý získaný údaj by sa mal dat zaradit jednoznacne (triedy sa nesmú prekrývat);
b) zásada úplnosti – každý získaný údaj by sa mal dat zaradit do niektorej z vytvorených tried;





Príklad: Nášho výskumu sa zúcastnilo 100 respondentov (chorých na urcité ochorenie) vo veku od 30 do 62 rokov. Nakolko nás zaujíma výskyt danej choroby vo vztahu k veku, potrebujeme súbor rozdelit podla veku. Z údajov vieme, že najmladší pacient mal 30 rokov a najstarší 62 rokov, triedne intervaly môžeme vytvorit nasledovne:
<30 – 34>, <35 - 39>, <40 – 44>, <45 – 49>, <50 – 54>, <55 – 59>,
< 60 a viac>
Takto vytvorené triedy nám umožnia jednoznacne zaradit každý získaný údaj

Zásady pri tvorbe intervalov:
 pocet intervalov by nemal byt ani príliš malý, ani príliš velký
 pri malom pocte intervalov strácame množstvo informácií
 pri velkom pocte môžeme mat problémy pri dalšom spracovaní a následnej interpretácii
 výber poctu intervalov však závisí len od výskumníka a jeho skúmaného problému



Pocet hodnôt, ktoré patria do tej istej skupiny, resp. triedneho intervalu nazývame
pocetnostou.

Pocetnost môže byt:
• absolútna – je to absolútny pocet hodnôt daného intervalu (skupiny )

• relatívna – dostaneme ju tak. že vydelíme pocet hodnôt v danom intervale (skupine) celkovým poctom hodnôt v danom súbore. Ak výsledok násobíme císlom 100 – relatívnu pocetnost vyjadríme v percentách

• kumulatívna - dostaneme ju scítaním pocetnosti danej skupiny (triedneho intervalu) s pocetnostami všetkých predchádzajúcich skupín (triednych intervalov).


Príklad: Roztriedenie hodnôt v súbore : n = 50 pacientov vo veku 30-62 rokov

Pocetnost
Vek. skupina Absolútna Relatívna Kumulatívna
/ % / Absol. Relat./%/
30 - 34 2 4 2 4
35 – 39 5 10 7 14
40 – 44 10 20 17 34
45 - 49 16 32 33 64
50 – 54 14 28 47 94
55 – 59 2 4 49 98
60 + 1 2 50 100
Spolu: 50 100


RELATÍVNE UKAZOVATELE.

- získané údaje z výberových súborov, ktoré majú charakter kvantitatívnych znakov, popisujeme pomocou charakteristík polohy a charakteristík variability (pracujeme s absolútnymi císlami).
-
- pri popisoch údajov z výberových súborov získaných hodnotením (meraním) kvalitatívnych znakov najcastejšie uvádzame v kolkých percentách (promiloch) sa skúmaný znak v danom súbore vyskytol – urcujeme tzv. relatívne ukazovatele. Vznikajú podielom dvoch absolútnych císiel.

1. Pomerné císla štruktúry (extenzitné)
- vyjadrujú vztah casti k celku, podiel z úhrnu, napr. štruktúra postelového fondu v nemocnici:


pocet postelí na oddelení
* 100 = ...... %

pocet všetkých postelí v nemocnici


2. Pomerné císla intenzitné:
- používame pri porovnávaní výskytu sledovaného javu v súbore. Napr. pri sledovaní pôrodnosti, úmrtnosti a pod.


pocet zomretých v sledovanom období
* 1000
stredný stav obyvatelstva



3. Indexy:
- sú relatívne ukazovatele, ktoré sa využívajú k vyjadreniu zmien, ktoré nastali vo vývoji sledovaného javu v case (v casových radoch):

a) Indexy s pevným základom – každú hodnotu delíme pevným základom, co býva najcastejšie prvá hodnota casového radu (oproti ktorej porovnávame) a vynásobíme císlom 100. Výsledok uvádzame v percentách. Napr. Sledujeme vývojové zmeny od. r.1990 do r. 2000. Pevný základ je údaj za r. 1990 – voci nemu porovnávame údaje za ostatné roky.

b) Indexy s pohyblivým základom – používame pri porovnávaní dvoch
po sebe idúcich údajov v casových radoch, pricom predchádzajúci údaj
tvorí základ, na ktorý je prepocítaný nasledujúci údaj.



Š t a t i s t i c k é t a b u l k y

Štatistické tabulky používame pri spracovaní, triedení a prezentovaní výsledkov štatistického zistovania. Tabulky používané pri triedení sa nazývajú pomocné alebo pracovné, tabulky do ktorých zhrname konecné výsledky a hodnotenie skúmaných javov sa nazývajú výsledné a bývajú súcastou správy alebo publikácie.

Podla stupna triedenia sa tabulky rozdelujú na:

1. jednoduché, obsahujú súbor roztriedený podla jedného znaku
2. zložité:
a) korelacné – údaje sú triedené podla dvoch kvantitatívnych znakov
b) asociacné –
kontingencné – obe pre údaje triedené súcasne podla dvoch kvalitatívnych
znakov
c) skupinové – údaje roztriedené podla dvoch kvalitatívnych, alebo jedného
kvalitatívneho a jedného kvantitatívneho znaku
d) kombinacné - údaje roztriedené podla troch, štyroch, prípadne viacerých
znakov súcasne

Svojím obsahom môže tabulka vyjadrovat prehlad vlastností, štruktúru súboru,
vývoj javu v case, rozdelenie pocetností a závislosti medzi sledovanými javmi.
Štatistická tabulka má byt prehladná, zrozumitelná a jednoduchá. Forma
usporiadania jednotlivých prvkov (schéma) štatistickej tabulky sa riadi podla týchto
zásad:

- císelné údaje sú usporiadané do vodorovných riadkov a stlpcov a tvoria pole tabulky, zložené z jednotlivých polícok;

- obsah stlpcov uvádza hlavicka tabulky, umiestnená nad císelnými údajmi (polom),

- obsah riadkov vyjadruje legenda umiestnená obycajne vlavo od císelných údajov (hlavicka a legenda vyjadrujú spôsob a stupen triedenia prezentovaných údajov);

- každá štatistická tabulka má mat strucný nadpis, ktorý má vyjadrovat podstatný obsah tabulky; má byt zrozumitelná tak, aby jej obsah nebolo treba osobitne vysvetlovat;

- má byt obsahovo a vecne správna (treba sa vyhnút chybám);

- má byt úplná, pri prezentácii údajov v percentách treba uviest velkost celku (kolko je 100%); na to sú vyhradené v tabulke súctový stlpec a súctový riadok ;

- každé polícko tabulky má obsahovat císlo, alebo niektorú zo znaciek:
(-) vodorovnú ciarku použijeme na oznacenie nulového výskytu daného
javu
(0) nula s príslušným poctom desatinných miest oznacuje hodnotu, ktorá je
taká malá, že sa nedá vyjadrit zvolenou jednotkou
(.) bodka znamená, že danú hodnotu nepoznáme, nezistovali sme ju,
alebo je nespolahlivá
(x) ležatý krížik zapíšeme do polícka, ktorého údaj nie je možný
z logických dôvodov


Názov tabulky

Hlavicka
Súcet


Legenda
polícko


Súcet







Grafické znázornenie.
Graf je symbolické zobrazenie urcitých javov (kvantitatívnych alebo kvalitatívnych údajov) pomocou grafických prostriedkov.
Graf rýchle a názorne informuje o zistených hodnotách, vývoji a štruktúre javu, vztahoch medzi javmi a umožnuje aj rýchle porovnanie vývoja alebo štruktúry pozorovaných javov


K najcastejšie používaným grafom patria grafy:
- bodové (korelacné),
- spojnicové (povrchové, stupnové),
- stlpcové (palickové),
- prúžkové,
- osové (radiálne, polárne),
- výsekové (kruhové),
- odchylkové,
- kartogramy,
- kartodiagramy,
- obrázkové (piktogramy).
Bodový graf vyjadruje najcastejšie závislost dvoch javov, jej druh, smer i velkost Poloha bodu v grafickej sieti je daná hodnotami dvoch korelovaných znakov štatistickej jednotky. Pocet bodov je daný poctom štatistických jednotiek (rozsahom súboru). Bodmi môžeme znázornit aj hodnoty okamihových casových radov.

Spojnicový graf sa používa na znázornenie vývoja javu v case a na znázornenie rozdelenia pocetností. Je to lomená ciara a vzniká spojením bodov alebo úseciek, ktoré oznacujú intenzitu alebo mieru javu v príslušnom case (okamihu alebo období) alebo pocetnost v príslušnom triednom intervale.
Pri znázornovaní casových radov nanášame na os x casovú stupnicu. Ak znázornujeme údaje za casové obdobie intervaly (dni, mesiace, roky), body zakreslujeme nad stred grafických intervalov (pocet ochorení, pôrodnost). Ak znázornujeme casové rady okamihových hodnôt (glykemická krivka, pocet prežívajúcich pacientov po operácii k 31. 12. 2000. 2001 atd.), body umiestnujeme nad kóty. Toto pravidlo platí aj pre císelné oznacenie stupnice na osi x.
Na jednom spojnicovom grafe môžeme znázornit aj niekolko casových radov, ktoré odlíšime použitím rôznych druhov ciar (plné, ciarkované, bodkované, silné, slabé). Treba pritom dbat, aby grafický obraz nebol preplnený množstvom prekrížených ciar - zachovat požiadavku názornosti.

Pri znázornovaní rozdelenia pocetností nanášame na os x jednotlivé varianty alebo triedne intervaly kvantitatívneho znaku. Pocetnosti vyznacíme bud bodmi a ich spojením dostaneme polygón, alebo úseckami, ktoré spojíme navzájom kolmicami a dostaneme tak stupnovitú ciaru - histogram.

Osový - radiálny graf je osobitným druhom spojnicového grafu, ktorý sa používa na znázornenie cyklických javov (casových radov), t.j. javov, ktorých výskyt kolíše v pravidelne sa opakujúcich casových obdobiach (výskyt infekcných chorôb podla mesiacov roka, úrazov podlá dní týždna, hodín dna a pod.). Úroven znázornovaného javu zakreslujeme bodmi na osi vychádzajúce radiálne z "pólu", ktorý je stredom kružnice. Body spojíme ciarou a dostaneme nepravidelný mnohouholník (obr.). Poloha bodu je daná vzdialenostou od pólu (zaciatku osí zastupujúcich os y) a odchýlkou, ktorá je urcená podielom kružnice a poctu sledovaných období (l2 mesiacov, 7 dní, 24 hodín). Smer orientácie je v smere hodinových ruciciek. Kružnica (zastupuje os x) je základnou ciarou, ktorá tvorí východisko pre porovnanie. Jej polomer je daný priemernou hodnotou javu za celé sledované obdobie.

Stlpcový graf je velmi oblúbený pre svoju jednoduchost a velkú názornost. Patrí tiež medzi súradnicové grafy. Používa sa na jednoduché porovnanie velkosti (alebo pocetností) javov najmä kvalitatívnych, triedených vecne, alebo miestne (územne). Zriedkavejšie sa používa na znázornenie vývojovej tendencie (casových radov).
Císelné hodnoty sú znázornené pravouhlými obdlžnikmi konštantnej šírky; výška stlpca vyjadruje velkost alebo pocetnost javu. Stlpce v grafe usporadúvame vertikálne. Niekedy, ak je pomenovanie jednotlivých obmien znaku príliš dlhé, je výhodnejšie uložit stlpce horizontálne a dostaneme prúžkový graf, ktorý sa používa na porovnanie pri vecných a priestorových štatistických radoch. Pomocou stlpcového grafu môžeme znázornit aj zloženie, štruktúru študovaného javu (v absolútnych alebo relatívnych císlach). Celý stlpec (najcastejšie jeho výška) predstavuje celý jav (rozsah súboru, 100 %). Podla podielov jednotlivých zložiek rozcleníme stlpec na casti a odlíšime ich rôznym šrafovaním alebo farebne


Výsekový (kruhový) graf sa používa velmi casto na znázornenie štruktúry kvalitatívnych javov. Plocha kruhu sa stredovým uhlom 360 je rovné 100 % celého súboru. Výseku 1 % patrí stredový uhol 3,6°. Percentuálne podiely jednotlivých zložiek javu násobíme teda hodnotou 3,6 a príslušné hodnoty stredových uhlov nanášame pomocou uhlomera v smere hodinových ruciciek . Jednotlivé výseky odlíšime šrafovaním alebo farebne. V zdravotníckej štatistike sa s ním stretávame pri znázornovaní vývoja úrovne jednotlivých prícin smrti alebo štruktúry prícin smrti podla vekových skupín (obycajne za každé pohlavie samostatne).

Kartogramy a kartodiagramy informujú o priestorovom (územnom – teritoriálmom) rozdelení znázornovaného javu.
Kartogram sa používa na znázornenie (porovnanie) poctu alebo intenzity sledovaného javu v jednotlivých castiach územného celku pomocou príslušne clenenej obrysovej mapy. Intenzitu javu v jednotlivých územných jednotkách znázorníme prostredníctvom odstupnovanej intenzity šrafovania alebo intenzity.












CHARAKTERISTIKY POLOHY
Charakteristiky polohy informujú o polohe rozdelenia pocetností na vodorovnej osi, teda o velkosti sledovanej veliciny.
Používame pre ne tiež názov - stredné hodnoty.
Najcastejšie sa používajú aritmetický priemer, medián a modus.
Aritmetický priemer - z hodnôt X1, X2, X3, , Xn spravíme súcet a delíme poctom (N).

Ak sú údaje roztriedené, vynásobíme na každom riadku Xi s Ni, spravíme súcet a vydelíme celkovým poctom (N) (Xi = hodnota urcitej triedy, Ni = pocet prípadov v urcitej triede - pocetnost)

Príklad: Výpocet aritmetického priemeru pre pocet ochorení v prvom roku života u 50 detí.

Pocet ochorení (Xi) Pocet detí (Ni) Súcin (Xi * Ni)
0 1 0
1 3 3
2 5 10
3 8 24
4 13 52
5 11 55
6 7 42
7 2 14
Súcet 50 = Ni 200 =  Xi * Ni
Aritmetický priemer m = 200/50 = 4 ochorenia
V prípade, že údaje sú roztriedené do intervalov, postupujeme nasledovne :
Pre každý interval urcíme stred Xi a aritmetický priemer vypocítame tak, akoby všetky údaje zahrnuté do jednotlivých intervalov boli sústredené do ich stredov.
Príklad: Výpocet priemernej vitálnej kapacity (v litroch) v súbore 90 mužov vo veku 40-49 rokov.
vitálna kapacita stred intervalu (Xi) pocetnost (Ni) súcin (Xi*Ni)
2,75-3,24 3,0 1 3,0
3,25-3,74 3,5 11 38,5
3,75-4,24 4,0 12 48,0
4,25-4,74 4,5 22 99,0
4,75-5,24 5,0 16 80,0
5,25-5,74 5,5 13 71,5
5,75-6,24 6,0 10 60,0
6,25-6,74 6,5 2 13,0
6,75-7,24 7,0 1 7,0
7,25-7,75 7,5 2 15,0
súcet 90 435,0
aritmetický priemer m = 435/90 = 4,83
Ak máme vypocítat aritmetický priemer pre súbor, ktorý je rozdelený do niekolkých podsúborov, postupujeme nasledovne :

m =

m1*n1 + m2*n2
n1 +n2 + + nx

mx*nx

Príklad: V nemocnici na chirurgickom oddelení bolo hospitalizovaných 150 pacientov s priemernou dlžkou hospitalizácie 19 dní. Na gynekologickom oddelení 100 pacientov s priemernou dlžkou hospitalizácie 7 dní. Na detskom oddelení 90 pacientov s priemernou dlžkou hospitalizácie 12 dní. Aká bola priemerná dlžka hospitalizácie za všetky tri oddelenia spolu ?
n1 =150, m1 = 19 n2 = 100 , m2 = 7 n3 = 90, m3 = 12

m =
19* 150 + 7* 100 + 12*90
150+ 100 + 90

= 13,6

Priemerná dlžka hospitalizácie bola 13,6 dna.

Medián je hodnota prostredného clena (prvku) štatistického súboru, ktorého hodnoty sú usporiadané podla velkosti

Medián oznacujeme : Me

Medián delí štatistický súbor na dve rovnako velké casti. Polovica údajov je menšia než Me a polovica väcšia.
Pre párny pocet údajov je medián rovný priemeru dvoch prostredných clenov.
Modus (Mo) je hodnota, ktorá má najväcšiu pocetnost.
Je to hodnota, ktorá sa vyskytuje najcastejšie.
Vztah medzi aritmetickým priemerom (m), mediánom (Me) a modusom (Mo) l. symetrické rozloženie pocetností






0 5 10
m = Me = Mo
(resp. líšia sa len nepatrne)
2. lavostranne asymetrické rozloženie pocetností




10


3. pravostranné asymetrické rozloženie pocetností


CHARAKTERISTIKY VARIABILITY

Okrem koncentrácie údajov okolo stredných hodnôt je pre kvantitatívne údaje typická aj ich variabilita, ktorá sa prejavuje tým, že jednotlivé údaje kolíšu okolo ukazovatelov polohy v urcitých vzdialenostiach. K najcastejšie používaným charakteristikám variability patria : variacné rozpätie, rozptyl, smerodajná odchýlka a variacný koeficient.

Variacné rozpätie : je najjednoduchší ukazovatel variability. Ukazuje, aký je rozdiel medzi maximálnou hodnotou a minimálnou hodnotou. (R=Xmax - Xmin)
Variacné rozpätie používame len k základnej orientácii. Variacné rozpätie nám nehovorí nic o tom, ako sú údaje medzi extrémnymi hodnotami rozptýlené.

Rozptyl (S2) : meria variabilitu kvantitatívnych údajov pomocou vzdialeností (odchýliek) jednotlivých údajov od aritmetického priemeru. Je to v podstate priemer štvorcov odchýliek.
l k
Výpocet S2 pre netriedené údaje : S2 = -----  (Xi -m)2
n i=l



Smerodajná odchýlka (S): je odmocninou z rozptylu. Z hladiska interpretácie má smerodajná odchýlka väcší význam než rozptyl. S - uvádza sa v rovnakých jednotkách
ako sledovaná velicina a jej priemer. S2 - má štvorcový rozmer
Ak sledujeme výšku detí, potom M (priemer) je v cm, S (smerodajná odchýlka) je v cm, S2 (rozptyl) v cm2.
S - dáva nám predstavu o tom, ako sú rozptýlené individuálne údaje v rámci celého súboru.
Variacný koeficient (v.k): je relatívny ukazovatel variability. Urcuje sa ako podiel smerodajnej odchýlky a aritmetického priemeru. Uvádza sa v %.
S
v.k = * 100
m
Používa sa vtedy, ked je potrebné porovnat
variabilitu dvoch alebo viacerých súborov, ktorých priemery sa navzájom znacne líšia variabilitu znakov uvádzaných v rôznych merných jednotkách (napr. cm a kg)




O

m = 5

10

(Si< S2 < S3) (ml=m2=m3)
Priemery sú rovnaké, ale smerodajné odchýlky rôzne.
Najmenšia smerodajná odchýlka je u výberu c. l (údaje sa najmenej odchylujú od priemeru).



Môže však nastat aj prípad, ked smerodajné odchýlky budú rovnaké, ale priemery sa budú líšit.






TEORETICKÉ ROZDELENIE POCETNOSTÍ

Normálne (Gaussovo) rozdelenie pocetností:

* je modelom teoretického rozdelenia. Jeho grafické znázornenie predstavuje
ideálnu, zvonovitú krivku, ktorá je symetrická k osi prechádzajúcej aritmetickým priemerom a zároven mediánom a modusom. Vodorovnú os nepretína, len sa jej v nekonecne dotýka.
* pretože normálne (Gaussove) krivky sú jednovrcholové, absolútne symetrické,
môžeme povedat:
- pravdepodobnost, že lubovolná hodnota xi bude nižšia resp. vyššia ako
priemer je 0.5 (50 %)
- ak by sme za mieru (meradlo) vzdialenosti xi od  nebrali konkrétne sledované hodnoty (pocet cm, g...), ale za jednotku miery by sme použili hodnoty  (smerodajnú odchylku), dostali by sme nasledujúce vztahy:
  1 = 68,27 %
  2 = 95,45 %
  3 = 99,78 %
- to znamená, že plocha pod krivkou (pravdepodobnost) vymedzená dvoma kolmicami vztýcenými od priemeru vo vzdialenosti jednej  na každú stranu, zaberala by 68,27 % celej plochy pod krivkou, vo vzdialenosti 2  - 95,45 % a vo vzdialenosti 3  - 99,78 %.


PRAVDEPODOBNOST

V obcianskom živote i v medicínskej praxi sa slovo pravdepodobnost vyskytuje casto. Napr. študent povie, že je velká pravdepodobnost, že skúšku neurobí, alebo lekár povie, že je velká pravdepodobnost vzniku komplikácií. Jeden aj druhý zvažuje podmienky, ktoré ovplyvnujú výskyt, ci uskutocnenie ocakávaného javu.
V štatistike pojmom pravdepodobnost oznacujeme kvantitatívnu charakteristiku výskytu urcitého náhodného javu. Túto vieme u niektorých náhodných javov vypocítat na základe klasickej definície pravdepodobnosti: Ak pri danom jave môže nastat n rôznych výsledkov, ktoré sú rovnako možné, a m výsledkov, ktoré sú priaznivé urcitému javu, potom sa pravdepodobnost javu rovná pomeru výsledkov priaznivých tomuto javu a všetkých možných výsledkov, oznacíme to: p = m/n.
Pri hode hracou kockou, ocíslovanou od l do 6 sa môže na jej hornej stene objavit ktorákolvek z císiel 1, 2, 3, 4, 5, 6: n=6; záleží len na náhode, ktoré to bude. To sú všetky výsledky možné.
Ak si urcíme vlastnost alebo variantu výsledku, ktorý ocakávame, napr., že pri hode kockou padne párne císlo, potom výsledky hodu 2, 4, 6, sú priaznivé výsledky (m=3) nášho náhodného javu (párneho císla) a jeho pravdepodobnost bude 3:6 (priaznivé k možným výsledkom). Pravdepodobnost, že padne 4 je 1/6, t.j. 0,166; pravdepodobnost, že padne 4 alebo 5 (m=2) je 2/6, t.j. 0,333; ak ocakávame ktorékolvek císlo od 1 do 5 (m=5), pravdepodobnost je 5/6, t,j. 0,833. Padnutie ktoréhokolvek císla od l do 6 (m=6) má pravdepodobnost 6/6, t .j. 1. Cím je hodnota pravdepodobnosti náhodného javu bližšia 0, tým je menšia, cím je bližšia jednotke, tým je väcšia. Uvedené pravdepodobnosti platia za podmienky, že hádžeme ideálne homogénnou kockou, ktorej tažisko je presne uprostred. Pravdepodobnost tohto druhu oznacujeme ako pravdepodobnost a priori.

K zisteniu pravdepodobnosti náhodného javu môžeme dôjst aj pokusom, mnohonásobným opakovaním (hodu kockou) a zaznamenávaním poctu priaznivých prípadov m z celkového poctu pokusov n, teda urcením relatívnej pocetnosti výskytu ocakávaného javu. Hodnota pravdepodobnosti získaná týmto spôsobom sa nazýva pravdepodobnost a posteriori. Relatívna pocetnost sa blíži skutocnej pravdepodobnosti tým viac, cím väcší pocet pokusov /pozorovaní/ sme urobili. (Uplatnenie zákona velkých císel).

V biológii a v medicíne sa stretávame zvycajne s náhodnými javmi (so skutocnostami), ktorých pravdepodobnost nevieme presne vypocítat. Napríklad aká je pravdepodobnost, že podaná ockovacia látka vyvolá imunitu, inokulovaná kultúra baktérií vyvolá infekciu u pokusného zvierata, alebo operatívny zákrok zlepší zdravotný stav pacienta? Pravdepodobnost takýchto javov len odhadujeme na základe relatívnej pocetnosti výskytu ocakávaných (priaznivých) výsledkov z poctu pozorovaní. Tento spôsob smeruje od praxe k teoretickým záverom.

Vlastnosti pravdepodobnosti:

1. Pravdepodobnost nadobúda hodnôt medzi nulou a jednotkou, 0 p  1.
2. Pravdepodobnost istého javu je rovná 1, p = 1, pravdepodobnost nemožného javu je rovná 0, p = 0.
3. Ak pravdepodobnost, že jav nastane je p, potom pravdepodobnost, že tento jav nenastane je: q = 1 - p (doplnková pravdepodobnost).
4. Ked sa p líši len nepatrne od nuly (napr. 0,05; 0,01; 0,001), je prakticky isté, že pri jedinom pokuse jav nenastane.
5. Ked sa p líši len nepatrne od jednotky (napr. 0,95; 0,99; 0,999), je prakticky isté, že pri jedinom pokuse jav nastane.
6. Pri mnohonásobnom opakovaní pokusu týkajúceho sa náhodného javu je prakticky isté, že relatívna pocetnost výskytu javu sa len nepatrne líši od jeho pravdepodobnosti p.

Nemožno zabudnút, že zistená pravdepodobnost platí len za takých podmienok pozorovania (pokusu), za akých bola zistená.
Napríklad pravdepodobnost získania imunity voci poliomyelitíde po ockovaní podla Sabina nie je totožná s pravdepodobnostou získania imunity proti poliomyelitíde po ockovaní podla Salka, alebo pravdepodobnost úmrtia na brušný týfus pred antibiotickou érou a po zavedení antibiotík je velmi rozdielna.
Treba si uvedomit, že pravdepodobnost je vlastnost daného náhodného javu, tak ako je šest rovnakých stien vlastnostou kocky, alebo výška vlastnostou cloveka. Tak ako výšku meriame v cm, pravdepodobnost náhodného javu meriame relatívnou pocetnostou. Jednoducho sa hovorí, že pravdepodobnost je pomer poctu priaznivých výsledkov k poctu všetkých získaných výsledkov.
(Riešenie úloh z poctu pravdepodobnosti vychádza v princípe zo vzorcov a viet kombinatoriky).

ZÁVERY ŠTATISTICKÝCH ZISTOVANÍ

A) Odhad neznámeho parametra základného súboru

* na základe empiricky zistených charakteristík výberového súboru
- aritm. priemeru a smerod. odchylky - pri kvantit. znakoch
- relatívnej pocetnosti - pri kvalit. znakoch

o d h a d u j e m e

s urcitou vopred stanovenou pravdepodobnostou
hodnotu neznámeho parametra základného súboru

ODHAD
* bodový
* intervalový - odhadujeme
interval spolahlivosti (konfidencný interval),
v ktorom sa s vopred zvolenou pravdepodobnostou nachádza
parameter základného súboru

INTERVALOVÝ ODHAD ARITMETICKÉHO PRIEMERU ZÁKLADNÉHO SÚBORU.

Interval spolahlivosti - je interval v ktorom sa s velkou pravdepodobnostou nachádza skutocná hodnota (aritmetický priemer základného súboru). Horný a dolný okraj tohoto intervalu sa nazývajú hranice intervalu spolahlivosti

Interval spolahlivosti = konfidencný interval
Postup: 1) výpocet charakteristík výberového súboru
(aritmetický priemer, smerodajná odchylka)
2) urcit typ rozdelenia empirických hodnôt
3) zvolit pravdepodobnost odhadu
4) vypocítat interval spolahlivosti

Všeobecný vzorec:
estimátor ± koeficient spolahlivosti * štandardná chyba
• estimátor = aritmetický priemer výberu
• koeficient spolahlivosti = tabulkové kritérium prisl.typu
rozdelenia a zvolenej pravdepodobnosti
• štandardná chyba (priemeru) = odhaduje stupen v akom sa priemer výberu
odlišuje od priemeru základného súboru.
Pocíta sa na základe smerodajnej odchylky a velkosti výberu.
s
Sx = ------------
 n


Príklad:

Chceme odhadnút interval spolahlivosti pre aritmetický priemer hodnôt BMI mužov vo veku 40 – 49 rokov.
Vypocítané charakteristiky:
aritm. priemer m = 28,08 j. BMI
smerod. odchylka s = 4,08 j. BMI
rozsah súboru n = 262 mužov
zvolená pravdepodobnost (p ) = 0,95
koeficient spolahlivosti ( t ) pre p = 0,95 je 1,96 (tabulková hodnota normálneho
rozdelenia pocetností)

s 4,08
štandardná chyba sx = ------- = ---------- = 0,25
n  262


p = 0,95

28,08 - 1,96 * 0,25    28,08 + 1,96 * 0,25
27,56    28,57


p = 0,99

28,08 - 2,58 * 0,25    28,08 + 2,58 * 0,25
27,43    28,72







B) Porovnávanie rozdielov výberových charakteristík
- metóda testovania (overovania) hypotéz.

* posudzujeme otázku, ci sa urcité výberové štatistické charakteristiky
od seba líšia len v dôsledku pôsobenia náhod, alebo pôsobením urcitého faktoru ;


Metóda:
TESTOVANIE HYPOTÉZ:
- testujeme (overujeme) platnost H0 , ktorá hovorí:
„ v skutocnosti nie je rozdiel medzi porovnávanými výberovými charakteristikami“
HA - v skutocnosti je rozdiel medzi porovnávanými výberovými charakteristikami


Postup:
1. formulujeme nulovú (H0) a alternatívnu (HA)hypotézu
2. zvolíme si vhodný test
3. porovnáme vypocítanú testovaciu charakteristiku s tabulkovou
charakteristikou na zvolenej hladine významnosti 
4. záver: zamietneme resp. nezamietneme H0 na zvolenej hladine
významnosti 

Príklad:
Chceme zistit, ci nami zistený rozdiel v hodnotách BMI (vyjadrených ich priemermi) mužov vo veku 40-49 r. 2 súborov je náhodný alebo je tento rozdiel skutocný, t.z. rozdiel je aj v základných súboroch.

Postup:
1) Definovanie H0 : - v skutocnosti nie je rozdiel medzi priemermi
2) Vypocítame výberové charakteristiky:
súbor c. 1 súbor c.2
pocet mužov n1 = 262 n 2 = 272
aritmetický priemer m1 = 28,08 m2 = 26,54
smerodajná odchylka s1 = 4,08 s2 = 3,61
štandardná chyba sm1= 0,25 sm2 = 0,22

3) Zvolíme hladinu významnosti  = 0,05
4) Zvolíme test významnosti ( v našom prípade test normálneho rozdelenia pocetností) – u-test:
/ m1 – m2 / 28,08 – 26,54
u = ------------------- = ------------------------- = 4,89 = tu
 s2 m1+ s2 m2  0,252 + 0,222

5) Nájst v tabulkách kritickú hodnotu t = 1,96
6) Porovnáme t s tu a ak je t  tu (1,96  4,86), tak H0 z a m i e t a m e na hladine významnosti  = 0,05.
7) Záver:
nami zistený rozdiel priemerov BMI v dvoch pozorovaných výberových sôborov je štatisticky signifikantbý na hladine významnosti 0,05, to znamená, že s 95 % pravdepodobnostou tento rozdiel bude aj v základných súboroch, pripúštame náš možný „omyl“ v 5 %.














Úloha štatistických metód v lekárskom výskume:
Procesy, ktoré prebiehajú v zdravom alebo chorom organizme a ktoré sú predmetom výskumu, obsahujú v sebe zložky
* d e t e r m i n o v a n é (zákonité)
* n á h o d n é (nezákonité)

• zložka determinovaná - jej správanie môžeme presne urcit a predpovedat;
• zložka pravdepodobnostná , alebo stochastická (náhodná)
- jej správanie nemôžeme jednoznacne predpovedat, ale len s urcitou
pravdepodobnostou;
- je charakterizovaná pôsobením najrôznejších vplyvov, ktoré nie je možné
prakticky predpovedat

Cielom aplikácie štatistiky v medicíne je z í s k a t r o z u m n é r o z h o d n u t i a
v prípadoch, kedy sa rozhodovanie opiera o informáciu, ktorá má variabilnú
povahu, a ked v dôsledku tejto variability je rozhodovanie zatažené urcitým
stupnom rizika a neistoty.
Pomocou štatistických metód možno spravidla mieru rizika nesprávneho rozhodnutia odhadnút.
Štatistické metódy majú napriek svojej dôležitosti len pomocný charakter.
Pri formulovaní záverov získaných štatistickou analýzou, je potrebné vždy vychádzat z klinických poznatkov





Použitá a doporucená literatúra:
1. Gerylovová, A., Holcík, A.: Statistická metodologie v lékarském výskumu.I.díl.
LK UJEP, Brno, 1990, 262 s.
2. Kubánková, V., Hendl,J.: Statistika pro zdravotníky. Avicenum. Praha, 1987,
280 s.
3. Class, J., Ebner,H.: Základy štatistiky pre psychológov, pedagógov a sociológov.
SPN, Bratislava, 1988, 504 s.
4. Beniak, M. a kolektív: Vybrané kapitoly zo sociálneho lekárstva. (skriptá) UK,
Bratislava, 1985, 208 s.







Diskuse

Buď první, kdo se vyjádří k tomuto příspěvku (0)