Štatistické metódy
1. Základné pojmy
Predmetom štatistického skúmania sú súbory spoločenských hromadných javov. Štatistika neskúma jednotlivé prípady, z ktorých sa súbor skladá izolovane, ale skúma javy v celistvosti. Hovoríme, že skúma hromadné javy. Štatistické súbory sa skladajú z jednotlivých štatistických jednotiek. Štatistické jednotky sú nositeľmi štatistických znakov, ktoré charakterizujú vlastnosti skúmaného hromadného javu. Štatistická jednotka, štatistický znak a štatistický súbor sú teda základnými pojmami, ktoré používame v celom procese štatistického skúmania. 2. Základné charakteristiky štatistického súboru
V teórií štatistiky poznáme dva hlavné druhy základných charakteristík štatistického súboru:
a) charakteristiky úrovne, ktoré nazývame stredovými hodnotami
b) charakteristiky variability, ktoré skúmajú rozloženie hodnôt kvantitatívnych znakov okolo stredných hodnôt
2.1.1 Stredné hodnoty
Stredná hodnota je súhrnná zovšeobecňujúca charakteristika skúmaného kvantitatívneho znaku v príslušnom štatistickom súbore. Stredné hodnoty vypočítame z absolútnych i pomerných čísel.
Medzi stredné hodnoty patria :
Ţ aritmetický priemer
Ţ harmonický priemer
Ţ geometrický priemer
Ţ modus
Ţ medián
Veľkosť hodnoty prvých troch druhov stredných hodnôt - priemerov – závisí od veľkosti hodnôt všetkých prvkov príslušného štat. súboru. Medián a modus slúžia na charakteristiku typických vlastností štatistického radu. Ich hodnota nezávisí od všetkých jednotiek štat. radu.
Podmienkou správnosti použitia strednej hodnoty v štatistike je rovnorodosť štatistického súboru, z ktorého vypočítame príslušnú strednú hodnotu. Štat. jednotky súboru sa môžu líšiť veľkosťou hodnoty skúmaného znaku, no musia byť kvalitatívne rovnorodé.
2.1.2 Aritmetický priemer
Aritmetický priemer je stredná hodnota, ktorá sa v praxi najviac používa. Reprezentatívna hodnota aritmetického priemeru je tým väčšia , čím je súbor rovnorodejší. Rovnicu, ktorú možno stanoviť pre aritmetický priemer, ako aj pre ostatné druhy priemerov, môžeme všeobecne vyvodiť na základe tejto určujúcej vlastnosti. Určujúcou vlastnosťou aritmetického priemeru je taká kvantitatívna vlastnosť, ktorá sa po nahradení hodnôt všetkých štatistických jednotiek radu priemerom nezmení. Určujúca vlastnosť arit. priemeru je charakterizovaná tým, že sa súčet hodnôt štatistického radu , z ktorého počítame arit.
priemer, nezmení, keď každú hodnotu radu nahradíme aritmetickým priemerom.
Určujúcu vlastnosť aritmetického priemeru môžme vyjadriť v rovnicovom tvare:
__ __ __ __
x1 + x2 + x3 + ......xn = x + x + x + ......+ x
kde x1, x2, x3 hodnoty kvantitatívneho znaku štatistického radu a indexy 1, 2, 3 označujú poradie prvého, druhého, tretieho až n – tého člena štatistického radu a x označuje aritmetický priemer. Súčet všetkých n hodnôt príslušného kvantitatívneho znaku je taký veľký ako súčet rovnakého počtu hodnôt aritmetického priemetu štat. radu.
Zjednodušene môžme aritmetický priemer označiť v tvare:
∑ x1
x = -------
n
kde ∑ označuje súčet.
Uvedený vzorec je vzorec jednoduchého aritmetického priemeru, ktorý vypočítame , keď súčet hodnôt delíme ich počtom.
2.1.3 Harmonický priemer
Určujúcou vlastnosťou , z ktorej môžeme harmonický priemer všeobecne odvodiť, je stálosť súčtu prevrátených hodnôt. Keď harmonický priemer označíme symbolom
__
xh a hodnoty znaku, ktoré priemerujeme, symbolom xi , vzorec jednoduchého harmonického priemeru bude:
__ n n
xh = -------------------------------- = ------------
1 1 1 1
-- + -- +.. + -- ∑ ---
x1 x2 xn xi
2.1.4 Geometrický priemer
Geometrický priemer používame v štatistike pre výpočte priemerného koeficientu rastu a pri interpolácií, resp. extrapolácií časových radov. Určujúcou vlastnosťou geometrického priemeru je stálosť súčinu hodnôt. __
Keď geometrický priemer označíme symbolom xg a hodnoty štatistického znaku x1, x2, ........xn, potom z rovnice: __ __ __ __
x1. x2. x3 .......xn = xg. xg. xg .....xg
__ _1_
xg = √ πxi = (πxi) n
Geometrický priemer je teda n – tou odmocninou zo súčinu n hodnôt znaku xi. Pri praktickom výpočte geometrického priemeru používame logaritmy:
__ log x1 + log x2 +....+ log xn ∑ log xi
log xg = ---------------------------------------- = ----------------
n n
Logaritmus geometrického priemeru z radu hodnôt štatistického znaku je teda aritmetickým priemerom ich logaritmov.
2.1.4. Medián
Okrem priemerov sa v štatistike používajú aj iné stredné hodnoty, ktoré majú v štatistických radoch charakteristickú polohu. Sú to medián a modus.
Medián a modus používame zvyčajne vtedy, keď priemery nie sú typickými predstaviteľmi príslušných štatistických radov.
Medián definujeme ako prostrednú hodnotu znaku vtedy, keď sú hodnoty znaku usporiadané v štatistickom rade podľa veľkosti, čiže je to tá hodnota znaku, vedľa ktorej v príslušnom štatistickom rade nájdeme taký istý počet štatistických jednotiek, s väčším a menšími hodnotami, ako je medián.
Keď vypočítavame hodnotu mediánu a počet hodnôt súboru je nepárny, určíme medián ako hodnotu s poradím:
n + 1
------------
2
kde n je počet hodnôt.
Pri párnom počte členov súboru vypočítame medián ako aritmetický priemer z hodnôt dvoch prostredných členov príslušného súboru.
štatistickú jednotku, ktorá je nositeľom mediánu, vypočítame teda vždy podľa vzorca:
n + 1
------------
2
2.1.5 Modus
Modus je tá hodnota štatistického znaku, ktorá sa v príslušnom štatistickom súbore najčastejšie vyskytuje. Je to najtypickejšia hodnota.
Pri skupinovom rozdelení početností s rovnakými intervalmi počítame modus podľa vzorca:
d1
Mo = A + h. ------------
d1 + d2
kde Mo je modus ,
A začiatok modálneho intervalu
h rozpätie modálneho intervalu
d1 rozdiel medzi početnosťou modálneho a predchádzajúceho intervalu
d2 rozdiel medzi početnosťou modálneho a nasledujúceho intervalu
2.2 Miery variácie
Stredné hodnoty nemôžu samy o sebe dostatočne charakterizovať štatistický súbor. Za zovšeobecňujúcou charakteristikou súboru je skrytá jeho štruktúra, rozdelenie početností podľa veľkostí skúmaného kvantitatívneho znaku, ako aj menlivosť (variácia) hodnôt štatistického znaku v príslušnom súbore.
Variácia hodnôt znakov určitých javov vzniká tým, že na ne pôsobia rozličné vplyvy, ktoré vytvárajú medzi nimi najrozmanitejšie spojenia. Samotná stredná hodnota pôsobenie tohto súhrnu vplyvov na meniace sa hodnoty zakrýva.
Variabilitu hodnôt znaku, ako aj typickosť(príznačnosť) strednej hodnoty pre príslušný súbor, zisťujeme mierami variácie. Miery variácie používame na charakterizovanie rovnomernosti a rytmičnosti javov.
Najdôležitejšími mierami variácie sú:
a) variačné rozpätie
b) priemerná odchýlka
c) rozptyl a smerodajná odchýlka
d) variačný koeficient
2.2.1 Variačné rozpätie
Rozdiel medzi najväčšou a najmenšou hodnotou znaku v štatistickom rade nazývame variačným rozpätím. Je to najjednoduchšia miera variácie, ktorej prednosti spočívajú v ľahkosti a rýchlosti výpočtu ako aj v jednoduchosti jej interpelácie. Jej nevýhodou je zase to, že značne kolíše v závislosti od krajných hodnôt znaku. Výskyt jednej extrémnej hodnoty znaku v súbore vyvoláva veľkú zmenu variačného rozpätia. Variačné rozpätie počítame podľa vzorca:
Vr = xmax - xmin
kde Vr je variačné rozpätie,
xmax najväčšia hodnota znaku v štatistickom rade
xmin najmenšia hodnota znaku v štatistickom rade
2.2.2 Priemerná odchýlka
Dokonalejšou mierou variácie, ktorej hodnota závisí od všetkých členov štatistického súboru, je priemerná odchýlka. Je to aritmetický priemer z absolútnych odchýlok hodnôt znaku od niektorej strednej hodnoty.
( Absolútne hodnota je hodnota bez ohľadu na znamienko).
_
Keď priemernú odchýlku označíme symbolom d a odchýlky hodnôt znaku od niektorej strednej hodnoty symbolom di , vzorec priemernej odchýlky bude:
__ ∑ | di |
d = --------------
n
Keď počítame odchýlky od aritmetického priemeru, vzorec priemernej odchýlky bude:
_
__ ∑ | xi - x |
d = --------------
n
Ak sa jednotlivé obmeny hodnôt kvantitatívneho znaku vyskytujú v rôznych množstvách, vypočítame aj priemernú odchýlku, a to tak, ako pri aritmetickom priemere , formou váženej priemernej odchýlky. Vážená priemerná odchýlky sa počíta podľa vzorca:
__ ∑ | xi - x |. ni
d = --------------------
Σ ni
kde ni sú početnosti.
2.2.3 Rozptyl a smerodajná odchýlka
Najdôležitejším ukazovateľmi variácie hodnôt znakov v štatistickom súbore sú rozptyl a smerodajná odchýlka.
Rozptylom nazývame aritmetický priemer zo štvorcov odchýlok hodnôt znaku od aritmetického priemeru. Keď rozptyl označíme symbolom σ2 , jeho vzorec má tvar:
_
∑ (xi - x )2
σ2 = --------------
n
Rozptyl v tvare váženého aritmetického priemeru je :
_
∑ (xi - x )2 ni
σ2 = ------------------
∑ni
Rozptyl zo skupinového rozdelenia početností počítame vždy formou váženého aritmetického priemeru.
Smerodajnú ( aj štandardnú) odchýlku, ktorú označíme σ, vypočítame ako kladný koreň druhej odmocniny z rozptylu. Teda:
_
∑ (xi - x )2
σ = √ --------------
n
a je vážený tvar :
_
∑ (xi - x )2. ni
σ = √ -----------------
∑ni
2.2.4 Variačný koeficient
Keď sa dva štatistické súbory líšia navzájom hodnotami znakov (majú rôznu úroveň), lepšie je porovnávať ich variabilitu relatívnou mierou disperzie.
Takouto známou relatívnou mierou variácie je variačný koeficient. Je to pomer smerodajnej odchýlky k aritmetickému priemeru, vyjadrený v percentách. Variačný koeficient ( Vk ) vypočítame podľa vzorca:
σ
Vk = ----. 100
x
3. Základné poznatky z teórie výberového skúmania
Všetky skúmané štatistické jednotky tvoria tzv. základný súbor. Tie štatistické jednotky, ktoré sme so skúmaného základného súboru vybrali a na základe ktorých chceme robiť o ňom úsudok, tvoria tzv. výberový súbor. Úsudky, ktoré urobíme o príslušnom súbore na základe vybraných vzoriek , sú založené na skúsenosti , že vybrané vzorky viac alebo menej presne charakterizujú súbor, z ktorého sú vybrané.
Teória výberového skúmania poskytuje logický základ pre takéto úsudky a umožňuje kvantitatívne merania.
Hlavné druhy výberových metód sú:
a) náhodný výber
b) mechanický výber
c) typický výber
d) viacstupňový výber
3.1 Náhodný výber
Keď chceme o určitom základnom súbore robiť úsudok na základe vybraných vzoriek, ktoré by najlepšie reprezentovali základný súbor, musíme každému prvku základného súboru dať rovnakú možnosť, aby sa dostala do výberového súboru. Jednotlivé vzorky vyberáme zo základného súboru náhodne. Zabezpečenie rovnakej pravdepodobnosti pojatia každého prvku základného súboru do výberového súboru má vylúčiť akýkoľvek subjektívny vplvyv pri náhodnom výbere. Okrem tejto podmienky musí byť ešte splnená jedna podmienka, a to aby všetky udalosti boli nezávislé.
Náhodný výber uskutočňujeme pomocou žrebovania alebo tabuliek náhodných čísel. V teórií i praxi náhodných výberov pôjde predovšetkým o to , ako odhadneme zo zistených základných charakteristík výberového súboru tie isté charakteristiky, patriace základnému súboru, z ktorého uskutočňujeme výber. Náhodné výbery môžu byť s opakovaním a bez opakovania. V prvom prípade vraciame každý vybraný prvok po zistení je ho vlastností späť do základného súboru. Pri náhodných výberoch bez opakovania sa vybraný prvok viac do základného súboru nevracia.
Počet všetkých možných náhodných výberov pri náhodných výberoch bez opakovania je :
Vn (N) = N (N – 1) (N – 2) (N – 3).....(N – n + 1)
alebo vyjadrené pomocou faktoriálov:
N !
Vn (N) = ----------
(N – n)
3.2 Mechanický výber
Pri výberovom skúmaní používame zriedkavo vlastný náhodný výber. Obvykle, najmä ak sú prvky základného súboru usporiadané podľa určitého pravidla, vyberáme zo základného súboru jednotlivé prvky podľa určitého znaku mechanicky. Keď máme napr. vybrať z určitého základného súboru do výberového súboru 10 % prvkov, vyberáme do tohto súboru každý desiaty prvok.
Priemernú chybu odhadu ako aj počet prvkov, ktoré treba vybrať do výberového súboru, stanovíme pri mechanickom výbere podľa vzorcov, ktoré používame pri vlastnom náhodnom výbere.
3.3 Oblastný (typický) výber
Oblastný (aj stratifikovaný) výber uskutočňujeme tak. že skúmaný základný súbor rozdeľujeme na typické skupiny - oblasti. Je ňou vlastne každá skupina jednotiek základného súboru, ktorá bola na základe určitého hľadiska vybraná do príslušnej typickej skupiny.
3.4 Viacstupňový výber
Pri viacstupňovom výbere nepodrobujeme výberovému skúmaniu jednotlivé prvky základného súboru, ale celé skupiny jednotiek (série). Viacstupňový výber môže byť alebo s vybranými sériami s rovnakým obsahom prvkov, alebo so sériami rôznych objemov.
|