9.1 A becslőfüggvény tulajdonságai
Az ismeretlen sokaság paraméterére vonatkozó következtetésünk minden esetben mintabeli információn fog alapulni, azaz egy valószínűségi változón, hiszen a mintánk minden mintavétel esetén más és más lenne. Ezt a valószínűségi változót becslőfüggvénynek, az adott minta esetén kiszámított értékét pedig becsült értéknek nevezzük.9 A becslőfüggvény tehát egy mintaelemektől mint valószínűségi változóktól függő matematikai formula, míg a becsült érték ennek a formulának az adott mintára vonatkozó kiszámított értéke, a valószínűségi változó egy realizációja, egy szám.
Első közelítésben tehát becslőfüggvényt kell meghatároznunk, amivel a becslés végrehajtható. Ez ugyan egyszerűnek tűnik, de mégsem létezik egyetlen legjobb módszer a függvény meghatározására. Az ebben a tananyagban tárgyalt egyszerű esetekre a becslőfüggvény többnyire kézenfekvő, azonban összetettebb esetekre ez már nem igaz. Annak érdekében, hogy a különböző becslőfüggvényeket össze tudjuk hasonlítani, érdemes néhány kritériumot felállítani, a két legfontosabb tulajdonság a torzítatlanság és a hatásosság.
9.1.1 Torzítatlanság
A becslőfüggvények egyik kívánatos tulajdonsága a torzítatlanság, ami alatt a következő tulajdonságot értjük (ahogy azt már az előző fejezetben is láttuk):
\[\begin{equation} \mathbf{E}(\hat{\theta}) = \theta \tag{9.1} \end{equation}\]
Ekkor azt mondjuk tehát, hogy a \(\hat{\theta}\) becslőfüggvény torzítatlan becslőfüggvénye a \(\theta\) sokasági paraméternek, a becslőfüggvény minden lehetséges mintán vett várható értéke pontosan a keresett sokasági paraméterrel egyenlő. A torzítatlanság tehát nem azt jelenti, hogy akár csak egyetlen mintabeli érték eltalálja a sokasági értéket, hanem azt, hogy a mintabeli értékek várható értékben a sokasági paramétert adják.
Ahogy azt a (8.1) összefüggésünk mutatta, a mintabeli átlagok átlaga (várható értéke) megegyezik a sokasági átlaggal, azaz a mintaátlag \(\hat{\theta} = \overline{X}\) torzítatlan becslőfüggvénye a sokasági átlagnak \(\theta = \mu\). A mintabeli átlag azonban nem az egyetlen lehetséges -- és nem is minden esetben a legjobb -- becslőfüggvénye a sokasági átlagnak. A mintabeli medián is egy lehetséges, de nem minden esetben jó becslőfüggvény.
Amennyiben a \(\sigma^2\) sokasági variancia becslőfüggvényét keressük, a torzítatlan becslőfüggvényt a mintabeli korrigált variancia adja, de itt is elképzelhető lenne más becslőfüggvény, pl. a mintabeli terjedelem osztva hárommal. Természetesen elméleti megalapozás nélkül ez a becslőfüggvény valószínűleg nem teljesítene túlságosan jól.
Vannak olyan esetek, amikor nem található torzítatlan becslőfüggvény, azaz nem teljesül a (9.1) összefüggés. A torzítás mértékét a
\[\begin{equation} \mathbf{E}(\hat{\theta}) - \theta \tag{9.2} \end{equation}\]
különbség méri, ami jellemzően \(n\), a mintaelemszám változásával változik10. Amennyiben \(n \to \infty\) esetén a torzítás a 0-hoz tart, a tulajdonságot aszimptotikus torzítatlanságnak nevezzük.
A 9.1. táblázatban az általunk eddig ismert és leggyakrabban használt paramétereket és becslőfüggvényeket foglaljuk össze. Valamennyi becslőfüggvényről elmondható, hogy azok torzítatlanok, azaz a hozzájuk tartozó torzítás 0.
paraméter | \(\theta\) | becslőfüggvény | \(\hat{\theta}\) |
---|---|---|---|
sokasági átlag | \(\mu\) | mintabeli átlag | \(\overline{X}\) |
sokasági variancia | \(\sigma^2\) | mintabeli korrigált variancia | \(S^2\) |
sokasági arány | \(\pi\) | mintabeli arány | \(P\) |
9.1.2 Hatásosság
A gyakorlatban sok esetben több torzítatlan becslőfüggvény is található, közülük segíthet választani a hatásosság. Azt a becslőfüggvényt preferáljuk a torzítatlan becslőfüggvények közül, melyek jobban koncentrálódnak a becsülni kívánt paraméter körül. Ez azt jelenti, hogy a hatásosabb becslőfüggvény esetén a mintabeli értékek átlagosan közelebb vannak a sokasági értékhez, mint a kevésbé hatékony alternatíva esetén.
Legyen \(\hat{\theta_1}\) és \(\hat{\theta_2}\) két, \(\theta\)-ra vonatkozó, ugyanakkora mintából számított becslőfüggvény, akkor \(\hat{\theta_1}\) hatásosabb mint \(\hat{\theta_2}\), ha \(\text{Var}({\hat{\theta_1}}) < \text{Var}({\hat{\theta_2}})\).
Léteznek ún. abszolút hatásos becslőfüggvények, melyek adott feltételek mellett bizonyíthatóan a legkisebb varianciájú becslést eredményezik.
Legyen \(X\) normális eloszlású sokaság, melyből függetlenül vett nagy, \(n\) elemű minta átlaga torzítatlan, és azt is tudjuk, hogy \[ \text{Var}(\overline{X}) = \frac{\sigma^2}{n} \]
Belátható, hogy a mintabeli medián is torzítatlan becslőfüggvénye a sokasági átlagnak nagy \(n\) esetén, valamint \[ \text{Var}(\hat{\text{me}}) = \frac{\pi}{2}\frac{\sigma^2}{n} \]
Mivel a mintaátlag varianciája alacsonyabb a mintabeli medián varianciájánál (\(\text{Var}(\overline{X}) < \text{Var}(\hat{\text{me}})\)), ezért a fenti feltételek mellett az átlag hatásosabb becslőfüggvény, mint a medián. Nem szabad azonban elfelejtenünk, hogy lehetnek olyan esetek, például kiugró értékek esetén, amikor a medián hatásosabb becslőfüggvény a sokasági átlagra vonatkozóan. Ennek vizsgálata meghaladja tankönyvünk kereteit.A továbbiakban is próbáljuk a valószínűségszámítás során bevezetett konvenciót követni. A valószínűségi változót nagybetűvel, míg a mintából származó becsült értéket kisbetűvel fogjuk jelölni. Ahol ez már nehezen tartható, gyakran használt jelölés a \(\hat{}\). Például a \(\theta\) paraméter becslőfüggvényét \(\hat{\theta}\) jelöli, általános esetben, amikor egy tetszőleges paraméterről beszélünk, mi is ezt a jelölést fogjuk használni.↩︎
Amennyiben nem változna, elegendő lenne a torzítást levonni a becslőfüggvényből, hogy torzítatlan becslőfüggvényt kapjunk.↩︎