9.2 Konfidencia intervallum becslés

Ebben a fejezetben elsőként a konfidencia intervallum fogalmáról általánosan beszélünk, majd a sokasági átlag (várható érték) becslés esetén több lépésen keresztül érkezünk el a gyakorlatban leggyakrabban alkalmazott formuláig. Az arányra és a varianciára vonatkozó intervallum becslés logikája hasonló, így ezeket jóval kevésbé részletesen tárgyaljuk.

A 9.1. fejezetben azt vizsgáltuk, hogy a pontbecslések minőségét milyen tulajdonságokkal jellemezhetjük. A torzítatlanság egy kívánatos tulajdonság, de pusztán annyit jelent, hogy a minták összességében a becslésünk eltalálja a sokasági értéket. A gyakorlatban ezzel szemben nincs lehetőségünk az összes lehetséges mintát kiválasztani, jellemzően egy minta alapján szeretnénk a sokaságra következtetni. Ekkor tudjuk, hogy az egyetlen mintánkból származó pontbecslésünk nagy valószínűséggel nem egyezik meg pontosan a sokasági paraméterrel. A célunk ezért egy olyan intervallum meghatározása, ami a sokasági paramétert már kellően nagy megbízhatósággal tartalmazza. Még inkább alátámasztja ennek a célnak a jogosságát az a tény, hogy a pontbecslés nem veszi figyelembe a minta nagyságát, annak ellenére, hogy tudjuk, egy kis mintából nyert pontbecslés nem olyan hasznos, mint egy nagy mintából nyert. A konfidencia intervallum becslés erre a problémára is megoldást nyújt.

A konfidencia intervallum meghatározásához tehát két valószínűségi változót kell meghatároznunk, melyek az intervallum alsó és felső határát jelölik ki. Eddig csak azt mondtuk, hogy azt szeretnénk, hogy nagy megbízhatósággal tartalmazza ez az intervallum a keresett sokasági paramétert. Nagy megbízhatóság alatt azt értjük, hogy amennyiben újra és újra mintát vennénk és újra és újra kiszámítanánk a (később meghatározandó) konfidencia intervallumot, akkor az esetek pl. 95%-ában az intervallum fedje le a sokasági paramétert. Az egyetlen minta alapján kiszámított alsó és felső határ vagy lefedi a sokasági paramétert, vagy sem, ezt nem tudjuk, de azt állíthatjuk, hogy a hasonló eljárással készült intervallumok 95%-a (vagy más százalékos értéke) fedi a paramétert. Az ilyen intervallumot 95%-os megbízhatóságú konfidencia intervallumnak nevezzük.

Legyen a keresett sokasági paraméter \(\theta\), amire mintabeli információ alapján szeretnénk becslést készíteni. Jelölje a két, mintabeli adatoktól függő valószínűségi változót \(X_a\) és \(X_f\), melyek az intervallum alsó és felső határát adják. Célunk \(X_a\) és \(X_f\) meghatározása úgy, hogy \(\mathbf{P}\left(X_a < \theta < X_f \right) = 1 - \alpha\), ahol \(\alpha\) tetszőleges 0 és 1 közötti érték (általában 0 közeli). A minta alapján kiszámított értékek legyenek \(x_a\) és \(x_f\), ekkor az általuk meghatározott intervallumot \(\theta\)-ra vonatkozó \(100(1-\alpha)\)% megbízhatóságú konfidencia intervallumnak nevezzük, \(100(1-\alpha)\)% pedig a konfidencia szint, vagy megbízhatósági szint.

Amikor mintavétel történik, akkor a mintabeli statisztikától azt várjuk, hogy a sokasági paraméter környezetében lesz az értéke, némely minta esetén annál nagyobb, némely minta esetén annál kisebb értéket fogunk kapni, ezért természetes, hogy a legtöbb (de nem minden) konfidencia intervallum a

\[\begin{equation} \hat{\theta} \pm \Delta \tag{9.3} \end{equation}\] alakot ölti, azaz a pontbecslésre szimmetrikus a konfidencia intervallum alsó és felső határa. A \(\Delta\) neve hibahatár, meghatároza a különböző paraméterek és feltevések mellett a következő fejezetekben történik.

9.2.1 Várható értékre vonatkozó intervallum becslés

A leggyakrabban becsült sokasági jellemző az átlag, más kifejezéssel a várható érték. Matematikailag a legegyszerűbb eset, ha egy normális eloszlást tekintünk, aminek \(\mu\) várható értéke ismeretlen, \(\sigma^2\) varianciája azonban ismert. A várható értéket egy \(n\) elemű minta alapján kívánjuk megbecsülni. Tudjuk, hogy

\[ \dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim \mathcal{N}\left(0,1\right) \]

Jelölje továbbá \(Z\) egy standard normális eloszlású véletlen változót, \(z_{1-\alpha/2}\) pedig azt a standard normális eloszlásból származó kvantilist, melytől balra eső terület \(1-\alpha/2\), azaz a jobbra eső terület \(\alpha/2\). Az eloszlás szimmetriája alapján azt is tudjuk, hogy

\[ \mathbf{P} \left(-z_{1-\alpha/2} <Z < z_{1-\alpha/2} \right) = 1 - \alpha \]

ami épp a kívánt konfidencia szint. Ebből egyszerű algebrai átalakítások segítségével adódik a konfidencia intervallum

\[\begin{equation} \begin{split} \mathbf{P} \left(-z_{1-\alpha/2} < \dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}} < z_{1-\alpha/2} \right)&= 1-\alpha \\ \mathbf{P} \left(-z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} < \overline{X}-\mu < z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right)&= 1-\alpha \\ \mathbf{P} \left(\overline{X}-z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} < \mu < \overline{X} + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \right)&= 1-\alpha \end{split} \tag{9.4} \end{equation}\]

azaz egy \(\mu\)-re vonatkozó valószínűségi állítást kaptunk, épp a (9.3) egyenletben definiált formában. A hasonlóság még inkább látható, ha az utolsó sort más formában írjuk. Az \(1 - \alpha\) megbízhatóságú konfidencia intervallum a minta alapján11

\[\begin{equation} \overline{x} \pm z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} = \overline{x} \pm \Delta_{\overline{X}} \tag{9.5} \end{equation}\] azaz az átlagra vonatkozó konfidencia intervallumot a mintaátlag (pontbecslés) köré képezzük, \(\Delta_{\overline{X}}\) pedig az átlagra vonatkozó hibahatár. A keletkező konfidencia intervallum hossza tehát a hibahatár kétszerese, értékét a sokasági szórás, a mintaelemszám, illetve a z-értéken keresztül a megbízhatóság befolyásolja. Amennyiben a sokasági szórás magas, úgy a lehetséges mintaátlagok is jelentősen eltérhetnek, ezért a becslésünk is pontatlanabb lesz. Természetesen a mintaelemszám növekedése épp ellentétes hatású, azonban vegyük észre, hogy a gyökös tag miatt a mintaelemszám növelése egyre kevésbé hatékony. Ha a becsült intervallum hosszát a felére szeretnénk csökkenteni, négyszer akkora mintára van szükségünk. Ha a negyedére, akkor már 16-szoros minta kiválasztására van szükség.

A \(z_{1-\alpha/2}\) kvantilisek táblázatból, vagy szoftver segítségével könnyen megtalálhatók, azonban néhány gyakran használt megbízhatósági szint esetére érdemes őket megjegyezni.

Táblázat 9.2: Gyakran használt megbízhatósági szintek és normális kvantilisek
Konfidencia szint (\(1-\alpha\)) 90% 95% 95,5% 99%
\(z_{1-\alpha/2}\) 1,645 1,96 2,00 2,576

A táblázat alapján jól látható, hogy a megbízhatóság növekedésével a z-értékek is emelkednek, ezt a jelenséget a statisztika úgy fogalmazza meg, hogy adott mintaelemszám (és mintavételi módszer) mellett a pontosság (az intervallum hossza) és a megbízhatóság (\(1-\alpha\)) csak egymás rovására javíthatók.

Egy üzemben a régóta működő gépről ismert, hogy a legyártott alkatrészek számunkra fontos hossza jó közelítéssel normális eloszlású és a várható értéktől függetlenül a szórás \(\sigma = 5\) mm. Az új megrendeléshez arra van szükség, hogy az alkatérsz hossza 1000 mm legyen. Az új beállításokkal próbagyártást végeztek az üzemben, amiből \(n = 10\) elemű mintát vettünk, a mintaátlag \(\overline{x} = 1002{,}74\). Becsüljünk 95%-os megbízhatóságú konfidencia intervallumot a sokasági átlagra (\(\mu\)) vonatkozóan!

Mivel a sokaságról feltételezhetjük, hogy normális eloszlást követ, alkalmazhatjuk (9.5) formulát, azaz a 95%-os megbízhatóságú konfidencia intervallumra \[ 1002{,}743 \pm 1{,}96 \frac{5}{\sqrt{10}} = 1002{,}743 \pm 3{,}099 \] adódik. A mintánk alapján 95%-os megbízhatósággal állíthatjuk, hogy az ismeretlen sokasági átlag 999,644 és 1005,842 mm között van.

A (9.5) formula abban az esetben alkalmazható, ha a sokaság normális, ismeretlen \(\mu\), de ismert \(\sigma\) paraméterekkel. A gyakorlatban ugyan előfordulhat ilyen eset (pl. korábbi tanulmányokból ismerhetjük a varianciát), azonban érezhetően nem túl gyakori eset. Tegyük most fel, hogy a sokasági variancia nem ismert, ezért (9.5) formula nem alkalmazható. A 8.3. fejezetben megismert mintavételi eloszlás azonban segítségünkre lehet. (8.12) formula szerint a

\[ T = \dfrac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}} \sim {}_{n-1} t \] valószínűségi változó \(n-1\) szabadságfokú t eloszlást követ, amiből (9.5) képlethez hasonló módon levezethető az átlagra vonatkozó konfidencia intervallum becslés mintából számítandó értéke ismeretlen sokasági variancia esetére is

\[\begin{equation} \overline{x} \pm {}_{n-1}t_{1-\alpha/2} \frac{s}{\sqrt{n}} = \overline{X} \pm \Delta_{\overline{X}} \tag{9.6} \end{equation}\] ahol \({}_{n-1}t_{1-\alpha/2}\) az \(n-1\) szabadságfokú t eloszlás \(1-\alpha/2\) kvantilise. A t eloszlásból származó kvantilisek (azonos megbízhatóság esetén) szabadságfoktól függetlenül magasabbak a 9.2. táblázatban látható értékektől, a szabadságfok növekedésével felülről egyre inkább megközelítve azokat.

A (9.6) formula igazi jelentőségét az adja, hogy nem csak abban az esetben alkalmazható, ha a sokaság normális eloszlású, hanem abban az esetben is, ha a minta elegendően nagy. Ekkor a centrális határeloszlás tétel az, ami megengedi a képlet alkalmazását. Annak meghatározása, hogy mi számít elegendően nagynak nem egyszerű matematikai feladat, alapvetően a sokaság normalitástól való eltérésének mértéke határozza ezt meg. A legtöbb tankönyvben a nagy minta határát valahol 30 és 100 között szokás meghúzni. Ebben a tananyagban a 30 feletti mintaelemszámot elegendően nagy mintának fogjuk tekinteni ahhoz, hogy a központi határeloszlás-tétel működésében már bízzunk, kiemelve azt, hogy extrém eloszlások esetén akár több ezer elemű minták sem biztosítják a (9.6) formula alkalmazhatóságát. A gyakorlatban (9.6) alkalmazása előtt ezért mindenképp javasoljuk a sokaság normalitásának vizsgálatát.

Meg szeretnénk becsülni 90%-os megbízhatósággal egy adott településen az egyetemisták által havonta lakhatásra költött összeg átlagát. Ehhez \(n = 50\) elemű mintát választottunk. A sokaság eloszlásának típusáról ugyan nem rendelkezünk ismeretekkel, de mivel a minta elegendően nagy, illetve a készített hisztogram alapján a sokaság jelentősen nem tér el a normálistól, alkalmazhatjuk a (9.6) formulát. Tegyük fel, hogy a mintabeli átlagra \(\overline{x} = 47\,543\) Ft, míg a mintabeli korrigált szórásra \(s = 13\,342\) Ft adódott. Ekkor

\[ \overline{x} \pm {}_{49}t_{0{,}95} \frac{s}{\sqrt{n}} = 47543 \pm 1{,}6765 \frac{13342}{\sqrt{50}} = 47543 \pm 3163{,}4 \] azaz 90%-os megbízhatósággal állíthatjuk, hogy az átlagos lakhatásra költött összeg a sokaságban 44,380 és 50,706 forint közötti.

A fejezetben eddig bemutatott becslési eljárások ((9.5) és (9.6)) független azonos eloszlású mintavételt tételeznek fel, azaz praktikusan azt, hogy \(N\), a sokaság elemszáma végtelen, vagy annyira nagy, hogy a visszatevés nélküli mintavétel sem változtatja meg jelentősen a sokaság összetételét. Abban az esetben, ha \(N\) ismert, úgy a (9.5) és (9.6) képletben alkalmazott standard hiba módosul,

\[\begin{equation} \overline{x} \pm z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}} \tag{9.7} \end{equation}\] valamint

\[\begin{equation} \overline{x} \pm {}_{n-1}t_{1-\alpha/2} \frac{s}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}} \tag{9.8} \end{equation}\]

adja a konfidencia intervallum becslés alsó és felső határát. A formulákban megjelenő, a (8.5) összefüggésben már megismert véges szorzóról megállapítottuk, hogy a standard hiba értékét csökkenti, azaz a visszatevés nélküli mintavétellel pontosabb becslést végezhetünk.

Sok gyakorlati esetben nem a sokasági átlagra, hanem az értékösszegre vonatkozó becslést szeretnénk elvégezni, azaz a \(\sum{X_i} = N\mu\) sokasági értékét szeretnénk közelítőleg ismerni. Belátható, hogy ebben az esetben a becslés elvégezhető két lépésben:

  • a szituációnak megfelelő becslés elvégzése \(\mu\)-re vonatkozóan (9.7), vagy (9.8) segítségével, majd
  • a konfidencia intervallum alsó és felső határának \(N\)-nel történő szorzása.
Egészítsük ki az előző, lakhatásra fordított összeggel foglalkozó példánkat azzal, hogy tudjuk, \(N=20\,000\) hallgató tanul az adott városban. A standard hiba ekkor a véges szorzóval módosul, azonban a hatás elenyésző, hiszen a sokaság viszonylag nagy a minta méretéhez képest, így a valamivel szűkebb \[ 47\,543 \pm 3155{,}6 \] intervallum adódik. A sokaság elemszámának ismerete azonban lehetőséget ad az értékösszeg becslésére, ezek szerint 90%-os megbízhatósággal az egyetemisták legalább \(887\,748\,000\), legfeljebb \(1\,013\,972\,000\) forintot költenek összesen lakhatásra havonta.

9.2.2 Arányra vonatkozó intervallum becslés

Az átlagra vonatkozó intervallum becsléshez nagyon hasonló megfontolások és a (8.6) összefüggés alapján belátható, hogy

\[\begin{equation} p \pm z_{1-\alpha/2} \sqrt{\frac{p(1-p)}{n}} = p \pm \Delta_{P} \tag{9.9} \end{equation}\] az arányra vonatkozó \(1-\alpha\) megbízhatósági szintű konfidencia intervallum. Ahogyan azt az arány mintavételi eloszlásánál is láttuk a 8.2.2. fejezetben, a normális eloszlással történő közelítés, tehát (9.9) abban az esetben alkalmazható, ha \(n\pi>5\) és \(n(1-\pi)>5\) is teljesül. Az \(n\pi>5\) és \(n(1-\pi)>5\) feltételeket természetesen nem tudjuk közvetlenül ellenőrizni, hisz feladatunk épp a \(\pi\) binomiális paraméter becslése, azonban a mintabeli arány segítségével az ellenőrzése elvégezhető. Léteznek becslési eljárások a kis minta esetére is, ezekkel azonban jelen tananyagunkban nem foglalkozunk részletesen.

A sokasági arányra vonatkozó konfidencia intervallumot tehát a mintabeli arány mint pontbecslés köré rajzoljuk. Általánosságban elmondható, hogy \(n\) növekedésével a hibahatár csökken és ezzel együtt a becslés pontossága javul. A \(p(1-p)\) kifejezés értéke a 0-1 tartományon \(p = 0{,}5\) esetén maximális, azaz adott mintaelemszám mellett a 0,5 körüli mintabeli arány adja a leginkább pontatlan becslést, illetve a \(p(1-p)\) szorzat szimmetriája miatt a 0,5 értéktől távolodva a becslés egyre pontosabb.

A sokasági átlag becsléséhez hasonlóan belátható, hogy véges \(N\) sokasági elemszám és visszatevés nélküli mintavétel esetén (9.9) helyett a

\[\begin{equation} p \pm z_{1-\alpha/2} \sqrt{\frac{p(1-p)}{n}} \sqrt{\frac{N-n}{N-1}} \tag{9.10} \end{equation}\] formula használatos, azaz a standard hiba ebben az esetben is a véges szorzóval módosul.

A gyakorlatban sok esetben nem az adott tulajdonsággal rendelkező megfigyelések sokasági arányára, hanem azok sokasági számára vagyunk kíváncsiak. Az értékösszeg becsléséhez hasonlóan két lépésben oldható meg a feladat:

  • a feltételek ellenőrzése, majd becslés végzése \(\pi\)-re vonatkozóan, majd
  • a konfidencia intervallum alsó és felső határának \(N\)-nel történő szorzása.

Egy egyszerű véletlen mintavétel adatai alapján a megkérdezett \(n = 1000\) választó közül \(k = 645\) válaszolta azt, hogy a következő hétvégén részt venne a választásokon. Készítsünk 99%-os megbízhatóságú konfidencia intervallumot a \(\pi\) sokasági arányra vonatkozóan! Mivel a mintánk meglehetősen nagy, ezért alkalmazhatjuk a (9.9) formulát. \[ p \pm z_{1-\alpha/2} \sqrt{\frac{p(1-p)}{n}} = 0{,}645 \pm 2,576 \sqrt{\frac{0{,}645(1-0{,}645)}{1000}} = 0{,}645 \pm 0{,}039 \] azaz a 99%os megbízhatóságú konfidencia intervallumunk alsó határa 60,6%, felső határa 68,4%, becslésünk szerint a választók összességében a két érték közötti lesz a részvételi arány.

Amennyiben tudjuk, hogy \(N = 4\,000\,000\) szavazásra jogosult van, alkalmazhatjuk a (9.10) formulát is, azonban a véges szorzó alkalmazása érdemben nem fogja megváltoztatni a végeredményt. Azt azonban tudhatjuk, ugyancsak 99%-os megbízhatóság mellett, hogy a választás 2 millió 424 ezer és 2 millió 736 ezer főt fog várhatóan mozgósítani.

  1. A levezetésben valószínűségi állítást tettünk, amit csak valószínűségi változókkal tehetünk meg, ezért használtuk a \(\overline{X}\) jelölést. Az adott mintából kiszámított érték, az adott realizáció jele \(\overline{x}\), az egyszerűség kedvéért innentől gyakran fogjuk ezt a kisbetűs jelölést is alkalmazni.↩︎