10.2 Sokasági arányok különbségének becslése
Gyakran nem két sokaság átlagát, hanem két sokaságban megfigyelhető arányt szeretnénk összehasonlítani. Az egymintás esethez hasonlóan megmutatható, hogy elegendően nagy minta esetén a
\[\begin{equation} Z = \frac{(P_X - P_Y) - (\pi_X - \pi_Y)}{\sqrt{\frac{P_X(1-P_X)}{n_X} + \frac{P_Y(1-P_Y)}{n_Y}}} \sim \mathcal{N}\left(0,1\right) \tag{10.10} \end{equation}\]
valószínűségi változó standard normális eloszlást követ, ahol \(P_X\) és \(P_Y\) jelöli a mintabeli arányok valószínűségi változóját, \(\pi_X\) és \(\pi_Y\) a két sokasági arány, \(n_X\) és \(n_Y\) pedig a két mintaelemszám.
Ebből belátható, hogy \(1-\alpha\) megbízhatóságú konfidencia intervallum szerkeszthető a \(\delta = \pi_X -\pi_Y\) sokasági arány különbségre
\[\begin{equation} p_X - p_Y \pm z_{1-\alpha/2} \sqrt{\frac{p_X(1-p_X)}{n_X} + \frac{p_Y(1-p_Y)}{n_Y}} \tag{10.11} \end{equation}\] módon, ahol \(p_x\) és \(p_y\) a mintából kiszámított arányt jelölik.
A termelési igazgató két beszállítótól származó termékek minőségét szeretné összehasonlítani, mintavételes módszerrel. Az A gyártó szállítmánya esetén a kivett 200 termékből 23 volt problémás, míg B gyártó esetén a kiválasztott 150 termékből 21 volt kifogásolható. Végezzünk 95%-os megbízhatóságú konfidencia intervallum becslést a sokasági arányok A és B gyártó közti különbségére vonatkozóan!
\[ p_X - p_Y \pm z_{1-\alpha/2} \sqrt{\frac{p_X(1-p_X)}{n_X} + \frac{p_Y(1-p_Y)}{n_Y}} = 0{,}115 - 0{,}14 \pm 0{,}071 \] Azaz a 95%-os megbízhatóságú konfidencia intervallum alsó határa \(-0{,}096\) és felső határa \(0{,}046\). Az eredmény alapján nem tudjuk eldönteni egyértelműen, hogy melyik sokasági arány a nagyobb, hiszen a különbség negatív és pozitív is lehet.