10.2 Sokasági arányok különbségének becslése
Gyakran nem két sokaság átlagát, hanem két sokaságban megfigyelhető arányt szeretnénk összehasonlítani. Az egymintás esethez hasonlóan megmutatható, hogy elegendően nagy minta esetén a
Z=(PX−PY)−(πX−πY)√PX(1−PX)nX+PY(1−PY)nY∼N(0,1)
valószínűségi változó standard normális eloszlást követ, ahol PX és PY jelöli a mintabeli arányok valószínűségi változóját, πX és πY a két sokasági arány, nX és nY pedig a két mintaelemszám.
Ebből belátható, hogy 1−α megbízhatóságú konfidencia intervallum szerkeszthető a δ=πX−πY sokasági arány különbségre
pX−pY±z1−α/2√pX(1−pX)nX+pY(1−pY)nY módon, ahol px és py a mintából kiszámított arányt jelölik.
A termelési igazgató két beszállítótól származó termékek minőségét szeretné összehasonlítani, mintavételes módszerrel. Az A gyártó szállítmánya esetén a kivett 200 termékből 23 volt problémás, míg B gyártó esetén a kiválasztott 150 termékből 21 volt kifogásolható. Végezzünk 95%-os megbízhatóságú konfidencia intervallum becslést a sokasági arányok A és B gyártó közti különbségére vonatkozóan!
pX−pY±z1−α/2√pX(1−pX)nX+pY(1−pY)nY=0,115−0,14±0,071 Azaz a 95%-os megbízhatóságú konfidencia intervallum alsó határa −0,096 és felső határa 0,046. Az eredmény alapján nem tudjuk eldönteni egyértelműen, hogy melyik sokasági arány a nagyobb, hiszen a különbség negatív és pozitív is lehet.