10.2 Sokasági arányok különbségének becslése

Gyakran nem két sokaság átlagát, hanem két sokaságban megfigyelhető arányt szeretnénk összehasonlítani. Az egymintás esethez hasonlóan megmutatható, hogy elegendően nagy minta esetén a

Z=(PXPY)(πXπY)PX(1PX)nX+PY(1PY)nYN(0,1)

valószínűségi változó standard normális eloszlást követ, ahol PX és PY jelöli a mintabeli arányok valószínűségi változóját, πX és πY a két sokasági arány, nX és nY pedig a két mintaelemszám.

Ebből belátható, hogy 1α megbízhatóságú konfidencia intervallum szerkeszthető a δ=πXπY sokasági arány különbségre

pXpY±z1α/2pX(1pX)nX+pY(1pY)nY módon, ahol px és py a mintából kiszámított arányt jelölik.

A termelési igazgató két beszállítótól származó termékek minőségét szeretné összehasonlítani, mintavételes módszerrel. Az A gyártó szállítmánya esetén a kivett 200 termékből 23 volt problémás, míg B gyártó esetén a kiválasztott 150 termékből 21 volt kifogásolható. Végezzünk 95%-os megbízhatóságú konfidencia intervallum becslést a sokasági arányok A és B gyártó közti különbségére vonatkozóan!

pXpY±z1α/2pX(1pX)nX+pY(1pY)nY=0,1150,14±0,071 Azaz a 95%-os megbízhatóságú konfidencia intervallum alsó határa 0,096 és felső határa 0,046. Az eredmény alapján nem tudjuk eldönteni egyértelműen, hogy melyik sokasági arány a nagyobb, hiszen a különbség negatív és pozitív is lehet.