9.4 Gyakorló feladatok

Szükséges Excel ismeretek

Függvények:

  • SZÓR.M
  • NORM.S.INVERZ, T.INVERZ (z érték és t érték meghatározásához)

Funkciók:

  • Az Adatelemzés menü Leíró statisztika eszköze
  1. Egy fánkokat árusító bolt a munkanapokon tapasztalható napi átlagos keresletét kívánja becsülni. Véletlenszerűen kiválasztott 25 munkanap alapján készített kimutatások szerint az időszakban az átlagos kereslet 324,72 darab volt, 21,5 darabos mintabeli korrigált szórással. Készítsen 95 és 99%-os megbízhatóságú konfidencia intervallumot a sokasági várható értékre! Mit állapít meg a két intervallummal kapcsolatban?
  1. Egy közigazgatási területen 32000 bejegyzett gépkocsi található. Egyszerű véletlen mintavétel segítségével kiválasztották a gépkocsik 5%-át, és aziránt érdeklődtek a tulajdonosoktól, hogy adott időszak alatt javíttatták-e gépkocsijukat. A megkérdezettek valamennyien válaszoltak a kérdésre, 1200-an igen választ adtak.
    1. Becsülje meg 95,5%-os megbízhatósági szinten a javítást végeztetők arányát!
    2. Becsülje meg 95,5%-os megbízhatósági szinten a javítást végeztetők számát!
    3. Mekkora mintára lenne szükségünk, hogy a pontosság 95,5%-os megbízhatósági szinten 1,5 százalékpont legyen. Adja meg a megoldást a legrosszabb esetet figyelembe véve és általánosan is!
  1. Nyissa meg a vizsgaország.xlsx fájlt, amely egy adott ország vállalatainak reprezentatív EV mintáját tartalmazza \(\left(N=3\,000\right)\)!
    1. Becsülje meg 90% megbízhatósággal az átlagos export nagyságát!
    2. Becsülje meg, hogy mekkora a vállalatok összes exportja 90%-os megbízhatósággal! (Becsülje meg az átlagos exportot, majd az eredményt használja az értékösszeg meghatározásához!)
    3. Becsülje meg a mezőgazdasági vállalatok számát 95%-os megbízhatósággal az egész országra vonatkozóan! (Becsülje meg először a mezőgazdasági vállalatok arányát és ezt használja fel!)
  1. Egy anyag szakítószilárdsága közelítőleg normális eloszlást követ. A gyárban tesztelik a tulajdonságot, a 16 véletlenszerűen kiválasztott anyagminta esetén az alábbi értékeket tapasztalták: 80,8; 88,1; 70,9; 85,3; 92,7; 95,7; 77,1; 62,0; 66,4; 79,4; 72,2; 92,6; 57,9; 88,5; 98,1 és 63,2. Készítsen 98%-os megbízhatóságú konfidencia intervallumot az eloszlás várható értékére!

A 98%-os megbízhatóságú konfidencia intervallum \(\left(71{,}05;87{,}81\right)\).

  1. Az ország egy adott régiójában az Országos Mentőszolgálat 80 mentőautóval rendelkezik. Útnyilvántartások alapján meghatározták a mentőautók által adott időszak alatt elfogyasztott üzemanyag mennyiségét (liter). A lenti táblázat foglalja össze az eredményeket.
    1. Számítsa ki a sokasági átlagot és szórást!
    2. Válasszon ki a 80 tagú alapsokaságból 8 elemű mintát véletlen generátor segítségével, majd ez alapján végezzen becslést az átlagos benzin felhasználásra 95%-os megbízhatósággal!
    3. Mit vár, ha a fenti eljárást 1000 alkalommal elvégezné, hány esetben fedné le a kapott intervallum a tényleges sokasági átlagot?
    4. Milyen eredményeket vár, ha 8 helyett 16 elemű minta alapján végzi el a becslést?
Ssz. Fogy. Ssz. Fogy. Ssz. Fogy. Ssz. Fogy.
01. 1300 21. 1880 41. 2246 61. 1950
02. 1940 22. 1949 42. 1655 62. 1616
03. 2055 23. 2008 43. 2310 63. 1930
04. 2300 24. 1675 44. 2412 64. 1932
05. 2572 25. 2070 45. 1970 65. 1985
06. 1715 26. 2412 46. 2216 66. 2545
07. 1777 27. 1900 47. 1996 67. 2416
08. 1990 28. 2075 48. 2346 68. 1832
09. 2150 29. 2610 49. 1642 69. 1906
10. 2030 30. 2600 50. 2534 70. 1712
11. 1680 31. 1940 51. 1870 71. 2605
12. 2540 32. 1876 52. 1911 72. 2605
13. 2670 33. 1675 53. 1735 73. 1819
14. 2038 34. 2020 54. 1715 74. 1942
15. 1735 35. 2436 55. 2635 75. 2026
16. 2400 36. 2515 56. 2697 76. 2222
17. 1650 37. 2419 57. 1842 77. 2415
18. 1730 38. 1842 58. 1936 78. 2506
19. 2340 39. 1700 59. 2610 79. 2303
20. 2080 40. 2335 60. 2216 80. 2610
  1. \(\mu=2\,100, \sigma=329{,}54\)
  2. Az eredmény egyedi, a generált véletlen értékektől függ. A véletlen számok generálására alkalmas például Excelben a VÉL() függvény.
  3. Azt várjuk, hogy nagyjából 950 esetben fedné le a kapott intervallum a tényleges sokasági átlagot \(\left(\mu=2\,100\right)\).
  4. Azonos megbízhatósági szint mellett pontosabb becslést kapunk, azaz a hibahatár \(\left(\Delta_{\overline{X}}\right)\) alacsonyabb lesz.
  1. Egy repülőtársaság véletlenszerű kiválasztás segítségével 1000 ügyfelét kérdezte meg, hogy elégedettek voltak-e a szolgáltatással. 760 válaszadó volt elégedett. Készítsen 95%-os megbízhatóságú konfidencia intervallumot a sokasági arányra vonatkozóan!

A 95%-os megbízhatóságú konfidencia intervallum \(\pi\)-re \(\left(0{,}7335;0{,}7865\right)\).

  1. Egy ország munkavállalóinak reprezentatív mintáját találja a munkavallalok.xlsx fájlban.
    1. Becsülje meg a munkavállalók átlagos havi bruttó fizetésének nagyságát 95% és 99%-os megbízhatósággal! Mit tapasztal a két esetben a konfidencia intervallumokkal kapcsolatban?
    2. Becsülje meg 99%-os megbízhatósággal azon munkavállalók arányát, akik több mint \(150\,000\) forintot keresnek! Hány ilyen munkavállaló van, ha az országban összesen \(4\,800\,000\) munkavállaló található?
  1. Magasabb megbízhatósági szint mellett romlik a pontosság.
    • A 95%-os megbízhatóságú konfidencia intervallum \(\mu\)-re \(\left(189\,610;235\,144\right)\).
    • A 99%-os megbízhatóságú konfidencia intervallum \(\mu\)-re \(\left(182\,285;242\,468\right)\).
  2. A 99%-os megbízhatóságú konfidencia intervallum \(\pi\)-re \(\left(65{,}25\%;85{,}15\%\right)\). A 99%-os megbízhatóságú konfidencia intervallum \(N\pi\)-re \(\left(3\,132\,035;4\,087\,165\right)\).
  1. Egy építőelemeket gyártó vállalat méréseket végez az egyik építőelem szilárdságára vonatkozóan. Kilogrammonként emelhető súlyokat helyeznek az építőelemre, míg az el nem törik. A szükséges adatokat az epitoelem.xlsx fájlban találja. Becsülje meg 90%-os megbízhatósággal az építőelemek átlagos terhelhetőségét!

A 90%-os megbízhatóságú konfidencia intervallum \(\mu\)-re \(\left(449{,}9;452{,}1\right)\).

  1. Alkalmazottként egy konkurens töltőállomáson a 95-ös oktánszámú benzin vásárolt mennyiségeit kívánjuk megvizsgálni. A pénztárgépben egyébként rögzített adatok üzleti titkot képeznek, ezért a mintavételes módszer mellett döntünk. Egyszerű véletlen mintavételt alkalmazva a benzinkut.xlsx fájlban található adatokhoz jutunk.
    1. Becsülje meg 95%-os megbízhatósággal, hogy mekkora az átlagosan vásárolt mennyiség az adott benzinkútnál!
    2. Sikerül kideríteni, hogy egy átlagos héten \(5\,200\) tankolás történik az adott állomáson. Határozza meg a heti átlagos eladás konfidencia intervallumát!
    3. Milyen mintavételi módot alkalmazna, ha alacsonyabb standard hibával szeretné a becslését elvégezni?
  1. A 95%-os megbízhatóságú konfidencia intervallum \(\mu\)-re \(\left(17{,}9;22{,}6\right)\).
  2. A 95%-os megbízhatóságú konfidencia intervallum \(N\mu\)-re \(\left(92\,909{,}8;117\,343{,}5\right)\).
  3. Érdemes lenne rétegzett mintavételt alkalmazni, mert a gépjármű típusa (motorkerékpár, személygépkocsi, tehergépkocsi) nagyban befolyásolja a vásárolt üzemanyag mennyiségét, így jó rétegképző ismérv lehet.
  1. Egy nagyváros önkormányzata ingatlanadó kivetését fontolgatja, azért fel szeretnék mérni a lakásállomány értékét. Az egyszerű véletlen mintavétellel nyert adatokat a lakasok.xlsx fájl tartalmazza.
    1. A minta alapján állapítsa meg 90%-os megbízhatósággal, hogy mekkora az átlagos ingatlanár.
    2. A fenti számítás alapján, amennyiben az adó mértéke az ingatlan értékének 3 ezreléke (0,3%), mekkora bevételre számíthat az önkormányzat, ha valamennyi ingatlanra kiveti azt?
    3. A minta alapján mekkora lehet a városban a 70 m\(^2\) feletti ingatlanok aránya és száma?
  1. A 90%-os megbízhatóságú konfidencia intervallum \(\mu\)-re \(\left(56\,956;62\,449 \right)\).
  2. Az önkormányzat 90%-os megbízhatósággal és közötti összegre számíthat az ingatlanadó bevezetéséből.
  3. Továbbra is 90%-os megbízhatósággal számolva a sokasági arányra vonatkozó konfidencia intervallum \(\left(28{,}34\%; 44{,}99\% \right)\). A 70 m\(^2\) feletti lakások száma ez alapján 90%-os megbízhatóság mellett (a közeli kerek százasokra) kerekítve \(3\,400\) és \(5\,400\) között van a városban.
  1. Amennyiben egy minőségellenőr 99% megbízhatósággal szeretné a sokasági arányt megbecsülni, mekkora FAE mintát kell vennie, ha maximum \(\pm4\) százalékpontos hibát szeretne elkövetni?

Mivel az ellenőrnek nincs elképzelése a sokasági arányról, a legrosszabb esetet kell figyelembe vennie, amikor \(\pi=0{,}5\). FAE mintát feltételezve a szükséges mintaelemszám \(n \geq 1\,037\).

  1. Egy vállalat meg kívánja határozni, hogy az ügyfelek hány százaléka elégedett a termékükkel, méghozzá \(\pm 3\%\) pontossággal, 95,5 százalékos megbízhatósági szinten.
    1. Mekkora mintát kell venniük, ha úgy gondolják, hogy a tényleges arány 80% körüli?
    2. Mekkora mintát kell venniük, ha az aránnyal kapcsolatban semmiféle elképzelésük sincs?

Tekintsük az \(1-\alpha=0{,}955\) megbízhatóságot. a) \(n \geq 715\) b) Ekkor, a legrosszabb esetet kell figyelembe venniük, \(\pi=0{,}5\). \(n \geq 1\,112\), vagy a pontos z-értékkel számolva \(n \geq 1\,117\).

  1. Egy régióban egy nagy, 1500 háztartásból álló egyszerű véletlen mintán vizsgálják a háztartások havi energiafogyasztását, melyben a kiválasztási arány 0,4%-os volt. A megkérdezés eredményeiből kiszámították az átlagos áramfogyasztást (229,96 kWh) és megbecsülték a szórást (60,89 kWh), illetve az átlagos vízfogyasztást (5,06 m\(^3\)) és annak szórását (1,918 m\(^3\)).
    1. Becsülje meg 95%-os megbízhatósági szinten, hogy mekkora a régióban a háztartások összes áram- és vízfogyasztása!
    2. A felmérést évente megismétlik. Mekkora mintát válasszanak jövőre, ha az átlagbecslésre vonatkozóan 2 kWh-s, illetve 0,07 m\(^3\)-es hibahatárt céloznak meg (a megbízhatósági szint változatlansága mellett)?

A 95%-os megbízhatóság mellett a) A kiválasztási arány alapján 375000 háztartás van összesen, így a konfidencia intervallum a régióban a háztartások összes * áramfogyasztására \(\left(85\,080\,853{,}979;87\,389\,146{,}021 \right)\), * vízfogyasztására \(\left(1\,861\,145{,}064;1\,933\,854{,}936 \right)\). b) a szükséges mintaelemszám az EV minta esetén, ha a hibahatár * 2 kWh legalább \(3\,528\) fő, * 0,07 m\(^3\) legalább \(2\,863\) fő.

  1. Egy választókörzetben két jelölt indult az országgyűlési választások második fordulójában. A leadott, érvényes szavazatok száma \(120\,000\) volt. Határozza meg, hogy az érvényes szavazatok véletlenül kiválasztott 2%-ának kiértékelése után, legalább hány szavazattal kell rendelkeznie valamelyik jelöltnek ahhoz, hogy 99%-os megbízhatósággal állíthassuk: megnyerte a választást!

Legalább 52,6%-ával kell rendelkeznie a szavazatoknak, azaz legalább \(1\,263\) szavazattal kell rendelkeznie.

  1. Egy választókörzetben két jelölt indult az országgyűlési választások második fordulójában. A szavazatok 2%-ának kiértékelése után megállapították, XY a szavazatok 54%-át kapta. Ennek alapján - feltételezve, hogy a kiértékelt 2% egyszerű véletlen mintának tekinthető - kijelentették, hogy XY 95,5%-os valószínűséggel megnyerte a választást. Határozza meg, legalább hány választásra jogosult adta le szavazatát a körzetben!

Legalább \(30\,572\) választásra jogosult adta le a szavazatát a körzetben.

  1. Becslést akarunk végezni egy sokasági várható értékre \(1-\alpha\) megbízhatósággal, és maximum \(\Delta_{\overline{X}}\) hibahatárral, ha ismert a sokasági szórás
    1. Vezesse le, hogy legalább mekkora mintát kell vennünk visszatevéssel!
    2. Vezesse le, hogy visszatevés nélkül legalább mekkora kell vennünk, ha tudjuk a sokaság elemszáma éppen \(N\)! Használja a véges szorzóra az egyszerűbb \(\sqrt{1-\dfrac{n}{N}}\) képletet. Tipp: Használja fel az előző feladatrészben kapott végeredményt!
    3. Vezesse le, hogy visszatevés nélkül legalább mekkora kell vennünk, ha tudjuk a sokaság elemszáma éppen \(N\)! Használja a véges szorzóra a \(\sqrt{\dfrac{N-n}{N-1}}\) képletet.

Tudjuk, hogy a hibahatár éppen \(\Delta_{\overline{X}} = z_{1-\alpha/2}\dfrac{\sigma}{\sqrt{n}}\) a) A hibahatár képletét átrendezve kapjuk, hogy \(n_0 = \dfrac{z_{1-\alpha/2}^2 \sigma^2}{\Delta_{\overline{X}}^2}\) b) Ebben az esetben a standard hiba a véges szorzóval módosul. \(\Delta_{\overline{X}} = z_{1-\alpha/2}\dfrac{\sigma}{\sqrt{n}}\sqrt{1-\dfrac{n}{N}}\)

Behelyettesítve az a. rész végeredményét

\[n = n_0 (1-\dfrac{n}{N})\] \[n = \dfrac{n_0}{1+\dfrac{n_0}{N}}\]

  1. Ebben az esetben a standard hiba a véges szorzóval módosul.

\(\Delta_{\overline{X}} = z_{1-\alpha/2}\dfrac{\sigma}{\sqrt{n}}\sqrt{\dfrac{N-n}{N-1}}\)

Behelyettesítve az a. rész végeredményét

\[n = n_0 \dfrac{N-n}{N-1}\] \[n = \dfrac{n_0N}{n_0 + N -1}\]

\[n = \dfrac{n_0}{1+\dfrac{n_0-1}{N}} = \dfrac{z_{1-\alpha/2}^2 \sigma^2}{\Delta_{\overline{X}}^2+\dfrac{z_{1-\alpha/2}^2 \sigma^2}{N}}\]