8.4 Gyakorló feladatok

Szükséges Excel ismeretek

Függvények:

  • GYÖK
  • SZÓR.M
Figyeljünk, hogy a SZÓR.M függvény nem azonos a SZÓR.S függvénnyel, amely a sokasági szórás kiszámolására alkalmas! A SZÓR.M függvény ezzel szemben a mintabeli korrigált szórást adja meg.
  • T.ELOSZL, T.INVERZ
  • KHINÉGYZET.ELOSZLÁS, KHINÉGYZET.INVERZ

Funkciók:

  • Az Adatelemzés menü Mintavétel eszköze
  1. Álljon egy sokaság a következő elemekből: 34, 45, 48, 53, 66.
    1. Számítsa ki a sokaság átlagát és szórását!
    2. Készítse el az összes lehetséges visszatevéses kételemű mintát, majd számítsa ki a mintaátlagokat is! (mintavetel.xlsx)
    3. Mekkora a mintaátlagok várható értéke és szórása?
    4. Rajzoljon hisztogramot a lehetséges mintaátlagokból (az átlag mintavételi eloszlása)!
    5. Hogyan változna a mintavételi eloszlás, ha visszatevés nélküli mintavételt végeztünk volna?
  1. Egy gabonafeldolgozó üzemben zsákokba töltik a búzát, az egyes zsákokba töltött mennyiségek egymástól függetlennek tekinthetők 50 kg várható értékkel és 0,5 kg szórással. Válaszolja meg az alábbi kérdéseket!
    1. Véletlenszerűen kiválasztva 49 zsákot a futószalagról, milyen típusú mintának minősülnek?
    2. Milyen eloszlást követ az így kiválasztott mintákban szereplő zsákok súlya egyenként?
    3. Milyen eloszlást követ az így kiválasztott mintákban szereplő zsákok átlagos súlya?
    4. Mi a valószínűsége, hogy a mintabeli átlag 50,05 kg-nál több lesz?
    5. Mi a valószínűsége, hogy a mintabeli átlag 49 kg-nál kevesebb lesz?
    6. Adjon meg egy olyan intervallumot, melybe a mintabeli átlag 90%-os valószínűséggel beleesik!
  1. Tegyük fel, hogy a választók körében egy adott pártra szavazók aránya a sokaságban 30%.
    1. Mi az arány mintavételi eloszlása 100 elemű minta esetén?
    2. Mi a valószínűsége, hogy 100 fős minta esetén a mintabeli arány 35%-nál magasabb?
  1. Legyen \(X \sim {}_{20}t\). Válaszolja meg az alábbi kérdéseket!
    1. \(\mathbf{P}\left(X<-2\right)\)
    2. \(\mathbf{P}\left(X>2\right)\)
    3. \(\mathbf{P}\left(-2<X<2\right)\)
    4. Mi az a t-érték, aminél nagyobb az értékek 60%-a?
    5. Mi az a t-érték, aminél kisebb az értékek 5%-a?
    6. Mi az a két t-érték, ami között az eloszlás középső 95%-a található?
  1. Végezze el az 1. feladatot \(n=3\) elemű minták esetére is! Hasonlítsa össze az eredményeket!
  1. A sokaság paraméterei az órai feladathoz hasonlóan \(\mu=49{,}2\), \(\sigma=10{,}46\).
  2. Összesen 125 visszatevéses minta van. (Tipp: az Exceles megvalósításhoz: a meglévő 25 mintát egymás alá másolni még négyszer, majd 25-ös blokkonként ugyanazt a mintaelemet mögé írni \(x_3\) oszlopnévvel.) A mintaátlagok kiszámítása kézenfekvő.
  3. A mintaátlagok átlaga megegyezik a sokaság várható értékével, azaz 49,2. A mintaátlagok szórása (standard hiba) 6,038, ami az elméleti eredménnyel \(\left(\frac{\sigma}{\sqrt{n}}=\frac{10{,}46}{\sqrt{3}}\right)\) megegyezik.
  4. Az átlag mintavételi eloszlása

  1. A visszatevés nélküli megoldást az Olvasóra bízzuk! A mintaátlagok átlaga meg fog egyezni a sokasági átlaggal, a mintaátlagok szórása pedig a visszatevéses esethez képest alacsonyabb lesz, ellenőrizhető az elméleti eredmény segítségével.
  1. Válaszolja meg a 4. feladat kérdéseit az alábbi eloszlásokra is:
    1. \(v=2\) szabadságfokú t-eloszlás.
    2. \(v=5\) szabadságfokú t-eloszlás.
    3. \(v=10\) szabadságfokú t-eloszlás.
    4. \(v=50\) szabadságfokú t-eloszlás.
    5. \(v=100\) szabadságfokú t-eloszlás.
    6. standard normális eloszlás.
    7. Hasonlítsa össze az egyes kérdésekre adott válaszait a különböző eloszlások esetén! Mit tapasztal?

Az alábbi táblázat foglalja össze az eredményeket:

\(v=2\) \(v=5\) \(v=10\) \(v=20\) \(v=50\) \(v=100\) \(\mathcal{N}\left(0,1\right)\)
\(\mathbf{P}(X<-2)\) 0,0918 0,0510 0,0367 0,0296 0,0255 0,0241 0,0228
\(\mathbf{P}(X>2)\) 0,0918 0,0510 0,0367 0,0296 0,0255 0,0241 0,0228
\(\mathbf{P}(-2<X<2)\) 0,8165 0,8981 0,9266 0,9407 0,9491 0,9518 0,9545
\(\mathbf{P}(X>x)=0{,}6\) -0,289 -0,267 -0,260 -0,257 -0,255 -0,254 -0,253
\(\mathbf{P}(X<x)=0{,}05\) -2,920 -2,015 -1,812 -1,725 -1,676 -1,660 -1,645
\(\mathbf{P}(-x<X<x)=0{,}95\) \(\pm4{,}303\) \(\pm2{,}571\) \(\pm2{,}228\) \(\pm2{,}086\) \(\pm2{,}009\) \(\pm1{,}984\) \(\pm1{,}960\)

Valamennyi sorban azt láthatjuk, hogy a szabadságfok növekedésével a kérdéses értékek egyre közelebb kerülnek a standard normális eloszlás esetén adott válaszainkhoz, hiszen a szabadságfok növekedésével a t-eloszlás belesimul a standard normálisba.

  1. Tekintsük az 1. órai feladat sokaságát és az összes lehetséges háromelemű visszatevéses mintát! Végezze el az alábbi feladatokat!
    1. Számítsa ki a sokasági varianciát!
    2. Valamennyi minta esetén számítsa ki a mintaelemek varianciáját (\(n\)-nel való osztással) és a mintaelemek korrigált mintabeli varianciáját (\(n-1\)-gyel való osztással)!
    3. Számítsa ki a két különböző mintabeli statisztika várható értékét! Mit tapasztal?
    4. Végezze el a feladatot mindkét típusú (korrigált és nem korrigált) szórással is, majd eredményeit hasonlítsa össze a sokasági szórással! Mit tapasztal?
  1. A sokasági variancia \(\sigma^2=109{,}36\).
  2. A két mintabeli statisztika kiszámítása minden lehetséges mintára triviális.
  3. A korrigálatlan mintabeli varianciák várható értéke 72,91, azaz jelentősen elmarad a tényleges sokasági varianciától. Új dolgot tapasztalunk, a sokasági paraméter mintabeli megfelelője nem tűnik jó közelítésnek. A korrigált varianciák várható értéke 109,36, ami megegyezik a sokasági értékkel, ezért használjuk a korrigált varianciát mintából való következtetés esetén. A jelenséget pontosabban megfogalmazzuk a következő előadáson.
  4. Sem a korrigált sem a korrigálatlan szórások átlaga nem egyezik a sokasági szórással.
  1. Egy üdítőital töltési mennyiségei normális eloszlást követnek \(2\,000\) ml várható értékkel és 35 ml szórással.
    1. A megtöltött palackok közül milyen arányban vannak olyanok, melyek több mint \(2\,010\) ml üdítőt tartalmaznak?
    2. A megtöltött palackok közül milyen arányban vannak olyanok, melyek \(1\,950\) és \(2\,050\) ml közötti mennyiséget tartalmaznak?
    3. Mekkora az a töltési mennyiség, aminél a palackok 99%-a többet tartalmaz?
    4. 25 elemű, visszatevés nélküli véletlen mintát kiemelve mi a valószínűsége, hogy a mintaátlag \(2\,010\) ml feletti?
    5. 25 elemű, visszatevés nélküli véletlen mintát kiemelve mi a valószínűsége, hogy a mintaátlag \(1\,950\) és \(2\,050\) ml közötti?
    6. Mekkora az az átlagos töltési mennyiség, aminél a 25 elemű minták 99%-a magasabb értéket vesz fel?
    7. Hasonlítsa össze a fenti válaszokat!

A feladat megoldásához elegendő tudnunk, hogy \(X \sim \mathcal{N}\left(2\,000,35\right)\), illetve \(\overline{X} \sim \mathcal{N}\left(2\,000,\frac{35}{\sqrt{25}}\right)\).

  1. \(\mathbf{P}\left(X>2\,010\right)=0{,}3875\)
  2. \(\mathbf{P}\left(1\,950<X<2\,050\right)=0{,}8469\)
  3. \(1\,918{,}58\) ml
  4. \(\mathbf{P}\left(\overline{X}>2\,010\right)=0{,}0766\)
  5. \(\mathbf{P}\left(1\,950<\overline{X}<2\,050\right)=0{,}999999999999086\)
  6. \(1\,983{,}72\) ml
  7. Valamennyi esetben az figyelhető meg, hogy a mintaátlagok eloszlása sokkal inkább koncentrálódik a várható érték körül, mint az eredeti eloszlás.
  1. A Király utcában friss facsart narancslevet áruló kereskedő a narancsot egy spanyol termelőtől importálja. A darabonként nyerhető lé közelítőleg normális eloszlást követ, 1,8 dl várható értékkel és 0,2 dl szórással.
    1. A narancsok mekkora hányadából lehet egy 2 dl-es poharat megtölteni lével?
    2. A narancsok 90%-a mekkora mennyiségnél tartalmaz többet?
    3. Mi a valószínűsége, hogy egy narancs 1,5 és 2 dl közötti levet tartalmaz?
    4. 25 narancs kifacsarása után mi a valószínűsége, hogy az átlagos létartalom 1,9 dl felett lesz?
    5. 100 narancs kifacsarása után mi a valószínűsége, hogy az átlagos létartalom 1,9 dl felett lesz?
    6. Fejtse ki, hogy a d. és e. feladatokban adott válaszai miért különbözőek!
  1. 0,1587
  2. 1,544 dl
  3. 0,7745
  4. 0,0062
  5. \(2{,}87 \cdot 10^{-7}\)
  6. A 100 elemű minta esetén a standard hiba jóval alacsonyabb, azaz a lehetséges mintaátlagok sokkal kevésbé szóródnak a sokasági várható érték körül, így a kérdéses valószínűség is jóval alacsonyabb.
  1. Tudjuk, hogy az évfolyamon tanuló 240 hallgatóból 180 nő. Tegyük fel, hogy \(n=50\) elemű visszatevés nélküli mintákat vizsgálunk. Válaszolja meg az alábbi kérdéseket:
    1. Milyen eloszlást követ a mintabeli arány?
    2. Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 76% feletti?
    3. Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 72% alatti?
    4. Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 70% és 77% közötti?
    5. A lehetséges minták ,,középső" 90%-a milyen mintabeli arányokat mutat?
    6. Válaszolja meg a fenti kérdéseket \(n=80\) elemű minták esetére is! Mit tapasztal?
  1. A mintabeli arány normális eloszlást követ, amelynek középértéke a mintabeli arány (0,75). Mivel egyszerű véletlen (EV) mintát veszünk, a szórás (standard hiba) a véges szorzóval módosul. \(p \sim \mathcal{N}\left(0{,}75, \sqrt{\dfrac{0{,}75 \cdot 0{,}25}{50}}\sqrt{\dfrac{240-50}{240-1}} \right) \approx \mathcal{N}\left(0{,}75, 0{,}0546 \right)\)
  2. 0,4273
  3. 0,2913
  4. 0,4630
  5. A lehetséges minták középső 90%-a kerekítve 66% és 84% közötti mintabeli arányokat mutat.
  6. A számításokat az Olvasóra bízzuk, az arány standard hibája két összetevő miatt is csökken, egyrészt a nevezőben szereplő \(\sqrt{n}\) miatt, másrészt a véges szorzó csökkenése miatt. Ennek megfelelően a valószínűségek is változnak, illetve a nagyobb minta, kevésbé szóródó mintabeli arányok miatt a középső 90% terjedelme is csökkenni fog (kerekítve 68,5% és 81,5% közé).
  1. Számítsa ki az 2,5., 5., 10., 90., 95., 97,5. percentilist (azokat az értéket, amik alatt az eloszlás értékeinek 2,5, 5,\(\dots\), 97,5%-a található) az alábbi eloszlások esetén:
    1. t-eloszlás 2, 5, 10, 20, 50, 100 szabadságfokokkal.
    2. standard normális eloszlás.
    3. Hasonlítsa össze az a. és b. feladatokban kapott értékeket! Mit tapasztal?

Az alábbi táblázat foglalja össze az eredményeket:

\(v=2\) \(v=5\) \(v=10\) \(v=20\) \(v=50\) \(v=100\) \(\mathcal{N}(0,1)\)
\(P_{2{,}5}\) -4,303 -2,571 -2,228 -2,086 -2,009 -1,984 -1,960
\(P_{5}\) -2,920 -2,015 -1,812 -1,725 -1,676 -1,660 -1,645
\(P_{10}\) -1,886 -1,476 -1,372 -1,325 -1,299 -1,290 -1,282
\(P_{90}\) 1,886 1,476 1,372 1,325 1,299 1,290 1,282
\(P_{95}\) 2,920 2,015 1,812 1,725 1,676 1,660 1,645
\(P_{97{,}5}\) 4,303 2,571 2,228 2,086 2,009 1,984 1,960

A táblázat egy korábbi gyakorló feladat eredményéhez hasonló. Azt láthatjuk, hogy például az eloszlás aljából 2,5%-ot levágó érték az alacsony szabadságfok esetén még alacsony érték, ami a t-eloszlás vastag eloszlásszéle miatt van, "messzire kell menni ahhoz, hogy a 2,5%-ot le tudjuk vágni". A másik oldalon azt látjuk, hogy az értékek a standard normális eloszlásnál megfigyelhető értékekhez tartanak. Látjuk természetesen azt is, hogy szimmetrikus a táblázat abból a szempontból, hogy pl. a felső és az alsó sor értékei abszolút értékben megegyeznek (az eloszlások szimmetriája miatt). Érdemes a táblázatban szereplő számok nagyságrendjét megjegyezni a következő témakörökhöz, miszerint az alul-felül összesen 5%-ot levágó értékek nagyobb minták esetén a \(\pm2\) tartományban, az összesen 10%-ot levágó értékek a \(\pm 1{,}7\) környékén találhatóak.

  1. Legyen \(X \sim {}_5\chi^2\). Válaszolja meg az alábbi kérdéseket!
    1. \(\mathbf{P}\left(X<3\right)\)
    2. \(\mathbf{P}\left(X>3{,}5\right)\)
    3. \(\mathbf{P}\left(1{,}3<X<2{,}7\right)\)
    4. Mi az az érték, aminél nagyobb az értékek 60%-a?
    5. Mi az az érték, aminél kisebb az értékek 5%-a?
    6. Mi az a két érték, ami között az eloszlás középső 95%-a található?
    7. Válaszolja meg a fenti kérdéseket 10 és 15 szabadságfokú \(\chi^2\)-eloszlások esetén is!

Az alábbi táblázat foglalja össze az eredményeket:

\(v=5\) \(v=10\) \(v=15\)
\(\mathbf{P}\left(X<3\right)\) 0,3000 0,0186 0,0004
\(\mathbf{P}\left(X>3{,}5\right)\) 0,6234 0,9671 0,9990
\(\mathbf{P}\left(1{,}3<X<2{,}7\right)\) 0,1888 0,0118 0,0002
\(\mathbf{P}(X>x)=0{,}6\) 3,66 8,30 13,03
\(\mathbf{P}(X<x)=0{,}05\) 1,15 3,94 7,26
\(\mathbf{P}(x_1<X<x_2)=0{,}95\) 0,83 3,25 6,26
12,83 20,48 27,49