8.4 Gyakorló feladatok
Szükséges Excel ismeretek
Függvények:
- GYÖK
- SZÓR.M
- T.ELOSZL, T.INVERZ
- KHINÉGYZET.ELOSZLÁS, KHINÉGYZET.INVERZ
Funkciók:
- Az Adatelemzés menü Mintavétel eszköze
- Álljon egy sokaság a következő elemekből: 34, 45, 48, 53, 66.
- Számítsa ki a sokaság átlagát és szórását!
- Készítse el az összes lehetséges visszatevéses kételemű mintát, majd számítsa ki a mintaátlagokat is! (
mintavetel.xlsx
) - Mekkora a mintaátlagok várható értéke és szórása?
- Rajzoljon hisztogramot a lehetséges mintaátlagokból (az átlag mintavételi eloszlása)!
- Hogyan változna a mintavételi eloszlás, ha visszatevés nélküli mintavételt végeztünk volna?
- Egy gabonafeldolgozó üzemben zsákokba töltik a búzát, az egyes zsákokba töltött mennyiségek egymástól függetlennek tekinthetők 50 kg várható értékkel és 0,5 kg szórással. Válaszolja meg az alábbi kérdéseket!
- Véletlenszerűen kiválasztva 49 zsákot a futószalagról, milyen típusú mintának minősülnek?
- Milyen eloszlást követ az így kiválasztott mintákban szereplő zsákok súlya egyenként?
- Milyen eloszlást követ az így kiválasztott mintákban szereplő zsákok átlagos súlya?
- Mi a valószínűsége, hogy a mintabeli átlag 50,05 kg-nál több lesz?
- Mi a valószínűsége, hogy a mintabeli átlag 49 kg-nál kevesebb lesz?
- Adjon meg egy olyan intervallumot, melybe a mintabeli átlag 90%-os valószínűséggel beleesik!
- Tegyük fel, hogy a választók körében egy adott pártra szavazók aránya a sokaságban 30%.
- Mi az arány mintavételi eloszlása 100 elemű minta esetén?
- Mi a valószínűsége, hogy 100 fős minta esetén a mintabeli arány 35%-nál magasabb?
- Legyen \(X \sim {}_{20}t\). Válaszolja meg az alábbi kérdéseket!
- \(\mathbf{P}\left(X<-2\right)\)
- \(\mathbf{P}\left(X>2\right)\)
- \(\mathbf{P}\left(-2<X<2\right)\)
- Mi az a t-érték, aminél nagyobb az értékek 60%-a?
- Mi az a t-érték, aminél kisebb az értékek 5%-a?
- Mi az a két t-érték, ami között az eloszlás középső 95%-a található?
- Végezze el az 1. feladatot \(n=3\) elemű minták esetére is! Hasonlítsa össze az eredményeket!
- A sokaság paraméterei az órai feladathoz hasonlóan \(\mu=49{,}2\), \(\sigma=10{,}46\).
- Összesen 125 visszatevéses minta van. (Tipp: az Exceles megvalósításhoz: a meglévő 25 mintát egymás alá másolni még négyszer, majd 25-ös blokkonként ugyanazt a mintaelemet mögé írni \(x_3\) oszlopnévvel.) A mintaátlagok kiszámítása kézenfekvő.
- A mintaátlagok átlaga megegyezik a sokaság várható értékével, azaz 49,2. A mintaátlagok szórása (standard hiba) 6,038, ami az elméleti eredménnyel \(\left(\frac{\sigma}{\sqrt{n}}=\frac{10{,}46}{\sqrt{3}}\right)\) megegyezik.
- Az átlag mintavételi eloszlása
- A visszatevés nélküli megoldást az Olvasóra bízzuk! A mintaátlagok átlaga meg fog egyezni a sokasági átlaggal, a mintaátlagok szórása pedig a visszatevéses esethez képest alacsonyabb lesz, ellenőrizhető az elméleti eredmény segítségével.
- Válaszolja meg a 4. feladat kérdéseit az alábbi eloszlásokra is:
- \(v=2\) szabadságfokú t-eloszlás.
- \(v=5\) szabadságfokú t-eloszlás.
- \(v=10\) szabadságfokú t-eloszlás.
- \(v=50\) szabadságfokú t-eloszlás.
- \(v=100\) szabadságfokú t-eloszlás.
- standard normális eloszlás.
- Hasonlítsa össze az egyes kérdésekre adott válaszait a különböző eloszlások esetén! Mit tapasztal?
Az alábbi táblázat foglalja össze az eredményeket:
\(v=2\) | \(v=5\) | \(v=10\) | \(v=20\) | \(v=50\) | \(v=100\) | \(\mathcal{N}\left(0,1\right)\) | |
---|---|---|---|---|---|---|---|
\(\mathbf{P}(X<-2)\) | 0,0918 | 0,0510 | 0,0367 | 0,0296 | 0,0255 | 0,0241 | 0,0228 |
\(\mathbf{P}(X>2)\) | 0,0918 | 0,0510 | 0,0367 | 0,0296 | 0,0255 | 0,0241 | 0,0228 |
\(\mathbf{P}(-2<X<2)\) | 0,8165 | 0,8981 | 0,9266 | 0,9407 | 0,9491 | 0,9518 | 0,9545 |
\(\mathbf{P}(X>x)=0{,}6\) | -0,289 | -0,267 | -0,260 | -0,257 | -0,255 | -0,254 | -0,253 |
\(\mathbf{P}(X<x)=0{,}05\) | -2,920 | -2,015 | -1,812 | -1,725 | -1,676 | -1,660 | -1,645 |
\(\mathbf{P}(-x<X<x)=0{,}95\) | \(\pm4{,}303\) | \(\pm2{,}571\) | \(\pm2{,}228\) | \(\pm2{,}086\) | \(\pm2{,}009\) | \(\pm1{,}984\) | \(\pm1{,}960\) |
Valamennyi sorban azt láthatjuk, hogy a szabadságfok növekedésével a kérdéses értékek egyre közelebb kerülnek a standard normális eloszlás esetén adott válaszainkhoz, hiszen a szabadságfok növekedésével a t-eloszlás belesimul a standard normálisba.
- Tekintsük az 1. órai feladat sokaságát és az összes lehetséges háromelemű visszatevéses mintát! Végezze el az alábbi feladatokat!
- Számítsa ki a sokasági varianciát!
- Valamennyi minta esetén számítsa ki a mintaelemek varianciáját (\(n\)-nel való osztással) és a mintaelemek korrigált mintabeli varianciáját (\(n-1\)-gyel való osztással)!
- Számítsa ki a két különböző mintabeli statisztika várható értékét! Mit tapasztal?
- Végezze el a feladatot mindkét típusú (korrigált és nem korrigált) szórással is, majd eredményeit hasonlítsa össze a sokasági szórással! Mit tapasztal?
- A sokasági variancia \(\sigma^2=109{,}36\).
- A két mintabeli statisztika kiszámítása minden lehetséges mintára triviális.
- A korrigálatlan mintabeli varianciák várható értéke 72,91, azaz jelentősen elmarad a tényleges sokasági varianciától. Új dolgot tapasztalunk, a sokasági paraméter mintabeli megfelelője nem tűnik jó közelítésnek. A korrigált varianciák várható értéke 109,36, ami megegyezik a sokasági értékkel, ezért használjuk a korrigált varianciát mintából való következtetés esetén. A jelenséget pontosabban megfogalmazzuk a következő előadáson.
- Sem a korrigált sem a korrigálatlan szórások átlaga nem egyezik a sokasági szórással.
- Egy üdítőital töltési mennyiségei normális eloszlást követnek
\(2\,000\) ml várható értékkel és 35 ml szórással.
- A megtöltött palackok közül milyen arányban vannak olyanok, melyek több mint \(2\,010\) ml üdítőt tartalmaznak?
- A megtöltött palackok közül milyen arányban vannak olyanok, melyek \(1\,950\) és \(2\,050\) ml közötti mennyiséget tartalmaznak?
- Mekkora az a töltési mennyiség, aminél a palackok 99%-a többet tartalmaz?
- 25 elemű, visszatevés nélküli véletlen mintát kiemelve mi a valószínűsége, hogy a mintaátlag \(2\,010\) ml feletti?
- 25 elemű, visszatevés nélküli véletlen mintát kiemelve mi a valószínűsége, hogy a mintaátlag \(1\,950\) és \(2\,050\) ml közötti?
- Mekkora az az átlagos töltési mennyiség, aminél a 25 elemű minták 99%-a magasabb értéket vesz fel?
- Hasonlítsa össze a fenti válaszokat!
A feladat megoldásához elegendő tudnunk, hogy \(X \sim \mathcal{N}\left(2\,000,35\right)\), illetve \(\overline{X} \sim \mathcal{N}\left(2\,000,\frac{35}{\sqrt{25}}\right)\).
- \(\mathbf{P}\left(X>2\,010\right)=0{,}3875\)
- \(\mathbf{P}\left(1\,950<X<2\,050\right)=0{,}8469\)
- \(1\,918{,}58\) ml
- \(\mathbf{P}\left(\overline{X}>2\,010\right)=0{,}0766\)
- \(\mathbf{P}\left(1\,950<\overline{X}<2\,050\right)=0{,}999999999999086\)
- \(1\,983{,}72\) ml
- Valamennyi esetben az figyelhető meg, hogy a mintaátlagok eloszlása sokkal inkább koncentrálódik a várható érték körül, mint az eredeti eloszlás.
- A Király utcában friss facsart narancslevet áruló kereskedő a narancsot egy spanyol termelőtől importálja. A darabonként nyerhető lé közelítőleg normális eloszlást követ, 1,8 dl várható értékkel és 0,2 dl szórással.
- A narancsok mekkora hányadából lehet egy 2 dl-es poharat megtölteni lével?
- A narancsok 90%-a mekkora mennyiségnél tartalmaz többet?
- Mi a valószínűsége, hogy egy narancs 1,5 és 2 dl közötti levet tartalmaz?
- 25 narancs kifacsarása után mi a valószínűsége, hogy az átlagos létartalom 1,9 dl felett lesz?
- 100 narancs kifacsarása után mi a valószínűsége, hogy az átlagos létartalom 1,9 dl felett lesz?
- Fejtse ki, hogy a d. és e. feladatokban adott válaszai miért különbözőek!
- 0,1587
- 1,544 dl
- 0,7745
- 0,0062
- \(2{,}87 \cdot 10^{-7}\)
- A 100 elemű minta esetén a standard hiba jóval alacsonyabb, azaz a lehetséges mintaátlagok sokkal kevésbé szóródnak a sokasági várható érték körül, így a kérdéses valószínűség is jóval alacsonyabb.
- Tudjuk, hogy az évfolyamon tanuló 240 hallgatóból 180 nő. Tegyük fel, hogy \(n=50\) elemű visszatevés nélküli mintákat vizsgálunk. Válaszolja meg az alábbi kérdéseket:
- Milyen eloszlást követ a mintabeli arány?
- Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 76% feletti?
- Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 72% alatti?
- Mi a valószínűsége, hogy olyan mintát veszünk, amelyben a nők aránya 70% és 77% közötti?
- A lehetséges minták ,,középső" 90%-a milyen mintabeli arányokat mutat?
- Válaszolja meg a fenti kérdéseket \(n=80\) elemű minták esetére is! Mit tapasztal?
- A mintabeli arány normális eloszlást követ, amelynek középértéke a mintabeli arány (0,75). Mivel egyszerű véletlen (EV) mintát veszünk, a szórás (standard hiba) a véges szorzóval módosul. \(p \sim \mathcal{N}\left(0{,}75, \sqrt{\dfrac{0{,}75 \cdot 0{,}25}{50}}\sqrt{\dfrac{240-50}{240-1}} \right) \approx \mathcal{N}\left(0{,}75, 0{,}0546 \right)\)
- 0,4273
- 0,2913
- 0,4630
- A lehetséges minták középső 90%-a kerekítve 66% és 84% közötti mintabeli arányokat mutat.
- A számításokat az Olvasóra bízzuk, az arány standard hibája két összetevő miatt is csökken, egyrészt a nevezőben szereplő \(\sqrt{n}\) miatt, másrészt a véges szorzó csökkenése miatt. Ennek megfelelően a valószínűségek is változnak, illetve a nagyobb minta, kevésbé szóródó mintabeli arányok miatt a középső 90% terjedelme is csökkenni fog (kerekítve 68,5% és 81,5% közé).
- Számítsa ki az 2,5., 5., 10., 90., 95., 97,5. percentilist (azokat az értéket, amik alatt az eloszlás értékeinek 2,5, 5,\(\dots\), 97,5%-a található) az alábbi eloszlások esetén:
- t-eloszlás 2, 5, 10, 20, 50, 100 szabadságfokokkal.
- standard normális eloszlás.
- Hasonlítsa össze az a. és b. feladatokban kapott értékeket! Mit tapasztal?
Az alábbi táblázat foglalja össze az eredményeket:
\(v=2\) | \(v=5\) | \(v=10\) | \(v=20\) | \(v=50\) | \(v=100\) | \(\mathcal{N}(0,1)\) | |
---|---|---|---|---|---|---|---|
\(P_{2{,}5}\) | -4,303 | -2,571 | -2,228 | -2,086 | -2,009 | -1,984 | -1,960 |
\(P_{5}\) | -2,920 | -2,015 | -1,812 | -1,725 | -1,676 | -1,660 | -1,645 |
\(P_{10}\) | -1,886 | -1,476 | -1,372 | -1,325 | -1,299 | -1,290 | -1,282 |
\(P_{90}\) | 1,886 | 1,476 | 1,372 | 1,325 | 1,299 | 1,290 | 1,282 |
\(P_{95}\) | 2,920 | 2,015 | 1,812 | 1,725 | 1,676 | 1,660 | 1,645 |
\(P_{97{,}5}\) | 4,303 | 2,571 | 2,228 | 2,086 | 2,009 | 1,984 | 1,960 |
A táblázat egy korábbi gyakorló feladat eredményéhez hasonló. Azt láthatjuk, hogy például az eloszlás aljából 2,5%-ot levágó érték az alacsony szabadságfok esetén még alacsony érték, ami a t-eloszlás vastag eloszlásszéle miatt van, "messzire kell menni ahhoz, hogy a 2,5%-ot le tudjuk vágni". A másik oldalon azt látjuk, hogy az értékek a standard normális eloszlásnál megfigyelhető értékekhez tartanak. Látjuk természetesen azt is, hogy szimmetrikus a táblázat abból a szempontból, hogy pl. a felső és az alsó sor értékei abszolút értékben megegyeznek (az eloszlások szimmetriája miatt). Érdemes a táblázatban szereplő számok nagyságrendjét megjegyezni a következő témakörökhöz, miszerint az alul-felül összesen 5%-ot levágó értékek nagyobb minták esetén a \(\pm2\) tartományban, az összesen 10%-ot levágó értékek a \(\pm 1{,}7\) környékén találhatóak.
- Legyen \(X \sim {}_5\chi^2\). Válaszolja meg az alábbi kérdéseket!
- \(\mathbf{P}\left(X<3\right)\)
- \(\mathbf{P}\left(X>3{,}5\right)\)
- \(\mathbf{P}\left(1{,}3<X<2{,}7\right)\)
- Mi az az érték, aminél nagyobb az értékek 60%-a?
- Mi az az érték, aminél kisebb az értékek 5%-a?
- Mi az a két érték, ami között az eloszlás középső 95%-a található?
- Válaszolja meg a fenti kérdéseket 10 és 15 szabadságfokú \(\chi^2\)-eloszlások esetén is!
Az alábbi táblázat foglalja össze az eredményeket:
\(v=5\) | \(v=10\) | \(v=15\) | |
---|---|---|---|
\(\mathbf{P}\left(X<3\right)\) | 0,3000 | 0,0186 | 0,0004 |
\(\mathbf{P}\left(X>3{,}5\right)\) | 0,6234 | 0,9671 | 0,9990 |
\(\mathbf{P}\left(1{,}3<X<2{,}7\right)\) | 0,1888 | 0,0118 | 0,0002 |
\(\mathbf{P}(X>x)=0{,}6\) | 3,66 | 8,30 | 13,03 |
\(\mathbf{P}(X<x)=0{,}05\) | 1,15 | 3,94 | 7,26 |
\(\mathbf{P}(x_1<X<x_2)=0{,}95\) | 0,83 | 3,25 | 6,26 |
12,83 | 20,48 | 27,49 |