10.3 Gyakorló feladatok
Szükséges Excel ismeretek
Függvények:
- SZÓR.M
- NORM.S.INVERZ, T.INVERZ (z érték és t érték meghatározásához)
- Egy sportórákat gyártó cég új terméket kíván bevezetni a piacra, melynek lényege, hogy a vásárló kap vele egy edzéstervet, amelyet ha elvégez, gyorsabban fogja tudni lefutni a félmaratoni távot. A marketing kampány megtervezéséhez egy 20 főből álló csoporton tesztelték a termék hatékonyságát úgy, hogy az edzésterv elvégzése előtt és után futtattak velük egy félmaratont. A mérés eredményei a
futok.xlsx
állományban találhatóak. A kampány során 95%-os megbízhatóság mellett legalább hány perces átlagos javulást ígérhetnek a fogyasztóknak?
- Egy nemzetközi tanulmány keretében a 14 évesek sportteljesítményét mérik standard eszközökkel, országonként 80-80 fős véletlenül választott minta segítségével. Jelen vizsgálatban csak a felmérésben résztvevő két ország, A és B sportolóit kívánjuk összehasonlítani. Az adatokat a
sporttelj.xlsx
fájl tartalmazza. Becsülje meg 90%-os megbízhatósággal a két ország fiataljainak átlagos teljesítménye közti különbséget, ha feltételezzük, hogy a sokasági varianciák megegyeznek!
- A PTE két karán vizsgáljuk a nyelvvizsgával rendelkezők arányát. Az első karon a 80 megkérdezettből 57 rendelkezik legalább középfokú nyelvvizsgával, míg a második esetében a 70 megkérdezett hallgatóból 43. Becsülje meg a két kar közötti arány különbségét a teljes kari hallgatói létszámra vonatkozóan!
- Egy vállalatnál porcelán szigeteléseket készítenek. Ehhez két öntőformát használnak. Megvizsgálták az előállított termékek minőségét: az egyik öntőformával készített telefontestekből 21 elemű mintát vettek, az átlagos méret 201,1 mm, a méretek szóródása 7,9 mm volt. A másik öntőformával előállított termékből 30 elemű minta alapján az átlagos méret 208,2 mm, a szórás 5,5 mm. Feltételezhető, hogy a sokasági eloszlás mindkét öntőformánál normális, de a sokasági varianciák egyezőségét az eltérő technológia miatt nem tételezhetjük fel. Becsülje meg 95%-os megbízhatósággal a két öntőformával előállított termékek méretbeli különbségének átlagos értékét!
A pontbecslés 7,1 mm, méghozzá a második öntőforma esetén. A szabadságfokra 33,235 adódik, így a t-érték 2,0345, a konfidencia intervallum alsó határa 3,04, a felső határa pedig 11,16 mm. Azaz 95%-os megbízhatósággal állíthatjuk, hogy a második öntőformával készült termékek átlagosan nagyobbak, méghozzá a sokasági különbség valahol 3,04 és 11,16 mm közötti.
- Egy vákuumtechnikai termék egyik lényeges, mA-ben mérhető minőségi jellemzőjét technológiai változtatással magasabb értékre akarjuk hozni. A változtatás előtti és a változtatás utáni állapot összehasonlításához a következő információkat ismerjük (a normális eloszlás mindkét esetben feltételezhető):
időszak | Mintanagyság | Átlag (mA) | Szórás (mA) |
---|---|---|---|
változtatás előtt | 17 | 39,4 | 1,46 |
változtatás után | 25 | 42,1 | 1,66 |
Becsülje meg 98%-os megbízhatósággal az átlagos változás mértékét a sokaságban, a varianciák egyezőségét feltételezve!
A konfidencia intervallum: \(\left(1{,}49; 3{,}91\right)\) mA. Tehát változtatás után a jellemző várható értéke 98%-os megbízhatósággal legalább 1,49 mA-el és legfeljebb 3,91-el magasabb, mint változtatás előtt.
- Energiatakarékos izzók átlagos élettartamát vizsgáltuk két gyártó (A és B) esetén. Az
izzok_elettartam.xlsx
fájl 40-40 véletlenül kiválasztott izzó élettartamát tartalmazza órában . Elemezze az átlagos élettartamok közötti különbségeket 95%-os megbízhatósági szint mellett a normalitás, de különböző varianciák feltételezésével! Értékelje a feltételezéseket!
A konfidencia intervallum: \(\left(66{,}13; 151{,}27\right)\) óra. A feltevések ellenőrzéséhez csak a minta adatait használhatjuk. A normalitást például a mintabeli jellemzők (átlag és medián közelsége, csúcsosság, ferdeség), vagy hisztogram segítségével vizsgálhatjuk. Ezek alapján jelentős eltérést nem látunk a normális eloszlástól, ezért ezt a feltevést jogosnak tarthatjuk. A mintabeli szórások nagyon hasonlóak, ezért a sokasági szórások különbségére vonatkozó feltételezésünk megkérdőjelezhető.
- Egyes kutatók véleménye szerint a kor előrehaladtával egyre nagyobb azon emberek aránya, akik elégedettek az életükkel. Ennek ellenőrzésére mintavételt végeztünk, 500-500 főt kérdeztünk meg a fiatalok és idősebbek köréből egyszerű véletlen mintavétellel. A fiatalok közül 356-an, az idősebbek közül 403-an válaszolták azt, hogy elégedettek jelenlegi életükkel. Becsülje meg 95%-os megbízhatósággal a két arány közötti különbség mértékét!
A konfidencia intervallum: \(\left(0{,}0413; 0{,}1467\right)\), azaz 4,1% és 14,7% közötti a két arány közötti különbség a sokaságban.
- Egy tanulmányhoz reprezentatív mintavétel segítségével összegyűjtöttük néhány tankönyv könyvesboltbeli és online árát. Az adatokat a
konyvarak.xlsx
fájl tartalmazza. Vizsgálja meg 99%-os megbízhatósági szinten a tankönyvek átlagos áraiban lévő sokasági különbséget a könyvesbolt és az online áruház között?
Mivel ugyanazokról a könyvekről van szó, párosított mintának tekinthetőek az adatok. A konfidencia intervallum: \(\left(295{,}1; 1174{,}9\right)\) Ft.
- Azonos időtartamot tanulnak a nők és a férfiak? - teszi fel a kérdést egy nemrégiben a PTE egyik karán lefolytatott tanulmány. Kérdőív segítségével többek között a válaszadó nemét és egy átlagos héten a tanulásra fordított időt mérték fel. Az adatokat a
tanulasiido.xlsx
fájl tartalmazza. 95%-os konfidencia szinten mekkora a különbség a nők és a férfiak tanulási idejének átlagában az egyetem egészére vonatkozóan? Vizsgálja meg a becslés feltételeinek teljesülését!
A konfidencia intervallum egyenlő sokasági varianciákat feltételezve: \(\left(-8{,}08; -2{,}58\right)\) óra. Azaz kijelenthető, hogy a férfiak nagy megbízhatósággal kevesebbet tanulnak átlagosan, mint a hölgyek. A két mintabeli szórás nagyon hasonló, a sokaság normalitása azonban a hisztogramok alapján sérülni látszik, illetve a minták sem túlzottan nagyok. A gyakorlatban ilyen esetben gyakran robosztusabb (kevesebb előfeltevést igénylő) eszközök alkalmazására kerül sor.
- Két középiskolában felmérték a 17 éves fiúk 1000 méteres futóteljesítményét. A futásidők közelítőleg normális eloszlást követnek mindkét csoportban. A lenti táblázatban foglaljuk össze az eredményeket.
- A mintába került tanulókat a sportiskolások és egyéb iskolások reprezentatív mintájának tekintve állapítsa meg, hogy mekkora az átlagos idők közötti különbség 90%-os megbízhatóság mellett! Korábbi vizsgálatok alapján feltételezzük a sokasági varianciák egyezőségét.
- Miben változna a becslési eljárás, ha a varianciák egyezőségét nem tételezhetnénk fel?
- Végezze el a számításokat a varianciák egyezőségének feltételezése nélkül is!
iskolatípus | tanuló | átlagos idő (mp) | idők szórása (mp) |
---|---|---|---|
Sportiskola | 14 | 240 | 20 |
Egyéb iskola | 22 | 270 | 30 |
- A 90%-os megbízhatóságú konfidencia intervallum \(\left(14{,}6; 45{,}4\right)\).
- Amennyiben nem feltételezzük a sokasági varianciák egyezőségét, nem használhatjuk a pooled varianciát, a nem egyenlő varianciák esetére érvényes képletet kell alkalmaznunk.
- A 90%-os megbízhatóságú konfidencia intervallum \(\left(15{,}9; 44{,}1\right)\), nagyon hasonló a varianciák egyezőségét feltételező megoldáshoz, a mintabeli szórások alapján valószínűleg a sokasági varianciák hasonlóak.
- Egy új orvosi eljárás egy hormon koncentrációjának csökkentését tűzte ki célul. 50 páciens esetén mérték meg a hormonszintet a kezelés előtt és után. Az értékeket a
hormonszint.xlsx
fájl tartalmazza.- Állapítsa meg, hogy 95%-os megbízhatóság mellett a hormon koncentráció mekkora átlagos változását eredményezi az eljárás!
- Az eredménye alapján hatásosnak tarja az eljárást? Minden páciens esetén bekövetkezett az adott mértékű változás?
- A 95%-os megbízhatóságú konfidencia intervallum \(\left(2{,}10; 3{,}65\right)\).
- Hatásosnak tartjuk, hiszen nagy valószínűséggel a különbség kedvező előjelű. Nem minden páciens esetén figyelhető meg javulás, néhány esetben a hormonszint növekedett. (A valóságban a vizsgálat mellett egy ún. kontroll-csoport is lenne, akik nem kapták meg a kezelést, és az ő átlagos hormonszint változásukat is vizsgálnánk.)
- Végezze el a 2. feladathoz kapcsolódóan az alábbi feladatokat is!
- Végezze el a becslést olyan módon is, hogy nem tételezzük fel a sokasági varianciák egyezőségét!
- Hasonlítsa össze a kapott eredményeket!
- Amennyiben nem tételezzük fel a sokasági varianciák egyezőségét, az eredmény szinte azonos a sokasági varianciák egyezőségét feltételező megoldással. A 90%-os megbízhatóságú intervallum \(\left(6{,}32; 17{,}41\right)\).
- A kapott intervallumok gyakorlatilag azonosak. A mintabeli szórások közel azonosak, ezért joggal feltételezhetjük, hogy a sokasági varianciák is közelítőleg azonosak. Amennyiben ez a feltevés fennáll, a kapott eredmények egymáshoz közeliek lesznek.
- A
sporttelj.xlsx
fájl alapján végezze el az országok fiataljainak páronkénti összehasonlítását- B és C ország,
- A és C ország között is, a sokasági varianciák egyezőségének feltevésével, 90%-os megbízhatóság mellett! Az eredményeket értelmezze!
- A 90%-os megbízhatóságú intervallum \(\left(1{,}66; 13{,}49\right)\) a B és C ország fiataljainak sportteljesítményének várható érték különbségére.
- A 90%-os megbízhatóságú intervallum \(\left(-1{,}65; 10{,}23\right)\) az A és C ország fiataljainak sportteljesítményének várható érték különbségére.
- Egy kísérletben 20 épület szigetelését végezték el, melyek esetén rendelkezésre áll az éves energiafelhasználás a felújítás előtti és utáni évekre (
energia.xlsx
). A két összehasonítandó évben a hőmérsékletek hasonlónak tekinthetőek, azaz a két év közötti különbséget elsősorban a szigetelés okozta. Becsülje meg 99%-os megbízhatósággal a sokasági átlagok különbségét!
A konfidencia intervallum: \(\left(6286{,}11; 7843{,}89\right)\) kWh.
- A PTE-KTK-n végzett hallgatók jövedelmét vizsgáltuk, méghozzá a Budapesten és nem Budapesten dolgozók csoportjaira vonatkozóan, reprezentatív minta alapján. A Budapesten állást vállaló 16 végzett esetén a mintabeli átlag 745600 forint volt 213480 forintos szórással. A nem budapestiek esetén a mintaátlag 638750 forint, a szórás pedig 221580 forint volt. A normalitás és egyező sokasági szórások feltételezése mellett becsülje meg 90%-os megbízhatósággal, mekkora a két csoport közötti sokasági különbség!
A konfidencia intervallum: \(\left(-23\,706; 237\,406\right)\) HUF.
- Tartson tovább nyitva az egyetemi könyvtár? 120 KTK-s diákból 35-en válaszolták, hogy jó lenne a hosszabb nyitva tartás, míg az ÁOK-sok esetén 140 hallgatóból 96 válaszolt igennel. Becsülje meg 90%-os megbízhatósággal, hogy a két kar egészére vonatkozóan mekkora lehet az arányok közötti különbség!
A konfidencia intervallum: \(\left(30{,}01; 48{,}80\right)\) %.
- Ipari környezetben gyakran kritikus két mérési módszer különbözőségének ismerete. Véletlenszerűen kiválasztott 60 alkatrész szóban forgó paraméterét két módszerrel mérték meg, hagyományos mechanikus és lézeres módon (mm). Az adatokat a
meresek.xlsx
fájlban találja. Becsülje meg a két mérési módszer által szolgáltatott eredmények átlagos eltérését 90%-os megbízhatósággal!
A konfidencia intervallum: \(\left(0{,}0831; 0{,}2203\right)\) mm.
- Egy politikus támogatottságát mérik a férfiak és a nők körében egy adott városban. A 1000 megkérdezett férfiből 640-en mondták, hogy támogatják, ugyanennyi nőből pedig csak 365-en. A különbségre becsült konfidencia intervallum alsó határa 22,5%, a felső pedig 32,5%.
- Határozza meg, hogy mekkora volt az alkalmazott megbízhatóság?
- Hány nőnek kellett volna igennel válaszolnia a kérdésre ahhoz, hogy a standard hiba (és ezzel a hibahatár) ugyanannyi legyen?
- Az alkalmazott megbízhatóság 98%-os volt.