10.3 Gyakorló feladatok

Szükséges Excel ismeretek

Függvények:

  • SZÓR.M
  • NORM.S.INVERZ, T.INVERZ (z érték és t érték meghatározásához)
A (10.8) egyenletből származó szabadságfokra jellemzően nem egész érték adódik. Az Excel azonban csak pozitív egész szabadságfokokra értelmezi a t eloszlást, amennyiben nem egész számot adunk meg, automatikusan lefelé kerekíti azt, ami konzervatív (nagyobb) t értéket ad. Egyéb szoftverekben a keresett érték pontosabban is megtalálható.
  1. Egy sportórákat gyártó cég új terméket kíván bevezetni a piacra, melynek lényege, hogy a vásárló kap vele egy edzéstervet, amelyet ha elvégez, gyorsabban fogja tudni lefutni a félmaratoni távot. A marketing kampány megtervezéséhez egy 20 főből álló csoporton tesztelték a termék hatékonyságát úgy, hogy az edzésterv elvégzése előtt és után futtattak velük egy félmaratont. A mérés eredményei a futok.xlsx állományban találhatóak. A kampány során 95%-os megbízhatóság mellett legalább hány perces átlagos javulást ígérhetnek a fogyasztóknak?
  1. Egy nemzetközi tanulmány keretében a 14 évesek sportteljesítményét mérik standard eszközökkel, országonként 80-80 fős véletlenül választott minta segítségével. Jelen vizsgálatban csak a felmérésben résztvevő két ország, A és B sportolóit kívánjuk összehasonlítani. Az adatokat a sporttelj.xlsx fájl tartalmazza. Becsülje meg 90%-os megbízhatósággal a két ország fiataljainak átlagos teljesítménye közti különbséget, ha feltételezzük, hogy a sokasági varianciák megegyeznek!
  1. A PTE két karán vizsgáljuk a nyelvvizsgával rendelkezők arányát. Az első karon a 80 megkérdezettből 57 rendelkezik legalább középfokú nyelvvizsgával, míg a második esetében a 70 megkérdezett hallgatóból 43. Becsülje meg a két kar közötti arány különbségét a teljes kari hallgatói létszámra vonatkozóan!
  1. Egy vállalatnál porcelán szigeteléseket készítenek. Ehhez két öntőformát használnak. Megvizsgálták az előállított termékek minőségét: az egyik öntőformával készített telefontestekből 21 elemű mintát vettek, az átlagos méret 201,1 mm, a méretek szóródása 7,9 mm volt. A másik öntőformával előállított termékből 30 elemű minta alapján az átlagos méret 208,2 mm, a szórás 5,5 mm. Feltételezhető, hogy a sokasági eloszlás mindkét öntőformánál normális, de a sokasági varianciák egyezőségét az eltérő technológia miatt nem tételezhetjük fel. Becsülje meg 95%-os megbízhatósággal a két öntőformával előállított termékek méretbeli különbségének átlagos értékét!

A pontbecslés 7,1 mm, méghozzá a második öntőforma esetén. A szabadságfokra 33,235 adódik, így a t-érték 2,0345, a konfidencia intervallum alsó határa 3,04, a felső határa pedig 11,16 mm. Azaz 95%-os megbízhatósággal állíthatjuk, hogy a második öntőformával készült termékek átlagosan nagyobbak, méghozzá a sokasági különbség valahol 3,04 és 11,16 mm közötti.

  1. Egy vákuumtechnikai termék egyik lényeges, mA-ben mérhető minőségi jellemzőjét technológiai változtatással magasabb értékre akarjuk hozni. A változtatás előtti és a változtatás utáni állapot összehasonlításához a következő információkat ismerjük (a normális eloszlás mindkét esetben feltételezhető):
időszak Mintanagyság Átlag (mA) Szórás (mA)
változtatás előtt 17 39,4 1,46
változtatás után 25 42,1 1,66

Becsülje meg 98%-os megbízhatósággal az átlagos változás mértékét a sokaságban, a varianciák egyezőségét feltételezve!

A konfidencia intervallum: \(\left(1{,}49; 3{,}91\right)\) mA. Tehát változtatás után a jellemző várható értéke 98%-os megbízhatósággal legalább 1,49 mA-el és legfeljebb 3,91-el magasabb, mint változtatás előtt.

  1. Energiatakarékos izzók átlagos élettartamát vizsgáltuk két gyártó (A és B) esetén. Az izzok_elettartam.xlsx fájl 40-40 véletlenül kiválasztott izzó élettartamát tartalmazza órában . Elemezze az átlagos élettartamok közötti különbségeket 95%-os megbízhatósági szint mellett a normalitás, de különböző varianciák feltételezésével! Értékelje a feltételezéseket!

A konfidencia intervallum: \(\left(66{,}13; 151{,}27\right)\) óra. A feltevések ellenőrzéséhez csak a minta adatait használhatjuk. A normalitást például a mintabeli jellemzők (átlag és medián közelsége, csúcsosság, ferdeség), vagy hisztogram segítségével vizsgálhatjuk. Ezek alapján jelentős eltérést nem látunk a normális eloszlástól, ezért ezt a feltevést jogosnak tarthatjuk. A mintabeli szórások nagyon hasonlóak, ezért a sokasági szórások különbségére vonatkozó feltételezésünk megkérdőjelezhető.

  1. Egyes kutatók véleménye szerint a kor előrehaladtával egyre nagyobb azon emberek aránya, akik elégedettek az életükkel. Ennek ellenőrzésére mintavételt végeztünk, 500-500 főt kérdeztünk meg a fiatalok és idősebbek köréből egyszerű véletlen mintavétellel. A fiatalok közül 356-an, az idősebbek közül 403-an válaszolták azt, hogy elégedettek jelenlegi életükkel. Becsülje meg 95%-os megbízhatósággal a két arány közötti különbség mértékét!

A konfidencia intervallum: \(\left(0{,}0413; 0{,}1467\right)\), azaz 4,1% és 14,7% közötti a két arány közötti különbség a sokaságban.

  1. Egy tanulmányhoz reprezentatív mintavétel segítségével összegyűjtöttük néhány tankönyv könyvesboltbeli és online árát. Az adatokat a konyvarak.xlsx fájl tartalmazza. Vizsgálja meg 99%-os megbízhatósági szinten a tankönyvek átlagos áraiban lévő sokasági különbséget a könyvesbolt és az online áruház között?

Mivel ugyanazokról a könyvekről van szó, párosított mintának tekinthetőek az adatok. A konfidencia intervallum: \(\left(295{,}1; 1174{,}9\right)\) Ft.

  1. Azonos időtartamot tanulnak a nők és a férfiak? - teszi fel a kérdést egy nemrégiben a PTE egyik karán lefolytatott tanulmány. Kérdőív segítségével többek között a válaszadó nemét és egy átlagos héten a tanulásra fordított időt mérték fel. Az adatokat a tanulasiido.xlsx fájl tartalmazza. 95%-os konfidencia szinten mekkora a különbség a nők és a férfiak tanulási idejének átlagában az egyetem egészére vonatkozóan? Vizsgálja meg a becslés feltételeinek teljesülését!

A konfidencia intervallum egyenlő sokasági varianciákat feltételezve: \(\left(-8{,}08; -2{,}58\right)\) óra. Azaz kijelenthető, hogy a férfiak nagy megbízhatósággal kevesebbet tanulnak átlagosan, mint a hölgyek. A két mintabeli szórás nagyon hasonló, a sokaság normalitása azonban a hisztogramok alapján sérülni látszik, illetve a minták sem túlzottan nagyok. A gyakorlatban ilyen esetben gyakran robosztusabb (kevesebb előfeltevést igénylő) eszközök alkalmazására kerül sor.

  1. Két középiskolában felmérték a 17 éves fiúk 1000 méteres futóteljesítményét. A futásidők közelítőleg normális eloszlást követnek mindkét csoportban. A lenti táblázatban foglaljuk össze az eredményeket.
    1. A mintába került tanulókat a sportiskolások és egyéb iskolások reprezentatív mintájának tekintve állapítsa meg, hogy mekkora az átlagos idők közötti különbség 90%-os megbízhatóság mellett! Korábbi vizsgálatok alapján feltételezzük a sokasági varianciák egyezőségét.
    2. Miben változna a becslési eljárás, ha a varianciák egyezőségét nem tételezhetnénk fel?
    3. Végezze el a számításokat a varianciák egyezőségének feltételezése nélkül is!
iskolatípus tanuló átlagos idő (mp) idők szórása (mp)
Sportiskola 14 240 20
Egyéb iskola 22 270 30
  1. A 90%-os megbízhatóságú konfidencia intervallum \(\left(14{,}6; 45{,}4\right)\).
  2. Amennyiben nem feltételezzük a sokasági varianciák egyezőségét, nem használhatjuk a pooled varianciát, a nem egyenlő varianciák esetére érvényes képletet kell alkalmaznunk.
  3. A 90%-os megbízhatóságú konfidencia intervallum \(\left(15{,}9; 44{,}1\right)\), nagyon hasonló a varianciák egyezőségét feltételező megoldáshoz, a mintabeli szórások alapján valószínűleg a sokasági varianciák hasonlóak.
  1. Egy új orvosi eljárás egy hormon koncentrációjának csökkentését tűzte ki célul. 50 páciens esetén mérték meg a hormonszintet a kezelés előtt és után. Az értékeket a hormonszint.xlsx fájl tartalmazza.
    1. Állapítsa meg, hogy 95%-os megbízhatóság mellett a hormon koncentráció mekkora átlagos változását eredményezi az eljárás!
    2. Az eredménye alapján hatásosnak tarja az eljárást? Minden páciens esetén bekövetkezett az adott mértékű változás?
  1. A 95%-os megbízhatóságú konfidencia intervallum \(\left(2{,}10; 3{,}65\right)\).
  2. Hatásosnak tartjuk, hiszen nagy valószínűséggel a különbség kedvező előjelű. Nem minden páciens esetén figyelhető meg javulás, néhány esetben a hormonszint növekedett. (A valóságban a vizsgálat mellett egy ún. kontroll-csoport is lenne, akik nem kapták meg a kezelést, és az ő átlagos hormonszint változásukat is vizsgálnánk.)
  1. Végezze el a 2. feladathoz kapcsolódóan az alábbi feladatokat is!
    1. Végezze el a becslést olyan módon is, hogy nem tételezzük fel a sokasági varianciák egyezőségét!
    2. Hasonlítsa össze a kapott eredményeket!
  1. Amennyiben nem tételezzük fel a sokasági varianciák egyezőségét, az eredmény szinte azonos a sokasági varianciák egyezőségét feltételező megoldással. A 90%-os megbízhatóságú intervallum \(\left(6{,}32; 17{,}41\right)\).
  2. A kapott intervallumok gyakorlatilag azonosak. A mintabeli szórások közel azonosak, ezért joggal feltételezhetjük, hogy a sokasági varianciák is közelítőleg azonosak. Amennyiben ez a feltevés fennáll, a kapott eredmények egymáshoz közeliek lesznek.
  1. A sporttelj.xlsx fájl alapján végezze el az országok fiataljainak páronkénti összehasonlítását
    1. B és C ország,
    2. A és C ország között is, a sokasági varianciák egyezőségének feltevésével, 90%-os megbízhatóság mellett! Az eredményeket értelmezze!
  1. A 90%-os megbízhatóságú intervallum \(\left(1{,}66; 13{,}49\right)\) a B és C ország fiataljainak sportteljesítményének várható érték különbségére.
  2. A 90%-os megbízhatóságú intervallum \(\left(-1{,}65; 10{,}23\right)\) az A és C ország fiataljainak sportteljesítményének várható érték különbségére.
  1. Egy kísérletben 20 épület szigetelését végezték el, melyek esetén rendelkezésre áll az éves energiafelhasználás a felújítás előtti és utáni évekre (energia.xlsx). A két összehasonítandó évben a hőmérsékletek hasonlónak tekinthetőek, azaz a két év közötti különbséget elsősorban a szigetelés okozta. Becsülje meg 99%-os megbízhatósággal a sokasági átlagok különbségét!

A konfidencia intervallum: \(\left(6286{,}11; 7843{,}89\right)\) kWh.

  1. A PTE-KTK-n végzett hallgatók jövedelmét vizsgáltuk, méghozzá a Budapesten és nem Budapesten dolgozók csoportjaira vonatkozóan, reprezentatív minta alapján. A Budapesten állást vállaló 16 végzett esetén a mintabeli átlag 745600 forint volt 213480 forintos szórással. A nem budapestiek esetén a mintaátlag 638750 forint, a szórás pedig 221580 forint volt. A normalitás és egyező sokasági szórások feltételezése mellett becsülje meg 90%-os megbízhatósággal, mekkora a két csoport közötti sokasági különbség!

A konfidencia intervallum: \(\left(-23\,706; 237\,406\right)\) HUF.

  1. Tartson tovább nyitva az egyetemi könyvtár? 120 KTK-s diákból 35-en válaszolták, hogy jó lenne a hosszabb nyitva tartás, míg az ÁOK-sok esetén 140 hallgatóból 96 válaszolt igennel. Becsülje meg 90%-os megbízhatósággal, hogy a két kar egészére vonatkozóan mekkora lehet az arányok közötti különbség!

A konfidencia intervallum: \(\left(30{,}01; 48{,}80\right)\) %.

  1. Ipari környezetben gyakran kritikus két mérési módszer különbözőségének ismerete. Véletlenszerűen kiválasztott 60 alkatrész szóban forgó paraméterét két módszerrel mérték meg, hagyományos mechanikus és lézeres módon (mm). Az adatokat a meresek.xlsx fájlban találja. Becsülje meg a két mérési módszer által szolgáltatott eredmények átlagos eltérését 90%-os megbízhatósággal!

A konfidencia intervallum: \(\left(0{,}0831; 0{,}2203\right)\) mm.

  1. Egy politikus támogatottságát mérik a férfiak és a nők körében egy adott városban. A 1000 megkérdezett férfiből 640-en mondták, hogy támogatják, ugyanennyi nőből pedig csak 365-en. A különbségre becsült konfidencia intervallum alsó határa 22,5%, a felső pedig 32,5%.
    1. Határozza meg, hogy mekkora volt az alkalmazott megbízhatóság?
    2. Hány nőnek kellett volna igennel válaszolnia a kérdésre ahhoz, hogy a standard hiba (és ezzel a hibahatár) ugyanannyi legyen?
  1. Az alkalmazott megbízhatóság 98%-os volt.