1 . fejezet A statisztika tárgya, alapfogalmak

Big data, data science, data analytics, adatelemzés, gépi tanulás, mesterséges intelligencia mind-mind olyan kifejezések, melyekkel gyakran és egyre gyakrabban találkozhatunk. A fenti területek mindegyike szorosan kapcsolódik az egyetemeken hagyományosan statisztika néven oktatott klasszikus tananyaghoz, kiegészülve naprakész informatikai, adatbáziskezelési, vagy programozási ismeretekkel. A napjainkban keletkező rengeteg adat gyűjtése, rendszerezése, elemzése, az eredmények értelmezése és bemutatása komoly szakértelmet igényel. Ezek a feladatok hagyományosan a statisztika témakörébe esnek, de az adatok keletkezésének gyorsasága és azok mennyisége miatt a korszerű adatfeldolgozási és informatikai ismeretek egyre kevésbé megkerülhetők.

A nagytömegű adatfeldolgozás és a mesterséges intelligencia napjainkra odáig jutott, hogy képes például chatrobotokat létrehozni, mint például a 2022 végén közzétett ChatGPT, mely rengeteg kérdésre tud helyesen válaszolni. Nincs felőle kétség, hogy a közeli jövőben még fejlettebb eszközök látnak napvilágot. Természetesen a hasonló rendszerek megértéséhez, építéséhez rengeteg ismeret kell, a kurzus az ide vezető úton lehet egy első lépés. Ebben a fejezetben a legfontosabb statisztikai alapfogalmakat ismerjük meg.