Python adatvizualizáció II.
- félnap (1 x 4 óra)
Adattáblák Python-ban – DataFrame-ek és ezeken fontosabb műveletek
Elméleti háttér tanítása: Mi a Pandas és NumPy csomag? Mik a DataFrame-ek? Milyen műveletek végezhetők el a DataFrame-eken?
Gyakorlati rész:
- (i) Mik a DataFrame-ek?
- (ii) Gyors alapstatisztikák egy DataFrame-ről – len(), shape, describe() és value_counts függvények bemutatása
- (iii) Milyen típusa lehet egy mezőnek? Hogyan lehet megváltoztatni egy mező típusát?
- (iv) Hogyan tudunk adatokat leválogatni? loc() és iloc függvények használata
- (v) Hiányzó értékek detektálása és pótlása
- (vii) DataFrame és más adattípusok (dict, list, …) kapcsolata. Hogyan tudunk létrehozni DataFrame-t más adatstruktúrából?
- (viii) Hogyan tudunk aggregálni adattáblákat? Groupby függvény bemutatása
- (ix) Mezőnevek átnevezése
- (x) Rekordok sorbarendezése
- (xi) Hogyan tudunk DataFrame műveleteket megadni chatGPT-ben?
Házifeladat: Adatelemzési feladatok az órán tanult függvények segítségével