Overfitting
// KÉPZÉS CÉLJA
A prediktív modellezés során számos olyan csapdahelyzet van, amibe mi elemzők sokszor beleesünk. Egyik ilyen probléma a túltanítás. Annak ellenére, hogy a szakirodalom számos megoldást kínál a túltanulás elkerülésére, különböző data science versenyek eredményei azt mutatják, hogy ebbe a csapdába sokan beleesnek. A kurzus célja néhány olyan technika bemutatása, melyek betartásával elkerülhető a modellek túltanítása.
// KÉPZÉS TEMATIKÁJA
Elmélet:
- Mi a túltanítás és "sweet spot" fogalma?
- Milyen mintavételezési eljárások vannak? Ezeknek mi a szerepe a modellezésnél? Mintavételezés hogyan befolyásolja a modell teljesítményét?
- Mi a cross-validation és hogyan működik a gyakorlatban? Miért nem alkalmas a túltanítás megelőzésére?
- Hogyan mérhető egy modell stabilitása?
Gyakorlati blokk (Python kódokon keresztül):
- Hogyan tudunk modellezni cross-validation mintavételezéssel?
- Hogyan tudjuk mérni megtalálni a ténylegesen legjobb modellt? "Sweet spot" megtalálására írt Python kód bemutatása
- "Sweet spot" vizualizációja (plotnine csomag ggplot függvényével )
// KINEK AJÁNLOM
Adatelemzőknek, adatmérnököknek, de végül is mindenkinek, aki adatelemzéssel foglalkozik.
// DÍJ
39.000 Ft + ÁFA
// MIKOR ÉS HOL?
2023.05.05 - Kiscsoportos képzés keretében tartom személyesen (Bartók Béla út 105-113. I/B, Budapest 1115 - kiselőadó)