Overfitting
// KÉPZÉS CÉLJA
A prediktív modellezés során számos olyan csapdahelyzet van, amibe mi elemzők sokszor beleesünk. Egyik ilyen probléma a túltanítás. Annak ellenére, hogy a szakirodalom számos megoldást kínál a túltanulás elkerülésére, különböző data science versenyek eredményei azt mutatják, hogy ebbe a csapdába sokan beleesnek. A kurzus célja néhány olyan technika bemutatása, melyek betartásával elkerülhető a modellek túltanítása.
// KÉPZÉS TEMATIKÁJA
Elmélet:
- Mi a túltanítás és "sweet spot" fogalma?
- Milyen mintavételezési eljárások vannak? Ezeknek mi a szerepe a modellezésnél? Mintavételezés hogyan befolyásolja a modell teljesítményét?
- Mi a cross-validation és hogyan működik a gyakorlatban? Miért nem alkalmas a túltanítás megelőzésére?
- Hogyan mérhető egy modell stabilitása?
Gyakorlati blokk (Python kódokon keresztül):
- Hogyan tudunk modellezni cross-validation mintavételezéssel?
- Hogyan tudjuk mérni megtalálni a ténylegesen legjobb modellt? "Sweet spot" megtalálására írt Python kód bemutatása
- "Sweet spot" vizualizációja (plotnine csomag ggplot függvényével )
// KINEK AJÁNLOM
Adatelemzőknek, adatmérnököknek, de végül is mindenkinek, aki adatelemzéssel foglalkozik.
// DÍJ
39.000 Ft + ÁFA
// MIKOR ÉS HOL?
2024.03.07 - Kiscsoportos képzés keretében tartom személyesen (Bartók Béla út 105-113. I/B, Budapest 1115 - kiselőadó)
Cégek kérhetnek kihelyezett tréninget minimum 3 fős létszámtól. Ebben az esetben van lehetőség arra, hogy a tréning során bemutatott példák, esettanulmányok az adott cég üzleti profiljához legyenek igazítva. Egyedi ajánlat kérésére email-ben vagy a honlap online regisztrációs felületén van lehetőség.