Data Literacy

Data Literacy – a hiányzó láncszem

Mi a Data Literacy?

Ez egy képesség. Az adatok olvasásának, elemzésének, kommunikációjának képessége. Azonban ez így nagyon általános, mást jelent elemzők szintjén és mást jelent az üzleti döntéshozók szintjén.

ELEMZŐK

Elemzők esetén a data literacy jelentése nem más, mint:

Adatokból más számára is értelmezhető információ kinyerésének képessége

És itt a kulcskifejezés a „más számára”! Ez több dolgot is jelent. Egyrészt hogy maguk az elemzések direkt válaszokat adjanak konkrét üzleti problémákra (ne legyen öncélú az elemzés), másrészt hogy az elemző ezt el is tudja magyarázni az üzleti oldal számára.

Na igen, ez utóbbi (azaz az elemzési eredmények bemutatása) általában az egyik Achilles sarka a Data Science projekteknek. Nézzük, hogy néz ki egy „tipikus” vezetői prezentáció ilyenkor:

  • adatok bemutatása
  • a forrás táblákból hogyan rakták össze az elemzési táblákat
  • hogyan kezelték a hiányzó értékeket és/vagy extrém értékeket
  • milyen „érdekes” eredmények jöttek ki (20-50 ábrán keresztül)
  • melyik modellező eljárásokat választották és hogyan paraméterezték ezeket
  • modellek kiértékelése (ROC, AUC)
  • javaslattétel

Szexi?

Nem mondanám. Egy ilyen prezentáció végig hallgatása embert próbáló feladat, még egy szakmabelinek is.

(tapasztalat: ha a prezentáció alatt nincs kérdés, akkor a hallgatóság nagy valószínűséggel nem értette az előadásodat, a kérdések hiánya sosem annak a jele, hogy szuper-érthető voltál)

De tegyük fel, hogy szerencsénk van, a túloldal érdeklődő és végighallgatott bennünket. Ekkor sem biztos, hogy mindent értett belőle.

ÜZLETI DÖNTÉSHOZÓK, MENEDZSEREK

Data Literacy készség esetükben a következőt jelenti:

adatelemzési eredmények, táblázatok, grafikonok olvasásának és értelmezésénék képessége

Napjainkban van bárki, aki ne tudna grafikonokat olvasni?

A qlik – 2018-as nagymintás kutatása szerint a döntéshozók közül csak 24%-a állította magáról, hogy magabiztos az adatok olvasásában, használatában. És ami még döbbenetesebb, hogy a fiatalok körében még ennél is alacsonyabb értéket, 21%-ot mértek („a jövő alkalmazottai”).

Miért fontos ez a készség?

Kezdjük az üzleti oldallal. Költői kérdés: vajon egy cégen belül mekkora eséllyel terjed el az adatelemzési kultúra, ha a döntéshozók többségének nehézséget okoz az adatelemzési eredmények olvasása és megértése.

Nem sok.

Azonban az adatelemzők oldalán is akad tennivaló. Nagyon fontos tudatosítani az adatelemzőkben, hogy minden projekt két szakaszból áll:

1.   Exploratory szakasz: ez az a szakasz, amiért megszerettük a szakmát. Ez az ún. „gyöngykeresés” időszaka, az óriási adattömegből a rejtette információk kinyerése. De van egy másik szakasz is.

2.   Explanatory szakasz: az eredmények, feltárt tudás átadásának szakasza. Gyakori tévedés, ha erre a szakaszra úgy tekintünk, mint a projektet lezáró „farkincára” (vagy még jellemzőbb, hogy a projekt „nyűgös” szakaszára). A projekt sikerét jelentősen növeli, ha erre a szakaszra, mint önálló projekt tekintünk. Ki kell válogatni a legérdekesebb eredményeket, ezeken belül is priorizálni kell, ki kell választani a legjobb adatvizualizációs megoldásokat, az se árt, ha az elemzési eredményeket, mint történet prezentáljuk (data-strorytelling egyre népszerűbb prezentációs technika). Sok esetben ezt a szakaszt érdemes másnak odaadni, nem minden szuperelemző képes a tudásátadásra.

Elsajátítható ez a készség?

A jó hír az, hogy igen. A rossz hír az, hogy ez egy hosszú folyamat. Ha valaki mégis el szeretne indulni Data Literacy készségeinek fejlesztésében, azok számára két kurzusomat ajánlom:

Sherlock: ahol olyan elemzési módszertanok kerülnek bemutatása, melyek segítségével az üzleti oldal számára (is) érthető információk kerülnek előállításra

Picasso: ahol olyan adatvizualizációs technikák kerülnek bemutatásra, melyek segítségével mások számára is jól értelmezhető diagramok készíthetők.