Data- ja analytiikkajohtajien kaksi suurinta haastetta ovat Gartnerin mukaan kulttuuri ja tiedonlukutaidon (Data literacy) puute.
MItä nämä kaksi oikeastaan tarkoittavat?
Datavetoisesta kulttuurista on puhuttu jo jonkun aikaa, joten monilla on siitä jonkinlainen käsitys. Ainakin se tarkoittaa toimintatapaa, jossa päätökset perustuvat dataan.
Kokonaisuudessaan se on kuitenkin hyvin laaja käsite, jonka voi ymmärtää kukin omalla tavallaan. Tiedonlukutaito on mahdollisesti vieläkin täsmentymättömämpi käsite.
Miten Gartner kuvaa tiedonlukutaidon?
”Gartner defines data literacy as the ability to read, write and communicate data in context, including an understanding of data sources and constructs, analytical methods and techniques applied — and the ability to describe the use case, application and resulting value.”
Vaikka määritelmä on selkeää englantia, ei tämä vielä konkretisoi asiaa kovinkaan tarkasti. Ainakin tämän voi ymmärtää hyvin monella tapaa. Palaan myöhemmin siihen, miten itse ymmärrän tiedonlukutaidon. Tarkastellaan ensin vähän tiedonlukutaidon taloudellista merkitystä yrityksille ja organisaatioille.
Yritykset hyödyntää dataa ovat vaarassa epäonnistua
David Dadoun pelifirmasta nimeltä Ubisoft piti Tukholmassa Data Innovation Summit 2020 -konferenssissa ansiokkaan esityksen tiedonlukutaidosta.
Hän eritteli muutamien faktojen avulla sitä, mitä tiedonlukutaidon puute maksaa yrityksille. Hän aloitti panostuksista, joita yritykset satsaavat data- ja analytiikka-aloitteisiin.
Pelkästään vuoituiset tekoälypanostukset kasvavat lähes 100 miljardiin dollariin globaalisti jo vuonna 2023. Data Science -aloitteista kuitenkin yleisesti vain 13% päätyy tuotantoon asti.
Toisaalta tarkasteltuna niistä aloitteista, jotka ovat analyyttisesti tarkasteltuna menestyksekkäitä – eli tuottavat analyyttisiä oivalluksia – ainoastaan 20% kääntyy liiketoiminnallisiksi tuloksiksi. Vaikka näistä lähtötiedoista ei pysty laskemaan tarkkaa lukuarvoa, selvää on, että valtaosa 100 miljardin panostuksista valuu hukkaan.
Dadounin mukaan keskeisin syy surkeisiin tuloksiin on organisaatioiden tiedonlukutaidon puute.
Mitä tiedonlukutaidon puute maksaa yrityksille?
PItäisikö panostukset data-, analytiikka- ja tekoälyhankkeisiin sitten lopettaa? Ovatko ne hukkaan heitettyä rahaa?
Eivät keskimäärin. Kolikon toinen puolihan on se, että niilllä jotka onnistuvat, voivat tuotot olla satumaisia. Tarkastelemalla listaa maailman arvokkaimmista yrityksistä nähdään, että panostukset tuottavat.
Vaikka unohdettaisiin nämä piilaakson gorillat, tavallisiakin yrityksiä tarkastelemalla huomataan, että panostukset dataan, analytiikkaan ja tekoälyyn tuovat laaja-alaista kilpailutetua. Forbes-lehdessä tiivistettiin asia seuraavasti:
”McKinsey Global Institute indicate that data driven organizations are 23 times more likely to acquire customers, six times as likely to retain those customers, and 19 times as likely to be profitable as a result.”
Datavetoiset yritykset lyövät siis kilapailijansa keskimäärin kaikilla toiminnan osa-alueilla. Yrityksillä ei ole varaa olla panostamatta dataan.
Jos David Dadounin ohjeita seuraa, yritysten tulee edelleenkin panostaa dataan, mutta pitää huolehtia tiedonlukutaidon kehityksestä organisaatiossa.
Pitäisikö hänen arvionsa hyväksyä sellaisenaan? Ainakin hänen arvionsa on linjassa monien omien omien havaintojemme kanssa.
Meitä pyydetään usein auditoimaan asiakkaidemme data- ja analytiikkahankkeita ja niissä toteutettuja ratkaisuja.
Usein johtopäätös on seuraavan suuntainen:
Tekijät ovat olleet ammattilaisia, ja he ovat tehneet oikeansuuntaisia teknologia- ja arkkitehtuuriratkaisuja. He ovat siis tehneet asiat keskimäärin oikein. Kuitenkaan hankkeet eivät ole välttämättä toteuttaneet liiketoiminnan tavoitteita. Tai itse asiassa tavoitteet itsessään ovat olleet usein epäselviä. Toisin sanoen ei ole osattu tehdä oikeita asioita.
Asiakkaamme ovat saattaneet käyttää miljoonia tekemällä asioita oikein, mutta tulokset eivät ole tyydyttäviä, koska on tehty vääriä asioita. Tällä on suora yhteys omaan määritelmääni tiedonlukutaidosta, johon palaan seuraavaksi.
Meidän kokemuksemme mukaan siis tiedonlukutaidon puute maksaa paljon myös suomalaisille organisaatioille.
Mitä tiedonlukutaito konkreettisesti tarkoittaa?
Tiedonlukutaito tarkoittaa kykyä lukea, mitä data meille kertoo.
Datasta voi muodostaa kuvaajia, joista voidaan tarkastella trendejä. Onko myynnissämme vuodenaikojen mukaista syklisyyttä. Voidaanko syklisyyden läpi nähdä myynnissä trendinomaista nousua tai laskua.
Toisenlaisella kuvaajalla voidaan tarkastella asioiden välistä korrelaatiota ja pohtia mahdollisia syyseuraussuhteita. Sopivalla kuvaajan akselien valinnalla voidaan havaita myös muutoksia, jotka muuten jäisivät huomaamatta. Muhimasssa oleva epidemia voidaan havaita, kun ymmärretään, että meidän pitää seurata asioiden kehittymistä logaritmisella asteikolla.
Perusymmärrys tilastollisista lainalaisuuksista auttaa kriittisessä tarkastelussa siitä, onko havaittu muutos trendiomainen vai onko kyseessä kenties vielä satunnaisuuteen liittyvä ”kohina”.
Nämä kaikki taidot auttavat hahmottamaan sitä, mitä data meille kertoo.
Osaamme analysoimme asioita oikein, mutta analysoimmeko oikeita asioita?
Tiedonlukutaitoon kuuluu keskeisesti myös kyky lukea, mitä data itse asiassa kuvaa.
Kuvaako data koko kuluttajamarkkinaa? Kuvaako data kaikkia kuluttaja-asiakkaita Suomessa?
Vai kuvaako data sitä osajoukkoa kuluttaja-asiakkaista, jotka on satuttu kyselytutkimuksessa tavoittamaan? Esimerkiksi niitä asiakkaita, jotka viettävät aikaansa kauppakeskuksissa silloin, kun kyselytutkimuksen tekijät ovat toimistotyöajan puitteissa niihin jalkautuneet. Tällöin aineistossa lienee aliedustettuina työssä käyvät.
Tämä tieto voi olla keskeinen – tai sitten ei ole – riippuen käyttötarkoituksesta. Keskeistä on, että tiedon käyttäjä tietää mitä data itse asiassa kuvaa.
Tällaisissa yksinkertaisissa tapauksissa riittää, että tiedon hyödyntäjä vaivautuu tarkastelemaan datan sisältöä tarkemmin ja osaa kriittisesti arvioida, mitä se tarkoittaa.
Monimutkaisemmissa tapauksissa asia ei välttämättä ratkea dataa tarkastelemalla.
Teollisen tuotantolaitoksen ongelmien juurisyistä ei välttämättä löydy vihjeitä pelkästään logitietoja tarkastelemalla. Datasta ei välttämättä hyppää esille, että virhetilanteet syntyvät tietyllä komponentttinimikkeen ja komponentin toimittajan yhdistelmällä.
Yksi tapa auttaa tässä on tiedon mallintaminen. Tietomalli, joka kertoo että tuotannossa käytetään samoja komponenttinimikkeitä eri toimittajilta, antaa suoran vihjeen siitä, mitä varitaatioita tulisi analysoida.
Asiayhteys – se mihin kaikkeen muuhun dataan tarkasteltava data liittyy – auttaa ymmärtämään, mitä data itse asiassa kuvaa. Gartner kuvasi tätä sanoilla ”data in context”.
Kumpi tulee ensin, datavetoinen kulttuuri vai tiedonlukutaito?
Alussa todettiin, että data- ja analytiikkajohtajien kaksi suurinta haastetta ovat kulttuuri ja tiedonlukutaidon puute.
Tässä kirjoituksessa on kuitenkin keskitytty vain jälkimmäiseen.
Datavetoisen kulttuurin kehittäminen on laaja kokonaisuus ja kokonaan erillisen blogikirjoituksen aihe, tai useamman.
Kuitenkin näiden kahden suhdetta voidaan tarkastella miettimällä, kumpi oli ensin kulttuuri vai lukutaito. Puhun tässä nyt kulttuurista yleisesti ja tavallisesta lukutaidosta.
En osaa vastata kumpi oli ensin. Sen kuitenkin muistan historiantunneilta, että lukutaidon kehitys on ollut keskeinen ellei keskeisin moottori kukoistavien kulttuurien kehitykselle.
Uskon että tiedonlukutaidon kehitys on samoin keskeisin moottori organisaation datavetoisen kulttuurin kehitykselle.
Ystävällisin terveisin,
Hannu Järvi