17.01.2018

Datan hyödyntämisen lähtökohta

Kaikki minut tuntevat tietävät, että olen aina asiakasprojekteissa pyrkinyt edistämään siiloutuneiden datojen saamista käyttöön, yli organisaatioyksikköjen rajojen.

Ja mihin dataa sitten tänä päivänä tarvitaan? Keskeisimpiä alueita ovat johdon raportointi, liiketoiminnan automatisointi, prosessien optimointi sekä tuote, -sekä sovelluskehitys. Me emme voi tehdä mitään näistä kokonaisvaltaisesti ilman dataa ja datan ymmärrystä. Puhumattakaan tekoälyn kehittämisestä.

Datat ovat siis piilossa ja tietysti yleinen ratkaisu tähän on EDW:n (Enterprise Data Warehouse). Mutta on yksi asia, jonka ratkominen on vieläkin tärkeämpää.

Palaan siihen pian, ensin muutama perusasia datasiiloista.

 

Mitä on datasiilot?

Kaikki data liiketoiminnastamme on It-järjestelmien (esim ERP, CRM, HRM) tietokannoissa. Eli jokaisella järjestelmällä on ns ”purkki” jossa kunkin järjestelmän datat ovat. Sitten meillä on ulkoisia lähteitä kuten internet (kotisivut, some yms), sensorit, koneet ja laitteet. Näistä tuleva data kertyy yleensä erillisiin datasetteihinsä. Meillä on siis hyvin monta erillistä purkkia.

Purkeissa oleva data on monessa eri muodossa, kuten numeroina, tauluina, kuvina, tekstinä tai vaikkapa videokuvana. Esimerkiksi tuotteisiin tai asiakkaisiin liittyviä tietoja saattaa olla yllättävän monessa eri järjestelmässä. Tämä data on potentiaalisesti kiinnostavaa, sitä halutaan tutkia ja analysoida, mutta se työlästä ja hidasta, koska data on hajallaan purkeissa ja eri muodossa.

Kaikki tämä johtuu siitä, että IT-järjestelmien toimittajat tekevät niistä suljettuja umpipurkkeja. Sille ei voi oikein mitään, mutta asiakas voi toki tilausvaiheessa vaatia, että haluaa datat itselleen, erikseen, ladattavaksi tietovarastoon (Data Warehouse).

Nyttemmin puhumme Data Platformista, joka toimii ikään kuin keskusvarastona kaikelle datalle. Se kannattaa tehdä. Jokainen isompi yritys tarvitsee sellaisen, ellei sitä jo ole.

Mutta jopa isompi asia on se, että myös ihmiset ovat samaan tapaan siiloissa, osaajasiiloissa.

 

Mitä sitten ovat osaajasiilot?

Organisaatiot on organisoitu toimintoihin, sanotaan tässä vaikkapa eri osastoihin. Kukin osasto pyrkii hankkimaan parhaat järjestelmät toiminnan tehostamiseksi ja palvelemaan osaston tavoitteita. Helposti ajatellaan, että nämä ovat meidän osaston datoja. Ne ovat kuitenkin koko organisaation tietoja ja saattavat olla hyvin kiinnostavia, kun ne yhdistetään naapuriosaston tietoihin.

Myös It-puolella on eriytyneitä porukoita, kirjoitinkin osaajaheimoista jo aikaisemmin. On monta eri koulukuntaa, paradigmaa ja lähestymistapaa asioihin. Jo pelkästään data-ala on jakautunut, esim DW/BI-, Data Science- ja koodaajaheimoihin. Esim agile-heimo saattaa olla ihan toiselta planeetalta tietovarastoheimon kanssa.

 

Mitä voidaan tehdä?

Organisaatiot toimivat monilta osin hyvin, vaikka toimitaan erillisissä yksiköissä. Yhteistyötä on hoidettu matriiseilla ja yhteisillä tukifunktioilla, kuten hankinta, HR ja talous. Niissä katsotaan yli organisaatiorajojen. Datan kanssa tilanne on sikäli toinen, että on voitava yhdistää eri osastojen dataa. Tämä tarkoittaa, että on voitava entistä paremmin tehdä yhteistyötä. Miten voisimme edistää yhteisymmärrystä?

Yhteistyö lähtee kommunikoinnista. Esteenä hyvälle kommunikoinnille ovat usein erilaiset näkemykset käsitteistä, puutteelliset tiedot toisen alueesta ja myöskin epämääräinen kieli. Käytetään erilaisia termejä, joiden merkitystä ei ole määritelty.

Käsite- ja tiedonmallinnusmenetelmät auttavat juuri näihin ongelmiin. Oikein vedettynä mallintaminen lisää keskinäistä ymmärrystä, selkiyttää käsitemaailmaa ja mahdollistaa huomattavasti paremmat data-alueen ratkaisut. Väittäisin, että mallintaminen on jatkossa suorastaan edellytys datakeskeisen organisaation menestykselle.

Itselleni ovat käsite- ja tiedonmallnnusmenetelmät olleet ehdottomasti tärkein menetelmä konsultin urallani. Juuri niiden avulla olemme onnistuneet niin monessa tietovarastoprojektissa ja korjanneet niin monta pieleen mennyttä sellaista.

Kuitenkin monien mielestä nämä työt vievät liikaa aikaa ja ovat vaikeita. Tätä ongelmaa helpottaakseni olen, kuten moni jo tietääkin, kehittänyt oman tavan mallintaa, jota kutsumme nimellä HDF-menetelmä (Hovi Data Framework). Menetelmä mahdollistaa laajankin alueen mallintamisen nopeammin ja selkeämmin.

Uusi sovellus – Ellie

Nyt viemme asiaa vielä pidemmälle: digitalisoimme HDF-menetelmän pilvipohjaiseksi sovellukseksi nimeltä Ellie. Se tukee mallintamistyötä HDF-konseptien mukaisesti ja auttaa kokemattomampaakin mallintajaa pääsemään eteenpäin.

Tärkeä osa Ellietä on tehostaa yhteistyötä eri osaajien helposti jaettavien mallien ja kuvausten avulla. Datakartat ovat heti kaikkien asianomaisten saatavilla, eri osaajasiilojen välilläkin. Ominaisuudet tukevat mallien jakelua, kommentointia ja esittämistä.

Ellien käyttäjät pääsevät muita edelle, koska tietävät datojensa sijainnit sekä niiden määritykset. Autan tälläkin hetkellä lukuisia organisaatioita tekemään parempia päätöksiä järjestelmähankinnoissa tai tietovarastohankinnoissa hyödyntäen menetelmääni. Uuden järjestelmän avulla se voidaan tehdä entistäkin tehokkaammin.

Nyt on mielenkiintoinen aika menossa, kun pääsen tätä kehittämään eräiden suomen johtavien sovelluskehittäjien ja palvelumuotoilijoiden kanssa. Tuomme Ellien sitten kaikkien saataville, kunhan olemme yhden asiakkaan kanssa sitä työstänyt hieman pidemmälle.

Ystävällisin terveisin,

Ari Hovi & tiimi

 

PS. Kannattaa katsastaa tuleva huippuvalmennus, datavaikuttajan Mike Fergusonin tilaisuus:

Enterprise Data Governance & Master Data Management, 22.03.2018 – 23.03.2018

Data Governance ja MDM ovat tiedonhallinnan keskiössä nyt 2018. Suosittelemme tätä Suomessa ensi kertaa järjestettävää tilaisuutta kaikille tiedonhallinan asiantuntijoille, tule siis mukaan oppimaan ja verkostoitumaan muiden kanssa.
Lue lisää tästä

Saattaisit olla kiinnostunut myös näistä

Microsoft Fabric: Shortcuts

Lue lisää

Data Lakehouse -projektit käytännössä: Kokemuksia asiantuntijoilta

Lue lisää

Eettinen tiedonkäyttö: Vastuullisuuden peruspilarit

Lue lisää