Hei,
Mietin kuluvalla viikolla yhtä asiaa, johtuen siitä, että olemme auttamassa useita isoja organisaatioita vaativissa datahankkeissa sekä tekoälyyn valmistautumisessa.
Osalta johtajista on tullut aika selvää viestiä, ettei digitalisointi ole edennyt halutusti. Ongelma on osaratkaisujen tuottaminen. Hankitaan tai teetetään jokin ohjelmisto, joka sisältää AI:n tai edistyneen analytiikan toiminnallisuuksia ja ajatellaan, että ollaan sitten datavetoisia. Se ei toimi niin.
Uskon, että tähän on olemassa kuitenkin ratkaisu. Se on eri osaajaheimojen yhteistyön optimointi. Mitä ovat sitten ovat nämä heimot? Ne ovat eri osaamisilla varustettuja ammattiryhmiä, jotka lähestyvät data & tekoäly asioita hieman eri kulmista. Heimoja määrittää osaaminen, mutta myös ikään kuin filosofia ja yleinen asenne.
Käyn läpi heimoja, koska lopulta heimojen välinen yhteistyö ratkaisee miten AI:ta ja muita uusia mahdollisuuksia kyetään hyödyntämään. Mihin heimoon itse kuulut?
Liiketoimintaheimo
Liiketoimintaheimo on päättänyt, että digitalisaatio on se juttu, johon on yksinkertaisesti pakko panostaa. Lähes kaikki aloitteet näihin hankkeisiin tulevat tältä heimolta ja he vastaavat lopputuloksesta. Usein liiketoimintaheimo on käynnistämässä uuden järjestelmän tai ERP:n hankintaa. Projektien eteneminen voi olla paikoittain tuskallista, koska jokainen heimo puhuu eri murretta, joista on hyvin vaikea saada selkoa. Liiketoimintaheimo on siksi usein pulassa, koska tuntuu etteivät muut heimot ymmärrä liiketoimintaa ja heille taas puhutaan liian teknisin termein.
Datan varastointi-heimo
Datan varastointi-heimon filosofia perustuu vahvasti datan keräämiseen operatiivisista järjestelmistä sekä ulkoisista lähteistä erilaisiin tietokantoihin, jossa sitä säilytetään ja ylläpidetään. Heille tärkeää on datan integrointi sekä raporttien tuotannollinen eheys. Heimon jäsenet osaavat tiedonmallinnusta, SQL:ää ja ovat mestareita kaivamaan dataa eri järjestelmistä. Taitavimmat heimon jäsenet ymmärtävät relaatiokantojen lisäksi NoSQL-kantoja ja Big Dataa, siis isoja volyymejä ei-strukturoitua dataa.
BI-heimo
BI-heimo on Datan varastointi-heimon sukulaisheimo, mutta pääpaino on datan kulutus, eikä niinkään varastointi. He tuntevat BI-ohjelmansa ja tietävät mihin se taipuu. BI-heimo ymmärtää liiketoimintaa sekä datan visuaalisen näyttävyyden merkityksen: he haluavat tehdä datasta mahdollisimman ymmärrettävä ja helppokäyttöistä liiketoimintaheimolle.
Data Science-heimo
Heimon jäsenet tutkivat dataa tilastollisin menetelmin, ja jos on taitava sellainen, hän tuntee myös koneoppimisen menetelmiä. Heimon jäseniä hieman harmittaa, että iso osa työstä kuluu datan kaivamiseen ja putsaamiseen; mieluiten he keskittyisivät hyvälaatuisen datan analysointiin. Dataan pitää olla myös mahdollisimman vapaa pääsy, kaikki governance -hommat ärsyttävät heitä. Data Science-heimon mentaliteetti on hyvin kokeileva. He haluavat testata eri hypoteeseja ja antaa datan puhua puolestaan. Jos annat heille tarpeeksi dataa, ennemmin tai myöhemmin he löytävät siitä potentiaalisesti hyödynnettäviä kaavoja.
Koodariheimo
Tämän heimon jäsenille dataan perustuvien sovellusten rakentaminen on keskiössä. He osaavat useita ohjelmointikieliä osaavat rakentaa web-, ja mobiilisovelluksia. Koodariheimo ei näe maailmaa datan kautta, vaan sovellusten toimivuuden ja käytettävyyden kautta. Nykyisillä open source -työkaluilla he pystyvät koodata nopeallakin aikataululla erilaisia sovelluksia ja käyttöliittymiä. Mikäli Data Science-heimo antaa heille kaavan, niin hyvä koodari osaa automatisoida kyseisen toiminnon. Koodariheimo jakautuu useisiin alaheimoihin, joilla omat kielensä.
IT-heimo
Organisaatioilla on tietysti IT-heimo, joka usein valvoo kaikkia heimoja ja toimii mahdollistaja. Tämä heimo on usein pahassa ristipaineessa, koska liiketoimintaheimo
Arkkitehtiheimo
Kokonaisarkkitehdit yrittävät katsoa järjestelmiä, prosesseja, tietoja ja teknologiaa kokonaisvaltaisesti, yrityksen tasolla. He pyrkivät standardoimaan ratkaisuja, jotta joka osastolla ei tehtäisi omia ratkaisuja. Vertauskuvallisesti että ei tehtäisi ysiköittäin ”voimalaitos- ja viemärijärjestelmiä” vaan käytettäisiin valmiita, yhteisiä ratkaisuja ja näin jäisi paukkuja oikeaan kehitykseen. Master Data-heimo on sukulainen. He pyrkivät harmonisoimaan tuote- ja asikastietoja ja parantamaan datan laatua.
Yhteenveto
Mikäli haluat olla datalla ohjautuva ja olla ensimmäisten joukossa toimivien tekoälyratkaisujen hyödyntämisessä, on näiden heimojen pelattava yhteen.
Työnjako voi olla seuraava: Datan varastointi-heimo pitää huolta, että dataa on laajasti valmiina ja se on laadultaan hyvää. BI-heimo pyrkii varmistamaan, että datat ymmärretään ja siihen käyttöliittymän avulla pääsy. Arkkitehtiheimo yrittävät kuvata dataa yli sovellus- ja organisaatiorajojen. Data Science-heimo tutkii dataa hyödyntäen edistynyttä analytiikka, neuroverkkoja ja koneoppimista. Koodariheimo auttavat automatisoinnissa sekä tekoälyn kehittämisestä taustalle. IT-heimo varmistaa, että käytössä on tarvittavat teknologiat ja työkalut on päivitetty. Liiketoiminnan tavoitteiden pitäisi tietysti olla kaiken takana. Liiketoimintaheimo tuo pöytään bisnesnäkökulman, rahoituksen ja tutkii alati uusien ratkaisujen kaupallisia mahdollisuuksia.
Kuulostaa helpolta, mutta onko yllä kuvattu yhteistyö mahdollista, jos yhteinen kieli puuttuu? Vaarana on, että määrityksiä ja mallinnuksia tehdään eri heimoissa uudestaan ja uudestaan eri näkökulmista ja heimojen välinen kommunikointi jää puutteelliseksi.
Olen pitkään kehittänyt tähän menetelmää, jota kutsun Hovi Data Frameworkiksi. Menetelmän avulla voidaan kerralla luoda kuvaukset, jotka hyödyttävät kaikkia heimoja. Voidaan luoda yhteinen kieli, datan kieli.
Tähän näytetään nyt panostettavan, koska kalenterini on tilauksista täynnä. Meillä aloitti juuri Jukka Nevalainen, aivan huippukaveri dataosaamisen suhteen, mutta hänenkin kalenterinsa täyttyi heti. Eli jos tiedätte data-alan osaajia, joita kiinnostaa todella mielenkiintoiset projektit isojen organisaatioiden parissa, niin pistäkää vinkkiä.
Tulevia valmennuksia ja koulutuksia:
Suosittelen Mike Fergusonin tilaisuutta erittäin lämpimästi, sillä aihe on erittäin ajankohtainen Data Lake. Mukana puolueeton katsaus moniin uudentyyppisiin ja kiinnostaviin tuoteperheisiin: Data Wrangling tools, Data Glossary Products, Information Catalog Products ja Audit & Data Protection Products.
Kurssin nimi on siis:
Building an Enterprise Data Lake, 02.11.2017
Lisätietoa kurssista löytyy tästä
Data Vaultin kehittäjä Dan Linstedt vetää jälleen sertifioinnin sisältävän:
Data Vault 2.0. Bootcamp + Certification 06.11.2017 – 08.11.2017
Lisätietoa kurssista löytyy tästä
Kolmas erittäin mielenkiintoinen uusi kurssi olisi:
Data Quality in practice, 22.11.2017
Tällä kurssilla käydään läpi miksi ja miten datan laadun hallinta (Data Quality Management, DQM) tuodaan osaksi liiketoimintaa ja sen kehitystä. Kurssin jälkeen tiedät, mitä onnistuneen DQM-hankkeen toteuttaminen vaatii eri vaiheissa liiketoimintahyötyjen kartoittamisesta aina prosessien jalkauttamiseen asti.
Lisätiedot kurssista löytyy tästä