Hei,
Datanhallinan viitekehykseen liittyvän blogisarjan kolmas osa on nyt julkaistu!
Tällä kertaan kirjoittajana toimii konsulttimme Roope Rantanen, jonka osaaminen BI/DW-kehittämisestä on vertaansa vailla.
Ari Hovi itse on aikanaan kehittänyt kuuluisan ”Pöydänjalkamallin”. Se on viitekehys, jonka avulla tietoarkkitehtuuria ja tietojohtamista voidaan tarkastella erillisten osa-alueiden kautta.
Pöydänjalkamallin osa-alueet ovat:
- Datastrategia
- Työn organisointi
- Arkkitehtuuri + menetelmät
- Työkalut + teknologia
Vertaus pöydänjalkoihin tulee pöydän neljästä jalasta: mikäli jalkoja on vain yksi tai kaksi, pöytä ei pysy lainkaan pystyssä. Jos jalkoja on kolme, pysyy se jotenkuten pystyssä, mutta on vaarassa kaatua. Sen lisäksi, että pöydänjalkoja tulee olla oikea määrä, niin näiden tulee olla yhdenmittaisia. Pöytälevynä on organisaation tiedonhallinnan kulttuuri.
Vältä hypetystä ja irrallisia valintoja, kun kokoat teknologista työkalupakkia vaihtoehtojen valtamerestä
Azure vai AWS? Power BI vai Tableau? SQL Server vain Snowflake? Erilaisia datatyökaluja, teknologioita ja menetelmiä on monta laatua ja moneen eri tarkoitukseen. Työkaluja tulee koko ajan lisää kiihtyvällä tahdilla.
Eri teknologioiden ympärillä on hypetystä, ja pinnalla on yleensä aina joku tietty teknologia. Silti on myös vanhempia teknologioita, joiden tärkeys säilyy ja joiden kysyntä ei laske.
Teknologisen työkalupakin luominen on haastava prosessi, johon ei ole täydellistä ohjetta tai sääntöä. Ei ole väliä, onko kyseessä datan visualisointityökalu, tietovarastoautomaatiotyökalu vai pilvipalvelu, vaihtoehtoja on monia ja valinta kahden tai useamman työkalun välillä voi olla vaikeaa.
Tämän blogikirjoituksen tarkoitus on antaa eväitä uuden teknologisen työkalupakin tai ”Techstackin” suunnitteluun, luomiseen ja ylläpitoon.
Valintojen taustalla datastrategia
Kuten projektijohtamisessa, myös uusien teknologioiden valinnassa vaatimusten määrittely on hyvä ensimmäinen askel. On syytä ymmärtää, mitä halutaan saada aikaiseksi, millaisia valmiuksia tarvitaan ja mitkä ovat pidemmän aikavälin tavoitteet. Näitä tavoitteita kannattaa verrata oman datastrategian linjauksiin organisaation pidemmän aikavälin kehityksestä. Ei ole suositeltavaa, että datastrategia on ristiriidassa työkalustrategian kanssa. Tästä on hyvä lähteä liikkeelle työkalupakin rakennuksessa.
Seuraavaksi on hyvä arvioida suurimpia valintaan vaikuttavia tekijöitä. Monissa yrityksissä hinta saattaa olla se tärkein tekijä, muttei kuitenkaan kaikissa. Jotkin organisaatiot pitävät joustavuutta paljon tärkeämpänä, ja tämä vaikuttaa vahvasti myös työkaluihin ja teknologioihin.
Jo käytössä olevat työkalut voivat vaikuttaa myös suuresti, joko softa tai ”rauta” -puolen. Jos koko yritys käyttää Applen tietokoneita, sitoutuminen Microsoftin palveluihin täysin ei välttämättä ole ensimmäinen idea. Kannattaa siis miettiä riippuvuuksia muihin työkaluihin.
Työkalun tulevaisuus ja tila on myös hyvä ottaa huomioon. Joillekin työkaluille tulevaisuus ja jatkokehityssuunnitelmat eivät ole selkeitä ja tuki saattaa loppua. Jotkut työkalut taas eivät ole käytössä Suomessa laajasti, jolloin osaajien ja tekijöiden etsiminen voi olla vaikeaa.
Sidosryhmien kuunteleminen on myös erittäin tärkeää. Jos tärkeimmät yhteistyökumppanit käyttävät jotain tiettyä työkalua, voi olla hyödyllistä käyttää sitä myös itse. Asiakkaat voivat olla tottuneita saamaan raportit tietyssä muodossa tietyn teknologian avulla, jolloin työkalun vaihtaminen voi vaikuttaa paljonkin. Omat työntekijät saattavat olla osaavia jonkun teknologian kanssa, muttei toisen, joten heitäkin on aiheellista kuunnella.
Ytimestä liikkeelle kokonaiskuva säilyttäen
Tämän jälkeen on hyvä joko valita niin sanottu työkalupakin ydin tai verrata uutta hankittavaa työkalua siihen. Tähän ytimeen suuri osa muista teknologioista nojaa ja toivon mukaan myös integroituu hyvin.
Tietovarastokehityksessä se voi olla esimerkiksi Azure, jolloin on helppo valita muitakin Microsoftin tuotteita. Jos käytössä taas on Tableau voi, vois AWS on luontaisempi valinta. Microsoftin oma teknologiatarjooma on muutenkin tässä toimiva esimerkki. Microsoftilla on monia hyviä datatyökaluja ja alustoja, jotka toimivat saumattomasti yhdessä. Jos valitsee Azuren, on helppo valita mukaan myös Power BI, Office 365 jne. Jos kuitenkin arvostaa työkalujen joustavuutta, voi olla parempi valita kombinaatio eri toimittajien työkaluja.
Ytimen valinnan jälkeen on hyvä miettiä täydentävät työkaluja, jotka voivat tuoda sellaisia uusia kyvykkyyksiä, joita ytimen teknologiat eivät mahdollista. Tämä voi tarkoittaa esimerkiksi projektinhallinnan työkaluja. Uudet teknologiat ja työkalut menevät yleensä tähän kategoriaan, mutta on myös mahdollista, että työkalu halutaan heti ytimeen. On myös mahdollista, että jokin työkalu tai teknologia siirtyy ytimeen ajan kuluessa ja käytön kasvaessa. ETL-työkalut ja kiihdyttimet ovat hyvä esimerkki tästä. Näiden rooli voi olla aluksi pieni, mutta tilanne voi muuttua nopeasti, kun huomataan työkalujen toimintaa tehostava vaikutus. Tärkeää on kokonaisuuden hahmottaminen ja tilannekuva.
Viimeisenä vaiheena on työkalujen testaaminen ja jatkuva kehittyminen. Työkalut ja teknologiat löytävät oman paikkansa todella vasta käytössä ajan kuluessa. Tätäkin prosessia on hyvä seurata, hallita ja omia käyttäjiä ”valtaannuttaa” – tästä voisi kirjoittaa jopa toisen blogin. Teknologiat ja tarpeet kehittyvät koko ajan, joten itsereflektointi sekä omien työkalujen jatkuva analysointi on tärkeää, jotta omat kyvykkyydet pysyvät kehityksen vauhdissa.
Universaalit ja täydentävät työkalut
Oman henkilökohtaisen kokemukseni mukaan osa työkaluista menee kategoriaan ”universaalit” työkalut ja teknologiat. Nämä toistuvat data-ammattilaisten osaamisportfolioissa ja niitä ilman on käytännössä mahdotonta tehdä laajaa tietovarastokehitystä.
Universaaleja työkaluja ja teknologioita voisi pitää teknologisen työkalupakin ytimenä. Itse pidän tietovarastokehityksessä universaaleina työkaluina SQL:lää, jotain BI- ja visualisointi ohjelmistoa, esim. Power BI:tä sekä ymmärrystä jostain data platformista ja ohjelmointikielestä. Tiedon mallinnus ja mallinnustyökalun käyttö, esim. Ellie, on myös mielestäni erittäin tärkeää ja sovellettavissa todella laajalti. Tähän voisi lisätä vielä monia, mutta tietovarastokehityksessä näillä pääsee erittäin hyvin alkuun.
Toiset työkalut kuuluvat taas kategoriaan ”niche”. Nämä ovat verrattavissa täydentäviin työkaluihin ja ovat toimintaa tukevia, mutta eivät välttämättömiä. Nämä voivat myös siirtyä jossain vaiheessa universaalien työkalujen kategoriaan, kun käyttö kehittyy. Niche-kategoriaan kuuluvat myös uusimmat teknologiat ja työkalut. ChatGPT on ollut todella pinnalla viime aikoina, ja tämän hetken hypeteknologioita ovatkin tekoälyyn ja koneoppimiseen liittyvät työkalut, joiden merkitys kasvaa koko ajan.
Seuraa kehitystä
Pidän itse myös erittäin tärkeänä teknologian kehittymisen seuraamista sopivan kriittisellä otteella. Työkaluihin tulee jatkuvasti uusia ominaisuuksia ja välillä voi olla erittäin haastavaa pysyä kehityksen perässä.
Suosittelen seuraamaan aktiivisesti edes muutamia työkaluja ja teknologioita. Itse seuraan esimerkiksi Power BI:tä YouTubessa kerran kuukaudessa julkaistavilta videoilta, joissa kerrotaan sen uusista ominaisuuksista ja kehityssuunnasta.
Jatkuva oppiminen ja uteliaisuus toimii tässäkin.
Ystävällisin terveisin,
Roope Rantanen, konsultti
Ps. Alec Sharp tulee jälleen Suomeen, aiheena tällä kertaa Prosessien mallinnus.
Working With Business Processes Masterclass
Legendaarinen mallinnusguru Alec Sharp saapuu jälleen Helsinkiin vetämään live-koulutuksen! Aiheena on perinteisen Tietojen Mallinnuksen sijaan Prosessien Mallinnus.
Luvassa on jälleen Alecin tavaramerkiksi muodostunutta osallistamista, oikeita tapausesimerkkejä, käytännönläheisyyttä sekä hauskaa yhdessä tekemistä – tällä kurssilla opit varmasti!
Lisätiedot ja ilmoittautuminen tästä.