18.01.2017

Business Intelligence vai Data Science?

Datan tarjoamisessa liiketoiminnan päätöksenteon tueksi on pitkä historia. On puhuttu päätöksenteon tukijärjestelmistä, tietovarastoinnista ja Business Intelligencestä. Muutama vuosi sitten analytiikka nousi uudeksi termiksi. Big Data –hype toi paljon uutta tälle alueelle. Nyttemmin puhutaan Data Sciencestä, ennustamisesta, algoritmien kehittämisestä ja tekoälystä. Yhä useampi organisaatio palkkaa tai kouluttaa nyt Data Scientistejä. Ovatko nämä uusimmat kehitykset korvaamassa aiemmat teknologiat, kuten tietovarastoinnin ja Business Intelligence –ratkaisut?

Alan kehitys ei ole poistanut yhtä perusongelmista, nimittäin tietojen siiloutumista erillisiin järjestelmiin.  Tietojärjestelmiä – tai appseja – tarvitaan eri tarpeisiin, ja kunkin toiminnon johtaja pyrkii hankkimaan omalle toiminnolle parhaan järjestelmän. Samalla eri sovellusten sisälle syntyy tärkeiden tietojen talletuspaikkoja. Tiedot siis siiloutuvat hajalleen eri järjestelmiin.

Data Lake –arkkitehtuurissa pyritään tallettamaan kaikki tiedot eri järjestelmistä – ja usein myös ulkoisista lähteistä – raakamuodossa Hadoopiin. Tämä on hyvä asia, tiedot saadaan näin lähemmäksi analyysiä. Hadoopin lisäksi tarvitaan useimmiten mallinnettu tietovarasto, jotta siiloutuneet raakatiedot saadaan valmiiksi yhdisteltyä Business Intelligence –kerrosta varten. Tietovarastolla on siis roolinsa edelleen.

Business Intelligence –ratkaisuissa selvitetään liiketoiminnan tietotarpeita ja laaditaan niille sopivia käyttöliittymiä ja visualisointia. Ratkaisut rakennetaan tuotantoon, automatisoidaan ja testataan. Vaikka työ on ehkä vähemmän seksikästä kuin Data Scientistien työ, se on jatkossakin tarpeellista ja tärkeää.

Data Scientistit hakevat datasta uudenlaisia, usein piilossa olleita riippuvuuksia. He kehittävät algoritmeja ja ennustemalleja. He hakevat pikatoimituksella taustadataa liiketoiminnan uusille päätösideoille. Työ sisältää datan kertaluonteista muokkaamista, koeasetelmien laatimista ja tilastollisten mallien käyttämistä. Mukaan tulee usein talon ulkopuolelta saatavaa dataa, kuten some-dataa tai markkinatutkimusdataa.  Data Scientistit haluavat paljon yksityiskohtaista raakadataa eri lähteistä, ja datan volyymit saattavat olla isot.  Hadoop alustana tarjoaa tähän laskentatehoa suhteellisen edullisesti.

BI –vakioraportoinnin ja Data Sciencen väliin sijoittuu alue, jota on kutsuttu ad hoc –kyselyiksi. Uusille tietotarpeille tehdään nopeasti räätälöityjä kyselyitä, usein kertakäyttöön. Nyttemmin alueen laajentumana voidaan pitää ns. itsepalvelu BI:tä. Idea on, että osa liiketoimintaihmisistä itsenäisesti osaa tutkia, muokata ja analysoida dataa. SQL:n lisäksi alueen tuotteiden kehitys on ollut nopeaa.  On toivottavaa, että yhä useampi kouluttautuisi omatoimiseksi datan hakijaksi, eräänlaisiksi kevyemmän sarjan Data Scienteitiksi.

Alueen voikin siis jakaa kolmeen osaan. Ensinnäkin vakiintunut, testattu tuotanto – BI, toiseksi itsepalvelutyyppinen kysely ja analysointi ja viimeisenä raskaan sarjan Data Science. Ne yritykset pärjäävät, jotka jatkuvasti kehittävät asiantuntijoitaan kaikkien näiden alueiden osaamisessa. Lopuksi muistutus, että on ymmärrettävä mitä tietoja meillä on ja mitkä ovat rakenteet. Tässä auttaa käsitemalliinnus.

Saattaisit olla kiinnostunut myös näistä

Tiedonhallinnan alueen suuria nimiä

Lue lisää

Uudistamme laajasti Ari Hovin koulutuksia ja toimintaa

Lue lisää

Vältä hypetystä ja irrallisia valintoja, kun kokoat teknologista työkalupakkia vaihtoehtojen valtamerestä

Lue lisää