Keskitettyjä tietovarastoja on suunniteltu usein joko tähtimallimenetelmällä (Kimball-tyyli) tai normalisoiduilla rakenteilla (Inmon-tyyli). Molempia menetelmiä on jouduttu sovittamaan alkuperäisestä tarkoituksestaan.
Dan Linstedtin kehittämä Data Vault -menetelmä on suunniteltu nimenomaan laajojen keskitettyjen tietovarastojen (EDW) suunnitteluun. Malli on kasvattanut koko ajan suosiotaan maailmalla ja mm. Hollannissa suurin osa tietovarastoista toteutetaan Data Vault -menetelmällä. Tietovarasto- ja Big Data -guru Rick van der Lans sanoo, että jokaisen tietovarastoa suunnittelevan täytyy aikakin tutkia Data Vault -menetelmä ja päättää sitten ottaako sen käyttöön.
Data Vault -menetelmän tukee hyvin tietovarastointia, joissa tarvitaan useiden tietolähteiden integrointia, muutosjoustavuutta ja helppoa laajennettavuutta. Menetelmässä on selkeä ja suoraviivainen tapa hoitaa tietojen historiointi. Erityisesti menetelmässä on panostettu tietojen jäljittämiseen ja auditointiin, mikä on osoittautunut tärkeäksi mm. viranomaisvaatimusten tiukentuessa (ns. compliance-vaatimukset). Vaikka menetelmä ei sellaisenaan soveltuisikaan, oppii kurssilla monenlaista hyödyllistä tietoa EDW -kannan mallintamismenetelmistä.
Kurssi sopii hyvin johdannoksi Data Vault 2.0 sertifiointikurssiin, joita kalenteristamme löytyy Cindi Meyersohnin pitäminä. Järjestämme koulutusta myös yrityskohtaisena toteutuksena, jota kannattaa miettiä ainakin jos teillä on jo tai on tulossa Data Vault 2.0 pohjainen keskitetty tietovarasto.
Yrityksemme perustaja Ari Hovi oli maailman ensimmäisiä sertifioituja Data Vault -mallintajia ja Euroopan ensimmäisiä Data Vault 2.0 Certified Practitioner – sertifioituja. Meillä on myös suora yhteys Data Vaultin kehittäjään Dan Linstedtiin.
Data Warehouse – arkkitehtuurit ja mallinnus
- eri arkkitehtuureihin sopivat mallinnusmenetelmät
- tähtimallinnuksen ja perinteisen ER-tietovarastomallinnuksen ongelmat
- tavoitteet hyvälle mallinnusmenetelmälle
Data Vault menetelmän taustaa
- menetelmän kehityshistoriasta
- taustalla olevat ideat ja arkkitehtuuri
- perusrakenteet
Data Vault menetelmän rakennuspalikat
- hubit, satelliitit ja linkit
- esimerkkejä ja ohjeita
- etenemisvaiheet
- harjoituksia
Tietojen käsittely ja laatuasiat
- missä tietoja jalostetaan ja johdetaan
- uusia ajatuksia laadun hoitamiseksi
Jäljitettävyys ja historiointi
- miksi jäljitettävyys on tärkeää
- jälitettävyysmenetelmät
- historiointimenetelmät
Data Vault -mallin arviointia
- soveltuvuusalueet, ongelmia ja ratkaisuja
- DW automaatio ja Data Vaultia tukevat tuotteet
- Data Vaultin rooli laajemmassa mallinnuksessa
Data Vault 2.0 piirteitä
- hajautusavain
- Menetelmistö, arkkitehtuuri ja malli
- tiedon virtualisointi
- Hadoopin niveltäminen mukaan
Koulutustapahtuman päivittäinen alkaminen ja päättyminen: koulutus 9:00-16.15.
Daily start and end of training event: training 9.00-16.15.