Datawarehouse
Hvad er datawarehouse?
Et Datawarehouse er en tilpasset kopi af data fra
virksomhedens økonomi- og andre produktionssystemer. I et datawarehouse
lægges data til rette i en ny datamodel, der gør det lettere og
hurtigere at foretage dataanalyse.
Der findes mange variationer af datawarehouse i form af såkaldte
Data Marts. Du har måske stødt på begreber som:
- Kuber
- In-memory
- Dice/terning
- Analysis Services
- osv.
Teknologien bag disse begreber kan være vidt forskellig, men fælles
for dem alle er, at data kopieres fra økonomisystemet til en ny
database, som altså bliver et skyggesystem.
Hvad bruges Datawarehouse til?
Et datawarehouse kan være nødvendigt for at opnå et effektivt
business intelligence system og ses især hos større virksomheder. Et
datawarehouse er en databasebaseret infrastruktur, med et tilhørende sæt
programmer, der henter, transformerer og renser data fra virksomhedens
kildesystemer og lagrer de behandlede data i en særlig databasestruktur,
der er optimeret til rapportering og analyse.
Et Datawarehouse kan være nødvendigt hvis f.eks.:
- Data skal hentes og integreres fra flere datakilder
- Data skal "renses" inden det er muligt at lave rapportering og
analyse
- Kildesystemerne ikke har kapacitet til at foretage de
beregninger, der skal understøtte rapportering og analyse
Der kan også være andre grunde, men dette er de mest almindelige.
Da mindre virksomheder typisk har de fleste data samlet i ét
økonomisystem og har begrænsede datamængder, vil det sjældent være
nødvendigt at bygge et datawarehouse. For mindre virksomheder er det
også ofte mere oplagt at foretage "datarens" i selve økonomisystemet
frem for at gøre det udenfor, i et separat system.
Acinta Intelligence Suite er et såkaldt dual-mode business
intelligence system, der både kan arbejde med et datawarehouse og
direkte med virksomhedens økonomisystem - et såkaldt virtuelt
datawarehouse.
Omkostninger ved Datawarehouse
Eftersom konstruktion af et datawarehouse er
forbundet med betragtelige omkostninger og krav uddannelse og
specialviden, bør det kraftigt overvejes, om behovene for at lave et datawarehouse kan
retfærdiggøre de meromkostninger, som et datawarehouse vil medføre.
Konstruktion af datawarehouse og tilhørende ETL processer (Extract
Transform Load) tegner sig skønsmæssigt for omkring 75% af løsningens
samlede omkostninger i både tid og penge.
Hvis der er tvivl om, hvorvidt et datawarehouse er nødvendigt, så bør
du starte med et virtuelt datawarehouse. Hvis dette ikke kan løfte
opgaven tilfredsstillende kan løsningen opgraderes til en datawarehouse
løsning uden nævneværdige meromkostninger sammenlignet med at bygge
datawarehouse platformen i første skridt.
Fordele og begrænsninger
Det er vigtigt at bemærke, at der ikke er nogen funktionelle
begrænsninger i et virtuelt datawarehouse sammenlignet med et
traditionelt datawarehouse. Faktisk har det nogle funktionelle fordele:
- adgang til live data
- mulighed for drill-through til det komplette
datagrundlag/transaktioner
- hurtigere validering og justering af data i rapporter
Fordelene ved et datawarehouse er muligheden for at foretage
avanceret integration og transformation af data fra flere datakilder,
bedre svartider samt mindre belastning af kildesystemerne, hvis disse
ikke har kapacitet til dynamiske beregninger. Men det er altså kun hvis
man har disse udfordringer, at Datawarehouse er nødvendigt.
|