softprojekt  > produkty a riešenia  > DWH & BI  

DWH & Business Intelligence

Koncept dátových skladov a multidimenzionálnych databáz predstavuje v architektúre podnikových IS samostatnú vrstvu, ktorá má za úlohu integrovať dáta z rôznych dátových zdrojov, transformovať ich a ukladať v štruktúrach, ktoré umožňujú ich efektívnu a rýchlu analýzu. Naša spoločnosť ponúka vývoj špecifických zákazníckych riešení z tejto oblasti na báze produktov Oracle. Databáza Oracle od verzie 9i Release2 obsahuje priamo v databázovom servery už kompletnú podporu pre OLAP a pre datamining. Výhoda integrácie je zrejmá. V klasickom riešení potrebujeme databázový server, OLAP server, server alebo engine pre datamining, nehovoriac o nutnosti presunu veľkého množstva údajov medzi týmito servermi.

Integrácia údajov z rôznorodých dátových zdrojov

Podnikové IS sa v našich podmienkach, za obdobie posledných desiatich rokov zameriavali najme na automatizáciu základných obchodných procesov. Tisíce či dokonca milióny elementárnych transakcií (informácii), ktoré je nutné zachytiť v základných produkčných systémoch predstavuje obrovské množstvo "surových dát", ktoré je treba analyzovať. Jednotlivé systémy IS navyše môžu byť realizované na rôznej technologickej platforme. Navyše je takmer pravidlom, že pri tvorbe analýz a prehľadov využívame množstvo ďalších informácii, ktoré sa v základných produkčných systémoch nenachádzajú. Sú to väčšinou pomocné agendy na riešenie oblastí plánovania a rozpočtovania a pod. Často na tento účel bývajú používané štandardné kancelárske aplikácie napr. Excel. A naopak, stáva sa, že v rôznych produkčných systémoch bývajú uložené tie isté informácie len z iného pohľadu. Úlohou dátového skladu je tieto dáta v plánovaných intervaloch načítavať, transformovať prípadne "čistiť" a ukladať v databáze.

Dátové štruktúry orientované procesne verzus predmetne

Dátové štruktúry v dátovom sklade sú na rozdiel od štruktúr v produkčných systémoch, navrhované tak aby umožňovali efektívnu analýzu údajov. Transakčné systémy zachytávajú jednotlivé obchodné procesy. Napríklad obchodný proces zachytávajúci výdaj materiálu zo skladu je implementovaný zberovou obrazovkou "Výdaj" a informácie z tohto procesu sú ukladané do tabuľky "Výdajky". Takto navrhnuté dátové štruktúry možno označiť ako procesne orientované. Naproti tomu dáta v dátovom sklade (DataWarehouse - DWH) sa orientujú na ukladanie faktov o konkrétnej sledovanej entite napríklad výrobok, odberateľ a pod. nezávisle na tom, v ktorom procese informácia vznikla.

Ďalšie dôležité pojmy z terminológie DWH

Fakty - faktami označujeme jednotlivé sledované veličiny, ktoré majú byť analyzované, napr. tržby, náklady a pod. Dimenzie - alebo klasifikačné premenné, charakterizujú jednotlivé pohľady na základe, ktorých fakty analyzujeme, napr. k faktu "TRŽBA" môže byť priradená hodnota dimenzie "výrobok", "obchodný partner" a pod. Dimenziou, ktorá sa opakuje takmer pri každom fakte je "čas", ktorá nám umožňuje analyzovať fakty z historického hľadiska. Dôležitou vlastnosťou dimenzií je možnosť definovať im hierarchiu (stromovú štruktúru). Tá umožňuje analyzovať dáta v rôznej úrovni hierarchie danej dimenzie (t.j. v rôznej úrovni detailnosti). Napríklad fakt "tržby" možno prezerať na úrovni:
  • skupina výrobkov a v prípade potreby prezerať detailné údaje na úrovni
    • akosť, alebo ešte nižšie na
      • vyrobok
Data Cube - dátová kocka - dátová štruktúra spájajúca množinu faktov a dimenzií, ktorá môže mať dopredu predpočítané fakty pre všetky zoskupenia dimenzií. To umožňuje vykonávať veľmi rýchle dotazy.
Datamart - dátový trh - podmnožina údajov špecializovane vybratá z dátového skladu pre účely konkrétnych potrieb časti užívateľov, napríklad ako zdroj tvorby skupiny reportov a pod.
OLAP - On Line Analytical Procesing - multidimenzionálna analýza, t.j. rýchle prezeranie dát sumarizovaných podľa rôznych dimenzií a na rôznych úrovniach.
Data Mining - dolovanie dát - Ide o špecializované techniky pre spracovanie veľkých objemov dát a hľadanie skrytých vzorov a súvislostí.
Copyright © Softprojekt Consulting