;
Hlavní navigace

Postavte datový sklad II.

23. 1. 2020
Doba čtení: 4 minuty

Sdílet

 Autor: © vege - Fotolia.com
Mezi klasickým a datovým skladem příliš mnoho analogií nenajdeme.

Budování DWH

Datový sklad je totiž z hlediska investic i objemu prací velmi náročný projekt. Proto se v některých případech přistupuje k budování datového skladu po částech, to znamená, že pro některé důležité organizační složky se vytvořily jakési podmnožiny datového skladu – datové trhy. Kromě ekonomického efektu má takový postup i psychologický efekt, protože fungující podmnožina datového skladu prohlubuje důvěru v úspěšnost a potřebnost datového skladu jako celku.

Datové trhy mohou vzniknout i opačným postupem čili nejdříve se vytvoří centrální integrovaný datový sklad a až z něj se pak vytvoří několik datových trhů.

Pravděpodobně nejdůležitějším krokem při budování datového skladu je výběr nejvhodnější metody. Musíme brát v úvahu nejen organizační strukturu a informační „kulturu“ firmy, ale předvídat i možné potíže, které se během budování datového skladu nevyhnutelně objeví. Snad nejznámější a nejčastěji používané jsou: metoda „velkého třesku“ a přírůstková metoda.

Mnohé firmy a vývojáři a možná i někteří konzultanti se domnívají, že je možné realizovat implementaci datového skladu pomocí jediného projektu. Výhodou metody „velkého třesku“ je skutečnost, že je možné celý projekt kompletně vypracovat ještě před začátkem jeho realizace. A protože budování datového skladu je dynamický proces, při kterém je téměř jisté, že se změní nejen technologie, ale i požadavky uživatelů, nelze tento fakt považovat za skutečnou výhodu.

Takže převažují spíše nevýhody, které lze vyjmenovat velmi stručně a jsou velmi závažné. Je zde jednak velké riziko změny požadavků a hlavně trvá velmi dlouhou dobu, dokud se projeví první výsledky obrovských investic do datového skladu, jinak řečeno, dokud se dostaví „hmatatelný“ obchodní zisk.

Přírůstková metoda, jinak nazvaná i evoluční, předpokládá budování datového skladu po jednotlivých etapách, tedy namísto vybudování celého datového skladu postupně přibývají přírůstková řešení, která samozřejmě zapadají do celkové architektury datového skladu. Začneme tedy budováním několika málo předmětných oblastí, typicky jedné nebo dvou.

Toto dílčí řešení implementujeme například jako škálovatelný datový trh a poskytneme ho koncovým uživatelům. Tím se částečně uspokojí „hlad“ managementu po návratnosti investic, protože první subsystémy začnou fungovat a přinášet výhody v krátkém čase po zahájení projektu. Když se dílčí řešení, navíc důsledně otestovaná skutečnými uživateli, osvědčí, můžeme do systému přidat další předmětnou oblast, čímž získáme novou funkcionalitu.

Přírůstkové budování datového skladu zachovává kontinuitu budovaného projektu s požadavky a potřebami uživatele, umožňuje implementovat škálovatelnou, tedy rozšiřitelnou architekturu a hlavně zajistí rychlejší zisk, a tedy i rychlejší návratnost investic.

Při přírůstkové metodě „shora dolů“ nejdříve na základě požadavků uživatelů vytvoří konceptuální model datového skladu, přičemž důležitou roli hraje stanovení hierarchie předmětných oblastí. Následně se sestaví konceptuální modely jednotlivých předmětných oblastí. Jinými slovy řečeno, postupně se vytvářejí datové trhy jednotlivých předmětných oblastí v rámci struktury datového skladu.

Tato metoda poskytuje poměrně rychlou implementaci jednotlivých datových trhů, a tím i návratnost investic. Ve srovnání s metodou „velkého třesku“ přírůstková metoda „shora dolů“ je zatížena podstatně menším rizikem, protože není tak náročná na analýzu. Mezi hlavní nevýhody patří zvýšené vstupní náklady dříve, než je možné předvídat návratnost investic.

Při přírůstkové metodě „zdola nahoru“ mají údaje prioritu před obchodním ziskem. Nejdřív se budují datové trhy předmětných oblastí ale v rámci struktury datového skladu. U této metody vystupuje do popředí IT oddělení podniku. Co se týče výhod a nevýhod, převažují nevýhody.

Jelikož se konceptuální model odvíjí od zdrojových systémů, je celková rozšiřitelnost v některých případech značně problematická. IT oddělení se v mnoha podnicích nepovažuje zrovna za „lídra“ v oblasti strategie a marketingu, proto se o mnohých připravovaných změnách a strategických záměrech dozvídá IT oddělení zpravidla jako poslední.

Proto mohou navrhnout a v některých případech i zrealizovat něco, co je už vzhledem ke strategickému záměru podniku již zastaralé. A navíc IT oddělení je zvyklé pracovat spíše s údaji než s informacemi, proto je úkol lídra pro IT oddělení ne vždy šťastným řešením.

Fáze přírůstkové metody

Úlohou fáze strategie je definovat cíle. Jednak cíl podnikání a také účel řešení datového skladu. Proto by fáze strategie měla být plně v rukou vrcholového managementu. V této fázi se definuje i základ architektury podnikového datového skladu.

Během fáze definice se jasně definuje rozsah a cíl přírůstkového vývoje. V této fázi se navrhuje jednak architektura datového skladu, jednak i architektura technických prostředků.

CS24

Cílem fáze analýzy je zaměřit se na informace ohledně uživatele, získávání dat a požadavků na přístup k datům na obchodní analýzu a rozhodování. Řeší se problémy kvality dat a stanoví požadavky na metadata. Cílem fáze návrhu je transformovat požadavky získané během fáze analýzy do detailních podmínek návrhu a dokončit instalaci technické architektury. Ve fázi sestavení se vytvoří a otestují navržené databázové struktury, moduly získávání dat, moduly správy datového skladu, moduly metadat, moduly přístupu k datům a sestavy a dotazy.

Závěrečnou fází je přechod do produkčního stadia. V této etapě se nainstaluje datový sklad a začne se používat nejdříve ve zkušebním režimu a následně i v ostrém provozu. Zároveň se zahájením provozu je nutné začít řídit růst a údržbu datového skladu.