Skladovanie údajov
Čo je to sklad údajov?Skladovanie údajov je elektronické ukladanie veľkého množstva informácií firmou alebo organizáciou. Skladovanie údajov je dôležitou súčasťou podnikovej inteligencie, ktorá využíva analytické techniky obchodných údajov.
Koncept skladovania údajov predstavili v roku 1988 vedci IBM Barry Devlin a Paul Murphy. Potreba skladovania údajov sa vyvíjala s tým, ako sa počítačové systémy stávali komplexnejšími a riešili rastúce množstvá údajov. Kľúčovou knihou o skladovaní údajov je WH Inmon's „Building the Warehouse“, ktorá bola prvýkrát vydaná v roku 1990 a odvtedy bola niekoľkokrát dotlačená.
Ako funguje ukladanie údajov
Skladovanie údajov sa používa na poskytnutie lepšieho prehľadu o výkonnosti spoločnosti porovnaním údajov konsolidovaných z viacerých heterogénnych zdrojov. Dátový sklad je navrhnutý tak, aby spúšťal dotaz a analýzu historických údajov odvodených z transakčných zdrojov.
Po začlenení údajov do skladu sa tieto údaje nezmenia a nemôžu sa zmeniť, pretože dátový sklad vykonáva analýzu udalostí, ktoré sa už vyskytli zameraním sa na zmeny v údajoch v priebehu času. Skladové údaje musia byť uložené spôsobom, ktorý je bezpečný, spoľahlivý, ľahko získateľný a ľahko spravovateľný.
Existujú určité kroky, ktoré sa podnikli na vytvorenie dátového skladu. Prvým krokom je extrakcia údajov, ktorá zahŕňa zhromažďovanie veľkého množstva údajov z viacerých zdrojových bodov. Po skompilovaní údajov prechádza vyčistením údajov, procesom vyčesávania údajov za chyby a opravou alebo vylúčením akýchkoľvek nájdených chýb.
Vyčistené údaje sa potom skonvertujú z formátu databázy do formátu skladu. Akonáhle sú údaje uložené v sklade, údaje prechádzajú triedením, konsolidáciou, sumarizáciou atď., Aby boli koordinovanejšie a ľahšie použiteľné. S postupom aktualizácie viacerých zdrojov údajov sa do skladu pridáva viac údajov.
Kľúčové jedlá
- Skladovanie údajov je elektronické ukladanie veľkého množstva informácií firmou alebo organizáciou.
- Dátový sklad je určený na spúšťanie dotazov a analýz historických údajov získaných z transakčných zdrojov na účely podnikovej inteligencie a získavania údajov.
- Skladovanie údajov sa používa na poskytnutie lepšieho prehľadu o výkonnosti spoločnosti porovnaním údajov konsolidovaných z viacerých heterogénnych zdrojov.
Osobitné úvahy: Dolovanie údajov
Podniky môžu skladovať údaje na použitie pri prieskume a ťažbe údajov a hľadajú vzory informácií, ktoré im pomôžu zlepšiť ich obchodné procesy. Dobrý systém skladovania údajov môže tiež uľahčiť prístup rôznych údajov k rôznym oddeleniam spoločnosti.
Napríklad dátový sklad môže spoločnosti umožniť ľahké vyhodnotenie údajov obchodného tímu a pomôcť pri rozhodovaní o tom, ako zlepšiť predaj alebo zefektívniť oddelenie. Podnik sa môže rozhodnúť zamerať na výdavkové zvyky svojich zákazníkov, aby lepšie umiestnil svoje výrobky a zvýšil predaj.
Vďaka skladovaniu údajov môže spoločnosť zhromažďovať historické údaje o výdavkoch svojich zákazníkov v minulosti - povedzme 20 rokov - a analyzovať tieto údaje. Výsledné informácie by mohli poskytnúť pohľad na preferencie jeho spotrebiteľov; čas dňa, mesiaca alebo roka s vyšším predajom; alebo zákazník s najvyššou spotrebou za daný rok.
Efektívne ukladanie a správa údajov sú tiež to, čo umožňuje procesy, ako napríklad iniciovanie cestovných rezervácií a používanie bankomatov.
Proces získavania údajov je rozdelený do piatich krokov:
- Organizácie zhromažďujú údaje a načítajú ich do svojich dátových skladov.
- Potom ukladajú a spravujú údaje buď na interných serveroch alebo v cloude.
- Obchodní analytici, manažérske tímy a profesionáli v oblasti informačných technológií majú prístup k údajom a určujú, ako ich chcú usporiadať.
- Aplikačný softvér potom triedi údaje na základe výsledkov používateľa
- Koncový užívateľ konečne prezentuje údaje v ľahko zdieľateľnom formáte, ako je napríklad graf alebo tabuľka.
Skladovanie dát verzus databázy
Dátový sklad nemusí byť nevyhnutne ten istý koncept ako štandardná databáza. Databáza je transakčný systém, ktorý je nastavený na monitorovanie a aktualizáciu údajov v reálnom čase, aby boli k dispozícii iba najnovšie údaje. Dátový sklad je naprogramovaný na agregáciu štruktúrovaných údajov za určité časové obdobie. Napríklad databáza môže mať iba najnovšiu adresu zákazníka, zatiaľ čo dátový sklad môže mať všetky adresy, v ktorých zákazník žil posledných 10 rokov.
Porovnať investičné účty Názov poskytovateľa Opis Zverejnenie informácií inzerenta × Ponuky uvedené v tejto tabuľke pochádzajú od partnerstiev, od ktorých spoločnosť Investopedia dostáva kompenzácie.