Big Data? Nielen efektívne, ale aj kvalitne

Ne­dô­ve­ra k fi­rem­ným dá­tam je úpl­ne bež­ná vec. Pod­ľa pries­ku­mov až jed­na tre­ti­na biz­nis líd­rov ne­dô­ve­ru­je dá­tam, na zá­kla­de kto­rých sa roz­ho­du­je a až po­lo­vi­ca tvr­dí, že pre svo­ju prá­cu ne­ma­jú v pod­ni­ko­vých sys­té­moch kom­plet­né dá­ta.

Prob­lé­my s dá­to­vou kva­li­tou ve­dú nie­len k nee­fek­ti­vi­te, ale aj k nes­po­koj­nos­ti zá­kaz­ní­kov ale­bo ku stra­te príj­mov. Zlé dá­ta sú pri­tom čas­to uvá­dza­né ako dô­vod zly­ha­nia pri pro­jek­toch zá­vis­lých od in­for­má­cií z rôz­nych ob­las­tí or­ga­ni­zá­cie.

Dá­to­vá kva­li­ta je cha­rak­te­ris­ti­ka, kto­rá de­fi­nu­je spo­ľah­li­vosť dát pre roz­ho­do­va­cie pro­ce­sy a jej zá­klad­ný­mi vlas­tnos­ťa­mi sú:

  • kom­plet­nosť - dá­ta mu­sia ob­sa­ho­vať všet­ky re­le­van­tné úda­je ako nap­rík­lad všet­ky úč­ty, ad­re­sy ale­bo vzťa­hy pre da­né­ho zá­kaz­ní­ka,
  • pres­nosť - bež­ným ne­dos­tat­kom sú prek­le­py, zlá di­ak­ri­ti­ka, skrat­ky ale­bo rôz­ne pou­ži­té syn­ony­má,
  • dos­tup­nosť - dá­ta by ma­li byť dos­tup­né tak, aby uží­va­te­lia k nim ma­li prís­tup bez zby­toč­né­ho ma­nuál­ne­ho trie­de­nia a vy­hľa­dá­va­nia,
  • ak­tuál­nosť - in­for­má­cie mu­sia byť čer­stvé a pos­kyt­núť pres­nú pod­po­ru pri roz­ho­do­va­ní,
  • jed­not­nosť - in­for­má­cie z rôz­nych sys­té­mov mu­sia byť kon­zis­ten­tné na­prieč or­ga­ni­zá­ciou.

Pri sú­čas­nej zá­pla­ve dá­to­vý­mi zdroj­mi a expo­nen­ciál­nym ná­ras­tom ob­je­mu dát mô­že byť ťaž­ké udr­žať dá­ta v po­ža­do­va­nej kva­li­te. Ak chce­te vy­užiť po­ten­ciál všet­kých in­for­má­cií, je ne­vyh­nut­né po­lo­žiť pev­né zá­kla­dy ria­de­nia "ži­vot­né­ho cyk­lu" dát po­mo­cou jas­ne de­fi­no­va­ných pro­ce­sov a nás­tro­jov na to ur­če­ných.

big data.jpg

Dá­ta mu­sia byť správ­ne de­fi­no­va­né a iden­tic­ky chá­pa­né v rám­ci ce­lej or­ga­ni­zá­cie. Nás­tro­je dá­to­vej kva­li­ty umož­nia de­fi­no­vať jed­not­né poj­my v or­ga­ni­zá­cii a pre­dí­du ne­do­ro­zu­me­niam me­dzi biz­ni­som a IT. Per­cen­tuál­na mie­ra nák­la­dov mô­že zna­me­nať nie­čo iné pre od­de­le­nie, kto­ré se­dí o pos­chodie niž­šie len pre­to, že vy­uží­va iný sys­tém na zís­ka­va­nie in­for­má­cií. Myl­ná inter­pre­tá­cia mô­že spô­so­biť kom­pli­ká­cie me­dzi za­mes­tnan­ca­mi, ale aj klien­ta­mi.

De­fi­ní­ciu dát a ich vzťa­hov je vhod­né vy­ko­nať v ana­ly­tic­kej fá­ze pro­jek­tu a je pred­pok­la­dom pre ply­nu­lú im­ple­men­tá­ciu rie­še­nia dá­to­vej kva­li­ty. De­fi­ní­cie sa zhro­maž­ďu­jú v jed­not­nom slov­ní­ku, kto­rý umož­ňu­je jed­no­du­chý prís­tup všet­ký­mi zú­čas­tne­ný­mi stra­na­mi. Správ­na de­fi­ní­cia je tak dos­tup­ná aj pri ko­mu­ni­ká­cii s klien­tom. Čis­te­nie dát je po­tom pro­ces, kto­rý za­bez­pe­ču­je nie­len kva­li­tu, ale aj jed­not­ný poh­ľad a tzv. "je­di­nú prav­du" v rám­ci or­ga­ni­zá­cie.

Sys­té­mo­vé rie­še­nie mu­sí byť nie­len schop­né rie­šiť dá­to­vú kva­li­tu, ale umož­ní ria­diť tok in­for­má­cií, ich ana­lý­zu a in­teg­rá­ciu s os­tat­ný­mi sys­té­ma­mi. Nap­rík­lad in­for­má­cie o tej is­tej oso­be mô­žu byť v or­ga­ni­zá­cii ulo­že­né na rôz­nych mies­tach - mô­že to byť zá­kaz­ník, za­mes­tna­nec ale­bo par­tner - a in­for­má­cie o tej­to oso­be mô­žu byť v rôz­nych sys­té­moch. Zá­ro­veň kaž­dá in­for­má­cia mô­že byť de­fi­no­va­ná rôz­ne na­prieč or­ga­ni­zá­ciou. Vzhľa­dom na tú­to zlo­ži­tosť, in­teg­rá­cia in­for­má­cií, za­bez­pe­če­nie kva­li­ty a správ­nej inter­pre­tá­cie umož­ňu­jú efek­tív­ne roz­ho­do­va­nie. Pro­ces umož­ňu­je po­ro­zu­me­nie dá­to­vých zdro­jov a ich vzá­jom­ných vzťa­hov. Uží­va­te­lia by si tak ma­li ve­dieť po­zrieť, od­kiaľ dá­ta po­chá­dza­jú a aký­mi tran­sfor­má­cia­mi preš­li. Dos­ta­nú tak kom­plet­nú in­for­má­ciu a po­pis dát, kto­ré pou­ží­va­jú.

Rie­še­nie kva­li­ty dát je kon­ti­nuál­ny pro­ces a nie jed­no­ra­zo­vý pro­jekt. Z vý­sku­mu vy­ply­nu­lo, že dá­ta kon­ti­nuál­ne deg­ra­du­jú rých­los­ťou 2% me­sač­ne. To zna­me­ná, že na je­den mi­lión zá­zna­mov mož­no oča­ká­vať dvad­sať­ti­síc poš­ko­de­ných úda­jov za je­den me­siac. Mo­ni­to­ro­va­nie sta­vu kva­li­ty umož­ňu­je vlas­tní­kom dát zís­kať in­for­má­ciu o ak­tuál­nom sta­ve dát, iden­ti­fi­ká­ciu prob­lé­mov a mož­nos­ti ich rie­še­nia. V pr­vom ra­de je však ne­vyh­nut­né ur­čiť vlas­tní­kov dát a správ­cu kva­li­ty, kto­rý sa sta­rá o pl­ne­nie po­žia­da­viek de­fi­no­va­ných biz­ni­som.

Vy­tvá­ra­nie de­fi­ní­cií pre správ­ne pá­ro­va­nie dát z dá­to­vých zdro­jov je ča­so­vo ná­roč­né. Čas­tok­rát je nut­né pra­co­vať s de­siat­ka­mi sys­té­mov, pri­čom je nee­fek­tív­ne ma­nuál­ne vy­tvá­ra­nie a sprá­va de­fi­ní­cií a al­go­ryt­mov na kaž­dom sys­té­me zvlášť. Rie­še­nie dá­to­vej kva­li­ty je kom­plexná té­ma a pre­to je vhod­né vy­brať správ­ny nás­troj, kto­rý do­ká­že vý­znam­ne uľah­čiť nie­len na­sa­de­nie, ale aj sprá­vu ta­ké­ho sys­té­mu. Dneš­né nás­tro­je už ma­jú pred­vyt­vo­re­né množ­stvo fun­kcií pre pá­ro­va­nie dát, ich skó­ro­va­nie a vy­hod­no­te­nie prav­de­po­dob­nos­ti. Tak­tiež umož­ňu­jú rie­šiť slov­ník de­fi­ní­cií, do­pa­do­vú ana­lý­zu ale­bo in­teg­ro­vať nás­troj do Mas­ter Da­ta Ma­na­ge­ment rie­še­nia. Kom­plexné ce­lo­pod­ni­ko­vé rie­še­nie kva­li­ty dát tak vý­znam­ne po­má­ha pri ope­ra­tív­nom ria­de­ní ale aj tak­tic­kom a stra­te­gic­kom roz­ho­do­va­ní.

Ju­raj Hrap­ko, In­for­ma­tion Ma­na­ge­ment Tech­ni­cal Spe­cia­list, DB2 IBM Slo­ven­sko

ju­raj.hrap­ko@sk.ibm.com



Ohodnoťte článok:
   
 

24 hodín

týždeň

mesiac

Najnovšie články

Roz­ho­vor: Pre zá­kaz­ní­ka je kľú­čo­vé, keď server­ov­é rie­še­nia do­ká­žu rásť spo­lu s ním a s je­ho ak­tuál­ny­mi po­žia­dav­ka­mi
ĽUBOŠ ŠENKERY pôsobí od decembra 2007 ako produktový manažér pre oblasť štandardných serverov v spoločnosti HP. Venuje sa projektom predaja serverov HP ProLiant na slovenskom trhu. čítať »
 
Ná­kup tech­no­ló­gií v pod­ni­koch
V priebehu augusta 2014 uskutočnila redakcia Infoware v spolupráci so spoločnosťou GRENKELEASING, s.r.o., prieskum o nákupe technológií v podnikoch. čítať »
 
Re­por­táž: VMware vFO­RUM 2014
Softvérovo definovaný podnik, investičné a technologické stratégie, ako si môžu firmy udržiavať konkurencieschopnosť v ére mobilných riešení a cloudu, zotavenie po havárii komponentov IT infraštruktúry... To boli len niektoré z tém podujatia VMware vFORUM 2014, ktoré sa konalo v Prahe. čítať »
 
Tla­čo­vé za­ria­de­nia pre ma­lé, stred­né a veľ­ké fir­my
Zariadenia pre tlač dokumentov v podnikovom prostredí ako aj procesy ich využívania sa priebežne optimalizujú. čítať »
 
Ana­lý­za tr­hu – tla­čiar­ne, ko­pír­ky a mul­ti­fun­kčné za­ria­de­nia
Digitalizácia dokumentov a procesov s nimi súvisiacich spôsobila revolúciu v ukladaní, zdieľaní a výmene dokumentov. čítať »
 
TCO: Nao­zaj vie­te, aká je ce­na pre­vádz­ky IT?
Riešenia v oblaku priniesli viac jasna. Kým v minulosti bolo vyhodnocovanie celkových nákladov na vlastníctvo informačných technológií zložitým porovnávaním množstva položiek, cloud vyhodnocovanie viacerých možností jednoznačne zjednodušuje. čítať »
 
TCO vs. ROI ale­bo Je pre­vádz­ka IT iba nák­la­do­vá po­lož­ka?
Prevádzka IT sa typicky považuje za nákladovú položku. Je to však skutočne tak? Sú náklady jediné kritérium, podľa ktorého vieme rozhodnúť, ktorý model, služba, systém, riešenie je lepšie? čítať »
 
Da­ta­cen­ter Cla­ri­ty LC – tran­spa­ren­tnosť infra­štruk­tú­ry dá­to­vých cen-tier
Spoločnosť Siemens rozšírila portfólio pre dátové centrá o riešenie Datacenter Clarity LC. Ide o systém DCIM (Data Center Infrastructure Management), ktorý umožňuje prepojenie IT manažmentu s facility manažmentom. čítať »
 
 
 
  Zdieľaj cez Facebook Zdieľaj cez Google+ Zdieľaj cez Twitter Zdieľaj cez LinkedIn Správy z RSS Správy na smartfóne Správy cez newsletter