Data Discovery - objavovanie vzorov v dátach

Dnes hý­bu sve­tom biz­ni­su nie­len pe­nia­ze, ale hlav­ne in­for­má­cie. V tej­to in­for­mač­nej do­be sa na dá­ta, ako aj na nás­tro­je na ich spra­co­va­nie kla­dú vy­so­ké ná­ro­ky. Tren­dom je, aby kaž­dý pro­ces v spo­loč­nos­ti bol me­ra­teľ­ný - či už ob­jek­tív­ny­mi, ale­bo sub­jek­tív­ny­mi pa­ra­met­ra­mi, na zá­kla­de kto­rých by bo­lo mož­né hod­no­tiť jed­not­li­vé pro­ce­sy a zlep­šo­vať ich kva­li­tu.

Sna­hy kvan­ti­fi­ko­vať kaž­dý pro­ces ma­jú za nás­le­dok vznik veľ­kých ob­je­mov dát, a čo je hor­šie, čas­to v rôz­nych for­mách. Dá­ta pred­sta­vu­jú v pod­sta­te len čí­sel­ne hod­no­ty da­né­ho pa­ra­met­ra. Dô­le­ži­tosť, resp. in­for­mač­nú hod­no­tu pre spo­loč­nosť zís­ka­va­jú prá­ve spra­co­va­ním a pre­zen­tá­ciou, te­da vi­zua­li­zá­ciou.

Da­ta Dis­co­ve­ry je biz­ni­so­vo orien­to­va­ná ar­chi­tek­tú­ra, za­me­ra­ná na inter­ak­tív­nu ko­mu­ni­ká­ciu a spo­lup­rá­cu me­dzi pou­ží­va­te­ľom a sof­tvé­rom pri vy­tvá­ra­ní re­por­tov a ich vi­zua­li­zá­cií v akej­koľ­vek for­me. Pod­ľa Jill Dy­che, vice­pre­zi­den­tky SAS zod­po­ved­nej za kľú­čo­vé stra­té­gie pre zá­kaz­ní­kov a ana­lý­zy tr­hu z ob­las­ti sprá­vy dát, je Da­ta Dis­co­ve­ry de­fi­no­va­né ako „ob­ja­vo­va­nie vzo­rov v dá­tach".

Tech­ni­ka a spô­sob zob­ra­zo­va­nia dát a ich nás­led­ná pre­zen­tá­cia mô­žu pos­kyt­núť vý­ho­du na tr­hu, ako aj spô­so­biť ne­do­zer­né ško­dy. Pre­to ob­lasť spra­co­va­nia a vi­zua­li­zá­cia dát by sa ne­ma­li pod­ce­ňo­vať.

Data_discovery_SK.jpg

Sof­tvé­ro­vé pros­tried­ky ur­če­né na spra­co­va­nie a vi­zua­li­zá­ciu veľ­ké­ho ob­je­mu dát a hlav­ne ich vý­voj v pos­led­ných ro­koch dá­va­jú ob­rov­ský pries­tor, ako sa rých­lej­šie, efek­tív­nej­šie a hlav­ne preh­ľad­nej­šie orien­to­vať tak­mer vo všet­kom, čo sa v spo­loč­nos­ti de­je. V čom je mo­del Da­ta Dis­co­ve­ry ta­ký prev­rat­ný op­ro­ti bež­né­mu mo­de­lu bu­si­ness in­telli­gen­ce?

No­vá vl­na v IT spo­čí­va v sna­he na­vo­diť inter­ak­tív­nu ko­mu­ni­ká­ciu me­dzi po­čí­ta­čom, resp. sof­tvé­rom a člo­ve­kom ako pou­ží­va­te­ľom. Vý­sled­ný efekt je správ­ne vy­vá­že­nie zruč­nos­tí pou­ží­va­te­ľa s fun­kcio­na­li­tou sof­tvé­ru. A prá­ve rých­la reak­cia na pou­ží­va­te­ľo­vu inter­ak­ciu s okam­ži­tým vý­sled­kom ro­bí z ar­chi­tek­tú­ry Da­ta Dis­co­ve­ry tech­no­ló­giu bu­dúc­nos­ti.

Pô­vod­ný mo­del bu­si­ness in­telli­gen­ce pra­cu­je s my­šlien­kou, že pou­ží­va­teľ sa pý­ta raz. Kaž­dá ďal­šia otáz­ka, kto­rá sa ob­ja­ví, ge­ne­ru­je no­vý re­port. Te­da pou­ží­va­teľ má mož­nosť vstu­po­vať do ce­lé­ho pro­ce­su spra­co­va­nia iba na za­čiat­ku, kde de­fi­nu­je svo­je ob­me­dzenia. Ak je ne­vyh­nut­né po­žia­dav­ku zme­niť, pod­ľa tra­dič­né­ho mo­de­lu sa za­čí­na od za­čiat­ku. Naj­chy­bo­vej­ší stroj je člo­vek, a pre­to za­čí­nať pri ne­patr­nej chy­be stá­le od za­čiat­ku a ab­sol­vo­vať krí­žo­vú ces­tu za­dá­va­nia ob­me­dze­ní či dl­hé ča­ka­nie na spra­co­va­nie vstu­pu na vý­stup nie je veľ­mi efek­tív­na ces­ta na­rá­ba­nia s dá­ta­mi.

Prin­cíp je ta­ký, že nas­le­du­jú­ci krok sa za­čal až po skon­če­ní pre­doš­lé­ho. V kon­tras­te s tým je tech­no­ló­gia Da­ta Dis­co­ve­ry, kde sa dá­ta spra­cú­va­jú v ča­se, to zna­me­ná, že aká­koľ­vek zme­na vstup­ných pod­mie­nok sa okam­ži­te pre­miet­ne do vý­stup­né­ho zob­ra­ze­nia dát. Pou­ží­va­teľ mô­že mať od­po­veď na svo­ju otáz­ku okam­ži­te, resp. je­ho otáz­ka mô­že byť vy­me­ne­ná za lep­šiu a vý­stiž­nej­šiu, a to ih­neď bez ov­plyv­ne­nia os­tat­ných ob­me­dze­ní. Tá­to ar­chi­tek­tú­ra dá­va pou­ží­va­te­ľo­vi naj­väč­ší zo všet­kých be­ne­fi­tov a šet­rí naj­cen­nej­šiu „su­ro­vi­nu" dneš­ka - čas.

Na trend so všet­kým inter­ago­vať za­ča­li, po­cho­pi­teľ­ne, rea­go­vať aj vý­rob­co­via sof­tvé­ru, kto­rí sa pred­bie­ha­jú v po­nu­ke nás­tro­jov na vi­zua­li­zá­ciu a spra­co­va­nie big da­ta. Nie­že­by tie­to vi­zua­li­zač­né nás­tro­je bo­li až ta­ká no­vin­ka, skôr ide o to, že bo­li pre 70 % pou­ží­va­te­ľov ná­roč­né na po­cho­pe­nie. V pos­led­ných ro­koch prud­ko stú­pol do­pyt po „user friend­ly" nás­tro­joch toh­to ty­pu. Na tú­to pot­re­bu za­ča­li rea­go­vať aj hlav­ní ven­do­ri toh­to ty­pu sof­tvé­ru, ako Tib­co Spot­fi­re a Tab­leau.

Da­ta Dis­co­ve­ry kla­die dô­raz na po­ten­ciál spo­lup­rá­ce ume­lej in­te­li­gen­cie a schop­nos­ti člo­ve­ka, kto­rý je, ako bo­lo ve­ľak­rát do­ká­za­né, väč­ší ako po­ten­ciál člo­ve­ka, resp. ume­lej in­te­li­gen­cie sa­mos­tat­ne. Mô­že­te dať nes­kú­se­né­mu šo­fé­ro­vi aj naj­rý­chlej­šie auto na sve­te, po­kiaľ bu­de jaz­diť na dvoj­ke v pra­vom pru­hu, pre­te­ky ne­vyh­rá.

Na dru­hej stra­ne skú­se­ný člo­vek do­ká­že aj z Exce­lu vy­ča­riť bri­lant­ný inter­ak­tív­ny nás­troj na spra­co­va­nie, vi­zua­li­zá­ciu a pre­zen­tá­ciu vý­sled­kov. Sof­tvé­ro­vé nás­tro­je na spra­co­va­nie dát sme­ru­jú k jed­no­du­chos­ti, inter­ak­ti­vi­te, rých­los­ti a roz­ma­ni­tos­ti.

Da­ta Dis­co­ve­ry nie je len no­vý typ sof­tvé­ru, ale aj no­vý poh­ľad na spra­co­va­nie dát, kto­rý pos­tup­ne sme­ru­je k poz­na­niu, že naj­lep­ší sof­tvér je zdra­vý se­dliac­ky ro­zum. Je to ta­kis­to spo­lup­rá­ca me­dzi pou­ží­va­te­ľom a sof­tvé­rom s pres­ne roz­de­le­ný­mi úlo­ha­mi. Úlo­hou sof­tvé­ru je rých­lo a inter­ak­tív­ne spra­cú­vať veľ­ké ob­je­my dát a zro­zu­mi­teľ­ne ich pou­ží­va­te­ľo­vi zob­ra­zo­vať. Nám os­tá­va už len správ­ne sa pý­tať.

Ján Ku­ku­ru­gya, Sys­tem Ad­mi­nis­tra­tor Li­nux, T-Sys­tems Slo­va­kia s.r.o.
jan.ku­ku­ru­gya@t-sys­tems.sk

Zdroj: IW 5-6/2014Ohodnoťte článok:
   
 

24 hodín

týždeň

mesiac

Najnovšie články

Cloud a je­ho do­sah na vý­voj IT tr­hu. CFO a CIO to vi­dia inak.
Ako môže ovplyvniť nástup cloudových technológií rozhodovacie a prevádzkové procesy v bežnej ekonomicky aktívnej spoločnosti? čítať »
 
Vy­uži­tie sen­zo­rov
Moderné tablety a konvertibilné zariadenia pod taktovkou operačného systému Windows 8.1 sú vybavené niekoľkými užitočnými senzormi, ktoré môžete využiť vo svojich aplikáciách. Spravidla ide o kompas, akcelerometer, gyroskop, náklonomer a snímač intenzity osvetlenia.  čítať »
 
No­vý Thin­kPad X1 Car­bon
ThinkPad X1 Carbon tretej generácie je naozaj veľmi ľahký vďaka tomu, že je vyrobený z karbónového vlákna, ktoré má menšiu hmotnosť ako horčíkové alebo hliníkové. Vďaka konštrukcii z uhlíkových vlákien je model X1 Carbon vôbec najodolnejší notebook z radu ThinkPad. čítať »
 
Da­ta Dis­co­ve­ry - ob­ja­vo­va­nie vzo­rov v dá­tach
Dnes hýbu svetom biznisu nielen peniaze, ale hlavne informácie. V tejto informačnej dobe sa na dáta, ako aj na nástroje na ich spracovanie kladú vysoké nároky. čítať »
 
No­vý pro­ce­sor IBM Power8: 50× rých­lej­ší pri ana­lý­ze dát ako x86
Spoločnosť IBM predstavila prvé servery vybavené novou generáciou procesora Power8. Zároveň pripomenula svoju nadáciu, ktorá otvára architektúru POWER záujemcom o jej ďalší vývoj. čítať »
 
 
 
  Zdieľaj cez Facebook Zdieľaj cez Google+ Zdieľaj cez Twitter Zdieľaj cez LinkedIn Správy z RSS Správy na smartfóne Správy cez newsletter