Ano ang Data Warehousing?
Data warehousing ay ang elektronikong imbakan ng isang malaking halaga ng impormasyon ng isang negosyo o samahan. Ang warehousing ng data ay isang mahalagang sangkap ng intelligence ng negosyo na gumagamit ng mga pamamaraan sa analytical sa data ng negosyo.
Ang konsepto ng warehousing ng data ay ipinakilala noong 1988 ng mga mananaliksik ng IBM na sina Barry Devlin at Paul Murphy. Ang pangangailangan sa data ng bodega na umunlad habang ang mga computer system ay naging mas kumplikado at hawakan ang pagtaas ng dami ng data. Ang isang pangunahing libro sa warehousing ng data ay ang "Building the Data Warehouse" ng WH Inmon, na unang nai-publish noong 1990 at maraming beses na nai-print.
Paano Gumagana ang Data Warehousing
Ang warehousing ng data ay ginagamit upang magbigay ng higit na pananaw sa pagganap ng isang kumpanya sa pamamagitan ng paghahambing ng data na pinagsama mula sa maraming mga mapagkukunang heterogen. Ang isang bodega ng data ay idinisenyo upang magpatakbo ng query at pagsusuri sa makasaysayang data na nagmula sa mga mapagkukunang transactional.
Kapag ang data ay naipasok sa bodega, hindi ito nagbabago at hindi mababago dahil ang isang bodega ng data ay nagpapatakbo ng analytics sa mga kaganapan na naganap sa pamamagitan ng pagtuon sa mga pagbabago sa data sa paglipas ng panahon. Ang data ng warehoused ay dapat na naka-imbak sa isang paraan na ligtas, maaasahan, madaling makuha at madaling pamahalaan.
Mayroong ilang mga hakbang na gagawin upang lumikha ng isang bodega ng data. Ang unang hakbang ay ang pagkuha ng data, na nagsasangkot sa pagkolekta ng malaking halaga ng data mula sa maraming mga puntos ng mapagkukunan. Matapos maipon ang data, dumadaan ito sa paglilinis ng data, ang proseso ng pagsusuklay ng data para sa mga pagkakamali at pagwawasto o pagbubukod ng anumang mga pagkakamali na natagpuan.
Ang nalinis na data ay pagkatapos ay mai-convert mula sa isang format ng database sa isang format ng bodega. Sa sandaling nakaimbak ito sa bodega, ang data ay dumadaan sa pag-uuri, pagsasama-sama, pagbubuod, atbp sa gayon ay mas coordinated at mas madaling gamitin. Sa paglipas ng panahon, mas maraming data ang idinagdag sa bodega dahil ang maraming mga mapagkukunan ng data ay na-update.
Mga Key Takeaways
- Ang warehousing ng data ay ang elektronikong imbakan ng isang malaking halaga ng impormasyon ng isang negosyo o samahan.Ang bodega ng data ay idinisenyo upang magpatakbo ng query at pagsusuri sa makasaysayang data na nagmula sa transactional na mga mapagkukunan para sa mga intelektwal na negosyo at mga minahan ng data.Data warehousing ay ginagamit upang magbigay ng higit na pananaw sa pagganap ng isang kumpanya sa pamamagitan ng paghahambing ng data na pinagsama mula sa maraming mapagkukunan ng heterogenous.
Mga Espesyal na Pagsasaalang-alang: Data Mining
Ang mga negosyo ay maaaring bodega ng data para magamit sa paggalugad at pagmimina ng data, naghahanap ng mga pattern ng impormasyon na makakatulong sa kanila na mapabuti ang kanilang mga proseso sa negosyo. Ang isang mahusay na sistema ng warehousing ng data ay maaari ring gawing mas madali para sa iba't ibang mga kagawaran sa loob ng isang kumpanya na mai-access ang data ng bawat isa.
Halimbawa, ang isang bodega ng data ay maaaring payagan ang isang kumpanya na madaling masuri ang data ng koponan ng mga benta at makakatulong upang makagawa ng mga pagpapasya tungkol sa kung paano mapagbuti ang benta o streamline ng kagawaran. Ang negosyo ay maaaring pumili upang tumuon sa mga gawi ng paggastos ng mga customer upang mas mahusay na iposisyon ang mga produkto at dagdagan ang mga benta.
Gamit ang warehousing ng data, maaaring makolekta ng kumpanya ang makasaysayang data ng paggasta ng mga kostumer nito sa nakaraan — sabihin, 20 taon - at magpatakbo ng mga analytics sa data na ito. Ang nagresultang impormasyon ay maaaring magbigay ng pananaw sa mga kagustuhan ng mga mamimili; ang oras ng araw, buwan, o taon na may mas malaking benta; o pinakamataas na customer sa paggastos para sa taon.
Ang epektibong pag-iimbak at pamamahala ng data ay din kung ano ang gumagawa ng mga proseso, tulad ng pagsisimula ng reserbasyon sa paglalakbay at paggamit ng mga awtomatikong machine teller.
Ang proseso ng pagmimina ng data ay nahati sa limang mga hakbang:
- Kinokolekta ng mga samahan ang data at mai-load ito sa kanilang mga warehouses ng data. Pagkatapos ay mag-imbak at pamahalaan ang data, alinman sa mga in-house server o mga cloud.Business analyst, mga management team at information technology professional na ma-access ang data at matukoy kung paano nila nais itong ayusin. Ang software ng application ay pagkatapos ay uri ng data batay sa mga resulta ng gumagamit Ang wakas na gumagamit sa wakas ay nagtatanghal ng data sa isang madaling-ma-share na format, tulad ng isang graph o talahanayan.
Data Warehousing kumpara sa mga Databases
Ang isang bodega ng data ay hindi kinakailangan ng parehong konsepto bilang isang karaniwang database. Ang isang database ay isang transactional system na nakatakda upang subaybayan at i-update ang data ng real-time upang magkaroon lamang ng pinakabagong data na magagamit. Ang isang bodega ng data ay na-program upang magkasama ang nakabalangkas na data sa isang tagal ng panahon. Halimbawa, ang isang database ay maaaring magkaroon lamang ng pinakabagong address ng isang customer, habang ang isang warehouse ng data ay maaaring magkaroon ng lahat ng mga address na nabuhay sa customer sa nakaraang 10 taon.
![Kahulugan ng warehousing ng data Kahulugan ng warehousing ng data](https://img.icotokenfund.com/img/financial-technology/385/data-warehousing.jpg)