Ano ang Data Science?
Nagbibigay ang agham ng data ng makabuluhang impormasyon batay sa malaking halaga ng kumplikadong data o malaking data. Ang agham ng data, o agham na hinihimok ng data, ay pinagsasama ang iba't ibang larangan ng trabaho sa mga istatistika at pagkalkula upang bigyang kahulugan ang data para sa mga layunin ng paggawa ng desisyon.
Pag-unawa sa Data Science
Ang data ay iginuhit mula sa iba't ibang sektor, channel, at platform kabilang ang mga cell phone, social media, e-commerce site, healthcare survey, at mga paghahanap sa Internet. Ang pagtaas ng dami ng magagamit na data ay nagbukas ng pintuan sa isang bagong larangan ng pag-aaral batay sa malaking data - ang napakalaking mga hanay ng data na nag-aambag sa paglikha ng mas mahusay na mga tool sa pagpapatakbo sa lahat ng mga sektor.
Ang patuloy na pagtaas ng pag-access sa data ay posible dahil sa mga pagsulong sa mga teknolohiyang pamamaraan at koleksyon. Ang mga indibidwal na pagbili ng mga pattern at pag-uugali ay maaaring masubaybayan at mga hula na ginawa batay sa impormasyong natipon.
Gayunpaman, ang patuloy na pagtaas ng data ay hindi nakaayos at nangangailangan ng pag-parse para sa epektibong paggawa ng desisyon. Ang prosesong ito ay kumplikado at pag-ubos ng oras para sa mga kumpanya — samakatuwid, ang paglitaw ng agham ng data.
Ang agham ng data, o agham na hinihimok ng data, ay gumagamit ng malaking data at pag-aaral ng makina upang bigyang kahulugan ang data para sa mga layunin ng paggawa ng desisyon.
Isang Maikling Kasaysayan ng Agham ng Data
Ang term na agham ng data ay umiral para sa mas mahusay na bahagi ng huling 30 taon at orihinal na ginamit bilang isang kahalili sa "computer science" noong 1960. Humigit-kumulang 15 taon na ang lumipas, ginamit ang term upang tukuyin ang survey ng mga pamamaraan sa pagproseso ng data na ginamit sa iba't ibang mga aplikasyon. Noong 2001, ang agham ng data ay ipinakilala bilang isang independiyenteng disiplina. Ang Harvard Business Review ay naglathala ng isang artikulo noong 2012 na naglalarawan ng papel ng siyentipiko ng data bilang "pinakapuksa sa trabaho sa ika-21 siglo."
Mga Key Takeaways
- Ang mga pagsulong sa teknolohiya, Internet, social media, at ang paggamit ng teknolohiya ay may lahat ng tumaas na pag-access sa malaking data.Data ang agham ay gumagamit ng mga pamamaraan tulad ng pag-aaral ng makina at artipisyal na intelihensiya upang kunin ang mga makabuluhang impormasyon at upang mahulaan ang hinaharap na mga pattern at pag-uugali.Ang larangan ng data lumalaki ang agham habang ang pagsulong ng teknolohiya at ang mga malaking pagkolekta ng data at mga diskarte sa pagsusuri ay nagiging mas sopistikado.
Paano Inilapat ang Agham ng Data
Isinasama ng agham ng data ang mga tool mula sa maraming disiplina upang makalikom ng isang set ng data, proseso, at kumuha ng mga pananaw mula sa set ng data, kunin ang mga makabuluhang data mula sa set, at bigyang kahulugan ito para sa mga layunin ng paggawa ng desisyon. Ang mga lugar na pang-disiplina na bumubuo sa larangan ng agham ng data ay may kasamang pagmimina, istatistika, pag-aaral ng makina, analytics, at pagprograma.
Ang data mining ay inilalapat ang mga algorithm sa kumplikadong data na itinakda upang ipakita ang mga pattern na pagkatapos ay ginagamit upang kunin ang kapaki-pakinabang at may-katuturang data mula sa set. Ang mga panukalang istatistika o mahuhulaan na analytics ay gumagamit ng nakuha na data na ito upang masukat ang mga kaganapan na posibleng mangyari sa hinaharap batay sa ipinakita ng mga datos na nangyari noong nakaraan.
Ang pag-aaral ng makina ay isang artipisyal na tool ng katalinuhan na nagpoproseso ng dami ng data na hindi ma-proseso ng isang tao sa isang buhay. Ang pag-aaral ng makina ay perpekto ang modelo ng desisyon na ipinakita sa ilalim ng mahuhulaan na analytics sa pamamagitan ng pagtutugma ng posibilidad ng isang kaganapan na nangyayari sa kung ano ang talagang nangyari sa isang hinulaang oras.
Gamit ang analytics, ang data analyst ay nangongolekta at pinoproseso ang nakabalangkas na data mula sa yugto ng pagkatuto ng makina gamit ang mga algorithm. Ang mga analyst ay nag-interpret, nag-convert, at nagbubuod ng data sa isang cohesive na wika na mauunawaan ng pangkat ng paggawa ng desisyon. Ang agham ng data ay inilalapat sa halos lahat ng mga konteksto at, habang ang papel ng siyentipiko ng data ay umuusbong, ang patlang ay lalawak upang mapaloob ang arkitektura ng data, engineering ng data, at pangangasiwa ng data.
Mabilis na Salik
Ayon sa IBM, ang demand para sa mga siyentipiko ng data ay inaasahan na madagdagan ng 28% sa 2020.
Tinukoy ng Data Scientist
Kinokolekta, pinag-aaralan, at binibigyang kahulugan ng isang siyentipiko ng data ang malalaking dami ng data, sa maraming kaso, upang mapagbuti ang operasyon ng isang kumpanya. Ang mga propesyunal na siyentipiko ng data ay nagkakaroon ng mga istatistikong modelo na nag-aaral ng data at nakakakita ng mga pattern, mga uso, at mga relasyon sa mga set ng data. Ang impormasyong ito ay maaaring magamit upang mahulaan ang pag-uugali ng mamimili o upang makilala ang mga panganib sa negosyo at pagpapatakbo. Ang data ng siyentipiko ay madalas na isang mananalaysay na naglalahad ng mga pananaw sa data sa mga gumagawa ng desisyon sa isang paraan na maiintindihan at naaangkop sa paglutas ng problema.
Data Science Ngayon
Ang mga kumpanya ay naglalapat ng malaking data at agham ng data sa pang-araw-araw na aktibidad upang magdala ng halaga sa mga mamimili. Ang mga institusyon ng pagbabangko ay nakakapital sa malaking data upang mapahusay ang kanilang tagumpay sa pagtuklas ng pandaraya. Ang mga kumpanya ng pamamahala ng Asset ay gumagamit ng malaking data upang mahulaan ang posibilidad ng pagtaas ng presyo ng isang seguridad pataas o pababa sa isang nakasaad na oras.
Ang mga kumpanya tulad ng Netflix mine malaking data upang matukoy kung anong mga produkto ang maihatid sa mga gumagamit nito. Gumagamit din ang Netflix ng mga algorithm upang lumikha ng mga isinapersonal na mga rekomendasyon para sa mga gumagamit batay sa kanilang kasaysayan sa pagtingin. Ang agham ng data ay nagbabago sa isang mabilis na rate, at ang mga aplikasyon nito ay patuloy na magbabago ng mga buhay sa hinaharap.
![Kahulugan ng agham ng data Kahulugan ng agham ng data](https://img.icotokenfund.com/img/business-essentials/386/data-science.jpg)