Ano ang Mga Nonparametric Statistics?
Ang mga istatistika ng nonparametric ay tumutukoy sa isang istatistikong pamamaraan kung saan ang data ay hindi kinakailangan upang magkasya sa isang normal na pamamahagi. Ang mga istatistika ng nonparametric ay gumagamit ng data na madalas na ordinal, nangangahulugang hindi ito umaasa sa mga numero, ngunit sa halip na isang ranggo o pagkakasunud-sunod ng mga uri. Halimbawa, ang isang survey na naghahatid ng mga kagustuhan ng mga mamimili na nagmula sa nais na ayaw ay isasaalang-alang ng mga pang-utos na data.
Ang mga istatistika ng nonparametric ay nagsasama ng mga istatistika na naglalarawan ng nonparametric, mga modelo ng istatistika, inference, at mga pagsubok sa istatistika. Ang istraktura ng modelo ng mga nonparametric na modelo ay hindi tinukoy na isang priori ngunit sa halip ay tinutukoy mula sa data. Ang salitang nonparametric ay hindi inilaan na ipahiwatig na ang mga nasabing modelo ay ganap na kulang sa mga parameter, ngunit sa halip na ang bilang at likas na katangian ng mga parameter ay nababaluktot at hindi naayos nang maaga. Ang isang histogram ay isang halimbawa ng isang nonparametric na pagtatantya ng isang pamamahagi ng posibilidad.
Pag-unawa sa Nonparametric Statistics
Sa mga istatistika, ang mga istatistika ng parametric ay may kasamang mga parameter tulad ng ibig sabihin, median, karaniwang paglihis, pagkakaiba-iba, atbp Ang form na ito ng mga istatistika ay gumagamit ng sinusunod na data upang matantya ang mga parameter ng pamamahagi. Sa ilalim ng mga istatistika ng parametric, ang data ay ipinapalagay na magkasya sa isang normal na pamamahagi na may hindi kilalang mga parameter (ang ibig sabihin ng populasyon) at σ 2 (pagkakaiba-iba ng populasyon), na kung saan pagkatapos ay tinantya gamit ang sample mean at sample variance.
Ang mga istatistika ng nonparametric ay walang pag-aakala tungkol sa laki ng sample o kung ang sinusunod na data ay dami.
Ang mga istatistika ng nonparametric ay hindi ipinapalagay na ang data ay iginuhit mula sa isang normal na pamamahagi. Sa halip, ang hugis ng pamamahagi ay tinatantya sa ilalim ng form na ito ng pagsukat sa istatistika. Habang maraming mga sitwasyon kung saan maipapalagay ang isang normal na pamamahagi, mayroon ding ilang mga sitwasyon kung saan hindi posible na matukoy kung ang data ay normal na ipinamamahagi.
Mga halimbawa ng Istatistika ng Nonparametric
Sa unang halimbawa, isaalang-alang ang isang mananaliksik na nais isang pagtatantya ng bilang ng mga sanggol sa Hilagang Amerika na ipinanganak na may kayumanggi na mata ay maaaring magpasya na kumuha ng isang sample ng 150, 000 mga sanggol at magpatakbo ng isang pagsusuri sa set ng data. Ang pagsukat na nakuha nila ay gagamitin bilang isang pagtatantya ng buong populasyon ng mga sanggol na may brown na mata na isinilang sa susunod na taon.
Para sa isang pangalawang halimbawa, isaalang-alang ang isang iba't ibang mananaliksik na nais malaman kung matulog nang maaga o huli ay naiugnay sa kung gaano kadalas ang isang tao ay nagkasakit. Ipinapalagay na ang sample ay pinili nang sapalaran mula sa populasyon, ang halimbawang laki ng pamamahagi ng dalas ng sakit ay maaaring ipagpalagay na normal. Gayunpaman, ang isang eksperimento na sumusukat sa paglaban ng katawan ng tao sa isang pilay ng bakterya ay hindi maaaring ipagpalagay na magkaroon ng isang normal na pamamahagi.
Ito ay dahil ang isang random na napiling sample data ay maaaring paglaban sa pilay. Sa kabilang banda, kung isinasaalang-alang ng mananaliksik ang mga kadahilanan tulad ng genetic makeup at etnisidad, maaari niyang makita na ang isang laki ng sample na pinili gamit ang mga katangiang ito ay maaaring hindi lumalaban sa pilay. Samakatuwid, ang isang tao ay hindi maaaring magpalagay ng isang normal na pamamahagi.
Ang pamamaraan na ito ay kapaki-pakinabang kapag ang data ay walang malinaw na interpretasyong ayon sa numero at pinakamahusay na gamitin sa data na may pagraranggo ng mga uri. Halimbawa, ang isang pagsubok sa pagtatasa ng pagkatao ay maaaring magkaroon ng isang ranggo ng mga sukatan na itinakda bilang malakas na hindi sumasang-ayon, hindi sumasang-ayon, walang malasakit, sumasang-ayon, at mariing sumasang-ayon. Sa kasong ito, dapat gamitin ang mga nonparametric na pamamaraan.
Mga Espesyal na Pagsasaalang-alang
Ang mga istatistika ng nonparametric ay nakakuha ng pagpapahalaga dahil sa kadalian ng paggamit. Tulad ng pangangailangan para sa mga parameter ay hinalinhan, ang data ay nagiging mas naaangkop sa isang mas malaking iba't ibang mga pagsubok. Ang ganitong uri ng istatistika ay maaaring magamit nang walang ibig sabihin, laki ng halimbawang, standard na paglihis, o ang pagtatantya ng anumang iba pang mga kaugnay na mga parameter kapag wala sa impormasyong iyon.
Dahil ang mga istatistika ng nonparametric ay gumagawa ng mas kaunting mga pagpapalagay tungkol sa data ng sample, ang aplikasyon nito ay mas malawak sa saklaw kaysa sa mga istatistika ng parametric. Sa mga kaso kung saan mas angkop ang pagsubok sa parametric, ang mga nonparametric na pamamaraan ay magiging hindi gaanong mahusay. Ito ay dahil ang mga resulta na nakuha mula sa mga istatistika ng nonparametric ay may mas mababang antas ng tiwala kaysa sa kung ang mga resulta ay nakuha gamit ang mga istatistika ng parametric.
Mga Key Takeaways
- Ang mga istatistika ng nonparametric ay madaling gamitin ngunit hindi inaalok ang katumpakan ng pinpoint ng iba pang mga statistical models.Ang uri ng pagsusuri na ito ay pinakaangkop kapag isinasaalang-alang ang pagkakasunud-sunod ng isang bagay, kung saan kahit na nagbabago ang mga numero ng data, ang mga resulta ay malamang na mananatiling pareho.
![Mga istatistika ng Nonparametric: pangkalahatang-ideya Mga istatistika ng Nonparametric: pangkalahatang-ideya](https://img.icotokenfund.com/img/financial-analysis/480/nonparametric-statistics.jpg)