Talaan ng nilalaman
- Ano ang T-Test?
- Nagpapaliwanag sa T-Test
- Hindi Karaniwang Resulta ng Pagsubok
- Mga Tungkulin sa T-Test
- Kinakalkula ang Mga T-Pagsubok
- T-Test ng correlated (o Ipares)
- Pantay na pagkakaiba-iba (naka-pool) na T-Test
- Hindi Natatanging Pagkakaiba-iba T-Test
- Pagtukoy sa Aling T-Test na Gagamitin
- Hindi Natatanging Uri ng T-Test Halimbawa
Ano ang T-Test?
Ang isang t-test ay isang uri ng inferential statistic na ginamit upang matukoy kung mayroong isang makabuluhang pagkakaiba sa pagitan ng mga paraan ng dalawang grupo, na maaaring nauugnay sa ilang mga tampok. Ito ay kadalasang ginagamit kapag ang mga set ng data, tulad ng itinakdang data na naitala bilang kinahinatnan mula sa pag-flipping ng isang barya ng 100 beses, ay susundan ng isang normal na pamamahagi at maaaring magkaroon ng hindi kilalang mga pagkakaiba-iba. Ang isang t-test ay ginagamit bilang isang tool sa pagsubok ng hypothesis, na nagbibigay-daan sa pagsubok ng isang palagay na naaangkop sa isang populasyon.
Tinitingnan ng isang t-test ang t-statistic, ang mga halaga ng pamamahagi ng t, at ang antas ng kalayaan upang matukoy ang posibilidad ng pagkakaiba sa pagitan ng dalawang hanay ng data. Upang magsagawa ng isang pagsubok na may tatlo o higit pang mga variable, dapat gumamit ang isang pagsusuri ng pagkakaiba-iba.
T-Test
Nagpapaliwanag sa T-Test
Mahalaga, ang isang t-test ay nagbibigay-daan sa amin upang ihambing ang average na mga halaga ng dalawang set ng data at matukoy kung nagmula ito sa parehong populasyon. Sa mga halimbawa sa itaas, kung kukuha tayo ng isang halimbawa ng mga mag-aaral mula sa klase A at isa pang halimbawa ng mga mag-aaral mula sa klase B, hindi namin inaasahan na magkakaroon sila ng eksaktong kaparehong kahulugan at karaniwang paglihis. Katulad nito, ang mga halimbawang kinuha mula sa pangkat na control control ng placebo at ang mga kinuha mula sa pangkat na inireseta ng gamot ay dapat magkaroon ng isang bahagyang magkakaibang kahulugan at karaniwang paglihis.
Matematika, ang t-test ay tumatagal ng isang sample mula sa bawat isa sa dalawang hanay at itinatag ang pahayag ng problema sa pamamagitan ng pag-aakalang isang null hypothesis na ang dalawang paraan ay pantay. Batay sa naaangkop na mga pormula, ang ilang mga halaga ay kinakalkula at inihambing laban sa mga pamantayang halaga, at ang ipinapalagay na null hypothesis ay tinatanggap o tinanggihan nang naaayon.
Kung ang null hypothesis ay kwalipikado na tanggihan, ipinapahiwatig nito na ang pagbabasa ng data ay malakas at hindi sinasadya. Ang t-test ay isa lamang sa maraming mga pagsubok na ginamit para sa hangaring ito. Ang mga istatistika ay dapat na magdagdag ng mga pagsubok bukod sa t-test upang masuri ang higit pang mga variable at pagsubok na may mas malaking sukat ng sample. Para sa isang malaking sukat ng sample, ang mga istatistika ay gumagamit ng isang z-test. Ang iba pang mga pagpipilian sa pagsubok ay kasama ang chi-square test at ang f-test.
Mayroong tatlong uri ng mga t-test, at sila ay ikinategorya bilang nakasalalay at independyenteng mga t-test.
Mga Key Takeaways
- Ang isang t-test ay isang uri ng inferential statistic na ginamit upang matukoy kung mayroong isang makabuluhang pagkakaiba sa pagitan ng mga paraan ng dalawang grupo, na maaaring nauugnay sa ilang mga tampok.Ang t-test ay isa sa maraming mga pagsubok na ginamit para sa layunin ng pagsubok sa hypothesis sa mga istatistika. Ang pagkalkula ng isang t-test ay nangangailangan ng tatlong mahahalagang halaga ng data. Kasama nila ang pagkakaiba sa pagitan ng mga ibig sabihin ng mga halaga mula sa bawat set ng data (na tinatawag na mean na pagkakaiba), ang karaniwang paglihis ng bawat pangkat, at ang bilang ng mga halaga ng data ng bawat pangkat. Mayroong iba't ibang mga uri ng t-test na maaaring isagawa depende sa data at uri ng pagsusuri na kinakailangan.
Hindi Karaniwang Resulta ng Pagsubok
Isaalang-alang na nais ng isang tagagawa ng gamot na subukan ang isang bagong imbenteng gamot. Sinusunod nito ang pamantayang pamamaraan ng pagsubok ng gamot sa isang pangkat ng mga pasyente at pagbibigay ng isang placebo sa ibang grupo, na tinatawag na control group. Ang placebo na ibinigay sa control group ay isang sangkap na walang inilaan na therapeutic na halaga at nagsisilbing benchmark upang masukat kung paano ang iba pang grupo, na binigyan ng aktwal na gamot, ay tumugon.
Matapos ang pagsubok sa droga, iniulat ng mga miyembro ng pangkat ng control na pinangalagaan ng placebo ang pagtaas ng average na pag-asa sa buhay ng tatlong taon, habang ang mga miyembro ng pangkat na inireseta sa bagong ulat ng gamot ay isang pagtaas sa average na pag-asa sa buhay ng apat na taon. Agarang pagmamasid ay maaaring magpahiwatig na ang gamot ay talagang gumagana dahil ang mga resulta ay mas mahusay para sa pangkat na gumagamit ng gamot. Gayunpaman, posible rin na ang pagmamasid ay maaaring dahil sa isang pagkakataong mangyari, lalo na ang isang nakakagulat na piraso ng swerte. Ang isang t-test ay kapaki-pakinabang upang tapusin kung ang mga resulta ay talagang tama at naaangkop sa buong populasyon.
Sa isang paaralan, 100 mga mag-aaral sa klase A ang average ng 85% na may standard na paglihis ng 3%. Ang isa pang 100 mga mag-aaral na kabilang sa klase B ay nakakuha ng average na 87% na may karaniwang paglihis ng 4%. Habang ang average ng klase B ay mas mahusay kaysa sa klase A, hindi maaaring tama na tumalon sa konklusyon na ang pangkalahatang pagganap ng mga mag-aaral sa klase B ay mas mahusay kaysa sa mga mag-aaral sa klase A. Ito ay dahil, kasama ang ibig sabihin, ang karaniwang paglihis ng klase B ay mas mataas din kaysa sa klase A. Ipinapahiwatig nito na ang kanilang matinding porsyento, sa mas mababa at mas mataas na panig, ay higit na kumalat kumpara sa klase ng A. Ang isang t-test ay makakatulong upang matukoy kung alin sa klase ang mas mahusay.
Mga Tungkulin sa T-Test
- Ang unang palagay na ginawa tungkol sa mga t-test ay nag-aalala sa laki ng pagsukat. Ang palagay para sa isang t-test ay ang sukat ng pagsukat na inilalapat sa data na nakolekta kasunod ng isang tuloy-tuloy o orasan na antas, tulad ng mga marka para sa isang pagsubok sa IQ. Ang pangalawang palagay na ginawa ay iyon ng isang simpleng random sample, na ang data ay na nakolekta mula sa isang kinatawan, sapalarang napiling bahagi ng kabuuang populasyon.Ang ikatlong palagay ay ang data, kapag na-plot, ay nagreresulta sa isang normal na pamamahagi, ang hugis ng kampanang pamamahagi ng kampanilya.Ang ikaapat na palagay ay isang makatwirang malaking sukat ng sample na ginamit. Ang mas malaking sukat ng halimbawang nangangahulugang ang pamamahagi ng mga resulta ay dapat lumapit sa isang normal na curve na hugis ng kampanilya. Ang pangwakas na palagay ay ang homogeneity ng pagkakaiba-iba. Ang homogenous, o pantay, pagkakaiba-iba umiiral kapag ang karaniwang mga paglihis ng mga sample ay halos katumbas.
Kinakalkula ang Mga T-Pagsubok
Ang pagkalkula ng isang t-test ay nangangailangan ng tatlong mahahalagang halaga ng data. Kasama nila ang pagkakaiba sa pagitan ng mga mean na halaga mula sa bawat set ng data (na tinatawag na mean na pagkakaiba), ang karaniwang paglihis ng bawat pangkat, at ang bilang ng mga halaga ng data ng bawat pangkat.
Ang kinalabasan ng t-test ay gumagawa ng t-halaga. Ang kinakalkula na t-halaga ay pagkatapos ihambing laban sa isang halagang nakuha mula sa isang kritikal na talahanayan ng halaga (na tinatawag na T-Distribution Table). Ang paghahambing na ito ay nakakatulong upang matukoy kung paano malamang ang pagkakaiba sa pagitan ng mga paraan ay naganap nang pagkakataon o kung ang mga set ng data ay talagang may mga pagkakaiba sa intrinsiko. Ang mga tanong na t-test kung ang pagkakaiba sa pagitan ng mga pangkat ay kumakatawan sa isang tunay na pagkakaiba sa pag-aaral o kung ito ay malamang na walang kahulugan na pagkakaiba sa istatistika.
T-Distribution Tables
Ang Talahanayan ng T-Pamamahagi ay magagamit sa mga format na one-tail at two-tails. Ang dating ay ginagamit para sa pagtatasa ng mga kaso na may isang nakapirming halaga o saklaw na may malinaw na direksyon (positibo o negatibo). Halimbawa, ano ang posibilidad ng natitirang halaga ng output sa ibaba -3, o nakakakuha ng higit sa pitong kapag lumiligid ng isang pares ng dice? Ang huli ay ginagamit para sa pagsusuri ng saklaw na saklaw, tulad ng pagtatanong kung ang mga coordinate ay nahuhulog sa pagitan ng -2 at +2.
Ang mga kalkulasyon ay maaaring isagawa sa mga karaniwang programang software na sumusuporta sa mga kinakailangang statistical function, tulad ng mga natagpuan sa MS Excel.
Mga T-Halaga at Degree ng Kalayaan
Ang t-test ay gumagawa ng dalawang halaga bilang output nito: t-halaga at antas ng kalayaan. Ang t-halaga ay isang ratio ng pagkakaiba sa pagitan ng kahulugan ng dalawang halimbawang set at ang pagkakaiba-iba na umiiral sa loob ng mga sample set. Habang ang halaga ng numumer (ang pagkakaiba sa pagitan ng ibig sabihin ng dalawang halimbawang set) ay diretso upang makalkula, ang denominator (ang pagkakaiba-iba na umiiral sa loob ng mga sample set) ay maaaring maging isang medyo kumplikado depende sa uri ng mga halaga ng data na kasangkot. Ang denominator ng ratio ay isang pagsukat ng pagpapakalat o pagkakaiba-iba. Ang mas mataas na halaga ng t-halaga, na tinatawag ding t-score, ay nagpapahiwatig na ang isang malaking pagkakaiba-iba ay umiiral sa pagitan ng dalawang set ng sample. Ang mas maliit na t-halaga, ang higit na pagkakapareho ay umiiral sa pagitan ng dalawang halimbawang set.
- Ang isang malaking t-score ay nagpapahiwatig na naiiba ang mga pangkat.Ang maliit na t-score ay nagpapahiwatig na magkatulad ang mga pangkat.
Ang mga antas ng kalayaan ay tumutukoy sa mga halaga sa isang pag-aaral na may kalayaan na magkakaiba-iba at mahalaga para sa pagtatasa ng kahalagahan at ang bisa ng null hypothesis. Ang pagkalkula ng mga halagang ito ay karaniwang nakasalalay sa bilang ng mga talaan ng data na magagamit sa halimbawang set.
T-Test ng correlated (o Ipares)
Ang correlated t-test ay isinasagawa kapag ang mga sample ay karaniwang binubuo ng mga pares na pares ng magkatulad na mga yunit, o kapag may mga kaso ng paulit-ulit na mga panukala. Halimbawa, maaaring magkaroon ng mga pagkakataon ng parehong mga pasyente na sinubukan nang paulit-ulit - bago at pagkatapos matanggap ang isang partikular na paggamot. Sa ganitong mga kaso, ang bawat pasyente ay ginagamit bilang isang control sample laban sa kanilang sarili.
Ang pamamaraang ito ay nalalapat din sa mga kaso kung saan ang mga halimbawa ay nauugnay sa ilang mga paraan o may mga katumbas na katangian, tulad ng isang paghahambing na pagsusuri na kinasasangkutan ng mga bata, magulang o kapatid. Ang mga correlated o ipinares na mga t-test ay isang nakasalalay na uri, dahil may kinalaman ito sa mga kaso kung saan nauugnay ang dalawang hanay ng mga sample.
Ang pormula para sa pag-compute ng t-halaga at antas ng kalayaan para sa isang ipinares na t-test ay:
- Ang mean1 at mean2 ay ang average na halaga ng bawat isa sa mga sample set, habang ang var1 at var2 ay kumakatawan sa pagkakaiba-iba ng bawat isa sa mga sample set.
Ang natitirang dalawang uri ay kabilang sa mga independiyenteng t-test. Ang mga halimbawa ng mga uri na ito ay pinili na independiyente sa bawat isa - iyon ay, ang mga set ng data sa dalawang pangkat ay hindi tumutukoy sa magkaparehong mga halaga. Kasama nila ang mga kaso tulad ng isang pangkat ng 100 mga pasyente na nahahati sa dalawang hanay ng 50 mga pasyente bawat isa. Ang isa sa mga grupo ay nagiging control group at binigyan ng isang placebo, habang ang ibang grupo ay tumatanggap ng inireseta na paggamot. Ito ay bumubuo ng dalawang independyenteng mga grupo ng sample na walang bayad sa bawat isa.
Katumbas na Pagkakaiba-iba (o Pooled) T-Test
Ang pantay na pagkakaiba-iba t-test ay ginagamit kapag ang bilang ng mga sample sa bawat pangkat ay pareho, o ang pagkakaiba-iba ng dalawang set ng data. Ang sumusunod na pormula ay ginagamit para sa pagkalkula ng t-halaga at antas ng kalayaan para sa pantay na pagkakaiba-iba ng t-test:
T-halaga = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 mean1 − mean2 kung saan: mean1 at mean2 = Average na halaga ng bawat isa sa halimbawang setsvar1 at var2 = Ang pagkakaiba-iba ng bawat isa sa mga halimbawang setn1 at n2 = Bilang ng mga rekord sa bawat halimbawang set
at, Mga Degree of Freedom = n1 + n2−2 saanman: n1 at n2 = Bilang ng mga rekord sa bawat halimbawang set
Hindi Natatanging Pagkakaiba-iba T-Test
Ang hindi pantay na pagkakaiba-iba t-test ay ginagamit kapag ang bilang ng mga sample sa bawat pangkat ay naiiba, at ang pagkakaiba-iba ng dalawang set ng data ay naiiba din. Ang pagsubok na ito ay tinatawag ding t-test ng Welch. Ang sumusunod na pormula ay ginagamit para sa pagkalkula ng t-halaga at antas ng kalayaan para sa isang hindi pantay na variance t-test:
T-halaga = n1var12 + n2var22 mean1 − mean2 kung saan: mean1 at mean2 = Average na mga halaga ng bawat isa sa halimbawang setsvar1 at var2 = Ang pagkakaiba-iba ng bawat halimbawang setn1 at n2 = Bilang ng mga rekord sa bawat halimbawang set
at, Mga Degree of Freedom = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 kung saan: var1 at var2 = Pagkakaiba-iba ng bawat isa sa mga halimbawang setn1 at n2 = Bilang ng mga talaan sa bawat halimbawang set
Ang pagtukoy ng Tamang T-Test na Gagamitin
Ang sumusunod na flowchart ay maaaring magamit upang matukoy kung aling t-test ang dapat gamitin batay sa mga katangian ng mga sample set. Ang mga pangunahing item na dapat isaalang-alang isama kung ang mga sample na rekord ay magkatulad, ang bilang ng mga talaan ng data sa bawat halimbawang set, at ang pagkakaiba-iba ng bawat halimbawang set.
Larawan ni Julie Bang © Investopedia 2019
Hindi Natatanging Uri ng T-Test Halimbawa
Ipagpalagay na kumukuha kami ng isang diagonal na pagsukat ng mga kuwadro na natanggap sa isang gallery ng sining. Ang isang pangkat ng mga sample ay nagsasama ng 10 mga kuwadro na gawa, habang ang iba pang may kasamang 20 kuwadro na gawa. Ang mga set ng data, na may kaukulang halaga at pagkakaiba-iba ng mga halaga, ay ang mga sumusunod:
Itakda ang 1 | Itakda ang 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Ibig sabihin | 19.4 | 21.6 |
Pagkakaiba-iba | 1.4 | 17.1 |
Kahit na ang ibig sabihin ng Set 2 ay mas mataas kaysa sa Set 1, hindi natin maaaring tapusin na ang lahat ng mga kuwadro ay may average na haba sa paligid ng 21.6 na yunit dahil ang pagkakaiba-iba ng Set 2 ay higit na mataas kaysa sa Itakda 1. Ito ba ay sa pamamagitan ng pagkakataon, o may pagkakaiba talaga sa pangkalahatang populasyon ng lahat ng mga kuwadro na natanggap sa gallery ng sining? Itinatag namin ang problema sa pamamagitan ng pagpapalagay ng null hypothesis na ang ibig sabihin ay pareho sa pagitan ng dalawang mga set ng sample at nagsasagawa ng t-test upang kumpirmahin kung totoo ang hypothesis.
Dahil naiiba ang bilang ng mga talaan ng data (n1 = 10 at n2 = 20) at ang pagkakaiba-iba ay magkakaiba din, ang t-halaga at antas ng kalayaan ay kinolekta para sa set ng data sa itaas gamit ang pormula na nabanggit sa Unequal Variance T-Test seksyon.
Ang t-halaga ay -2.24787. Dahil ang minus sign ay maaaring hindi papansinin kapag inihahambing ang dalawang t-halaga, ang nakalkula na halaga ay 2.24787.
Ang antas ng halaga ng kalayaan ay 24.38 at nabawasan sa 24, dahil sa kahulugan ng formula na nangangailangan ng pag-ikot ng halaga sa pinakamaliit na posibleng halaga ng integer.
Sa tuwing ipinapalagay ang isang normal na pamamahagi, maaaring tukuyin ng isang tao ang isang antas ng posibilidad (antas ng alpha, antas ng kabuluhan, p ) bilang isang criterion para sa pagtanggap. Sa karamihan ng mga kaso, ang isang 5% na halaga ay maaaring ipalagay.
Gamit ang antas ng halaga ng kalayaan bilang 24 at isang 5% na antas ng kabuluhan, ang pagtingin sa talahanayan ng t-halaga na pamamahagi ay nagbibigay ng isang halaga ng 2.064. Ang paghahambing ng halagang ito laban sa pinagsama-samang halaga ng 2.247 ay nagpapahiwatig na ang kinakalkula na t-halaga ay mas malaki kaysa sa halaga ng talahanayan sa isang antas ng kabuluhan ng 5%. Samakatuwid, ligtas na tanggihan ang null hypothesis na walang pagkakaiba sa pagitan ng paraan. Ang populasyon na itinakda ay may mga pagkakaiba-iba sa loob, at hindi sila sinasadya.
Paghambingin ang Mga Account sa Pamumuhunan × Ang mga alok na lilitaw sa talahanayan na ito ay mula sa mga pakikipagsosyo kung saan tumatanggap ng kabayaran ang Investopedia. Paglalarawan ng Pangalan ng TagabigayKaugnay na Mga Tuntunin
Paano ang Pagtatasa ng Pagkakaiba-iba (ANOVA) Gumagana Pagtatasa ng pagkakaiba-iba (ANOVA) ay isang tool sa pagsusuri ng istatistika na naghihiwalay sa kabuuang pagkakaiba-iba na natagpuan sa loob ng isang data na itinakda sa dalawang sangkap: random at sistematikong mga kadahilanan. higit pang Kahulugan ng Z-Test Ang z-test ay isang statistical test na ginamit upang matukoy kung ang dalawang ibig sabihin ng populasyon ay naiiba kapag ang mga pagkakaiba-iba ay kilala at ang laki ng sample. higit pang Mga Degree ng Kahulugan ng Kalayaan Ang Mga Degree ng Kalayaan ay tumutukoy sa maximum na bilang ng mga lohikal na independiyenteng mga halaga, na mga halaga na may kalayaan na magkakaiba, sa sample ng data. higit pang Pag-unawa sa Pamamahagi ng T Ang AT ay isang uri ng posibilidad ng pag-andar na angkop para sa pagtantya ng mga parameter ng populasyon para sa maliit na laki ng sample o hindi kilalang mga pagkakaiba-iba. higit pa Ano ang Mga Panukala ng Semi-Deviation Ang Semi-paglihis ay isang paraan ng pagsusuri sa mga mas mababang kahulugan na pagbabagu-bago sa pagbabalik sa pamumuhunan. Ginagamit ito bilang alternatibo sa karaniwang paglihis. higit pang Bonferroni Test Isang Bonferroni Test ay isang uri ng maramihang pagsubok na paghahambing na ginamit sa statistic analysis. higit pang Mga Link sa PartnerMga Kaugnay na Artikulo
Ekonomiks
Anong mga pagpapalagay ang ginawa kapag nagsasagawa ng t-test?
Pamamahala sa Panganib
Paggamit ng Makasaysayang pagkasumpungin Upang Makakuha ng Panganib sa Hinaharap
Istratehiya ng Stock Trading at Edukasyon
Paano Gumamit ng Excel upang Gayahin ang Mga Presyo ng Stock
Pinansiyal na mga ratio
Paano mo makakalkula ang IRR sa Excel?
Matematika at Istatistika
Ano ang Isang Relatibong Pamantayang Error
Pinansiyal na mga ratio
Ano ang pormula para sa pagkalkula ng net present na halaga (NPV) sa Excel?
![T T](https://img.icotokenfund.com/img/tools-fundamental-analysis/447/t-test.jpg)