Ano ang Linear Regression?
Ang linear regression ay isang plot ng data na nag-grap sa magkakaugnay na ugnayan sa pagitan ng isang independyente at isang dependant variable. Karaniwan itong ginagamit upang biswal na ipakita ang lakas ng relasyon at pagpapakalat ng mga resulta - lahat para sa layunin ng pagpapaliwanag ng pag-uugali ng umaasang variable.
Sabihin na nais naming subukan ang lakas ng relasyon sa pagitan ng dami ng kinakain ng sorbetes at labis na katabaan. Dadalhin namin ang independiyenteng variable, ang halaga ng sorbetes, at maiuugnay ito sa nakasalalay na variable, labis na katabaan, upang makita kung mayroong isang relasyon. Dahil sa isang regression ay isang graphical na pagpapakita ng relasyon na ito, mas mababa ang pagkakaiba-iba sa data, mas malakas ang relasyon at mas magaan ang akma sa linya ng regression.
Mga Key Takeaways
- Ang mga modelo ng pagkakasunud-sunod sa pagkakasunud-sunod ng pagkakaugnay sa pagitan ng isang nakasalalay at independyenteng variable (s).Ang pagsusuri ng pagkakamali ay maaaring makamit kung ang mga variable ay independyente, walang heteroscedasticity, at ang mga tuntunin ng pagkakamali ng mga variable ay hindi napapabagsak.Modeling linear regression sa Excel ay mas madali sa ang Data Analysis ToolPak.
Mahalagang Pagsasaalang-alang
Mayroong ilang mga kritikal na pagpapalagay tungkol sa iyong set ng data na dapat totoo upang magpatuloy sa isang pagtatasa ng regression:
- Ang mga variable ay dapat na tunay na independiyenteng (gamit ang isang Chi-square test).Ang data ay hindi dapat magkaroon ng iba't ibang mga pagkakaiba-iba ng error (ito ay tinatawag na heteroskedasticity (din na nabaybay na heteroscedasticity)). Ang mga tuntunin ng pagkakamali ng bawat variable ay dapat na walang pagsala. Kung hindi, nangangahulugan ito na ang mga variable ay serially correlated.
Kung ang mga tatlong bagay na iyon ay kumplikado, ito ay. Ngunit ang epekto ng isa sa mga pagsasaalang-alang na hindi totoo ay isang bias na pagtatantya. Mahalaga, nais mong maling akalain ang kaugnayan na sinusukat mo.
Outputting isang Pagkalungkot sa Excel
Ang unang hakbang sa pagpapatakbo ng pagtatasa ng regression sa Excel ay ang dobleng suriin na ang libreng Excel plugin Data Analysis ToolPak ay naka-install. Ginagawa ng plugin na ito ang pagkalkula ng isang hanay ng mga istatistika. Hindi kinakailangan na mag-tsart ng isang linear na regression line, ngunit ginagawang mas simple ang paglikha ng mga talahanayan ng istatistika. Upang i-verify kung naka-install, piliin ang "Data" mula sa toolbar. Kung ang "Data Analysis" ay isang pagpipilian, ang tampok ay naka-install at handa nang gamitin. Kung hindi mai-install, maaari mong hilingin ang pagpipiliang ito sa pamamagitan ng pag-click sa pindutan ng Opisina at pagpili ng "Mga pagpipilian sa Excel".
Gamit ang Data Analysis ToolPak, ang paglikha ng isang regresyon na output ay ilan lamang sa mga pag-click.
Ang independiyenteng variable ay napupunta sa saklaw ng X.
Dahil sa pagbabalik ng S&P 500, sabihin na nais naming malaman kung maaari naming matantya ang lakas at relasyon ng stock ng Visa (V). Ang stock ng Visa (V) ay nagbabalik ng data na populasyon ng haligi 1 bilang umaasa sa variable. Ibinalik ng S&P 500 ang data na populasyon ng haligi 2 bilang independiyenteng variable.
- Piliin ang "Data" mula sa toolbar. Ang menu ng "Data" ay nagpapakita.Select "Data Analysis". Ipinapakita ng kahon ng dialogo ng Datos ng Pagsusuri - Mga tool sa Pagsusuri.Mula sa menu, piliin ang "Regression" at i-click ang "OK". Sa kahon ng diyalogo ng Regression, i-click ang kahon ng "Input Y Range" at piliin ang umaasang variable na data (Visa (V) stock nagbabalik).Pipili ang kahon ng "Input X Range" at piliin ang independiyenteng data na variable (Bumalik ang S&P 500).Mag-click sa "OK" upang patakbuhin ang mga resulta.
I-interpret ang mga Resulta
Gamit ang data na iyon (pareho mula sa aming artikulo na R-square), nakuha namin ang sumusunod na talahanayan:
Ang halaga ng R 2, na kilala rin bilang koepisyent ng pagpapasiya, ay sumusukat sa proporsyon ng pagkakaiba-iba sa nakasalalay na variable na ipinaliwanag ng independyenteng variable o kung gaano kahusay ang modelo ng pagbabalik sa data. Ang halaga ng R 2 ay mula sa 0 hanggang 1, at ang isang mas mataas na halaga ay nagpapahiwatig ng isang mas mahusay na akma. Ang p-halaga, o halaga ng posibilidad, ay umaabot din mula 0 hanggang 1 at nagpapahiwatig kung ang pagsubok ay makabuluhan. Kabaligtaran sa halaga ng R 2, ang isang mas maliit na p-halaga ay kanais-nais dahil ito ay nagpapahiwatig ng isang ugnayan sa pagitan ng mga nakasalalay at malayang variable.
Charting a Regression sa Excel
Maaari kaming mag-tsart ng isang regression sa Excel sa pamamagitan ng pag-highlight ng data at charting ito bilang isang plot ng pagkakalat. Upang magdagdag ng isang linya ng regression, piliin ang "Layout" mula sa menu na "Chart Tools". Sa kahon ng diyalogo, piliin ang "Trendline" at pagkatapos ay "Linear Trendline". Upang magdagdag ng halaga ng R 2, piliin ang "Marami pang Mga Pagpipilian sa Trendline" mula sa "menu ng Trendline. Panghuli, piliin ang" Ipakita ang halaga ng R-parisukat sa tsart. "Ang visual na resulta ay sumasama sa lakas ng relasyon, kahit na sa gastos ng hindi pagbibigay kasing dami ng talahanayan sa itaas.
![Paano lumikha ng isang linear regression model nang higit pa Paano lumikha ng isang linear regression model nang higit pa](https://img.icotokenfund.com/img/financial-analysis/354/creating-linear-regression-model-excel.jpg)