Dispersijas inflācijas koeficients (VIF) - pārskats, formula, izmantošana

Dispersijas inflācijas koeficients (VIF) regresijas analīzē mēra daudzkolinearitātes smagumu. Regresijas analīze Regresijas analīze ir statistikas metožu kopums, ko izmanto, lai novērtētu attiecības starp atkarīgo mainīgo un vienu vai vairākiem neatkarīgiem mainīgajiem. To var izmantot, lai novērtētu mainīgo lielumu attiecības un modelētu turpmākās attiecības starp tiem. . Tas ir statistikas jēdziens, kas norāda uz regresijas koeficienta dispersijas pieaugumu kolinearitātes rezultātā.

Kopsavilkums

Dispersijas inflācijas koeficientu (VIF) izmanto, lai noteiktu multikolinearitātes smagumu parastajā mazākā kvadrāta (OLS) regresijas analīzē.
Daudzkolinearitāte palielina dispersiju un II tipa kļūdu. Tas padara mainīgā koeficientu konsekventu, bet neuzticamu.
VIF mēra uzpūsto dispersiju skaitu, ko izraisa multikolinearitāte.

Dispersijas inflācijas koeficients un multikolinearitāte

Parastajā mazākā kvadrāta (OLS) regresijas analīzē daudzkolinearitāte pastāv, ja divi vai vairāki neatkarīgie mainīgie ir Neatkarīgs mainīgais. Neatkarīgais mainīgais ir ievads, pieņēmums vai draiveris, kas tiek mainīts, lai novērtētu tā ietekmi uz atkarīgo mainīgo (iznākumu). . demonstrēt lineāru saikni starp tām. Piemēram, lai regresijas modelī analizētu uzņēmuma lieluma un ieņēmumu saistību ar akciju cenām, neatkarīgie mainīgie ir tirgus kapitalizācija un ieņēmumi.

Uzņēmuma tirgus kapitalizācija Tirgus kapitalizācija Tirgus kapitalizācija (Market Cap) ir visjaunākā uzņēmuma apgrozībā esošo akciju tirgus vērtība. Tirgus ierobežojums ir vienāds ar pašreizējo akciju cenu, kas reizināta ar apgrozībā esošo akciju skaitu. Investoru kopiena bieži izmanto tirgus kapitalizācijas vērtību, lai ranžētu uzņēmumus, un tās kopējie ieņēmumi ir cieši saistīti. Uzņēmumam gūstot arvien lielākus ieņēmumus, tas arī palielinās. OLS regresijas analīzē tas noved pie daudzkolinearitātes problēmas. Ja neatkarīgie mainīgie regresijas modelī uzrāda pilnīgi paredzamu lineāru sakarību, to sauc par perfektu daudzkolinearitāti.

Izmantojot daudzkolinearitāti, regresijas koeficienti joprojām ir konsekventi, bet vairs nav ticami, jo standarta kļūdas ir paaugstinātas. Tas nozīmē, ka modeļa prognozēšanas jauda netiek samazināta, bet koeficienti var nebūt statistiski nozīmīgi ar II tipa kļūdu II tipa kļūda Statistiskās hipotēzes pārbaudē II tipa kļūda ir situācija, kad hipotēzes pārbaude nenoraida nulles hipotēzi, ka ir nepatiesa. Citā .

Tādēļ, ja mainīgo koeficienti nav individuāli nozīmīgi - t testā tos attiecīgi nevar noraidīt -, bet var kopīgi izskaidrot atkarīgā mainīgā lieluma dispersiju ar noraidījumu F testā un augstu noteikšanas koeficientu (R2), varētu pastāvēt daudzkolinearitāte. Tā ir viena no multikolinearitātes noteikšanas metodēm.

VIF ir vēl viens bieži izmantots rīks, lai noteiktu, vai regresijas modelī pastāv multikolinearitāte. Tas mēra, cik lielā mērā aplēstā regresijas koeficienta dispersija (vai standarta kļūda) ir palielināta kolinearitātes dēļ.

Dispersijas inflācijas koeficienta izmantošana

VIF var aprēķināt pēc šādas formulas:

Kur R_i2 ir nepielāgots noteikšanas koeficients, lai regresētu i-to neatkarīgo mainīgo uz pārējiem. VIF abpusējais ir pazīstams kā iecietība. Atkarībā no personīgās izvēles multikolinearitātes noteikšanai var izmantot vai nu VIF, vai toleranci.

Ja R_i2 ir vienāds ar 0, atlikušo neatkarīgo mainīgo lielumu dispersiju nevar paredzēt no i-tā neatkarīgā mainīgā. Tāpēc, kad VIF vai pielaide ir vienāda ar 1, i-tais neatkarīgais mainīgais nav korelē ar pārējiem, kas nozīmē, ka šajā regresijas modelī multikolinearitāte nepastāv. Šajā gadījumā i regresijas koeficienta dispersija nav uzpūsta.

Parasti VIF virs 4 vai pielaide zem 0,25 norāda, ka var pastāvēt daudzkolinearitāte, un ir nepieciešama papildu izpēte. Ja VIF ir lielāks par 10 vai pielaide ir mazāka par 0,1, pastāv ievērojama daudzkolinearitāte, kas jākoriģē.

Tomēr ir arī situācijas, kad augstas VFI var droši ignorēt, neciešot multikolinearitāti. Trīs šādas situācijas ir šādas:

1. Augsti VIF pastāv tikai kontroles mainīgajos, bet ne interesējošajos mainīgajos. Šajā gadījumā interesējošie mainīgie nav kolināri viens otram vai kontroles mainīgie. Regresijas koeficienti netiek ietekmēti.

2. Ja lielu mainīgo frekvenci izraisa citu mainīgo produktu vai spēku iekļaušana, daudzkolinearitāte neizraisa negatīvu ietekmi. Piemēram, regresijas modelis kā neatkarīgos mainīgos ietver gan x, gan x2.

3. Ja manekena mainīgajam, kas pārstāv vairāk nekā divas kategorijas, ir augsts VIF, multikolinearitāte ne vienmēr pastāv. Mainīgajiem vienmēr būs augsts VIF, ja kategorijā ir neliela daļa gadījumu, neatkarīgi no tā, vai kategoriskie mainīgie ir saistīti ar citiem mainīgajiem.

Multikolinearitātes korekcija

Tā kā multikolinearitāte palielina koeficientu dispersiju un izraisa II tipa kļūdas, ir svarīgi to atklāt un izlabot. Ir divi vienkārši un parasti izmantoti daudzkolinearitātes labošanas veidi, kas uzskaitīti zemāk:

1. Pirmais ir noņemt vienu (vai vairākus) ļoti korelējošos mainīgos. Tā kā mainīgo lielumu sniegtā informācija ir lieka, noņemšana būtiski neietekmēs noteikšanas koeficientu.

2. Otrā metode ir OLS regresijas vietā izmantot galveno komponentu analīzi (PCA) vai daļēju mazāko kvadrātu regresiju (PLS). PLS regresija var samazināt mainīgos līdz mazākam kopumam bez korelācijas starp tiem. PCA tiek izveidoti jauni nekorelēti mainīgie. Tas samazina informācijas zudumu un uzlabo modeļa paredzamību.

Vairāk resursu

Finanses ir oficiālais globālā sertificētā banku un kredīta analītiķu (CBCA) ™ CBCA ™ sertifikāta nodrošinātājs. Sertificētā banku un kredītu analītiķu (CBCA) ™ akreditācija ir pasaules mēroga kredītanalītiķu standarts, kas aptver finanses, grāmatvedību, kredīta analīzi, naudas plūsmas analīzi. , derību modelēšana, aizdevuma atmaksa un citas darbības. sertifikācijas programma, kas izstrādāta, lai palīdzētu ikvienam kļūt par pasaules klases finanšu analītiķi. Lai turpinātu virzīties uz priekšu, noderēs tālāk norādītie papildu resursi:

Finanšu pamatstatistikas jēdzieni Finanšu pamatstatistikas jēdzieni Stingra statistikas izpratne ir ārkārtīgi svarīga, lai palīdzētu mums labāk izprast finanses. Turklāt statistikas jēdzieni var palīdzēt investoriem uzraudzīt
Prognozēšanas metodes Prognozēšanas metodes Top Prognozēšanas metodes. Šajā rakstā mēs izskaidrosim četru veidu ieņēmumu prognozēšanas metodes, kuras finanšu analītiķi izmanto, lai prognozētu nākotnes ieņēmumus.
Daudzkārtēja lineārā regresija Daudzkārtēja lineārā regresija Daudzkārtēja lineārā regresija attiecas uz statistikas metodi, ko izmanto, lai prognozētu atkarīgā mainīgā rezultātu, pamatojoties uz neatkarīgo mainīgo lielumu vērtību
Nejaušais mainīgais Nejaušais mainīgais Gadījuma mainīgais (stohastiskais mainīgais) ir statistikas mainīgā veids, kura iespējamās vērtības ir atkarīgas no noteiktas nejaušas parādības iznākuma.

Dispersijas inflācijas koeficients (VIF) - pārskats, formula, izmantošana

Kopsavilkums

Dispersijas inflācijas koeficients un multikolinearitāte

Dispersijas inflācijas koeficienta izmantošana

Multikolinearitātes korekcija

Vairāk resursu

Jaunākās publikācijas

Kas ir funkcija ISERROR Excel?

Kas ir tiesību jautājums?