Kako izračunati preostalo odstopanje

Kazalo:

Anonim

Vlagatelji uporabljajo modele gibanja cen sredstev za napovedovanje, kje bo cena naložbe v danem trenutku. Metode, uporabljene za izdelavo teh napovedi, so del področja statistike, znane kot regresijske analize. Izračun. T rezidualna variance niza vrednosti je orodje za regresijsko analizo, ki meri, kako natančno se napovedi modela ujemajo z dejanskimi vrednostmi.

Linija regresije

The regresijsko premico prikazuje, kako se je vrednost sredstva spremenila zaradi sprememb v različnih spremenljivkah. Znan tudi kot a trend line, regresijska vrstica prikazuje "trend" cene sredstva. Regresijska črta je predstavljena z linearno enačbo:

Y = a + bX

kjer je "Y" vrednost sredstva, "a" je konstanta, "b" je množitelj in "X" je spremenljivka, povezana z vrednostjo sredstva.

Na primer, če model napoveduje, da se hiša z eno spalnico proda za 300.000 dolarjev, se hiša z dvema spalnicama prodaja za 400.000 dolarjev, hiša s tremi spalnicami pa se proda za 500.000 dolarjev, regresijska črta bi izgledala tako:

Y = 200,000 + 100,000X

kjer je "Y" domača prodajna cena, "X" pa število sob.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

Graf raztrosa

A graf raztrosa prikazuje točke, ki predstavljajo dejanske korelacije med vrednostjo sredstva in spremenljivko. Izraz "scatterplot" izhaja iz dejstva, da se, ko so te točke narisane na graf, zdi, da so "razpršene" okrog, namesto da ležejo povsem na regresijski premici. Na zgornjem primeru bi lahko imeli scatterplot s temi podatkovnimi točkami:

Točka 1: 1BR se je prodala za 288.000 $

Točka 2: 1BR se je prodala za 315.000 $

Točka 3: 2BR se je prodala za 395.000 $

Točka 4: 2BR prodana za 410.000 $

Točka 5: 3BR se je prodala za 492.000 $

Točka 6: 3BR se je prodala za 507.000 $

Izračun preostalih odstopanj

Izračun preostale variance se začne z vsota kvadratov (a) razlike med vrednostjo sredstva na regresijski premici in vsako ustrezno vrednostjo sredstva na razpršeni ploskvi. t

Tukaj so prikazani kvadratki razlik:

Točka 1: 288.000 $ - 300.000 $ = (- 12.000 $); (-12,000)2 = 144,000,000

Točka 2: 315.000 $ - 300.000 $ = (+ 15.000 $); (+15.000)2 = 225,000,000

Točka 3: 395.000 $ - 400.000 $ = (- 5000 $); (-5,000)2 = 25,000,000

Točka 4: 410.000 $ - 400.000 $ = (+ 10.000 $); (+10.000)2 = 100,000,000

Točka 5: 492 000 USD - 500 000 USD = (- 8 000 USD); (-8,000)2 = 64,000,000

Točka 6: 507 000 USD - 500 000 USD = (+ 7 000 USD); (+7 000)2 = 49,000,000

Vsota kvadratov = 607.000.000

Preostala varianca je ugotovljena z jemanjem vsote kvadratov in deljenjem z (n-2), kjer je "n" število podatkovnih točk na scatterplot.

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

Uporablja se za preostalo odstopanje

Medtem ko vsaka točka na scatterplotu ne bo popolnoma poravnana z regresijsko premico, bo stabilen model imel točke raztrosa v redni porazdelitvi okoli regresijske premice. Preostala varianca je znana tudi kot "varianca napak". Visoka rezidualna variance kaže, da je regresijska premica v prvotnem modelu lahko napačna. Nekatere funkcije preglednice lahko prikažejo proces za ustvarjanjem regresijske črte, ki se bolj približa podatkom o razpršitvi.