V statistični analizi. T variance med člani podatkovnega niza je prikazano, kako daleč so med seboj podatkovne točke iz trendne črte, znane tudi kot a regresijsko premico. Višja kot je varianca, bolj se razprostirajo podatkovne točke. Raziskava analize variance prikazuje, katere dele variance je mogoče razložiti z značilnostmi podatkov in ki jih je mogoče pripisati naključnim dejavnikom. Del variance, ki ga ni mogoče pojasniti, se imenuje preostala varianca.
Uporaba Excelovih preglednic za izračun preostale odstopanja
Formula za izračun preostale variance vključuje številne kompleksne izračune. Pri majhnih podatkovnih nizih je lahko postopek izračuna rezidualne variance z roko dolgočasen. Pri velikih nizih podatkov je naloga lahko izčrpna. Z uporabo Excelove preglednice morate vnesti samo podatkovne točke in izbrati pravilno formulo. Program obravnava kompleksne izračune in hitro doseže rezultat.
Podatkovne točke
Odprite novo Excelovo preglednico in vnesite podatkovne točke v dva stolpca. Regresijske črte zahtevajo, da ima vsaka podatkovna točka dva elementa. Statistični strokovnjaki običajno označijo te elemente »X« in »Y«. Generic Insurance Co. želi na primer poiskati preostalo odstopanje višine in teže zaposlenih. Spremenljivka X predstavlja višino in spremenljivka Y predstavlja težo. Vnesite višine v stolpec A in uteži v stolpec B.
Iskanje Srednje
The pomeni predstavlja povprečje za vsak element v nizu podatkov. V tem primeru želi Generic Insurance poiskati povprečje, standardno odstopanje in kovarianco 10 višin in uteži zaposlenih. Povprečje višin, navedenih v stolpcu A, je mogoče najti z vnosom funkcije "= AVERAGE (A1: A10)" v celico F1. Povprečje uteži, navedenih v stolpcu B, je mogoče najti tako, da v celico F3 vnesete funkcijo "= AVERAGE (B1: B10)".
Iskanje standardnega odstopanja in kovariance
The standardni odklon meri, kako daleč se razširijo podatkovne točke od povprečja. The kovarianca meri, koliko se dva elementa podatkovne točke spremenita skupaj. Standardno odstopanje višin se ugotovi z vnosom funkcije "= STDEV (A1: A10)" v celico F2. Standardno odstopanje uteži najdemo z vnosom funkcije "= STDEV (B1: B10)" v celico F4. Kovarianco med višino in težo najdemo tako, da v celico F5 vnesemo funkcijo "= COVAR (A1: A10; B1: B10)".
Iskanje regresijske črte
The regresijsko premico predstavlja linearno funkcijo, ki sledi trendu podatkovnih točk. Formula za regresijsko vrstico izgleda takole: Y = aX + b.
Vrednosti za "a" in "b" lahko uporabnik najde z izračuni sredstev, standardnih odstopanj in kovarianc. Vrednost za "b" pomeni točko, kjer regresijska premica prestreže os Y. Vrednost je mogoče najti tako, da vzamemo kovarianco in jo delimo s kvadratom standardnega odstopanja vrednosti X. Excelova formula gre v celico F6 in izgleda takole: = F5 / F2 ^ 2.
Vrednost za "a" predstavlja naklon regresijske premice. Excelova formula gre v celico F7 in izgleda takole: = F3-F6 * F1.
Za prikaz formule za regresijsko premico vnesite povezavo niza v celico F8:
= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (ZNAK (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))
Izračunajte Y vrednosti
Naslednji korak vključuje izračun Y-vrednosti regresijske vrstice za dane vrednosti X v podatkovnem nizu. Formula za iskanje vrednosti Y gre v stolpec C in izgleda takole:
= $ F $ 6 * A (i) + $ F $ 7
Kjer je A (i) vrednost za stolpec A v vrstici (i). Formule izgledajo tako v preglednici:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7 in tako naprej
Vnosi v stolpcu D prikazujejo razlike med pričakovanimi in dejanskimi vrednostmi za Y. Formule izgledajo takole:
= B (i) -C (i), Če sta B (i) in C (i) vrednosti v vrstici (i) v stolpcih B in C.
Iskanje preostale variance
The formula za preostalo varianco gre v celico F9 in izgleda tako:
= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)
Kjer je SUMSQ (D1: D10) vsota kvadratov razlik med dejansko in pričakovano vrednostjo Y, in (COUNT (D1: D10) -2) je število podatkovnih točk, minus 2 za stopnje svobode v podatkov.