Kako določiti vrsto porazdelitve verjetnosti za podatke

Kazalo:

Anonim

Ko ste zbrali podatke o vašem sistemu ali procesu, je naslednji korak določitev, katera vrsta porazdelitve verjetnosti obstaja. Vrste verjetnostnih porazdelitev so: diskretna uniformnost, Bernoulli, binom, negativni binom, Poissonova, geometrijska, kontinuirana enotna, normalna (zvonska krivulja), eksponentna, gama in beta porazdelitev. Zoževanje še nekaj s seznama možnosti omogoča, da je določitev, ki je najbližja R kvadratni vrednosti, veliko hitrejša.

Postavke, ki jih boste potrebovali

  • Grafična programska oprema

  • Sredstva za izračun vrednosti R kvadratov (analiza najprimernejšega)

Podajte podatke za vizualno predstavitev podatkovnega tipa.

Eden od prvih korakov pri določanju, katera distribucija podatkov ima - in s tem enačbo za modeliranje podatkov - je izključiti, kaj ne more biti. • Če v podatkovnem nizu obstajajo kakršni koli vrhovi, to ne more biti diskretna enakomerna porazdelitev. • Če imajo podatki več kot en vrh, to ni Poisson ali binom. • Če ima enojna krivulja, ni sekundarnih vrhov in ima na vsaki strani počasen nagib, je lahko Poissonova ali gama porazdelitev. Vendar ne more biti diskretna enakomerna porazdelitev. • Če so podatki enakomerno porazdeljeni in je brez asimetrije proti eni strani, je varno izključiti gama ali Weibullova porazdelitev. • Če ima funkcija enakomerno porazdelitev ali vrh v sredini graficnih rezultatov, to ni geometrijska porazdelitev ali eksponentna porazdelitev. • Če se pojav faktorja spreminja glede na spremenljivko okolja, verjetno ni Poissonova porazdelitev.

Ko je vrsta porazdelitve verjetnosti zmanjšana, naredite R kvadratno analizo vsake možne vrste porazdelitve verjetnosti. Tisti z najvišjo R kvadratno vrednostjo je najverjetneje pravilen.

Odstranite eno podatkovno točko za izločanje. Nato ponovno izračunajte R kvadrat. Če se ista vrsta porazdelitve verjetnosti pojavi kot najbližje ujemanje, potem obstaja veliko zaupanje, da je to pravilna porazdelitev verjetnosti za nabor podatkov.

Nasveti

  • Če podatki kažejo več vrhov širokega razpršitve, je možno, da potekajo dva ločena procesa ali pa je proizvod, ki se vzorči, mešan. Spomnite se podatkov in jih nato ponovno analizirajte.

Opozorilo

Potrdite enačbe, ki so ustvarjene za poznejše podatkovne nize, da potrdite, da je še vedno točen za podatkovni niz. Možno je, da so okoljski faktorji in procesni pomik povzročili napačne trenutne enačbe in modele.

Priporočena