Iako krivulja izgleda isto, koja je razlika između Cauchijeve i Gaussove distribucije?


Odgovor 1:

Cauchy ne izgleda normalno. Kako točno Cauchy izgleda ovisi o parametrima koje koristite, ali ne izgleda normalno.

npr

set.seed (1234) # Postavlja sjeme slučajnog broja x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, srednja (x1), sd (x1)) parcela (gustoća (x1)) parcela (gustoća (x2))

Uopće ne izgledajte isto. A x1 se kreće od -178 do 702, dok x2 kreće od -76 do 71.


Odgovor 2:

Kao što vidite, dvije krivulje izgledaju slično kao što obje imaju po jedan "prasak" i rašireni se manje dalje. Razlikuju se po tome što Cauchy ima uži vrh i širi se sporije - postoji mnogo veća vjerojatnost dobivanja vrijednosti daleko od vrha u usporedbi s normalnom raspodjelom. Ta razlika daje matematički različite posljedice - poput Cauchija koji nema dobro definiranu srednju vrijednost i ima osebujnu raspodjelu uzorka tamo gdje se „zakon velikih brojeva“ ne primjenjuje.


Odgovor 3:

Iako krivulja izgleda isto, koja je razlika između Cauchijeve i Gaussove distribucije?

Površno izgledaju slično. Ali pokažite mi graf funkcije gustoće distribucije i recite mi da je ili Cauchy ili Gaussian, znao bih koji (pod pretpostavkom da je zaista jedan od njih). Cauchy ima mnogo duže repove.

Kad imamo obitelj distribucija s nepoznatim parametrima, želimo ih procijeniti.

  • Gaussova raspodjela ima dva parametra, srednju i standardnu ​​devijaciju. Umjesto toga mogli bismo upotrijebiti druge parametre, na primjer medijanu (koja je jednaka srednjoj vrijednosti) i polu-interkvartilni raspon (što je otprilike
  • 0.67450.6745
  • puta standardno odstupanje). Srednja razdioba Cauchija ne postoji, ali medijan je središte simetrije. Standardno odstupanje također ne postoji, ali prosjek kvadratnih odstupanja od medijale je beskonačan.

Dakle, to je glavna razlika. Parametri bilo koje raspodjele možemo uzeti da su srednji i polu-interkvartilni raspon, ali ne možemo upotrijebiti srednje i standardno odstupanje za Cauchyja jer oni ne postoje.

Kad uzmemo uzorak koji nam pomaže procijeniti parametre raspodjele, izračunavamo statistiku poput srednjeg i standardnog odstupanja vrijednosti uzorka. Ove statistike imaju raspodjelu. Distribucija uzorka statistika poznata je i kao distribucija uzorkovanja.

  • Ako je raspodjela populacije Gaussova, (raspodjela uzorkovanja), vrijednost uzorka je također Gausova i ima znatno manje standardno odstupanje, tako da veliki uzorak daje preciznije procjene od samo jednog opažanja. Ako je raspodjela Cauchy, uzorak srednje vrijednosti također ima Cauchy-jevu distribuciju, ali ima potpuno isti srednji i polu-kvartalni raspon kao u izvornoj distribuciji. Nema koristi u uzimanju srednje vrijednosti uzorka.

Dakle, to je druga razlika. Srednja vrijednost uzorka iz Gaussove korisna je za procjenu srednje vrijednosti (ili srednje vrijednosti); srednja vrijednost uzorka za Cauchija beskorisna je za procjenu medijane. Bolje je koristiti uzorak medijan, koji daje preciznije procjene.

Slični argumenti primjenjuju se na procjenu širenja (no vi ga definirate) bilo koje distribucije. Uobičajene procjene za Gaussovu raspodjelu ne djeluju za Cauchyjevu distribuciju.

Prava razlika je u matematičkoj formuli gustoće. U standardnom obliku Gaussian ima gustoću

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

a Cauchy ima gustoću

1π(1+z2)\frac1{\pi(1+z^2)}

,

Imajte na umu da njih dvoje

zz

s su različiti. U prvom slučaju je standardno odstupanje

11

, u drugom je slučaju gornji kvartil

11

,

Funkcija raspodjele (vjerojatnost da

ZzZ\le z

) nema uredno zatvoren oblik za Gaussovu raspodjelu, ali ima to za Cauchy, jeste

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

,

Ako želite iscrtati raspodjele na istim osovinama da biste vidjeli razliku, trebali biste uskladiti parametre. Pa bih standardizirao Gaussove tako da su donji i gornji kvartil

0.6745-0.6745

i

0.67450.6745

, tj. učini standardno odstupanje jednakim

1.48261.4826

i koristite standardni obrazac za Cauchy. Područja ispod grafova trebaju biti jednaka, tako da visine u središtu trebaju biti odgovarajuće skalirane (

0.2690.269

za Gausije i

0.3180.318

za Cauchija - Cauchy je viši u sredini, a viši u repovima).