Zakon raspodjele slučajne varijable. Zakon normalne raspodjele vjerovatnoće

21.09.2019

Teorija vjerovatnoće je grana matematike koja proučava obrasce slučajnih pojava: slučajne događaje, slučajne varijable, njihova svojstva i operacije nad njima.

Dugo vremena teorija vjerovatnoće nije imala jasnu definiciju. Formulisan je tek 1929. Pojava teorije vjerovatnoće kao nauke datira iz srednjeg vijeka i prvih pokušaja matematičke analize kockanja (pahuljica, kockica, rulet). Francuski matematičari iz 17. stoljeća Blaise Pascal i Pierre Fermat, istražujući predviđanje dobitaka u kockanje, otkrio prve probabilističke obrasce koji nastaju prilikom bacanja kocke.

Teorija vjerovatnoće je nastala kao nauka iz vjerovanja da su masovni slučajni događaji zasnovani na određenim obrascima. Teorija vjerovatnoće proučava ove obrasce.

Teorija vjerovatnoće bavi se proučavanjem događaja čiji se nastanak ne zna sa sigurnošću. Omogućava vam da procenite stepen verovatnoće nastanka nekih događaja u poređenju sa drugim.

Na primjer: nemoguće je nedvosmisleno odrediti rezultat "glava" ili "repa" kao rezultat bacanja novčića, ali se pri ponovljenom bacanju pojavljuje približno isti broj "glava" i "repova", što znači da vjerovatnoća da će “glave” ili “repovi” pasti”, jednaka je 50%.

Test u ovom slučaju se naziva implementacija određenog skupa uslova, odnosno u ovom slučaju bacanje novčića. Izazov se može odigrati neograničen broj puta. U ovom slučaju, skup uslova uključuje slučajne faktore.

Rezultat testa je događaj. Događaj se dešava:

  1. Pouzdan (uvijek se javlja kao rezultat testiranja).
  2. Nemoguće (nikad se ne dešava).
  3. Nasumično (može ili ne mora da se pojavi kao rezultat testa).

Na primjer, prilikom bacanja novčića, nemoguć događaj - novčić će pasti na njegovu ivicu, slučajni događaj - pojava "glava" ili "repova". Specifični rezultat testa se zove elementarni događaj. Kao rezultat testa, javljaju se samo elementarni događaji. Zove se skup svih mogućih, različitih, specifičnih ishoda testa prostor elementarnih događaja.

Osnovni koncepti teorije

Vjerovatnoća- stepen mogućnosti nastanka događaja. Kada razlozi da se neki mogući događaj zaista dogodi nadjačaju suprotne razloge, onda se ovaj događaj naziva vjerojatnim, inače - malo vjerovatnim ili nevjerovatnim.

Slučajna varijabla- to je količina koja, kao rezultat testiranja, može poprimiti jednu ili drugu vrijednost, a ne zna se unaprijed koju. Na primjer: broj po vatrogasnoj stanici dnevno, broj pogodaka sa 10 hitaca itd.

Slučajne varijable se mogu podijeliti u dvije kategorije.

  1. Diskretna slučajna varijabla je veličina koja, kao rezultat testiranja, može poprimiti određene vrijednosti sa određenom vjerovatnoćom, formirajući prebrojiv skup (skup čiji se elementi mogu numerisati). Ovaj skup može biti konačan ili beskonačan. Na primjer, broj hitaca prije prvog pogotka u metu je diskretna slučajna varijabla, jer ova količina može poprimiti beskonačan, iako prebrojiv broj vrijednosti.
  2. Kontinuirana slučajna varijabla je veličina koja može uzeti bilo koju vrijednost iz nekog konačnog ili beskonačnog intervala. Očigledno, broj mogućih vrijednosti kontinuiranog slučajna varijabla beskonačno.

Prostor vjerovatnoće- koncept koji je uveo A.N. Kolmogorov 30-ih godina 20. vijeka da formalizuje koncept vjerovatnoće, što je dovelo do naglog razvoja teorije vjerovatnoće kao stroge matematičke discipline.

Prostor vjerovatnoće je trostruka (ponekad zatvorena u ugaone zagrade: , gdje

Ovo je proizvoljan skup, čiji se elementi nazivaju elementarni događaji, ishodi ili tačke;
- sigma algebra podskupova koji se nazivaju (slučajni) događaji;
- mjera vjerovatnoće ili vjerovatnoća, tj. sigma-aditivna konačna mjera takva da .

De Moivre-Laplaceova teorema- jedna od graničnih teorema teorije vjerovatnoće, koju je ustanovio Laplace 1812. godine. Navodi da je broj uspjeha pri ponavljanju istog slučajnog eksperimenta iznova i iznova s ​​dva moguća ishoda približno normalno raspoređen. Omogućava vam da pronađete približnu vrijednost vjerovatnoće.

Ako je za svaki od nezavisnih pokušaja vjerovatnoća pojave nekog slučajnog događaja jednaka () i predstavlja broj pokušaja u kojima se on stvarno dogodi, tada je vjerovatnoća da je nejednakost istinita bliska (za velike vrijednosti) vrijednost Laplaceovog integrala.

Funkcija distribucije u teoriji vjerojatnosti- funkcija koja karakterizira distribuciju slučajne varijable ili slučajnog vektora; vjerovatnoća da će slučajna varijabla X uzeti vrijednost manju ili jednaku x, gdje je x proizvoljan realan broj. Ako su poznati uslovi ispunjeni, to u potpunosti određuje slučajnu varijablu.

Očekivanje- prosječna vrijednost slučajne varijable (ovo je distribucija vjerovatnoće slučajne varijable, razmatrana u teoriji vjerovatnoće). U literaturi na engleskom jeziku označava se sa , u ruskom - . U statistici se često koristi notacija.

Neka je dat prostor vjerovatnoće i na njemu definirana slučajna varijabla. To je, po definiciji, mjerljiva funkcija. Zatim, ako postoji Lebesgueov integral od nad prostorom, onda se to naziva matematičko očekivanje ili srednja vrijednost i označava se .

Varijanca slučajne varijable- mjera širenja date slučajne varijable, odnosno njenog odstupanja od matematičko očekivanje. Označava se u ruskoj i stranoj literaturi. U statistici se često koristi notacija ili. Kvadratni korijen varijanse naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Neka je slučajna varijabla definirana na nekom prostoru vjerovatnoće. Onda

gdje simbol označava matematičko očekivanje.

U teoriji vjerovatnoće nazivaju se dva slučajna događaja nezavisni, ako pojava jednog od njih ne mijenja vjerovatnoću pojave drugog. Slično, pozivaju se dvije slučajne varijable zavisan, ako vrijednost jednog od njih utječe na vjerovatnoću vrijednosti drugog.

Najjednostavniji oblik zakona veliki brojevi- Ovo je Bernulijeva teorema, koja kaže da ako je vjerovatnoća događaja ista u svim pokušajima, onda kako se broj pokušaja povećava, učestalost događaja teži vjerovatnoći događaja i prestaje biti slučajna.

Zakon velikih brojeva u teoriji vjerovatnoće kaže da je aritmetička sredina konačnog uzorka iz fiksne distribucije blizu teorijske sredine te distribucije. U zavisnosti od vrste konvergencije, pravi se razlika između slabog zakona velikih brojeva, kada se konvergencija dešava po verovatnoći, i jakog zakona velikih brojeva, kada je konvergencija skoro sigurna.

Opšte značenje zakona velikih brojeva je zajedničko djelovanje veliki broj identični i nezavisni slučajni faktori dovode do rezultata koji, u krajnjoj liniji, ne zavisi od slučajnosti.

Metode za procjenu vjerovatnoće zasnovane na analizi konačnog uzorka zasnivaju se na ovoj osobini. Jasan primjer je prognoza izbornih rezultata na osnovu ankete uzorka birača.

Centralne granične teoreme- klasa teorema u teoriji vjerovatnoće u kojima se navodi da je zbir dovoljan velika količina slabo zavisne slučajne varijable koje imaju približno iste skale (ni jedan pojam ne dominira niti daje odlučujući doprinos zbiru) ima distribuciju blisku normalnoj.

Budući da se mnoge slučajne varijable u aplikacijama formiraju pod utjecajem nekoliko slabo zavisnih slučajnih faktora, njihova se raspodjela smatra normalnom. U ovom slučaju mora biti ispunjen uslov da nijedan od faktora nije dominantan. Centralne granične teoreme u ovim slučajevima opravdavaju upotrebu normalne distribucije.

kao što je poznato, slučajna varijabla je promjenjiva veličina koja može poprimiti određene vrijednosti u zavisnosti od slučaja. Slučajne varijable su označene velikim slovima latinice (X, Y, Z), a njihove vrijednosti su označene odgovarajućim malim slovima (x, y, z). Slučajne varijable se dijele na diskontinualne (diskretne) i kontinuirane.

Diskretna slučajna varijabla je slučajna varijabla koja uzima samo konačan ili beskonačan (prebrojiv) skup vrijednosti sa određenim nenultim vjerovatnoćama.

Zakon distribucije diskretne slučajne varijable je funkcija koja povezuje vrijednosti slučajne varijable sa njihovim odgovarajućim vjerovatnoćama. Zakon o raspodjeli može se specificirati na jedan od sljedećih načina.

1 . Zakon distribucije se može dati u tabeli:

gdje je λ>0, k = 0, 1, 2, … .

V) korišćenjem funkcija distribucije F(x) , koji za svaku vrijednost x određuje vjerovatnoću da će slučajna varijabla X poprimiti vrijednost manju od x, tj. F(x) = P(X< x).

Svojstva funkcije F(x)

3 . Zakon distribucije može se grafički specificirati – distributivni poligon (poligon) (vidi problem 3).

Imajte na umu da za rješavanje nekih problema nije potrebno poznavati zakon raspodjele. U nekim slučajevima, dovoljno je znati jedan ili više brojeva koji najviše odražavaju važne karakteristike zakon o distribuciji. To može biti broj koji ima značenje “prosječne vrijednosti” slučajne varijable ili broj koji pokazuje prosječnu veličinu odstupanja slučajne varijable od njene srednje vrijednosti.

Brojevi ove vrste nazivaju se numeričkim karakteristikama slučajne varijable. :

  • Osnovne numeričke karakteristike diskretne slučajne varijable Matematičko očekivanje (prosječna vrijednost) diskretne slučajne varijable.
    Za binomnu distribuciju M(X)=np, za Poissonovu distribuciju M(X)=λ
  • Disperzija diskretna slučajna varijabla D(X)=M2 ili D(X) = M(X 2)− 2. Razlika X–M(X) naziva se odstupanjem slučajne varijable od njenog matematičkog očekivanja.
    Za binomnu distribuciju D(X)=npq, za Poissonovu distribuciju D(X)=λ
  • Standardna devijacija (standardna devijacija) σ(X)=√D(X).

Primjeri rješavanja zadataka na temu "Zakon distribucije diskretne slučajne varijable"

Zadatak 1.

1000 oslobođeno srećke: za 5 njih je dobitak od 500 rubalja, za 10 – dobitak od 100 rubalja, za 20 – dobitak od 50 rubalja, za 50 – dobitak od 10 rubalja. Odrediti zakon distribucije vjerovatnoće slučajne varijable X - dobitak po listiću.

Rješenje. U skladu sa uslovima zadatka, moguće su sledeće vrednosti slučajne varijable X: 0, 10, 50, 100 i 500.

Broj tiketa bez dobitka je 1000 – (5+10+20+50) = 915, zatim P(X=0) = 915/1000 = 0,915.

Slično, nalazimo sve ostale vjerovatnoće: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01 , P(X =500) = 5/1000=0,005. Predstavimo rezultujući zakon u obliku tabele:

Nađimo matematičko očekivanje vrijednosti X: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1+ 2+3+4+5+6)/6 = 21/6 = 3,5

Zadatak 3.

Uređaj se sastoji od tri nezavisna radna elementa.

Rješenje. 1. Vjerovatnoća kvara svakog elementa u jednom eksperimentu je 0,1. Napraviti zakon raspodjele za broj neuspjelih elemenata u jednom eksperimentu, konstruirati poligon distribucije. Pronađite funkciju distribucije F(x) i nacrtajte je. Pronađite matematičko očekivanje, varijansu i standardnu ​​devijaciju diskretne slučajne varijable.

Diskretna slučajna varijabla X = (broj neuspjelih elemenata u jednom eksperimentu) ima sljedeće moguće vrijednosti: x 1 =0 (nijedan element uređaja nije uspio), x 2 =1 (jedan element nije uspio), x 3 =2 ( dva elementa nisu uspjela) i x 4 =3 (tri elementa nisu uspjela). Kvarovi elemenata su nezavisni jedan od drugog, vjerovatnoće kvara svakog elementa su jednake, stoga je primjenjiv Bernulijeva formula
. S obzirom na to da prema uslovu, n=3, p=0,1, q=1-p=0,9, određujemo vjerovatnoće vrijednosti:
P 3 (0) = C 3 0 p 0 q 3-0 = q 3 = 0,9 3 = 0,729;
P 3 (1) = C 3 1 p 1 q 3-1 = 3*0,1*0,9 2 = 0,243;
P 3 (2) = C 3 2 p 2 q 3-2 = 3*0,1 2 *0,9 = 0,027;
P 3 (3) = C 3 3 p 3 q 3-3 = p 3 =0,1 3 = 0,001;

Provjerite: ∑p i = 0,729+0,243+0,027+0,001=1.

Crtamo moguće vrijednosti x i duž ose apscise, a odgovarajuće vjerovatnoće p i duž ordinatne ose. Konstruirajmo tačke M 1 (0; 0,729), M 2 (1; 0,243), M 3 (2; 0,027), M 4 (3; 0,001). Povezivanjem ovih tačaka pravim segmentima dobijamo željeni poligon distribucije.

3. Nađimo funkciju raspodjele F(x) = R(H

Za x ≤ 0 imamo F(x) = R(H<0) = 0;
za 0< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
za 1< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
za 2< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
za x > 3 postojaće F(x) = 1, jer događaj je pouzdan.

Grafikon funkcije F(x)

4. Za binomnu distribuciju X:
- matematičko očekivanje M(X) = np = 3*0,1 = 0,3;
- varijansa D(X) = npq = 3*0,1*0,9 = 0,27;
- standardna devijacija σ(X) = √D(X) = √0,27 ≈ 0,52.

Distribucija vjerovatnoće je mjera vjerovatnoće na mjerljivom prostoru.

Neka je W neprazan skup proizvoljne prirode i Ƒ -s- algebra na W, to jest, kolekcija podskupova od W koji sadrži sam W, prazan skup Æ, i zatvoren pod najviše prebrojiv skup teoretskih skupova operacija (to znači da za bilo koji A Î Ƒ skup = W\ A ponovo pripada Ƒ i ako A 1 , A 2 ,…O Ƒ , To Ƒ I Ƒ ). Par (W, Ƒ ) se naziva mjerljivim prostorom. Nenegativna funkcija P( A), definisano za svakoga A Î Ƒ , naziva se mjera vjerovatnoće, vjerovatnoća, P. vjerovatnoće ili jednostavno P., ako je P(W) = 1 i P je prebrojivo aditivna, odnosno za bilo koji niz A 1 , A 2 ,…O Ƒ takav da A i A j= Æ za sve i ¹ j, jednakost P() = P( A i). Tri (W, Ƒ , P) naziva se prostor vjerovatnoće. Prostor vjerovatnoće je originalni koncept aksiomatske teorije vjerovatnoće koju je predložio A.N. Kolmogorov ranih 1930-ih.

Na svakom prostoru vjerovatnoće mogu se razmatrati (realne) mjerljive funkcije X = X(w), wÎW, odnosno funkcije takve da (w: X(w)O B} Î Ƒ za bilo koji Borelov podskup B prava linija R. Mjerljivost funkcije X je ekvivalentno (w: X(w)< x} Î Ƒ za bilo koji pravi x. Mjerljive funkcije se nazivaju slučajne varijable. Svaka slučajna varijabla X, definisan na prostoru vjerovatnoće (W, Ƒ , P), generiše P. vjerovatnoće

P X (B) = P( XÎ B) = P((w: X(w)O B}), B Î Ɓ ,
na mjerljivom prostoru ( R, Ɓ ), Gdje Ɓ R, i funkcija distribucije

F X(x) = P( X < x) = P((w: X(w)< x}), -¥ < x <¥,
koje se nazivaju vjerovatnoća vjerovatnoće i funkcija distribucije slučajne varijable X.

Funkcija distribucije F bilo koja slučajna varijabla ima svojstva

1. F(x) neopadajuća,

2. F(- ¥) = 0, F(¥) = 1,

3. F(x) ostaje kontinuirano u svakoj tački x.

Ponekad u definiciji funkcije distribucije nejednakost< заменяется неравенством £; в этом случае функция распределения является непрерывной справа. В содержательных утверждениях теории вероятностей не важно, непрерывна функция распределения слева или справа, важны лишь положения ее точек разрыва x(ako ih ima) i veličine prirasta F(x+0) - F(x-0) na ovim tačkama; Ako F X, tada je ovaj prirast P( X = x).

Bilo koja funkcija F, koja ima svojstva 1. - 3. naziva se funkcija distribucije. Korespondencija između distribucija na ( R, Ɓ ) i funkcije distribucije su jedan na jedan. Za bilo koji R. P na ( R, Ɓ ) njegova funkcija distribucije je određena jednakošću F(x) = P((-¥, x)), -¥ < x <¥, а для любой функции распределения F koji mu odgovara R. P je definirana na algebri £ skupova koji se sastoje od unija konačnog broja disjunktnih intervala funkcije F 1 (x) linearno raste od 0 do 1. Za konstruiranje funkcije F 2 (x) segment je podijeljen na segment , interval (1/3, 2/3) i segment . Funkcija F 2 (x) na intervalu (1/3, 2/3) jednaka je 1/2 i linearno raste od 0 do 1/2 i od 1/2 do 1 na segmentima i, respektivno. Ovaj proces se nastavlja i funkcija Fn+1 se dobiva korištenjem sljedeće transformacije funkcije Fn, n³ 2. Na intervalima u kojima je funkcija Fn(x) je konstantna, Fn +1 (x) poklapa se sa Fn(x). Svaki segment gdje je funkcija Fn(x) raste linearno od a to b, podijeljen je na segment , interval (a + (a - b)/3, a + 2(b - a)/3) i segment . U navedenom intervalu Fn +1 (x) je jednako ( a + b)/2 i na naznačenim segmentima Fn +1 (x) raste linearno od a do ( a + b)/2i od ( a + b)/2 do b respektivno. Za svakih 0 £ x£1 sekvenca Fn(x), n= 1, 2,..., konvergira na neki broj F(x). Redoslijed funkcija distribucije Fn, n= 1, 2,..., je ekvikontinuirana, dakle funkcija granične raspodjele F(x) je kontinuiran. Ova funkcija je konstantna na prebrojivom skupu intervala (vrijednosti funkcije su različite na različitim intervalima), na kojima nema tačaka rasta, a ukupna dužina ovih intervala je 1. Stoga je Lebesgueova mjera za set supp F je jednako nuli, tj F jednina.

Svaka funkcija distribucije može se predstaviti kao

F(x) = str ac F ac ( x) + str d F d ( x) + str s F s ( x),
Gdje F ac, F d i F s je apsolutno kontinuirana, diskretna i singularna funkcija raspodjele, i zbir nenegativnih brojeva str ac, str d i p s je jednako jedan. Ova reprezentacija se zove Lebesgueova ekspanzija i funkcije F ac, F d i F s - komponente dekompozicije.

Funkcija distribucije naziva se simetrična if F(-x) = 1 - F(x+ 0) za
x> 0. Ako je simetrična funkcija distribucije apsolutno kontinuirana, tada je njena gustoća parna funkcija. Ako je slučajna varijabla X ima simetričnu distribuciju, zatim slučajne varijable X i - X podjednako raspoređeni. Ako je funkcija simetrične distribucije F(x) je dakle kontinuiran na nuli F(0) = 1/2.

Među apsolutno kontinuiranim pravilima koja se često koriste u teoriji vjerovatnoće su uniformna pravila, normalna pravila (Gaussova pravila), eksponencijalna pravila i Cauchyjeva pravila.

R. se naziva uniformnim na intervalu ( a, b) (ili na segmentu [ a, b], ili u intervalima [ a, b) I ( a, b]), ako je njegova gustina konstantna (i jednaka 1/( b - a)) do ( a, b) i jednaka je nuli izvan ( a, b). Najčešće se koristi uniformna distribucija na (0, 1), njena funkcija distribucije F(x) je jednako nuli na x£ 0, jednako jedan u x>1 i F(x) = x u 0< x£ 1. Ujednačena slučajna varijabla na (0, 1) ima slučajnu varijablu X(w) = w na prostoru vjerovatnoće koji se sastoji od intervala (0, 1), skupa Borelovih podskupova ovog intervala i Lebesgueove mjere. Ovaj prostor vjerovatnoće odgovara eksperimentu „bacanje tačke w nasumično na interval (0, 1)“, gdje riječ „nasumično“ znači jednakost („jednaka mogućnost“) svih tačaka iz (0, 1). Ako na prostoru vjerovatnoće (W, Ƒ , P) postoji slučajna varijabla X sa uniformnom distribucijom na (0, 1), zatim na njoj za bilo koju funkciju distribucije F postoji slučajna varijabla Y, za koju je funkcija distribucije F Y poklapa se sa F. Na primjer, funkcija distribucije slučajne varijable Y = F -1 (X) poklapa se sa F. Evo F -1 (y) = inf( x: F(x) > y}, 0 < y < 1; если функция F(x) je dakle kontinuirana i strogo monotona na cijeloj realnoj liniji F-1 - inverzna funkcija F.

Normalni R. sa parametrima ( a, s 2), -¥< a < ¥, s 2 >0, nazvan R. sa gustinom, -¥< x < ¥. Чаще всего используется нормальное Р. с параметрами a= 0 i s 2 = 1, što se naziva standardna normalna R., njena funkcija distribucije F( x) nije izraženo kroz superpozicije elementarnih funkcija i moramo koristiti njegov integralni prikaz F( x) =, -¥ < x < ¥. Для фунции распределения F(x) sastavljene su detaljne tabele koje su bile neophodne prije pojave moderne računarske tehnologije (vrijednosti funkcije F( x) se također može dobiti pomoću posebnih tabela. funkcije erf( x)), vrijednosti F( x) Za x> 0 se može dobiti pomoću sume serije

,
i za x < 0 можно воспользоваться симметричностью F(x). Vrijednosti normalne funkcije distribucije s parametrima a i s 2 se može dobiti koristeći činjenicu da se poklapa sa F(( x - a)/s). Ako X 1 i X 2 nezavisna normalno raspoređena s parametrima a 1 , s 1 2 i a 2 , s 2 2 slučajne varijable, zatim distribucija njihovog zbira X 1 + X 2 je također u redu s parametrima a= a 1 + a 2 i s 2 = s 1 2 + s 2 2 . Tvrdnja je također tačna, u određenom smislu, suprotna: ako je slučajna varijabla X normalno raspoređena sa parametrima a i s 2 i
X = X 1 + X 2 gdje X 1 i X 2 su, dakle, nezavisne slučajne varijable osim konstanti X 1 i X 2 imaju normalne distribucije (Cramerov teorem). Opcije a 1 , s 1 2 i a 2 , s 2 2 distribucije normalnih slučajnih varijabli X 1 i X 2 vezano za a i s 2 gore navedenim jednakostima. Standardna normalna distribucija je granica u središnjoj graničnoj teoremi.

Eksponencijalna distribucija je distribucija sa gustinom str(x) = 0 at x < 0 и str(x) = l e- l x at x³ 0, gdje je l > 0 parametar, njegova funkcija distribucije F(x) = 0 at x£0 i F(x) = 1 - e- l x at x> 0 (ponekad se koriste eksponencijalni parametri koji se razlikuju od naznačenog pomakom duž realne ose). Ovaj R. ima svojstvo koje se zove odsustvo naknadnog efekta: ako X je slučajna varijabla s eksponencijalnim R., tada za bilo koji pozitivan x I t

P( X > x + t | X > x) = P( X > t).
Ako X je vrijeme rada nekog uređaja prije kvara, tada odsustvo naknadnog efekta znači da je vjerovatnoća da uređaj, uključen u vrijeme 0, neće otkazati sve dok x + t pod uslovom da do tog trenutka nije odbio x, ne zavisi od x. Ovo svojstvo se tumači kao odsustvo "starenja". Odsustvo naknadnog efekta je karakteristično svojstvo eksponencijalne raspodjele: u klasi apsolutno kontinuiranih distribucija, gornja jednakost vrijedi samo za eksponencijalnu raspodjelu (sa nekim parametrom l > 0). Eksponencijalni R. se pojavljuje kao granični R. u minimalnoj šemi. Neka X 1 , X 2 ,… - nenegativne nezavisne identično raspoređene slučajne varijable i za njihovu zajedničku funkciju distribucije F tačka 0 je tačka rasta. Zatim u n®¥ distribucije slučajnih varijabli Yn= min( X 1 ,…, Xn) slabo konvergiraju u degenerisanu distribuciju sa jednom tačkom rasta 0 (ovo je analog zakona velikih brojeva). Ako dodatno pretpostavimo da je za neki e > 0 funkcija distribucije F(x) na intervalu (0, e) dopušta reprezentaciju i str(u)®l at u¯ 0, tada funkcije distribucije slučajnih varijabli Z n = n min( X 1 ,…, Xn) at n®¥ ravnomjerno preko -¥< x < ¥ сходятся к экспоненциальной функции распределения с параметром l (это - аналог центральной предельной теоремы).

R. Cauchy se zove R. sa gustinom str(x) = 1/(p(1 + x 2)), -¥< x < ¥, его функция рас-пределения F(x) = (arctg x+ p/2)/str. Ovaj R. pojavio se u radu S. Poissona 1832. godine u vezi sa rješenjem sljedećeg problema: postoje li nezavisne identično raspoređene slučajne varijable? X 1 , X 2 ,... tako da je aritmetička sredina ( X 1 + … + Xn)/n na svakom n imaju isti R. kao i svaka od slučajnih varijabli X 1 , X 2 ,...? S. Poisson je otkrio da slučajne varijable sa specificiranom gustinom imaju ovo svojstvo. Za ove slučajne varijable ne vrijedi izjava zakona velikih brojeva u kojoj je aritmetička sredina ( X 1 +…+ Xn)/n sa rastom n degenerisati. Međutim, to nije u suprotnosti sa zakonom velikih brojeva, jer nameće ograničenja na distribucije originalnih slučajnih varijabli koje nisu zadovoljene za navedenu distribuciju (za ovu distribuciju postoje apsolutni momenti svih pozitivnih redova manji od jedinice, ali matematičko očekivanje ne postoji). U djelima O. Cauchyja, R., koji nosi njegovo ime, pojavio se 1853. R. Cauchy je srodan X/Y nezavisne slučajne varijable sa standardnim normalnim P.

Među diskretnim varijablama koje se često koriste u teoriji vjerovatnoće su R. Bernoulli, binom R. i R. Poisson.

R. Bernoulli svaku distribuciju naziva sa dvije tačke rasta. Najčešće korištena slučajna varijabla je R. X, uzimajući vrijednosti 0 i 1 sa vjerovatnoćama
q = 1 - str I str odnosno, gdje je 0< str < 1 - параметр. Первые формы закона больших чисел и центральной предельной теоремы были получены для случайных величин, имею-щих Р. Бернулли. Если на вероятностном пространстве (W, Ƒ , P) postoji niz X 1 , X 2,... nezavisne slučajne varijable koje uzimaju vrednosti 0 i 1 sa verovatnoćom od 1/2 svaka, onda na ovom prostoru verovatnoće postoji slučajna varijabla sa uniformnim R na (0, 1). Konkretno, slučajna varijabla ima uniformnu distribuciju na (0, 1).

Binomna R. sa parametrima n I str, n- prirodno, 0< str < 1, называется Р., с точками роста 0, 1,..., n, u kojem su koncentrisane vjerovatnoće C n k p k q n-k, k = 0, 1,…, n,
q = 1 - str. To je R. iznos n nezavisne slučajne varijable koje imaju R. Bernoullija sa tačkama rasta 0 i 1, u kojima su koncentrisane verovatnoće q I str. Proučavanje ove raspodjele dovelo je J. Bernoullija do otkrića zakona velikih brojeva, a A. Moivrea do otkrića središnje granične teoreme.

Poissonova formula se naziva formula čiji je oslonac niz tačaka 0, 1,..., u kojima su koncentrisane vjerovatnoće l k e-l/ k!, k= 0, 1,…, gdje je l > 0 parametar. Zbir dvije nezavisne slučajne varijable koje imaju R. Poisson sa parametrima l i m opet ima R. Poisson sa parametrom l + m. R. Poisson je granica za R. Bernoullija sa parametrima n I str = str(n) at n®¥ ako n I str povezane relacijom n.p.®l at n®¥ (Poissonova teorema). Ako je niz 0< T 1 < T 2 < T 3 <… есть последовательность моментов времени, в которые происходят некоторые события (так. наз поток событий) и величины T 1 , T 2 -T 1 , T 3 - T 2 ,... su nezavisne identično raspoređene slučajne varijable i njihov zajednički R. je eksponencijalan sa parametrom l > 0, tada je slučajna varijabla Xt, jednako broju događaja koji su se desili u intervalu (0, t), ima R. Poisson s parametrom.l t(takav tok se zove Poisson).

Koncept R ima brojne generalizacije, posebno se proteže na višedimenzionalni slučaj i na algebarske strukture.

Odjeljak 6. Tipični zakoni distribucije i numeričke karakteristike slučajnih varijabli

Oblik funkcija F(x), p(x) ili nabrajanje p(x i) naziva se zakon raspodjele slučajne varijable. Iako možemo zamisliti beskonačnu raznolikost slučajnih varijabli, postoji mnogo manje zakona distribucije. Prvo, različite slučajne varijable mogu imati potpuno iste zakone raspodjele. Na primjer: neka y uzme samo 2 vrijednosti 1 i -1 sa vjerovatnoćom 0,5; vrijednost z = -y ima potpuno isti zakon raspodjele.
Drugo, vrlo često slučajne varijable imaju slični zakoni distribucije, tj. na primjer, p(x) za njih se izražava formulama istog oblika, koje se razlikuju samo u jednoj ili više konstanti. Ove konstante se nazivaju parametri distribucije.

Iako u principu najviše moguće različiti zakoni distribucije, ovdje će se razmotriti nekoliko najtipičnijih zakona. Važno je obratiti pažnju na uslove pod kojima nastaju, parametre i svojstva ovih distribucija.

1. Ujednačena distribucija
Ovo je naziv za distribuciju slučajne varijable koja može uzeti bilo koju vrijednost u intervalu (a,b), a vjerovatnoća da ona padne u bilo koji segment unutar (a,b) proporcionalna je dužini segmenta i ne zavisi od njegovog položaja, a verovatnoća vrednosti izvan (a,b) jednaka je 0.


Slika 6.1 Funkcija uniformne distribucije i gustina

Parametri distribucije: a, b

2. Normalna distribucija
Distribucija sa gustinom opisanom formulom

(6.1)

zove se normalno.
Parametri distribucije: a, σ


Slika 6.2 Tipična funkcija gustine i normalne distribucije

3. Bernulijeva distribucija
Ako se izvede niz nezavisnih pokušaja, u svakom od kojih se događaj A može pojaviti s istom vjerovatnoćom p, tada je broj pojavljivanja događaja slučajna varijabla raspoređena prema Bernoullijevom zakonu, ili prema binomskom zakonu (drugi naziv za distribuciju).

Ovdje je n broj pokušaja u seriji, m je slučajna varijabla (broj pojavljivanja događaja A), P n (m) je vjerovatnoća da će se A dogoditi tačno m puta, q = 1 - p (vjerovatnoća da se A neće pojaviti na suđenju).

Primer 1: Kocka je bačena 5 puta, kolika je verovatnoća da će 6 biti bačena dva puta?
n = 5, m = 2, p = 1/6, q = 5/6

Parametri distribucije: n, p

4. Poissonova distribucija
Poissonova raspodjela se dobija kao granični slučaj Bernoullijeve raspodjele, ako p teži nuli, a n beskonačnosti, ali tako da njihov proizvod ostaje konstantan: nr = a. Formalno, takav prijelaz do granice vodi do formule

Parametar distribucije: a

Mnoge slučajne varijable koje se nalaze u nauci i praktičnom životu podliježu Poissonovoj distribuciji.

Primjer 2: broj primljenih poziva u stanici hitne pomoći u roku od sat vremena.
Podijelimo vremenski interval T (1 sat) na male intervale dt, tako da je vjerovatnoća primanja dva ili više poziva tokom dt zanemarljiva, a vjerovatnoća jednog poziva p proporcionalna dt: p = μdt;
posmatranje u trenucima dt posmatraćemo kao nezavisne pokušaje, broj takvih pokušaja tokom vremena T: n = T / dt;
ako pretpostavimo da se vjerovatnoće dolazaka poziva ne mijenjaju tokom sata, tada ukupan broj poziva ispunjava Bernoullijev zakon s parametrima: n = T / dt, p = μdt. Usmjeravajući dt na nulu, nalazimo da n teži beskonačnosti, a proizvod n×r ostaje konstantan: a = n×r = μT.

Primjer 3: broj molekula idealan gas u nekom fiksnom svesku V.
Podijelimo volumen V na male zapremine dV tako da je vjerovatnoća pronalaženja dva ili više molekula u dV zanemarljiva, a vjerovatnoća pronalaženja jednog molekula proporcionalna dV: p = μdV; posmatranje svake zapremine dV posmatraćemo kao nezavisni test, broj takvih testova n=V/dV; ako pretpostavimo da su vjerovatnoće pronalaska molekula bilo gdje unutar V iste, ukupan broj molekula u volumenu V ispunjava Bernoullijev zakon sa parametrima: n = V / dV, p = μdV. Usmjeravajući dV na nulu, nalazimo da n teži beskonačnosti, a proizvod n×r ostaje konstantan: a = n×r =μV.

Numeričke karakteristike slučajnih varijabli

1. matematičko očekivanje (prosječna vrijednost)

definicija:
Matematičko očekivanje se zove
  (6.4)

Zbir se uzima preko svih vrijednosti koje slučajna varijabla uzima. Niz mora biti apsolutno konvergentan (inače se kaže da slučajna varijabla nema matematičko očekivanje)

;   (6.5)

Integr mora biti apsolutno konvergentan (inače se kaže da slučajna varijabla nema matematičko očekivanje)


Svojstva matematičkog očekivanja:

a. Ako je C - konstantan, tada je MC = C
b. MCx = CMx
c. Matematičko očekivanje zbira slučajnih varijabli je uvijek jednako zbiru njihovih matematičkih očekivanja: M(x+y) = Mx + My d. Uvodi se koncept uslovnog matematičkog očekivanja. Ako slučajna varijabla uzme svoje vrijednosti x i sa različitim vjerovatnoćama p(x i /H j) pod različitim uslovima H j, tada se određuje uslovno očekivanje

Kako ili ;   (6.6)

Ako su vjerovatnoće događaja H j poznate, potpuna

matematičko očekivanje: ;   (6.7)

Primjer 4: Koliko puta u prosjeku treba baciti novčić prije nego što se pojavi prvi simbol? Ovaj problem se može riješiti direktno

x i 1 2 3 ... k..
p(x i) :  ,

ali ovaj iznos još treba izračunati. Možete to učiniti jednostavnije korištenjem koncepata uvjetnog i potpunog matematičkog očekivanja. Razmotrimo hipoteze H 1 - grb je ispao prvi put, H 2 - grb nije ispao prvi put. Očigledno, p(H 1) = p(H 2) = ½; Mx / N 1 = 1;
Mx / N 2 je 1 više od željenog punog očekivanja, jer nakon prvog bacanja novčića situacija se nije promijenila, ali je već jednom bačena. Koristeći formulu za ukupno matematičko očekivanje, imamo Mh = Mx / N 1 ×r(N 1) + Mx / N 2 ×r(N 2) = 1 × 0,5 + (Mh + 1) × 0,5, rješavajući jednačinu za Mh, odmah dobijamo Mx = 2.

e. Ako je f(x) funkcija slučajne varijable x, tada je definiran koncept matematičkog očekivanja funkcije slučajne varijable:

Za diskretnu slučajnu varijablu: ;   (6.8)

Zbir se uzima preko svih vrijednosti koje slučajna varijabla uzima. Niz mora biti apsolutno konvergentan.

Za kontinuiranu slučajnu varijablu: ;   (6.9)

Integral mora biti apsolutno konvergentan.

2. Varijanca slučajne varijable
definicija:
Varijanca slučajne varijable x je matematičko očekivanje kvadrata odstupanja vrijednosti vrijednosti od njenog matematičkog očekivanja: Dx = M(x-Mx) 2

Za diskretnu slučajnu varijablu: ;   (6.10)

Zbir se uzima preko svih vrijednosti koje slučajna varijabla uzima. Niz mora biti konvergentan (inače se kaže da slučajna varijabla nema varijansu)

Za kontinuiranu slučajnu varijablu: ;   (6.11)

Integral mora biti konvergentan (inače se kaže da slučajna varijabla nema varijansu)

Svojstva disperzije:
a. Ako je C konstantna vrijednost, tada je DC = 0
b. DSh = S 2 Dh
c. Varijanca sume slučajnih varijabli je uvijek jednaka zbroju njihovih varijansi samo ako su ove vrijednosti nezavisne (definicija nezavisnih varijabli)
d. Za izračunavanje varijanse prikladno je koristiti formulu:

Dx = Mx 2 - (Mx) 2 (6.12)

Odnos između numeričkih karakteristika
i parametri tipičnih distribucija

distribucijaparametriformulaMxDx
uniformaa, b (b+a) / 2(b-a) 2 / 12
normalnoa, σ aσ 2
Bernoullin,p n.p.npq
Poissona aa

Unatoč egzotičnim nazivima, uobičajene distribucije se međusobno povezuju na intuitivan i zanimljiv način koji ih čini lakim za pamćenje i pouzdano razmišljanje. Neki slijede prirodno, na primjer, iz Bernoullijeve distribucije. Vrijeme je da pokažemo mapu ovih veza.

Svaka distribucija je ilustrirana primjerom njene funkcije gustoće distribucije (DFF). Ovaj članak je samo o onim distribucijama čiji su ishodi pojedinačni brojevi. Stoga je horizontalna osa svakog grafa skup mogućih brojeva ishoda. Vertikala – vjerovatnoća svakog ishoda. Neke distribucije su diskretne - njihovi ishodi moraju biti cijeli brojevi, kao što su 0 ili 5. One su označene rijetkim linijama, po jedna za svaki ishod, sa visinom koja odgovara vjerovatnoći datog ishoda. Neki su kontinuirani, njihovi ishodi mogu imati bilo koju numeričku vrijednost, kao što je -1,32 ili 0,005. One su prikazane kao guste krive sa površinama ispod delova krive koji daju verovatnoće. Zbir visina linija i površina ispod krivih je uvijek 1.

Štampaj, seci prema isprekidana linija i nosite ga sa sobom u novčaniku. Ovo je vaš vodič kroz zemlju distribucije i njihove rođake.

Bernuli i uniforma

Već ste se susreli sa Bernoullijevom distribucijom iznad, sa dva ishoda - glavom ili repom. Zamislite to sada kao distribuciju preko 0 i 1, 0 je glava, 1 je rep. Kao što je već jasno, oba ishoda su podjednako vjerovatna, a to je prikazano na dijagramu. Bernoulli PDF sadrži dvije linije jednake visine, koje predstavljaju 2 jednako vjerojatna ishoda: 0 i 1, respektivno.

Bernulijeva distribucija takođe može predstavljati nejednako verovatne ishode, kao što je bacanje pogrešnog novčića. Tada vjerovatnoća glava neće biti 0,5, već neka druga vrijednost p, a vjerovatnoća repova će biti 1-p. Kao i mnoge druge distribucije, ovo je zapravo čitava porodica distribucija koje daje određene parametre, kao p gore. Kada pomislite na „Bernoullija“, pomislite na „bacivanje (verovatno pogrešnog) novčića“.

Odavde je vrlo mali korak da se predstavi distribucija na vrhu nekoliko jednako vjerojatnih ishoda: uniformna distribucija koju karakterizira ravni PDF. Zamislite običnu kocku. Njegovi ishodi 1-6 su jednako vjerovatni. Može se specificirati za bilo koji broj ishoda n, pa čak i kao kontinuirana distribucija.

Zamislite ravnomjernu distribuciju kao "ravnu kockicu".

Binomni i hipergeometrijski

Binomna distribucija se može smatrati zbirom rezultata onih stvari koje slijede Bernoullijevu distribuciju.

Bacite pošten novčić dvaput - koliko puta će to biti grla? Ovo je broj koji prati binomnu distribuciju. Njegovi parametri su n, broj pokušaja, i p – vjerovatnoća „uspjeha“ (u našem slučaju glava ili 1). Svako bacanje je rezultat ili test raspoređen po Bernoulliju. Koristi binomna distribucija, kada računate broj uspjeha u stvarima kao što je bacanje novčića, gdje je svako bacanje nezavisno od drugih i ima istu vjerovatnoću uspjeha.

Ili zamislite urnu s istim brojem bijelih i crnih kuglica. Zatvorite oči, izvadite loptu, zapišite njenu boju i vratite je nazad. Ponovi. Koliko puta je izvučena crna kugla? Ovaj broj također prati binomnu distribuciju.

Predstavili smo ovu čudnu situaciju kako bismo lakše razumjeli značenje hipergeometrijske distribucije. Ovo je distribucija istog broja, ali u situaciji ako mi Ne vratio lopte. Svakako rođak binomna distribucija, ali nije ista, jer se vjerovatnoća uspjeha mijenja sa svakom izvučenom loptom. Ako je broj loptica dovoljno velik u odnosu na broj izvlačenja, onda su ove raspodjele gotovo identične, jer se šansa za uspjeh izuzetno malo mijenja sa svakim izvlačenjem.

Kada neko priča o izvlačenju loptica iz urni bez vraćanja, gotovo je uvijek sigurno reći "da, hipergeometrijska raspodjela", jer nikada u životu nisam sreo nikoga ko je zapravo punio urne kuglicama, a zatim ih izvlačio i vraćao. , ili obrnuto. Čak i ne poznajem nikoga sa kantom za smeće. Još češće, ova distribucija bi se trebala pojaviti kada se kao uzorak odabire značajan podskup neke populacije.

Napomena prevod

Ovdje možda nije baš jasno, ali budući da je tutorijal ekspresni kurs za početnike, trebalo bi ga pojasniti. Stanovništvo je nešto što želimo statistički procijeniti. Za procjenu odabiremo određeni dio (podskup) i na njemu napravimo traženu procjenu (tada se ovaj podskup naziva uzorak), pod pretpostavkom da će procjena za cijelu populaciju biti slična. Ali da bi to bilo tačno, često su potrebna dodatna ograničenja za definiciju podskupa uzorka (ili, obrnuto, s obzirom na poznati uzorak, moramo procijeniti da li dovoljno precizno opisuje populaciju).

Praktični primjer - potrebno je da odaberemo predstavnike iz kompanije od 100 ljudi koji će putovati na E3. Poznato je da je prošle godine tamo već putovalo 10 ljudi (ali niko to ne priznaje). Koliki je minimalni iznos koji trebate uzeti da postoji velika vjerovatnoća da u grupi bude barem jedan iskusan drug? U ovom slučaju, populacija je 100, uzorak je 10, zahtjevi za uzorkovanje su najmanje jedna osoba koja je već vozila E3.

Wikipedia ima manje smiješan, ali praktičniji primjer o neispravnim dijelovima u seriji.

Poisson

Šta je sa brojem klijenata koji zovu hotline tehničkoj podršci svake minute? Ovo je ishod čija se distribucija čini binomnom, ako svaku sekundu računamo kao Bernoulli test tokom kojeg kupac ili ne zove (0) ili zove (1). Ali organizacije za opskrbu električnom energijom vrlo dobro znaju: kada je struja isključena, dvije osobe mogu nazvati u sekundi. ili čak više od stotinu ljudi. Razmišljanje o tome kao o testovima od 60.000 milisekundi također ne pomaže - ima više testova, vjerovatnoća poziva po milisekundi je manja, čak i ako ne računate dva ili više u isto vrijeme, ali, tehnički, ovo je još uvijek nije Bernoullijev test. Međutim, radi logičko rezonovanje sa prelaskom u beskonačnost. Neka n teži beskonačnosti, a p 0, tako da je np konstantan. To je kao dijeljenje na sve manje i manje dijelove vremena sa sve manjom vjerovatnoćom poziva. U limitu dobijamo Poissonovu distribuciju.

Baš kao i binom, Poissonova distribucija je distribucija brojanja: koliko puta će se nešto dogoditi. Parametrizuje se ne vjerovatnoćom p i brojem pokušaja n, već prosječnim intenzitetom λ, koji je, u analogiji sa binomom, jednostavno konstantna vrijednost np. Poissonova distribucija - o čemu se radi neophodno zapamtite kada govorimo o brojanju događaja tokom određenog vremena sa konstantnim datim intenzitetom.

Kada nešto, kao što su paketi koji pristižu na ruter, ili se kupci pojavljuju u prodavnici, ili nešto čeka u redu, pomislite „Poisson“.

Geometrijski i negativni binom

Iz jednostavnih Bernoullijevih testova proizlazi drugačija distribucija. Koliko puta će novčić sletjeti glavom prije nego što padne na glavu? Broj repova prati geometrijsku distribuciju. Kao i Bernulijeva distribucija, ona je parametrizovana verovatnoćom uspešnog ishoda, str. Nije parametriran brojem n, brojem testova bacanja, jer je broj neuspješnih testova upravo rezultat.

Ako je binomna raspodjela "koliko uspjeha", onda je geometrijska distribucija "Koliko neuspjeha prije uspjeha?"

Negativna binomna distribucija je jednostavna generalizacija prethodne. Ovo je broj neuspjeha prije nego što bude r, a ne 1 uspjeha. Stoga se dalje parametrizuje ovim r. Ponekad se opisuje kao broj uspjeha do r neuspjeha. Ali kako moj životni trener kaže: „Vi odlučujete šta je uspeh, a šta neuspeh“, tako da je ista stvar, sve dok se setite da verovatnoća p treba da bude i tačna verovatnoća uspeha, odnosno neuspeha.

Ako vam je potrebna šala da ublažite napetost, možete spomenuti da su binomna i hipergeometrijska distribucija očigledan par, ali su geometrijski i negativni binom također prilično slični, a zatim recite: „Pa, tko ih sve tako zove, ha? ”

Eksponencijalna i Weibula

Opet o pozivima tehničkoj podršci: koliko će proći do sljedećeg poziva? Čini se da je raspodjela ovog vremena čekanja geometrijska, jer je svaka sekunda dok se niko ne javi kao neuspjeh, sve dok se ne javi poziv. Broj kvarova je kao broj sekundi dok se niko nije javio, i ovo praktično vremena do sledećeg poziva, ali nam "praktično" nije dovoljno. Poenta je da će ovo vrijeme biti zbir cijelih sekundi, pa stoga neće biti moguće računati čekanje unutar ove sekunde prije samog poziva.

Pa, kao i ranije, prelazimo na granicu u geometrijskoj distribuciji, što se tiče vremenskih udjela - i voila. Dobijamo eksponencijalnu distribuciju koja tačno opisuje vrijeme prije poziva. Ovo je kontinuirana distribucija, prva naše vrste, jer ishod nije nužno u cijelim sekundama. Kao i Poissonova raspodjela, ona je parametrizovana intenzitetom λ.

Ponavljajući vezu između binoma i geometrijskog, Poissonova „koliko događaja u vremenu?“ je povezano sa eksponencijalnim "koliko dugo do događaja?" Ako postoje događaji čiji broj po jedinici vremena odgovara Poissonovoj raspodjeli, tada vrijeme između njih podliježe eksponencijalnoj raspodjeli sa istim parametrom λ. Ova korespondencija između dvije distribucije mora se primijetiti kada se raspravlja o bilo kojoj od njih.

Eksponencijalna distribucija treba da vam padne na pamet kada razmišljate o „vremenu do događaja“, možda „vremenu do neuspeha“. U stvari, ovo je toliko važna situacija da postoje generalizovanije distribucije koje opisuju MTBF, kao što je Weibullova distribucija. Dok je eksponencijalna distribucija prikladna kada je stopa habanja, ili stopa kvara, na primjer, konstantna, Weibullova distribucija može modelirati stope kvarova koje se povećavaju (ili smanjuju) tokom vremena. Eksponencijalni je, općenito, poseban slučaj.

Mislite na "Weibull" kada pričate o MTBF.

Normalno, lognormalno, Studentov t i hi-kvadrat

Normalna, ili Gausova, distribucija je vjerovatno jedna od najvažnijih. Njegov oblik zvona je odmah prepoznatljiv. Na primjer, ovo je posebno znatiželjan entitet koji se manifestira posvuda, čak i iz naizgled najjednostavnijih izvora. Uzmite skup vrijednosti koje slijede istu distribuciju - bilo koju! - i savijte ih. Distribucija njihovog zbroja slijedi (približno) normalna distribucija. Što se više stvari sabira, njihov zbir bliži odgovara normalnoj distribuciji (cava: distribucija termina mora biti predvidljiva, nezavisna, teži samo normalnoj). Nevjerovatno je da je to istina uprkos originalnoj distribuciji.

Napomena prevod

Iznenadilo me je što autor ne piše o potrebi za uporedivom skalom sumiranih distribucija: ako jedna značajno dominira nad drugima, konvergencija će biti izuzetno loša. I, generalno, apsolutna međusobna nezavisnost nije dovoljna;

Pa, vjerovatno dobro za žurke, kako je napisao.


Ovo se zove „teorema centralne granice“, i morate znati šta je to, zašto se tako zove i šta znači, inače ćete se odmah nasmijati.

U svom kontekstu, normalno je povezano sa svim distribucijama. Iako je, u osnovi, povezano sa distribucijom svih vrsta iznosa. Zbir Bernoullijevih pokušaja prati binomnu distribuciju i, kako se broj pokušaja povećava, ova binomna distribucija postaje bliža normalnoj distribuciji. Isto tako, njegov rođak je hipergeometrijska distribucija. Poissonova raspodjela - ograničavajući oblik binoma - također se približava normalnoj s povećanjem parametra intenziteta.

Ishodi koji slijede lognormalnu distribuciju proizvode vrijednosti čiji je logaritam normalno raspoređen. Ili drugim riječima: eksponent normalno raspoređene vrijednosti je lognormalno raspoređen. Ako su zbroji normalno raspoređeni, zapamtite da su proizvodi lognormalno raspoređeni.

Studentova t distribucija je osnova t testa, koji mnogi nestatičari proučavaju u drugim oblastima. Koristi se za stvaranje pretpostavki o srednjoj vrijednosti normalne distribucije i također teži normalnoj distribuciji kako se njen parametar povećava. Prepoznatljiva karakteristika t-distribucija - njeni repovi, koji su deblji od repova normalne distribucije.

Ako debelorepa šala nije dovoljno potresla vašeg komšiju, pređite na prilično smiješnu priču o pivu. Prije više od 100 godina, Guinness je koristio statistiku kako bi poboljšao svoj staut. Tada je William Seely Gosset izmislio potpuno novu statističku teoriju za poboljšani uzgoj ječma. Goset je ubedio svog šefa da drugi pivari neće razumeti kako da iskoriste njegove ideje i dobio je dozvolu za objavljivanje, ali pod pseudonimom "Student". Najviše poznato dostignuće Gosset - to je upravo t-distribucija, koja je, moglo bi se reći, nazvana po njemu.

Konačno, hi-kvadrat distribucija je distribucija zbira kvadrata normalno raspoređenih vrijednosti. Hi-kvadrat test se zasniva na ovoj raspodeli, koja se sama zasniva na zbiru kvadrata razlika, koji bi trebalo da budu normalno raspoređeni.

Gama i beta

U ovom trenutku, ako ste već počeli da pričate o nečemu hi-kvadrat, razgovor počinje ozbiljno. Možda već razgovarate sa pravim statističarima i vjerovatno biste već trebali pokleknuti, jer bi se mogle pojaviti stvari poput gama distribucije. Ovo je generalizacija I eksponencijalna I hi-kvadrat raspodjela. Kao i eksponencijalna distribucija, koristi se za složeni modeli vremena čekanja. Na primjer, gama distribucija se pojavljuje kada se simulira vrijeme do sljedećih n događaja. Pojavljuje se u mašinskom učenju kao "pridružena prethodna distribucija" sa nekoliko drugih distribucija.

Nemojte pričati o ovim konjugiranim distribucijama, ali ako morate, nemojte zaboraviti govoriti o beta distribuciji, jer je to konjugat prije većine ovdje spomenutih distribucija. Naučnici podataka sigurni su da je upravo za to stvoren. Spomeni ovo opušteno i idi do vrata.

Početak mudrosti

Distribucije vjerovatnoće su nešto o čemu ne možete znati previše. Istinski zainteresovani mogu pogledati ovu super-detaljnu mapu svih distribucija verovatnoće Dodaj oznake