Binomické rozdelenie diskrétnej náhodnej premennej. Rozdelenie pravdepodobnosti

22.09.2019

Časť 6. Typické distribučné zákony a číselné charakteristiky náhodných premenných

Tvar funkcií F(x), p(x) alebo enumerácia p(x i) sa nazýva distribučný zákon náhodná premenná. Hoci si vieme predstaviť nekonečnú škálu náhodných premenných, zákonov rozdelenia je oveľa menej. Po prvé, rôzne náhodné premenné môžu mať presne rovnaké distribučné zákony. Napríklad: nech y má iba 2 hodnoty 1 a -1 s pravdepodobnosťou 0,5; hodnota z = -y má presne rovnaký distribučný zákon.
Po druhé, veľmi často náhodné premenné majú podobné zákony rozdelenia, t.j. napríklad p(x) je pre ne vyjadrené vzorcami rovnakého tvaru, líšiacich sa len jednou alebo viacerými konštantami. Tieto konštanty sa nazývajú distribučné parametre.

Aj keď v princípe najviac možné rôzne zákony distribúcie, bude tu zvažovaných niekoľko najtypickejších zákonov. Je dôležité venovať pozornosť podmienkam, za ktorých vznikajú, parametrom a vlastnostiam týchto rozvodov.

1. Rovnomerná distribúcia
Toto je názov pre distribúciu náhodnej premennej, ktorá môže nadobúdať ľubovoľné hodnoty v intervale (a,b) a pravdepodobnosť, že spadne do ktoréhokoľvek segmentu vo vnútri (a,b), je úmerná dĺžke segmentu. a nezávisí od jeho polohy a pravdepodobnosť hodnôt mimo (a,b) sa rovná 0.


Obr 6.1 Rovnomerná distribučná funkcia a hustota

Distribučné parametre: a, b

2. Normálne rozdelenie
Distribúcia s hustotou opísaná vzorcom

(6.1)

nazývaný normálny.
Parametre rozdelenia: a, σ


Obrázok 6.2 Typická hustota a funkcia normálneho rozdelenia

3. Bernoulliho distribúcia
Ak sa vykoná séria nezávislých pokusov, v ktorých sa udalosť A môže objaviť s rovnakou pravdepodobnosťou p, potom počet výskytov udalosti je náhodná premenná rozdelená podľa Bernoulliho zákona alebo podľa binomického zákona (iný názov pre distribúciu).

Tu n je počet pokusov v sérii, m je náhodná premenná (počet výskytov udalosti A), P n (m) je pravdepodobnosť, že A nastane presne m-krát, q = 1 - p (pravdepodobnosť že A sa v procese nezúčastní ).

Príklad 1: Kockou sa hodí 5-krát, aká je pravdepodobnosť, že dvakrát padne 6?
n = 5, m = 2, p = 1/6, q = 5/6

Parametre distribúcie: n, s

4. Poissonovo rozdelenie
Poissonovo rozdelenie získame ako limitný prípad Bernoulliho rozdelenia, ak p smeruje k nule a n k nekonečnu, ale tak, že ich súčin zostáva konštantný: nр = а. Formálne takýto prechod na limit vedie k vzorcu

Distribučný parameter: a

Mnoho náhodných premenných nájdených vo vede a praktickom živote podlieha Poissonovmu rozdeleniu.

Príklad 2: počet hovorov prijatých na ambulancii za hodinu.
Rozdeľme časový interval T (1 hodina) na malé intervaly dt tak, že pravdepodobnosť prijatia dvoch alebo viacerých hovorov počas dt je zanedbateľná a pravdepodobnosť jedného hovoru p je úmerná dt: p = μdt;
pozorovanie v momentoch dt budeme považovať za nezávislé pokusy, počet takýchto pokusov za čas T: n = T / dt;
ak predpokladáme, že pravdepodobnosti príchodov hovorov sa počas hodiny nemenia, potom sa celkový počet hovorov riadi Bernoulliho zákonom s parametrami: n = T / dt, p = μdt. Po nasmerovaní dt na nulu zistíme, že n smeruje k nekonečnu a súčin n×р zostáva konštantný: a = n×р = μT.

Príklad 3: počet molekúl ideálny plyn v nejakom pevnom zväzku V.
Rozdeľme objem V na malé objemy dV tak, že pravdepodobnosť nájdenia dvoch alebo viacerých molekúl v dV je zanedbateľná a pravdepodobnosť nájdenia jednej molekuly je úmerná dV: p = μdV; pozorovanie každého objemu dV budeme považovať za nezávislý test, počet takýchto testov n=V/dV; ak predpokladáme, že pravdepodobnosti nájdenia molekuly kdekoľvek vo vnútri V sú rovnaké, celkový počet molekúl v objeme V sa riadi Bernoulliho zákonom s parametrami: n = V / dV, p = μdV. Po nasmerovaní dV na nulu zistíme, že n smeruje k nekonečnu a súčin n×р zostáva konštantný: a = n×р =μV.

Numerické charakteristiky náhodných premenných

1. matematické očakávania (priemerná hodnota)

Definícia:
Matematické očakávanie je tzv
  (6.4)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť absolútne konvergentná (inak sa hovorí, že náhodná premenná nemá žiadne matematické očakávania)

;   (6.5)

Integrál musí byť absolútne konvergentný (inak sa hovorí, že náhodná premenná nemá žiadne matematické očakávania)


Vlastnosti matematického očakávania:

a. Ak C- konštantný potom MC = C
b. MCx = CMx
c. Matematické očakávanie súčtu náhodných premenných sa vždy rovná súčtu ich matematických očakávaní: M(x+y) = Mx + My d. Zavádza sa pojem podmieneného matematického očakávania. Ak náhodná premenná nadobúda svoje hodnoty x i s rôznymi pravdepodobnosťami p(x i /H j) za rôznych podmienok H j, potom sa určí podmienené očakávanie

Ako alebo ;   (6.6)

Ak sú známe pravdepodobnosti udalostí H j, úplná

matematické očakávania: ;   (6.7)

Príklad 4: Koľkokrát treba v priemere hodiť mincou, kým sa objaví prvý symbol? Tento problém sa dá vyriešiť priamočiaro

x i 1 2 3 ... k..
p(x i):  ,

ale túto sumu je ešte potrebné vypočítať. Môžete to urobiť jednoduchšie pomocou konceptov podmieneného a úplného matematického očakávania. Uvažujme hypotézy H 1 - erb vypadol prvýkrát, H 2 - erb nevypadol prvýkrát. Je zrejmé, že p(H1) = p(H2) = 1/2; Mx/N1 = 1;
Mx / N 2 je o 1 viac ako požadované úplné očakávanie, pretože po prvom hode mincou sa situácia nezmenila, ale už raz hodená bola. Pomocou vzorca pre celkové matematické očakávania máme Мх = Мx / Н 1 ×р(Н 1) + Мx / Н 2 ×р(Н 2) = 1 × 0,5 + (Мх + 1) × 0,5, čím vyriešime rovnicu pre Мх okamžite získame Mx = 2.

e. Ak je f(x) funkciou náhodnej premennej x, potom je pojem matematického očakávania funkcie náhodnej premennej definovaný:

Pre diskrétnu náhodnú premennú: ;   (6.8)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť absolútne konvergentná.

Pre spojitú náhodnú premennú: ;   (6.9)

Integrál musí byť absolútne konvergentný.

2. Rozptyl náhodnej premennej
Definícia:
Rozptyl náhodnej premennej x je matematické očakávanie druhej mocniny odchýlky hodnoty hodnoty od jej matematického očakávania: Dx = M(x-Mx) 2

Pre diskrétnu náhodnú premennú: ;   (6.10)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť konvergentná (inak sa hovorí, že náhodná premenná nemá žiadny rozptyl)

Pre spojitú náhodnú premennú: ;   (6.11)

Integrál musí byť konvergentný (inak sa hovorí, že náhodná premenná nemá žiadny rozptyl)

Disperzné vlastnosti:
a. Ak je C konštantná hodnota, potom DC = 0
b. DСх = С 2 Dх
c. Rozptyl súčtu náhodných premenných sa vždy rovná súčtu ich rozptylov, iba ak sú tieto hodnoty nezávislé (definícia nezávislých premenných)
d. Na výpočet rozptylu je vhodné použiť vzorec:

Dx = Mx 2 - (Mx) 2 (6,12)

Vzťah medzi číselnými charakteristikami
a parametre typických distribúcií

distribúciaparametrevzorecMxDx
uniformaa, b (b+a) / 2(b-a) 2/12
normálnea, σ aσ 2
Bernoullin,p n.p.npq
Poissona aa

Rozdelenie pravdepodobnosti je miera pravdepodobnosti na merateľnom priestore.

Nech W je neprázdna množina ľubovoľnej povahy a Ƒ -s- algebra na W, to znamená kolekciu podmnožín W, ktorá obsahuje samotné W, prázdnu množinu Æ a uzavretú nanajvýš pod spočítateľnou množinou operácií teoretických množín (to znamená, že pre ľubovoľné A Î Ƒ sada = W\ A opäť patrí Ƒ a ak A 1 , A 2,...О Ƒ , To Ƒ A Ƒ ). Pár (W, Ƒ ) sa nazýva merateľný priestor. Nezáporná funkcia P( A), definované pre každého A Î Ƒ , sa nazýva miera pravdepodobnosti, pravdepodobnosť, P. pravdepodobnosti alebo jednoducho P., ak P(W) = 1 a P je spočítateľne aditívne, teda pre ľubovoľnú postupnosť A 1 , A 2,...О Ƒ také že A i A j= Æ pre všetkých i ¹ j, rovnosť P() = P( A i). tri (W, Ƒ , P) sa nazýva pravdepodobnostný priestor. Pravdepodobný priestor je pôvodný koncept axiomatickej teórie pravdepodobnosti, ktorú navrhol A.N. Kolmogorov začiatkom 30. rokov 20. storočia.

V každom pravdepodobnostnom priestore možno uvažovať (reálne) merateľné funkcie X = X(w), wÎW, teda funkcie tak, že (w: X(w)О B} Î Ƒ pre akúkoľvek podskupinu Borel B skutočná línia R. Merateľnosť funkcie X je ekvivalentné (w: X(w)< x} Î Ƒ pre akékoľvek skutočné x. Merateľné funkcie sa nazývajú náhodné premenné. Každá náhodná premenná X, definovaný v priestore pravdepodobnosti (W, Ƒ , P), generuje P. pravdepodobnosti

P X (B) = P( XÎ B) = P((w: X(w)О B}), B Î Ɓ ,
na merateľný priestor ( R, Ɓ ), kde Ɓ R a distribučná funkcia

F X(x) = P( X < x) = P((w: X(w)< x}), -¥ < x <¥,
ktoré sa nazývajú pravdepodobnosť pravdepodobnosť a distribučná funkcia náhodnej premennej X.

Distribučná funkcia F každá náhodná premenná má vlastnosti

1. F(x) neklesá,

2. F(- ¥) = 0, F(¥) = 1,

3. F(x) zostáva v každom bode súvislá x.

Niekedy v definícii distribučnej funkcie nerovnosť< заменяется неравенством £; в этом случае функция распределения является непрерывной справа. В содержательных утверждениях теории вероятностей не важно, непрерывна функция распределения слева или справа, важны лишь положения ее точек разрыва x(ak existujú) a zvýšenie veľkosti F(x+0) - F(x-0) v týchto bodoch; Ak F X, potom je tento prírastok P( X = x).

Akákoľvek funkcia F, majúci vlastnosti 1. - 3. sa nazýva distribučná funkcia. Korešpondencia medzi distribúciami na ( R, Ɓ ) a distribučné funkcie sú individuálne. Pre každého R. P na ( R, Ɓ ) jeho distribučnú funkciu určuje rovnosť F(x) = P((-¥, x)), -¥ < x <¥, а для любой функции распределения F tomu zodpovedá R. P je definovaná na algebre £ množín pozostávajúcich zo zjednotení konečného počtu funkcií disjunktných intervalov F 1 (x) sa lineárne zvyšuje od 0 do 1. Na zostrojenie funkcie F 2 (x) segment je rozdelený na segment , interval (1/3, 2/3) a segment . Funkcia F 2 (x) na intervale (1/3, 2/3) sa rovná 1/2 a lineárne sa zvyšuje od 0 do 1/2 a od 1/2 do 1 na segmentoch, resp. Tento proces pokračuje a funkcia Fn+1 sa získa pomocou nasledujúcej transformácie funkcie Fn, n³ 2. Na intervaloch, kde je funkcia Fn(x) je konštantná, Fn +1 (x) sa zhoduje s Fn(x). Každý segment, kde je funkcia Fn(x) rastie lineárne od a do b, sa delí na segment , interval (a + (a - b)/3, a + 2(b - a)/3) a segment . V určenom intervale Fn +1 (x) sa rovná ( a + b)/2 a na označených segmentoch Fn +1 (x) rastie lineárne od a do ( a + b)/2a od ( a + b)/2 až b resp. Za každých 0 £ x sekvencia 1 £ Fn(x), n= 1, 2,..., konverguje k nejakému číslu F(x). Postupnosť distribučných funkcií Fn, n= 1, 2,..., je rovnospojitá, preto funkcia limitného rozdelenia F(x) je nepretržitý. Táto funkcia je konštantná na spočítateľnej množine intervalov (hodnoty funkcie sa líšia v rôznych intervaloch), na ktorých nie sú žiadne rastové body a celková dĺžka týchto intervalov je 1. Preto je Lebesgueova miera nastaviť supp F sa rovná nule, tzn F jednotného čísla.

Každá distribučná funkcia môže byť reprezentovaná ako

F(x) = p ac F ac ( x) + p d F d ( x) + p s F s ( x),
Kde F AC, F d a F s je absolútne spojitá, diskrétna a singulárna distribučná funkcia a súčet nezáporných čísel p AC, p d a p s sa rovná jednej. Táto reprezentácia sa nazýva Lebesgueova expanzia a funkcie F AC, F d a F s - zložky rozkladu.

Distribučná funkcia sa nazýva symetrické if F(-x) = 1 - F(x+ 0) pre
x> 0. Ak je funkcia symetrického rozdelenia absolútne spojitá, potom je jej hustota párnou funkciou. Ak náhodná premenná X má symetrické rozdelenie, potom náhodné premenné X a - X rovnomerne rozdelené. Ak funkcia symetrického rozdelenia F(x) je teda súvislý na nule F(0) = 1/2.

Medzi absolútne spojité pravidlá často používané v teórii pravdepodobnosti patria jednotné pravidlá, normálne pravidlá (Gaussove pravidlá), exponenciálne pravidlá a Cauchyho pravidlá.

R. sa nazýva rovnomerné na intervale ( a, b) (alebo na segmente [ a, b] alebo v intervaloch [ a, b) A ( a, b]), ak je jeho hustota konštantná (a rovná sa 1/( b - a)) až ( a, b) a rovná sa nule vonku ( a, b). Najčastejšie sa používa rovnomerné rozdelenie na (0, 1), jeho distribučná funkcia F(x) sa rovná nule at x£ 0, rovná jednej at x>1 a F(x) = x na 0< x£ 1. Rovnomerná náhodná premenná na (0, 1) má náhodnú premennú X(w) = w na pravdepodobnostnom priestore pozostávajúcom z intervalu (0, 1), množiny borelových podmnožín tohto intervalu a Lebesgueovej miery. Tento pravdepodobnostný priestor zodpovedá experimentu „hodenie bodu w náhodne na interval (0, 1)“, kde slovo „náhodne“ znamená rovnosť („rovnaká príležitosť“) všetkých bodov z (0, 1). Ak je v priestore pravdepodobnosti (W, Ƒ , P) existuje náhodná premenná X s rovnomerným rozdelením na (0, 1), potom na ňom pre akúkoľvek distribučnú funkciu F existuje náhodná premenná Y, pre ktoré je distribučná funkcia F Y sa zhoduje s F. Napríklad distribučná funkcia náhodnej premennej Y = F -1 (X) sa zhoduje s F. Tu F -1 (r) = inf( x: F(x) > r}, 0 < r < 1; если функция F(x) je teda súvislý a striktne monotónny na celej skutočnej línii F-1 - inverzná funkcia F.

Normálne R. s parametrami ( a, s 2), -¥< a < ¥, s 2 >0, nazývaný R. s hustotou, -¥< x < ¥. Чаще всего используется нормальное Р. с параметрами a= 0 a s 2 = 1, čo sa nazýva štandardná normálna R., jej distribučná funkcia F( x) nie je vyjadrený superpozíciami elementárnych funkcií a musíme použiť jeho integrálnu reprezentáciu F( x) =, -¥ < x < ¥. Для фунции распределения F(x) boli zostavené podrobné tabuľky, ktoré boli potrebné pred objavením sa modernej výpočtovej techniky (hodnoty funkcie F( x) možno získať aj pomocou špeciálnych tabuliek. funkcie erf( x)), hodnoty F( x) Pre x> 0 možno získať pomocou súčtu radu

,
a pre x < 0 можно воспользоваться симметричностью F(x). Hodnoty funkcie normálneho rozdelenia s parametrami a a s 2 možno získať pomocou skutočnosti, že sa zhoduje s F(( x - a)/s). Ak X 1 a X 2 nezávislé normálne rozdelené s parametrami a 1, s 12 a a 2 , s 2 2 náhodné veličiny, potom rozdelenie ich súčtu X 1 + X 2 je v poriadku aj s parametrami a= a 1 + a 2 a s2 = si2 + s22. Výrok je v istom zmysle pravdivý aj opačne: ak náhodná premenná X normálne rozdelené s parametrami a a s 2 a
X = X 1 + X 2 kde X 1 a X 2 sú nezávislé náhodné premenné iné ako konštanty X 1 a X 2 majú normálne rozdelenia (Cramerova veta). Možnosti a 1, s 12 a a 2 , s 2 2 rozdelenia normálnych náhodných premenných X 1 a X 2 súvisiace s a a s 2 rovnosťami uvedenými vyššie. Štandardné normálne rozdelenie je limita v centrálnej limitnej vete.

Exponenciálne rozdelenie je rozdelenie s hustotou p(x) = 0 at x < 0 и p(x) = l e- l x pri x³ 0, kde l > 0 je parameter, jeho distribučná funkcia F(x) = 0 at x 0 £ a F(x) = 1 - e- l x pri x> 0 (niekedy sa používajú exponenciálne parametre, ktoré sa od indikovaného líšia posunom po reálnej osi). Tento R. má vlastnosť zvanú absencia následného účinku: ak X je náhodná premenná s exponenciálnym R., potom pre ľubovoľné kladné x A t

P( X > x + t | X > x) = P( X > t).
Ak X je prevádzkový čas nejakého zariadenia pred poruchou, potom neprítomnosť následného efektu znamená, že pravdepodobnosť, že zariadenie, zapnuté v čase 0, zlyhá až do x + t za predpokladu, že do tej doby neodmietol x, nezávisí od x. Táto vlastnosť sa interpretuje ako absencia „starnutia“. Absencia následného efektu je charakteristickou vlastnosťou exponenciálneho rozdelenia: v triede absolútne spojitých rozdelení platí vyššie uvedená rovnosť len pre exponenciálne rozdelenie (s niektorým parametrom l > 0). Exponenciálna R. sa objavuje ako limitná R. v minimálnej schéme. Nechaj X 1 , X 2 ,… - nezáporné nezávislé identicky rozdelené náhodné premenné a pre ich spoločnú distribučnú funkciu F bod 0 je bod rastu. Potom o n®¥ rozdelenia náhodných premenných Yn= min( X 1 ,…, Xn) slabo konvergujú k degenerovanému rozdeleniu s jediným rastovým bodom 0 (toto je analógia zákona veľké čísla). Ak navyše predpokladáme, že pre niektoré e > 0 je distribučná funkcia F(x) na intervale (0, e) pripúšťa reprezentáciu a p(u)®l pri u¯ 0, potom distribučné funkcie náhodných premenných Z n = n min( X 1 ,…, Xn) pri n®¥ rovnomerne naprieč -¥< x < ¥ сходятся к экспоненциальной функции распределения с параметром l (это - аналог центральной предельной теоремы).

R. Cauchy sa nazýva R. s hustotou p(x) = 1/(p(1+ x 2)), -¥< x < ¥, его функция рас-пределения F(x) = (arctg x+ p/2)/s. Tento R. sa objavil v práci S. Poissona v roku 1832 v súvislosti s riešením nasledujúceho problému: existujú nezávislé identicky rozdelené náhodné premenné? X 1 , X 2 ,... tak, že aritmetický priemer ( X 1 + … + Xn)/n pri každom n majú rovnaké R. ako každá z náhodných premenných X 1 , X 2,...? S. Poisson zistil, že túto vlastnosť majú náhodné premenné so zadanou hustotou. Pre tieto náhodné veličiny neplatí výrok zákona veľkých čísel, v ktorom aritmetický priemer ( X 1 +…+ Xn)/n s rastom n degenerovať. To však nie je v rozpore so zákonom veľkých čísel, pretože ukladá obmedzenia na distribúcie pôvodných náhodných premenných, ktoré nie sú splnené pre špecifikované rozdelenie (pre toto rozdelenie sú absolútne momenty všetkých kladných rádov menšie ako jednota, ale matematické očakávanie neexistuje). V dielach O. Cauchyho sa R., nesúci jeho meno, objavil v roku 1853. R. Cauchy je príbuzný X/Y nezávislé náhodné premenné so štandardným normálnym P.

Medzi diskrétne premenné často používané v teórii pravdepodobnosti patria R. Bernoulli, binomický R. a R. Poisson.

R. Bernoulli nazýva akúkoľvek distribúciu s dvoma rastovými bodmi. Najčastejšie používaná náhodná premenná je R. X, pričom hodnoty 0 a 1 s pravdepodobnosťou
q = 1 - p A p v tomto poradí, kde 0< p < 1 - параметр. Первые формы закона больших чисел и центральной предельной теоремы были получены для случайных величин, имею-щих Р. Бернулли. Если на вероятностном пространстве (W, Ƒ , P) existuje postupnosť X 1 , X 2,... nezávislé náhodné premenné nadobúdajúce hodnoty 0 a 1 s pravdepodobnosťou každá 1/2, potom v tomto pravdepodobnostnom priestore existuje náhodná premenná s rovnomerným R na (0, 1). Najmä náhodná premenná má rovnomerné rozdelenie na (0, 1).

Binomické R. s parametrami n A p, n- prírodný, 0< p < 1, называется Р., с точками роста 0, 1,..., n, v ktorom sú sústredené pravdepodobnosti C n k p k q n-k, k = 0, 1,…, n,
q = 1 - p. Je to R. suma n nezávislé náhodné premenné s R. Bernoullim s rastovými bodmi 0 a 1, v ktorých sú sústredené pravdepodobnosti q A p. Štúdium tohto rozdelenia priviedlo J. Bernoulliho k objavu zákona veľkých čísel a A. Moivreho k objavu centrálnej limitnej vety.

Poissonov vzorec sa nazýva vzorec, ktorého oporou je postupnosť bodov 0, 1,..., v ktorej sú sústredené pravdepodobnosti l k e-l/ k!, k= 0, 1,…, kde l > 0 je parameter. Súčet dvoch nezávislých náhodných premenných, ktoré majú R. Poisson s parametrami la m, má opäť R. Poisson s parametrom l + m. R. Poisson je limitom pre R. Bernoulliho s parametrami n A p = p(n) pri n®¥ ak n A p súvisí vzťahom n.p.®l pri n®¥ (Poissonova veta). Ak je sekvencia 0< T 1 < T 2 < T 3 <… есть последовательность моментов времени, в которые происходят некоторые события (так. наз поток событий) и величины T 1 , T 2 -T 1 , T 3 - T 2 ,... sú nezávislé identicky rozdelené náhodné premenné a ich spoločné R. je exponenciálne s parametrom l > 0, potom náhodná premenná Xt rovná počtu udalostí, ktoré sa vyskytli v intervale (0, t), má R. Poisson s parametrom.l t(takýto prúd sa nazýva Poisson).

Pojem R má množstvo zovšeobecnení, najmä sa rozširuje na viacrozmerný prípad a na algebraické štruktúry.

Napriek svojim exotickým menám sa bežné distribúcie navzájom spájajú intuitívnymi a zaujímavými spôsobmi, vďaka ktorým sú ľahko zapamätateľné a uvažujú o nich s istotou. Niektoré prirodzene vyplývajú napríklad z Bernoulliho distribúcie. Je čas ukázať mapu týchto spojení.

Každé rozdelenie je ilustrované príkladom jeho funkcie hustoty distribúcie (DFF). Tento článok je len o tých rozdeleniach, ktorých výsledkom sú jednotlivé čísla. Preto je horizontálna os každého grafu množinou možných výsledných čísel. Vertikálne – pravdepodobnosť každého výsledku. Niektoré distribúcie sú diskrétne – ich výsledky musia byť celé čísla, napríklad 0 alebo 5. Sú označené riedkymi čiarami, jednou pre každý výsledok, s výškou zodpovedajúcou pravdepodobnosti daného výsledku. Niektoré sú kontinuálne, ich výsledky môžu mať akúkoľvek číselnú hodnotu, napríklad -1,32 alebo 0,005. Tieto sú znázornené ako husté krivky s oblasťami pod časťami krivky, ktoré dávajú pravdepodobnosti. Súčet výšok čiar a plôch pod krivkami je vždy 1.

Vytlačte, vyrežte podľa bodkovaná čiara a noste ho so sebou v peňaženke. Toto je váš sprievodca krajinou distribúcie a ich príbuznými.

Bernoulli a uniforma

Vyššie ste sa už stretli s Bernoulliho distribúciou s dvoma výsledkami – hlavami alebo chvostmi. Predstavte si to teraz ako rozdelenie cez 0 a 1, 0 sú hlavy, 1 sú chvosty. Ako je už jasné, oba výsledky sú rovnako pravdepodobné, a to sa odráža v diagrame. Bernoulliho PDF obsahuje dva riadky rovnakej výšky, ktoré predstavujú 2 rovnako pravdepodobné výsledky: 0 a 1.

Bernoulliho rozdelenie môže predstavovať aj nerovnako pravdepodobné výsledky, ako napríklad hodenie nesprávnej mince. Potom pravdepodobnosť hláv nebude 0,5, ale nejaká iná hodnota p, a pravdepodobnosť chvostov bude 1-p. Rovnako ako mnoho iných distribúcií, aj toto je vlastne celá rodina distribúcií daná určité parametre, ako je uvedené vyššie. Keď si myslíte „Bernoulli“, myslite na „hodenie (možno nesprávnej) mince.

Odtiaľ je už len veľmi malý krok k znázorneniu distribúcie nad niekoľkými rovnako pravdepodobnými výsledkami: rovnomerné rozdelenie charakterizované plochým súborom PDF. Predstavte si obyčajnú kocku. Jeho výsledky 1-6 sú rovnako pravdepodobné. Môže byť špecifikovaný pre ľubovoľný počet výsledkov n a dokonca aj ako spojité rozdelenie.

Predstavte si rovnomerné rozdelenie ako „priamu kocku“.

Binomické a hypergeometrické

Binomické rozdelenie si možno predstaviť ako súčet výsledkov tých vecí, ktoré nasledujú po Bernoulliho rozdelení.

Dvakrát si hoďte poctivou mincou – koľkokrát to budú hlavy? Toto je číslo, ktoré nasleduje po binomickom rozdelení. Jeho parametre sú n, počet pokusov a p – pravdepodobnosť „úspechu“ (v našom prípade hlavy alebo 1). Každý hod je Bernoulliho distribuovaný výsledok alebo test. Použite binomické rozdelenie, keď spočítate počet úspechov vo veciach ako je hod mincou, kde je každý hod nezávislý od ostatných a má rovnakú pravdepodobnosť úspechu.

Alebo si predstavte urnu s rovnakým počtom bielych a čiernych guľôčok. Zatvorte oči, vyberte loptu, zapíšte si jej farbu a vložte ju späť. Opakujte. Koľkokrát sa ťahá čierna guľa? Toto číslo tiež sleduje binomické rozdelenie.

Túto zvláštnu situáciu sme predstavili, aby sme uľahčili pochopenie významu hypergeometrického rozdelenia. Ide o rozdelenie rovnakého čísla, ale v situácii, ak my nie vrátil lopty. To určite bratranec binomické rozdelenie, ale nie rovnaké, keďže pravdepodobnosť úspechu sa mení s každou vytiahnutou loptičkou. Ak je počet loptičiek dostatočne veľký v porovnaní s počtom žrebov, potom sú tieto rozdelenia takmer totožné, pretože šanca na úspech sa s každým žrebovaním extrémne mierne mení.

Keď niekto hovorí o vyťahovaní loptičiek z urien bez toho, aby ich vracal, je takmer vždy bezpečné povedať „áno, hypergeometrické rozloženie“, pretože v živote som nestretol nikoho, kto by skutočne naplnil urny loptičkami a potom ich vytiahol a vrátil. , alebo naopak. Ani nepoznám nikoho s odpadkovými košmi. Ešte častejšie by sa toto rozdelenie malo objaviť pri výbere významnej podskupiny nejakej populácie ako vzorky.

Poznámka preklad

Možno to tu nie je veľmi jasné, ale keďže je tutoriál expresným kurzom pre začiatočníkov, malo by sa to objasniť. Populácia je niečo, čo chceme štatisticky vyhodnotiť. Pre odhad vyberieme určitú časť (podmnožinu) a urobíme na nej požadovaný odhad (vtedy sa táto podmnožina nazýva vzorka), pričom predpokladáme, že odhad pre celú populáciu bude podobný. Ale aby to bola pravda, často sú potrebné ďalšie obmedzenia na definíciu podmnožiny vzorky (alebo naopak, ak je známa vzorka, musíme posúdiť, či dostatočne presne popisuje populáciu).

Praktický príklad – na cestu na E3 potrebujeme vybrať zástupcov zo 100-člennej spoločnosti. Je známe, že minulý rok tam cestovalo už 10 ľudí (ale nikto to nepriznáva). Aké minimálne množstvo musíte zobrať, aby bola veľká pravdepodobnosť, že v skupine bude aspoň jeden skúsený spolubojovník? V tomto prípade obyvateľov- 100, vzorka - 10, vzorové požiadavky - aspoň jeden, ktorý už bol na E3.

Wikipedia má menej vtipný, ale o to praktickejší príklad chybných častí v dávke.

Poisson

Čo sa týka počtu volajúcich zákazníkov horúcu linku na technickú podporu každú minútu? Toto je výsledok, ktorého rozdelenie sa javí ako binomické, ak každú sekundu počítame ako Bernoulliho test, počas ktorého zákazník buď nezavolá (0), alebo zavolá (1). Ale energetické organizácie veľmi dobre vedia: keď je elektrina vypnutá, za sekundu môžu zavolať dvaja ľudia. alebo dokonca viac ako stoľudí. Myslieť si to ako 60 000 milisekúnd testov tiež nepomáha – testov je viac, pravdepodobnosť hovoru na milisekunda je menšia, aj keď nepočítate dva alebo viac súčasne, ale technicky je to stále nie Bernoulliho test. Však to funguje logické uvažovanie s prechodom do nekonečna. Nech n smeruje k nekonečnu a p k 0, takže np je konštantné. Je to ako delenie na menšie a menšie časti času s čoraz menšou pravdepodobnosťou hovoru. V limite dostaneme Poissonovo rozdelenie.

Rovnako ako binomické, Poissonovo rozdelenie je rozdelenie počtu: koľkokrát sa niečo stane. Nie je parametrizovaná pravdepodobnosťou p a počtom pokusov n, ale priemernou intenzitou λ, ktorá je analogicky s binomikou jednoducho konštantná hodnota np. Poissonova distribúcia – o čo ide nevyhnutné pamätajte, keď hovoríme o počítaní udalostí za určitý čas pri konštantnej danej intenzite.

Keď sa niečo stane, ako sú pakety prichádzajúce do smerovača, zákazníci, ktorí sa objavia v obchode, alebo niečo čakajúce v rade, myslite na „Poisson“.

Geometrická a záporná dvojčlenka

Z jednoduchých Bernoulliho testov vyplýva iná distribúcia. Koľkokrát padne minca hlavou, kým dopadne na hlavu? Počet chvostov sleduje geometrické rozdelenie. Podobne ako Bernoulliho rozdelenie je parametrizované pravdepodobnosťou úspešného výsledku, s. Nie je parametrizovaný číslom n, počtom hodových testov, pretože výsledkom je práve počet neúspešných testov.

Ak je binomické rozdelenie "koľko úspechov", potom geometrické rozdelenie je "Koľko zlyhaní pred úspechom?"

Záporné binomické rozdelenie je jednoduchým zovšeobecnením predchádzajúceho. Toto je počet zlyhaní pred r, nie 1 úspechmi. Preto sa ďalej parametrizuje týmto r. Niekedy sa popisuje ako počet úspechov až r neúspechov. Ale ako hovorí môj životný kouč: „Vy rozhodujete, čo je úspech a čo neúspech,“ tak je to to isté, pokiaľ si pamätáte, že pravdepodobnosť p by mala byť aj správna pravdepodobnosť úspechu alebo zlyhania.

Ak potrebujete vtip na uvoľnenie napätia, môžete spomenúť, že binomické a hypergeometrické distribúcie sú zrejmý pár, ale geometrické a záporné binomické sú tiež dosť podobné, a potom povedať: „No, kto ich tak nazýva, hej? “

Exponenciálna a Weibulova

Opäť o volaniach na technickú podporu: ako dlho bude trvať do ďalšieho hovoru? Rozdelenie tohto čakacieho času sa zdá byť geometrické, pretože každá sekunda, kým nikto nezavolá, je ako zlyhanie, až kým sa druhá, kým hovor konečne neuskutoční. Počet zlyhaní je ako počet sekúnd, kým nikto nezavolal, a toto praktickyčas do ďalšieho hovoru, ale „prakticky“ nám nestačí. Ide o to, že tento čas bude súčtom celých sekúnd a teda nebude možné započítať čakanie do tejto sekundy pred samotným hovorom.

No, ako predtým, pohybujeme sa na hranici geometrického rozdelenia, čo sa týka časových podielov - a voilá. Získame exponenciálne rozdelenie, ktoré presne popisuje čas pred hovorom. Toto je nepretržitá distribúcia, prvá svojho druhu, pretože výsledok nemusí byť nevyhnutne v celých sekundách. Podobne ako Poissonovo rozdelenie je parametrizované intenzitou λ.

Opakujúc spojenie medzi binomickým a geometrickým, Poissonovo "koľko udalostí v čase?" súvisí s exponenciálnym „ako dlho do udalosti?“ Ak existujú udalosti, ktorých počet za jednotku času zodpovedá Poissonovmu rozdeleniu, potom čas medzi nimi podlieha exponenciálnemu rozdeleniu s rovnakým parametrom λ. Táto zhoda medzi týmito dvoma distribúciami musí byť zaznamenaná, keď sa diskutuje o jednej z nich.

Exponenciálne rozdelenie by malo prísť na myseľ pri premýšľaní o „čase do udalosti“, možno „čase do zlyhania“. V skutočnosti je to taká dôležitá situácia, že existujú zovšeobecnené distribúcie na opis MTBF, ako napríklad Weibullova distribúcia. Zatiaľ čo exponenciálna distribúcia je vhodná, keď je miera opotrebovania alebo napríklad miera porúch konštantná, Weibullova distribúcia môže modelovať rastúce (alebo klesajúce) miery porúch v priebehu času. Exponenciála je vo všeobecnosti špeciálny prípad.

Myslite na „Weibulla“, keď hovoríte o MTBF.

Normálne, lognormálne, Studentovo t a chí-kvadrát

Normálne alebo Gaussovo rozdelenie je pravdepodobne jedným z najdôležitejších. Jeho zvonovitý tvar je okamžite rozpoznateľný. Ako , toto je obzvlášť kuriózna entita, ktorá sa prejavuje všade, dokonca aj z tých zdanlivo jednoduchých zdrojov. Vezmite súbor hodnôt, ktoré majú rovnakú distribúciu - ľubovoľnú! - a zložte ich. Rozdelenie ich súčtu sleduje (približne) normálne rozdelenie. Čím viac vecí sa sčítava, tým viac ich súčet zodpovedá normálnemu rozdeleniu (háčik: rozdelenie členov musí byť predvídateľné, nezávislé, smeruje len k normálnemu). To, že je to pravda aj napriek pôvodnej distribúcii, je úžasné.

Poznámka preklad

Prekvapilo ma, že autor nepíše o potrebe porovnateľnej škály sčítaných rozdelení: ak jedno výrazne dominuje nad ostatnými, konvergencia bude mimoriadne zlá. A vo všeobecnosti nie je potrebná absolútna vzájomná nezávislosť, stačí slabá závislosť.

No na párty asi dobré, ako napísal.


Toto sa nazýva „teorém centrálnej limity“ a musíte vedieť, čo to je, prečo sa to tak nazýva a čo to znamená, inak sa budete okamžite smiať.

Vo svojom kontexte je normálne spojené so všetkými distribúciami. Aj keď v podstate je to spojené s rozdeľovaním všemožných súm. Súčet Bernoulliho pokusov sleduje binomické rozdelenie a so zvyšujúcim sa počtom pokusov sa toto binomické rozdelenie približuje k normálnemu rozdeleniu. Podobne je jeho príbuzným hypergeometrické rozdelenie. Poissonovo rozdelenie - limitná forma binomického znaku - sa tiež približuje k normálu so zvyšujúcim sa parametrom intenzity.

Výsledky, ktoré sledujú lognormálne rozdelenie, vytvárajú hodnoty, ktorých logaritmus je normálne rozdelený. Alebo inými slovami: exponent normálne rozloženej hodnoty je lognormálne rozložený. Ak sú sumy normálne rozdelené, potom nezabudnite, že produkty sú lognormálne rozdelené.

Študentská t distribúcia je základom t testu, ktorý mnoho neštatistikov študuje v iných odboroch. Používa sa na vytvorenie predpokladov o strednej hodnote normálneho rozdelenia a tiež smeruje k normálnemu rozdeleniu, keď sa jeho parameter zvyšuje. Výrazná vlastnosť t-distribúcia - jej chvosty, ktoré sú hrubšie ako pri normálnom rozdelení.

Ak vtip s tučným chvostom vášho suseda dostatočne nerozkolísal, prejdite na celkom vtipnú rozprávku o pive. Pred viac ako 100 rokmi použil Guinness štatistiku na zlepšenie svojho silného postavenia. Potom William Seely Gosset vynašiel úplne novú štatistickú teóriu na zlepšenie pestovania jačmeňa. Gossett presvedčil svojho šéfa, že ostatní pivovarníci nerozumejú, ako použiť jeho nápady, a dostal povolenie na publikovanie, ale pod pseudonymom „Študent“. Najviac slávny úspech Gosset - to je presne t-distribúcia, ktorá, dalo by sa povedať, je pomenovaná po ňom.

Nakoniec, chí-kvadrát rozdelenie je rozdelenie súčtov druhých mocnín normálne rozdelených hodnôt. Chí-kvadrát test je založený na tomto rozdelení, ktoré je samo o sebe založené na súčte druhých mocnín rozdielov, ktoré by mali byť normálne rozdelené.

Gamma a beta

V tomto bode, ak ste už začali hovoriť o niečom chi-kvadrát, rozhovor začína vážne. Možno už hovoríte so skutočnými štatistikami a pravdepodobne by ste sa už mali pokloniť, pretože sa môžu objaviť veci ako gama distribúcia. Toto je zovšeobecnenie A exponenciálny A chí-kvadrát rozdelenie. Rovnako ako exponenciálne rozdelenie sa používa na komplexné modelyčakacie doby. Napríklad gama rozdelenie sa objaví, keď sa simuluje čas do ďalších n udalostí. V strojovom učení sa objavuje ako „pridružená predchádzajúca distribúcia“ k niekoľkým ďalším distribúciám.

Nehovorte o týchto konjugovaných distribúciách, ale ak musíte, nezabudnite hovoriť o beta distribúcii, pretože je to konjugovaná pred väčšinou tu uvedených distribúcií. Dátoví vedci sú si istí, že presne na to bol vyrobený. Nenápadne to spomeňte a choďte k dverám.

Začiatok múdrosti

Rozdelenie pravdepodobnosti je niečo, o čom nemôžete vedieť príliš veľa. Skutoční záujemcovia sa môžu pozrieť na túto super podrobnú mapu všetkých rozdelení pravdepodobnosti Pridať značky Účel služby. Online kalkulačka slúži na zostavenie tabuľky rozdelenia náhodnej premennej X - počtu vykonaných experimentov a na výpočet všetkých charakteristík série: matematické očakávanie, rozptyl a smerodajná odchýlka. Správa s rozhodnutím je vyhotovená vo formáte Word.
Príklad 1 V urne biele a čierna guľa. Loptičky sa náhodne vyberajú z urny bez návratu, kým sa neobjaví biela guľa. Hneď ako sa to stane, proces sa zastaví.
Tento typ úlohy sa týka problému konštrukcie geometrického rozdelenia.

Príklad 2 Dvaja Traja strelci vystrelia po jednej rane na cieľ. Pravdepodobnosť, že ju zasiahne prvý strelec, je , druhý -

. Zostavte distribučný zákon pre náhodnú premennú X - počet zásahov do cieľa. , Príklad 2a. Strelec strieľa dve tri štyri rany. Pravdepodobnosť zásahu zodpovedajúcim výstrelom sa rovná

. Ak dôjde k prvej chybe, strelec sa nezúčastňuje ďalších súťaží. Zostavte distribučný zákon pre náhodnú premennú X - počet zásahov do cieľa. Príklad 3 V partii od podrobnosti chybné štandardné. Ovládač žrebuje náhodne
podrobnosti. Zostavte distribučný zákon pre náhodnú premennú X - počet chybných dobrých častí vo vzorke. Podobná úloha
: V košíku je m červených a n modrých loptičiek. K loptičiek sa žrebuje náhodne. Zostavte zákon distribúcie DSV X - vzhľad modrých guľôčok.

pozrite si ďalšie príklady riešení. Príklad 4. Pravdepodobnosť udalosti, ktorá sa vyskytne v jednom pokuse, sa rovná . Vyrobené
testy. Zostavte zákon rozdelenia náhodnej premennej X - počet výskytov udalosti.:
Podobné úlohy pre tento typ distribúcie
1. Zostavte distribučný zákon pre náhodnú veličinu X počet zásahov štyrmi ranami, ak pravdepodobnosť zasiahnutia cieľa jednou ranou je 0,8.

js-script
Príklad č.1. Hodia sa tri mince. Pravdepodobnosť získania erbu jedným hodom je 0,5. Zostavte distribučný zákon pre náhodnú premennú X - počet vypadnutých emblémov.
Riešenie.
Pravdepodobnosť, že neboli nakreslené žiadne emblémy: P(0) = 0,5*0,5*0,5= 0,125 0,5 *0,5*0,5 + 0,5*0,5 *0,5 + 0,5*0,5*0,5 = 3*0,125=0,375
P(1) = 0,5 *0,5 *0,5 + 0,5 *0,5*0,5 + 0,5*0,5 *0,5 = 3*0,125=0,375
P(2) =

Pravdepodobnosť získania troch erbov: P(3) = 0,5*0,5*0,5 = 0,125

X0 1 2 3
P0,125 0,375 0,375 0,125
Kontrola: P = P(0) + P(1) + P(2) + P(3) = 0,125 + 0,375 + 0,375 + 0,125 = 1

Príklad č.2. Pravdepodobnosť, že jeden strelec zasiahne terč jednou ranou pre prvého strelca je 0,8, pre druhého 0,85. Strelci vystrelili jednu ranu na cieľ. Vzhľadom na to, že zásah do terča považujete za nezávislé udalosti pre jednotlivých strelcov, nájdite pravdepodobnosť udalosti A – presne jeden zásah do terča.
Príklad č.1. Hodia sa tri mince. Pravdepodobnosť získania erbu jedným hodom je 0,5. Zostavte distribučný zákon pre náhodnú premennú X - počet vypadnutých emblémov.
Zvážte udalosť A – jeden zásah do cieľa. Možné možnosti Výskyt tejto udalosti je nasledujúci:

  1. Prvý strelec zasiahol, druhý strelec minul: P(A/H1)=p 1 *(1-p 2)=0,8*(1-0,85)=0,12
  2. Prvý strelec minul, druhý strelec zasiahol terč: P(A/H2)=(1-p 1)*p 2 =(1-0,8)*0,85=0,17
  3. Prvý a druhý šíp zasiahli cieľ nezávisle od seba: P(A/H1H2)=p 1 *p 2 =0,8*0,85=0,68
Potom sa pravdepodobnosť udalosti A – presne jeden zásah do cieľa – bude rovnať: P(A) = 0,12+0,17+0,68 = 0,97

Teória pravdepodobnosti je oblasť matematiky, ktorá študuje vzorce náhodných javov: náhodné udalosti, náhodné premenné, ich vlastnosti a operácie s nimi.

Teória pravdepodobnosti dlho nemala jasnú definíciu. Bol sformulovaný až v roku 1929. Vznik teórie pravdepodobnosti ako vedy sa datuje do stredoveku a prvých pokusov o matematickú analýzu hazardných hier (vločka, kocky, ruleta). Francúzski matematici zo 17. storočia Blaise Pascal a Pierre Fermat, ktorí skúmali predpoveď výhier v r. hazardných hier, objavil prvé pravdepodobnostné vzorce, ktoré vznikajú pri hádzaní kockou.

Teória pravdepodobnosti vznikla ako veda z presvedčenia, že hromadné náhodné udalosti sú založené na určitých vzorcoch. Teória pravdepodobnosti študuje tieto vzorce.

Teória pravdepodobnosti sa zaoberá štúdiom udalostí, ktorých výskyt nie je s určitosťou známy. Umožňuje vám posúdiť mieru pravdepodobnosti výskytu niektorých udalostí v porovnaní s inými.

Napríklad: nie je možné jednoznačne určiť výsledok „hlavy“ alebo „chvosta“ v dôsledku hodu mincou, ale pri opakovanom hádzaní sa objaví približne rovnaký počet „hlavy“ a „chvosta“, čo znamená, že pravdepodobnosť, že padnú „hlavy“ alebo „chvosty“, sa rovná 50 %.

Test v tomto prípade sa nazýva realizácia určitého súboru podmienok, teda v tomto prípade hod mincou. Výzvu je možné hrať neobmedzený počet krát. V tomto prípade súbor podmienok zahŕňa náhodné faktory.

Výsledok testu je udalosť. Udalosť sa koná:

  1. Spoľahlivé (vždy sa vyskytuje ako výsledok testovania).
  2. Nemožné (nikdy sa to nestane).
  3. Náhodné (môže alebo nemusí nastať ako výsledok testu).

Napríklad pri hádzaní mince je nemožná udalosť - minca pristane na jej okraji, náhodná udalosť - výskyt „hláv“ alebo „chvostov“. Konkrétny výsledok testu je tzv elementárna udalosť. Výsledkom testu sú iba elementárne udalosti. Súbor všetkých možných, rôznych, špecifických výsledkov testov sa nazýva priestor elementárnych udalostí.

Základné pojmy teórie

Pravdepodobnosť- miera možnosti výskytu udalosti. Keď dôvody pre nejakú možnú udalosť skutočne nastanú prevažujú nad opačnými dôvodmi, potom sa táto udalosť nazýva pravdepodobná, inak - nepravdepodobná alebo nepravdepodobná.

Náhodná premenná- je to množstvo, ktoré v dôsledku testovania môže nadobudnúť jednu alebo druhú hodnotu a nie je vopred známe, akú. Napríklad: počet na požiarnu stanicu za deň, počet zásahov s 10 výstrelmi atď.

Náhodné premenné možno rozdeliť do dvoch kategórií.

  1. Diskrétna náhodná premenná je veličina, ktorá v dôsledku testovania môže s určitou pravdepodobnosťou nadobudnúť určité hodnoty a vytvoriť tak počítateľnú množinu (množinu, ktorej prvky možno očíslovať). Táto množina môže byť buď konečná alebo nekonečná. Napríklad počet výstrelov pred prvým zásahom do cieľa je diskrétna náhodná premenná, pretože táto veličina môže nadobudnúť nekonečný, aj keď spočítateľný počet hodnôt.
  2. Spojitá náhodná premenná je veličina, ktorá môže nadobudnúť akúkoľvek hodnotu z nejakého konečného alebo nekonečného intervalu. Je zrejmé, že počet možných hodnôt spojitej náhodnej premennej je nekonečný.

Priestor pravdepodobnosti- koncept zavedený A.N. Kolmogorov v 30. rokoch 20. storočia formalizoval pojem pravdepodobnosti, čo dalo podnet k prudkému rozvoju teórie pravdepodobnosti ako prísnej matematickej disciplíny.

Pravdepodobný priestor je trojitý (niekedy uzavretý v lomených zátvorkách: , kde

Ide o ľubovoľnú množinu, ktorej prvky sa nazývajú elementárne udalosti, výsledky alebo body;
- sigma algebra podmnožín nazývaných (náhodné) udalosti;
- miera pravdepodobnosti alebo pravdepodobnosť, t.j. sigma-aditívna konečná miera taká, že .

De Moivre-Laplaceova veta- jedna z limitných viet teórie pravdepodobnosti, ktorú založil Laplace v roku 1812. Uvádza, že počet úspechov pri opakovaní rovnakého náhodného experimentu znova a znova s ​​dvoma možnými výsledkami je približne normálne rozdelený. Umožňuje vám nájsť približnú hodnotu pravdepodobnosti.

Ak sa pre každý z nezávislých pokusov pravdepodobnosť výskytu nejakej náhodnej udalosti rovná () a je to počet pokusov, v ktorých k nej skutočne dôjde, potom je pravdepodobnosť, že nerovnosť platí, blízka (pri veľkých hodnotách) hodnota Laplaceovho integrálu.

Distribučná funkcia v teórii pravdepodobnosti- funkcia charakterizujúca rozdelenie náhodnej premennej alebo náhodného vektora; pravdepodobnosť, že náhodná premenná X nadobudne hodnotu menšiu alebo rovnú x, kde x je ľubovoľné reálne číslo. Ak sú splnené známe podmienky, úplne určuje náhodnú premennú.

Očakávanie- priemerná hodnota náhodnej veličiny (ide o rozdelenie pravdepodobnosti náhodnej veličiny, uvažované v teórii pravdepodobnosti). V anglickojazyčnej literatúre sa označuje , v ruštine - . V štatistike sa často používa zápis.

Nech je daný priestor pravdepodobnosti a na ňom definovaná náhodná premenná. To je podľa definície merateľná funkcia. Potom, ak existuje Lebesgueov integrál nad priestorom, potom sa nazýva matematické očakávanie alebo stredná hodnota a označuje sa .

Rozptyl náhodnej premennej- miera šírenia danej náhodnej veličiny, teda jej odchýlky od matematického očakávania. Označuje sa v ruskej a zahraničnej literatúre. V štatistike sa často používa zápis alebo. Druhá odmocnina od rozptylu sa nazýva štandardná odchýlka, smerodajná odchýlka alebo štandardný spread.

Nech je náhodná premenná definovaná na nejakom pravdepodobnostnom priestore. Potom

kde symbol označuje matematické očakávanie.

V teórii pravdepodobnosti sa nazývajú dve náhodné udalosti nezávislý, ak výskyt jedného z nich nemení pravdepodobnosť výskytu druhého. Podobne sa nazývajú dve náhodné premenné závislý, ak hodnota jednej z nich ovplyvňuje pravdepodobnosť hodnôt druhej.

Najjednoduchšou formou zákona veľkých čísel je Bernoulliho veta, ktorá hovorí, že ak je pravdepodobnosť udalosti rovnaká vo všetkých pokusoch, potom s narastajúcim počtom pokusov sa frekvencia udalosti približuje k pravdepodobnosti udalosti a prestáva byť náhodný.

Zákon veľkých čísel v teórii pravdepodobnosti hovorí, že aritmetický priemer konečnej vzorky z pevného rozdelenia je blízky teoretickému priemeru tohto rozdelenia. Podľa typu konvergencie sa rozlišuje slabý zákon veľkých čísel, kedy ku konvergencii dochádza podľa pravdepodobnosti, a silný zákon veľkých čísel, kedy je konvergencia takmer istá.

Všeobecný význam zákona veľkého počtu je spoločný postup veľké množstvo identické a nezávislé náhodné faktory vedú k výsledku, ktorý v limite nezávisí od náhody.

Metódy odhadu pravdepodobnosti založené na analýze konečných vzoriek sú založené na tejto vlastnosti. Jasný príklad je prognóza výsledkov volieb na základe prieskumu na vzorke voličov.

Centrálne limitné vety- trieda viet v teórii pravdepodobnosti vyjadrujúca, že súčet je dostatočný veľké množstvo slabo závislé náhodné premenné, ktoré majú približne rovnaké škály (žiadny člen nedominuje ani neprispieva rozhodujúcim spôsobom k súčtu), má rozdelenie blízke normálu.

Keďže mnohé náhodné premenné v aplikáciách vznikajú pod vplyvom niekoľkých slabo závislých náhodných faktorov, ich rozdelenie sa považuje za normálne. V tomto prípade musí byť splnená podmienka, že žiadny z faktorov nie je dominantný. Centrálne limitné vety v týchto prípadoch oprávňujú použitie normálneho rozdelenia.