Valószínűségszámítás és az elmélet alapfogalmai. Egy diszkrét valószínűségi változó binomiális eloszlása

22.09.2019

Binomiális eloszlás- a diszkréten változó egyik legfontosabb valószínűségi eloszlása valószínűségi változó. A binomiális eloszlás a szám valószínűségi eloszlása m esemény bekövetkezése A V n egymástól független megfigyelések. Gyakran esemény A egy megfigyelés „sikerének”, az ellenkező eseményt pedig „kudarcnak” nevezik, de ez a megjelölés nagyon feltételes.

Binomiális eloszlási feltételek:

  • V teljes végrehajtani n kísérletek, amelyekben az esemény A előfordulhat vagy nem;
  • esemény A minden kísérletben azonos valószínűséggel fordulhat elő p;
  • a tesztek egymástól függetlenek.

Annak a valószínűsége, hogy be n tesztelő esemény A pontosan jönni fog m alkalommal, Bernoulli képletével számítható ki:

,

Ahol p- egy esemény bekövetkezésének valószínűsége A;

q = 1 - p- az ellenkező esemény bekövetkezésének valószínűsége.

Találjuk ki miért kapcsolódik a binomiális eloszlás a Bernoulli-képlethez a fent leírt módon? . Esemény – a sikerek száma időpontban n A tesztek számos lehetőségre oszlanak, amelyek mindegyikében sikerül elérni m tesztek, és hiba - be n - m tesztek. Tekintsünk egyet ezek közül a lehetőségek közül - B1 . A valószínűségek összeadási szabályával megszorozzuk az ellentétes események valószínűségét:

,

és ha jelöljük q = 1 - p, Azt

.

Bármilyen más lehetőség, amelyben m siker és n - m kudarcok. Az ilyen opciók száma megegyezik a lehetséges módok számával n teszt kap m siker.

Az összes valószínűség összege m események előfordulási számai A(számok 0-tól n) egyenlő eggyel:

ahol minden tag egy tagot jelent a Newton-binomiálisban. Ezért a vizsgált eloszlást binomiális eloszlásnak nevezzük.

A gyakorlatban gyakran szükséges a valószínűségek kiszámítása „legfeljebb m siker benne n tesztek" vagy "legalábbis m siker benne n tesztek". Ehhez a következő képleteket használjuk.

Az integrál függvény, azaz valószínűség F(m) mi van benne n megfigyelő esemény A nem jön több m egyszer, kiszámítható a következő képlettel:

Viszont valószínűség F(≥m) mi van benne n megfigyelő esemény A nem jön kevesebb m egyszer, a következő képlettel számítjuk ki:

Néha kényelmesebb ennek a valószínűségét kiszámítani n megfigyelő esemény A nem jön több m alkalommal, az ellenkező esemény valószínűségén keresztül:

.

A használandó képlet attól függ, hogy melyikükben van kevesebb tagot tartalmazó összeg.

A binomiális eloszlás jellemzőit a következő képletekkel számítjuk ki .

Várható érték: .

Diszperzió: .

Szórás: .

Binomiális eloszlás és számítások MS Excelben

Binomiális valószínűség P n ( m) és az integrálfüggvény értékei F(m) az MS Excel BINOM.DIST függvényével számítható ki. A megfelelő számítás ablaka alább látható (bal klikk a nagyításhoz).


Az MS Excel a következő adatok megadását igényli:

  • sikerek száma;
  • vizsgálatok száma;
  • a siker valószínűsége;
  • integrál - logikai érték: 0 - ha ki kell számítani a valószínűséget P n ( m) és 1 - ha a valószínűség F(m).

1. példa A cégvezető összefoglalta az elmúlt 100 napban eladott kamerák számát. A táblázat összefoglalja az információkat, és kiszámítja annak valószínűségét, hogy bizonyos számú kamerát eladnak naponta.

A nap nyereséggel ér véget, ha 13 vagy több kamerát adnak el. Annak valószínűsége, hogy a napot nyereségesen ledolgozzák:

Annak valószínűsége, hogy egy napot profit nélkül ledolgoznak:

Legyen annak a valószínűsége, hogy egy napot nyereséggel dolgoznak le, és egyenlő legyen 0,61, és a naponta eladott kamerák száma nem függ a naptól. Ekkor használhatjuk a binomiális eloszlást, ahol az esemény A- a nap nyereséggel lesz ledolgozva, - haszon nélkül.

Annak valószínűsége, hogy mind a 6 nap nyereséggel lesz ledolgozva:

.

Ugyanezt az eredményt kapjuk az MS Excel BINOM.DIST függvényével (az integrál értéke 0):

P 6 (6 ) = BINOM.ELOSZTÁS(6; 6; 0,61; 0) = 0,052.

Annak a valószínűsége, hogy 6 napból 4 és több nap nyereséggel kerül kidolgozásra:

Ahol ,

,

Az MS Excel BINOM.DIST függvényével kiszámítjuk annak a valószínűségét, hogy 6 napból legfeljebb 3 napot töltünk nyereséggel (az integrál értéke 1):

P 6 (≤3 ) = BINOM.ELOSZTÁS(3; 6; 0,61; 1) = 0,435.

Annak valószínűsége, hogy mind a 6 nap veszteséggel lesz ledolgozva:

,

Ugyanezt a mutatót az MS Excel BINOM.DIST függvényével számíthatjuk ki:

P 6 (0 ) = BINOM.ELOSZTÁS(0; 6; 0,61; 0) = 0,0035.

Oldja meg a problémát saját maga, majd nézze meg a megoldást

2. példa Az urnában 2 fehér és 3 fekete golyó van. Kiveszünk egy labdát az urnából, beállítjuk a színt és visszatesszük. A kísérlet 5-ször megismétlődik. A fehér golyók előfordulásának száma diszkrét valószínűségi változó x, a binomiális törvény szerint oszlik el. Rajzolja fel egy valószínűségi változó eloszlási törvényét! Módus, matematikai elvárás és diszperzió meghatározása.

Folytassuk a problémák közös megoldását

3. példa A futárszolgálattól a helyszínekre mentünk n= 5 futár. Mindegyik futár valószínű p= 0,3, másoktól függetlenül, késik az objektumhoz. Diszkrét valószínűségi változó x- a késedelmes futárok száma. Készítsen eloszlássorozatot ennek a valószínűségi változónak. Keresse meg annak matematikai elvárását, szórását, szórását. Határozza meg annak valószínűségét, hogy legalább két futár késni fog a tárgyakért.

Véletlen esemény minden olyan tény, amely a teszt eredményeként előfordulhat vagy nem. Egy véletlenszerű esemény egy teszt eredménye. Próba– ez egy kísérlet, egy bizonyos feltételrendszer teljesülése, amelyben ezt vagy azt a jelenséget megfigyeljük, ezt vagy azt az eredményt rögzítjük.

Az eseményeket a latin A, B, C nagybetűi jelölik.

Az esemény bekövetkezésének lehetőségének objektivitási fokának numerikus mértékét ún véletlenszerű esemény valószínűsége.

Klasszikus meghatározás Az A esemény valószínűsége:

Az A esemény valószínűsége megegyezik az A(m) eseménynek kedvező esetek számának arányával teljes szám esetek (n).

Statisztikai definíció valószínűségek

Az események relatív gyakorisága– ez azoknak a ténylegesen elvégzett teszteknek az aránya, amelyeknél A esemény jelent meg W=P*(A)= m/n. Ez egy kísérleti jellemző, ahol m azoknak a kísérleteknek a száma, amelyekben A esemény megjelent; n az összes elvégzett kísérlet száma.

Az esemény valószínűsége az a szám, amely köré csoportosulnak egy adott esemény gyakorisági értékei különböző sorozatokban nagyszámú tesztek P(A)=.

Az eseményeket ún összeegyeztethetetlen, ha az egyik előfordulása kizárja a másik előfordulását. Különben az események közös.

Összeg két esemény olyan esemény, amelyben ezen események közül legalább az egyik (A vagy B) bekövetkezik.

Ha A és B közös eseményeket, akkor ezek A+B összege az A vagy B esemény bekövetkezését, vagy a két esemény együttes előfordulását jelzi.

Ha A és B összeegyeztethetetlen eseményeket, akkor az A+B összeg az A vagy a B esemény bekövetkezését jelenti.

2. A függő és független események fogalma. Feltételes valószínűség, a valószínűségek szorzásának törvénye (tétele). Bayes képlete.

A B eseményt hívják független az A eseményből, ha az A esemény bekövetkezése nem változtatja meg a B esemény bekövetkezésének valószínűségét. Több esemény bekövetkezésének valószínűsége független események egyenlő ezek valószínűségeinek szorzatával:

P(AB) = P(A)*P(B)

Mert függő események:

P(AB) = P(A)*P(B/A).

Két esemény bekövetkezésének valószínűsége egyenlő az egyik esemény valószínűségének és a másik feltételes valószínűségének a szorzatával, amelyet abból a feltételezésből adunk meg, hogy az első esemény bekövetkezett.

Feltételes valószínűség B esemény a B esemény megtalálásának valószínűsége, mivel az A esemény bekövetkezett. P(V/A)

Munka két esemény olyan esemény, amely ezen események együttes előfordulásából áll (A és B)

A Bayes-képlet a véletlenszerű események újrabecslésére szolgál

P(H/A) = (P(H)*P(A/H))/P(A)

P(H) – H esemény előzetes valószínűsége

P(H/A) – a H hipotézis utólagos valószínűsége, feltéve, hogy az A esemény már megtörtént

P(A/H) – szakértői értékelés

P(A) – az A esemény teljes valószínűsége

3. A diszkrét és folytonos valószínűségi változók megoszlása ​​és jellemzőik: matematikai elvárás, diszperzió, szórás. Folytonos valószínűségi változók normális eloszlási törvénye.

Véletlenszerű érték olyan mennyiség, amely a tesztelés eredményeként esettől függően felveszi a lehetséges sok érték közül az egyiket.

Diszkrét valószínűségi változó ez egy valószínűségi változó, amikor egyetlen, elszigetelt, megszámlálható értékkészletet vesz fel.

Folyamatos valószínűségi változó egy valószínűségi változó, amely egy bizonyos intervallumból bármilyen értéket vesz fel. A méréseknél felmerül a folytonos valószínűségi változó fogalma.

A diszkrétnek valószínűségi változó, az eloszlási törvényt a formában adhatjuk meg táblázatok, analitikusan (képlet formájában) és grafikusan.

asztal ez az elosztási törvény pontosításának legegyszerűbb formája

Követelmények:

diszkrét valószínűségi változókhoz

Analitikai:

1)F(x)=P(X

Eloszlásfüggvény = kumulatív eloszlásfüggvény. Diszkrét és folytonos valószínűségi változókhoz.

2)f(x) = F’(x)

Valószínűségi sűrűségfüggvény = differenciális eloszlásfüggvény csak folytonos valószínűségi változó esetén.

Grafikus:

Feltételek: 1) 0≤F(x)≤1

2) nem csökkenő diszkrét valószínűségi változók esetén

S-va: 1) f(x)≥0 P(x)=

2) terület S=1

folytonos valószínűségi változókhoz

Jellemzők:

1.matematikai elvárás – átlagos legvalószínűbb esemény

Diszkrét valószínűségi változókhoz.

Folyamatos valószínűségi változókhoz.

2) Diszperzió – szóródás a matematikai elvárás körül

Diszkrét valószínűségi változók esetén:

D(x)=x i -M(x)) 2 *p i

Folyamatos valószínűségi változók esetén:

D(x)=x-M(x)) 2 *f(x)dx

3) Szórás:

σ(x)=√(D(x))

σ – szórás vagy standard

x a variancia négyzetgyökének számtani értéke

Normális eloszlási törvény (NDL) – Gauss törvénye

Az NZR egy folytonos valószínűségi változó valószínűségeinek lecsengése, amelyet a differenciálfüggvény ír le

A valószínűségszámítás a matematikának egy olyan ága, amely a véletlenszerű jelenségek mintázatait vizsgálja: véletlenszerű eseményeket, valószínűségi változókat, tulajdonságaikat és a rajtuk végzett műveleteket.

A valószínűségszámításnak hosszú ideig nem volt egyértelmű meghatározása. Csak 1929-ben fogalmazták meg. A valószínűségszámítás tudományként való megjelenése a középkorig nyúlik vissza, és a szerencsejátékok (pehely, kocka, rulett) matematikai elemzésének első próbálkozásaira nyúlik vissza. A 17. századi francia matematikusok, Blaise Pascal és Pierre Fermat, miközben a szerencsejátékok nyereményének előrejelzését tanulmányozták, felfedezték az első valószínűségi mintákat, amelyek kockadobáskor jelentkeznek.

A valószínűségszámítás tudományként abból a meggyőződésből alakult ki, hogy a tömeges véletlenszerű események bizonyos mintákon alapulnak. A valószínűségszámítás ezeket a mintákat vizsgálja.

A valószínűségszámítás olyan események tanulmányozásával foglalkozik, amelyek bekövetkezése nem ismert bizonyossággal. Lehetővé teszi bizonyos események bekövetkezésének valószínűségének mértékét másokhoz képest.

Például: nem lehet egyértelműen meghatározni a „fejek” vagy „farok” eredményét érmefeldobás eredményeként, de ismételt feldobással megközelítőleg ugyanannyi „fej” és „farok” jelenik meg, ami azt jelenti, hogy annak valószínűsége, hogy a „fejek” vagy „farok” leesnek", egyenlő 50%.

Teszt ebben az esetben egy bizonyos feltételrendszer megvalósítását, vagyis ebben az esetben érmefeldobásnak nevezzük. A kihívás korlátlan számú alkalommal lejátszható. Ebben az esetben a feltételrendszer véletlenszerű tényezőket tartalmaz.

A teszt eredménye az esemény. Az esemény történik:

  1. Megbízható (mindig a tesztelés eredményeként fordul elő).
  2. Lehetetlen (soha nem történik meg).
  3. Véletlenszerű (a teszt eredményeként előfordulhat, de előfordulhat, hogy nem).

Például egy érme feldobásakor lehetetlen esemény - az érme a szélére kerül, véletlenszerű esemény - „fejek” vagy „farok” megjelenése. A konkrét vizsgálati eredményt ún elemi esemény. A teszt eredményeként csak elemi események történnek. Az összes lehetséges, különböző, specifikus vizsgálati eredmény halmazát ún elemi események tere.

Az elmélet alapfogalmai

Valószínűség- egy esemény bekövetkezésének lehetőségének mértéke. Ha egy lehetséges esemény tényleges bekövetkezésének okai felülmúlják az ellenkező okokat, akkor ezt az eseményt valószínűnek, egyébként valószínűtlennek vagy valószínűtlennek nevezzük.

Véletlenszerű érték- ez egy olyan mennyiség, amely a tesztelés eredményeként ilyen vagy olyan értéket vehet fel, és nem tudni előre, hogy melyiket. Például: száma tűzoltóállomásonként naponta, találatok száma 10 lövéssel stb.

A véletlenszerű változók két kategóriába sorolhatók.

  1. Diszkrét valószínűségi változó olyan mennyiség, amely a tesztelés eredményeként bizonyos valószínűséggel bizonyos értékeket felvehet, megszámlálható halmazt alkotva (egy olyan halmazt, amelynek elemei megszámozhatók). Ez a halmaz lehet véges vagy végtelen. Például a célpont első találata előtti lövések száma diszkrét valószínűségi változó, mert ez a mennyiség végtelen számú, bár megszámlálható értéket vehet fel.
  2. Folyamatos valószínűségi változó Olyan mennyiség, amely bármely véges vagy végtelen intervallumból tetszőleges értéket vehet fel. Nyilvánvaló, hogy egy folytonos valószínűségi változó lehetséges értékeinek száma végtelen.

Valószínűségi tér- koncepció, amelyet A.N. Kolmogorov a 20. század 30-as éveiben, hogy formalizálja a valószínűség fogalmát, ami a valószínűségszámítás, mint szigorú matematikai tudományág gyors fejlődéséhez vezetett.

A valószínűségi tér egy hármas (néha szögletes zárójelben: , ahol

Ez egy tetszőleges halmaz, melynek elemeit elemi eseményeknek, kimeneteknek vagy pontoknak nevezzük;
- (véletlenszerű) eseményeknek nevezett részhalmazok szigma algebra;
- valószínűségi mérték vagy valószínűség, azaz. szigma-additív véges mérték úgy, hogy .

De Moivre-Laplace tétel- a valószínűségszámítás egyik határtétele, amelyet Laplace állított fel 1812-ben. Azt állítja, hogy a sikerek száma, amikor ugyanazt a véletlenszerű kísérletet ismételjük meg újra és újra két lehetséges eredménnyel, megközelítőleg normális eloszlású. Lehetővé teszi egy közelítő valószínűségi érték meghatározását.

Ha a független kísérletek mindegyikére valamilyen véletlenszerű esemény bekövetkezésének valószínűsége egyenlő ()-vel, és azoknak a kísérleteknek a száma, amelyekben az ténylegesen bekövetkezik, akkor az egyenlőtlenség igazának valószínűsége közel van (nagy értékek esetén) a a Laplace-integrál értéke.

Eloszlási függvény a valószínűségszámításban- egy valószínűségi változó vagy valószínűségi vektor eloszlását jellemző függvény; annak a valószínűsége, hogy egy X valószínűségi változó kisebb vagy egyenlő értéket vesz fel, mint x, ahol x tetszőleges valós szám. Ha az ismert feltételek teljesülnek, akkor teljesen meghatározza a valószínűségi változót.

Várható érték- egy valószínűségi változó átlagértéke (ez a valószínűségelméletben figyelembe vett valószínűségi változó valószínűségi eloszlása). Az angol nyelvű irodalomban , oroszul - jelöli. A statisztikákban gyakran használják a jelölést.

Legyen adott egy valószínűségi tér és egy azon definiált valószínűségi változó. Ez értelemszerűen mérhető függvény. Ekkor, ha van egy Lebesgue-integrál a tér felett, akkor azt matematikai elvárásnak vagy középértéknek nevezzük, és jelöljük.

Valószínűségi változó varianciája- egy adott valószínűségi változó terjedésének mértéke, vagyis a matematikai elvárástól való eltérése. Az orosz és a külföldi irodalomban meg van jelölve. A statisztikákban gyakran használják a vagy jelölést. A variancia négyzetgyökét szórásnak, szórásnak vagy szórásnak nevezzük.

Legyen egy valószínűségi változó, amely valamilyen valószínűségi téren van definiálva. Akkor

ahol a szimbólum a matematikai elvárást jelöli.

A valószínűségszámításban két véletlenszerű eseményt nevezünk független, ha az egyik előfordulása nem változtat a másik előfordulási valószínűségén. Hasonlóképpen két valószínűségi változót nevezünk függő, ha az egyik értéke befolyásolja a másik értékének valószínűségét.

A nagy számok törvényének legegyszerűbb formája a Bernoulli-tétel, amely szerint ha egy esemény valószínűsége minden próbában azonos, akkor a kísérletek számának növekedésével az esemény gyakorisága az esemény valószínűsége felé hajlik, ill. megszűnik véletlenszerű lenni.

A nagy számok törvénye a valószínűségszámításban kimondja, hogy egy fix eloszlásból származó véges minta számtani átlaga közel van az eloszlás elméleti átlagához. A konvergencia típusától függően különbséget teszünk a nagy számok gyenge törvénye között, amikor a konvergencia valószínűség szerint következik be, és a nagy számok erős törvénye között, amikor a konvergencia szinte biztos.

A nagy számok törvényének általános jelentése az, hogy nagyszámú azonos és független véletlentényező együttes hatása olyan eredményhez vezet, amely határértékben nem a véletlentől függ.

A véges mintaelemzésen alapuló valószínűségbecslési módszerek ezen a tulajdonságon alapulnak. Jó példa erre a választási eredmények előrejelzése a választói mintán végzett felmérés alapján.

Központi határérték tételek- a valószínűségszámítás tételeinek egy osztálya, amely azt állítja, hogy kellően nagy számú gyengén függő valószínűségi változó összege, amelyek megközelítőleg azonos skálával rendelkeznek (egyik kifejezés sem dominál, vagy nem járul hozzá meghatározó módon az összeghez) normálishoz közeli eloszlású.

Mivel az alkalmazásokban sok valószínűségi változó több gyengén függő véletlen tényező hatására jön létre, ezek eloszlása ​​normálisnak tekinthető. Ebben az esetben annak a feltételnek kell teljesülnie, hogy egyik tényező sem domináns. A centrális határeloszlás tételei ezekben az esetekben indokolják a normális eloszlás használatát.

A gyakorlatban a legtöbb valószínűségi változó, amelyet nagyszámú véletlenszerű tényező befolyásol, betartja a normál valószínűségi eloszlás törvényét. Ezért a valószínűségszámítás különféle alkalmazásaiban ez a törvény különös jelentőséggel bír.

A $X$ valószínűségi változó megfelel a normál valószínűségi eloszlási törvénynek, ha valószínűségi eloszlási sűrűsége a következő

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2)))$$

A $f\left(x\right)$ függvény grafikonja sematikusan látható az ábrán, és „Gauss-görbének” nevezzük. A grafikontól jobbra a német 10 márkás bankjegy látható, amelyet az euró bevezetése előtt használtak. Ha alaposan megnézi, ezen a bankjegyen láthatja a Gauss-görbét és annak felfedezőjét, a legnagyobb matematikus Carl Friedrich Gausst.

Térjünk vissza a $f\left(x\right)$ sűrűségfüggvényünkhöz, és adjunk néhány magyarázatot az $a,\ (\sigma )^2$ eloszlási paraméterekre vonatkozóan. Az $a$ paraméter egy valószínűségi változó értékeinek diszperziós középpontját jellemzi, azaz matematikai elvárás jelentéssel bír. Ha az $a$ paraméter megváltozik és a $(\sigma )^2$ változatlan marad, akkor a $f\left(x\right)$ függvény grafikonjában eltolódást figyelhetünk meg az abszcissza mentén, míg a sűrűséggráf maga nem változtatja meg alakját.

A $(\sigma )^2$ paraméter a variancia, és a sűrűséggráf $f\left(x\right)$ alakját jellemzi. Ha a $(\sigma )^2$ paramétert változatlanul $a$ paraméterrel változtatjuk meg, akkor megfigyelhetjük, hogy a sűrűséggráf hogyan változtatja alakját, összenyomódik vagy nyúlik anélkül, hogy az abszcissza tengelye mentén mozogna.

Annak a valószínűsége, hogy egy normális eloszlású valószínűségi változó egy adott intervallumba esik

Mint ismeretes, annak a valószínűsége, hogy egy $X$ valószínűségi változó a $\left(\alpha ;\ \beta \right)$ intervallumba esik, kiszámítható a $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Itt a $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ függvény a Laplace függvény. Ennek a függvénynek az értékei innen származnak. A $\Phi \left(x\right)$ függvény alábbi tulajdonságai figyelhetők meg.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, vagyis a $\Phi \left(x\right)$ függvény páratlan.

2 . A $\Phi \left(x\right)$ egy monoton növekvő függvény.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ bal(x\jobb)\ )=-0,5$.

A $\Phi \left(x\right)$ függvény értékeinek kiszámításához használhatja a $f_x$ függvény varázslót is az Excelben: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\jobbra )-0,5$. Például számítsuk ki a $\Phi \left(x\right)$ függvény értékeit $x=2$ esetén.

A képlet segítségével kiszámítható annak a valószínűsége, hogy egy normális eloszlású $X\in N\left(a;\ (\sigma )^2\right)$ a matematikai elvárás $a$ szempontjából szimmetrikus intervallumba esik.

$$P\left(\left|X-a\right|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Három szigma szabály. Szinte biztos, hogy egy normális eloszlású $X$ valószínűségi változó a $\left(a-3\sigma ;a+3\sigma \right)$ intervallumba esik.

1. példa . Az $X$ valószínűségi változóra a normál valószínűségi eloszlás törvénye vonatkozik, amelynek paraméterei $a=2,\ \sigma =3$. Határozza meg annak valószínűségét, hogy $X$ a $\left(0.5;1\right)$ intervallumba esik, és mekkora valószínűséggel teljesül a $\left|X-a\right|< 0,2$.

Képlet segítségével

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

ezt találjuk: $P\left(0.5;1\right)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0.5-2)\ over (3) ))\right)=\Phi \left(-0,33\right)-\Phi \left(-0,5\right)=\Phi \left(0,5\right)-\Phi \ left(0,33\right)=0,191- 0,129 = 0,062 USD.

$$P\left(\left|X-a\right|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

2. példa . Tegyük fel, hogy az év során egy bizonyos társaság részvényeinek árfolyama egy véletlenszerű változó, amely a normál törvény szerint eloszlik, 50 konvencionális pénzegység matematikai elvárása és 10 szórása. Mennyi a valószínűsége, hogy egy véletlenszerűen kiválasztott a tárgyalt időszak napján az akció ára:

a) több mint 70 hagyományos pénzegység?

b) részvényenként 50 alatt?

c) részvényenként 45 és 58 hagyományos pénzegység között?

Legyen az $X$ valószínűségi változó valamelyik vállalat részvényeinek ára. Feltétel szerint az $X$ normál eloszlás alá esik $a=50$ - matematikai elvárás, $\sigma =10$ - szórás paraméterekkel. Valószínűség $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\right)=\Phi \left(((\infty -50)\over (10))\right)-\Phi \left(((70-50)\ over (10))\right)=0,5-\Phi \left(2\right)=0,5-0,4772=0,0228.$$

$$b)\P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\left(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Egzotikus nevük ellenére a gyakori disztribúciók intuitív és érdekes módon kapcsolódnak egymáshoz, így könnyen megjegyezhetők és magabiztosan érvelhetők. Néhányan természetesen következnek, például a Bernoulli-eloszlásból. Ideje megmutatni ezeknek a kapcsolatoknak a térképét.

Mindegyik eloszlást egy példával szemléltetjük az eloszlási sűrűség függvényére (DFF). Ez a cikk csak azokról az eloszlásokról szól, amelyek eredménye egyszeres szám. Ezért az egyes grafikonok vízszintes tengelye a lehetséges kimeneti számok halmaza. Függőleges – az egyes kimenetelek valószínűsége. Egyes eloszlások diszkrétek – eredményüknek egész számoknak kell lenniük, például 0-nak vagy 5-nek. Ezeket ritka vonalak jelzik, mindegyik eredményhez egy-egy, egy adott eredmény valószínűségének megfelelő magassággal. Némelyik folyamatos, eredményük bármilyen számértéket felvehet, például -1,32 vagy 0,005. Ezek sűrű görbékként jelennek meg, a görbe azon szakaszai alatti területekkel, amelyek valószínűségeket adnak. A vonalak és a görbe alatti területek magasságának összege mindig 1.

Nyomtatás, kivágás szaggatott vonalés cipeld magaddal a pénztárcádban. Ez az Ön útmutatója a terjesztések országához és hozzátartozóikhoz.

Bernoulli és egyenruha

A fenti Bernoulli-eloszlással már találkoztál, két eredménnyel – fejjel vagy farokkal. Képzelje el most, hogy eloszlása ​​0 és 1 között, 0 a fejek, 1 a farok. Amint az már világos, mindkét eredmény egyformán valószínű, és ez a diagramon is megjelenik. A Bernoulli PDF két azonos magasságú sort tartalmaz, amelyek 2 egyformán valószínű eredményt képviselnek: 0, illetve 1.

A Bernoulli-eloszlás egyenlőtlenül valószínű kimeneteleket is jelenthet, például egy helytelen érme feldobását. Ekkor a fejek valószínűsége nem 0,5, hanem valami más p érték, a farok valószínűsége pedig 1-p. Sok más disztribúcióhoz hasonlóan ez is egy egész család által adott disztribúció bizonyos paramétereket, mint fent p. Amikor „Bernoulli”-ra gondol, gondoljon „egy (esetleg rossz) érme feldobására”.

Innentől kezdve nagyon kis lépés az eloszlás megjelenítése több egyformán valószínű kimenetel mellett: egy egységes eloszlás, amelyet egy lapos PDF jellemez. Képzelj el egy rendes kockát. Az 1-6. kimenetele egyformán valószínű. Megadható tetszőleges számú n eredményhez, sőt folyamatos eloszlásként is.

Tekintse az egyenletes eloszlást „egyenes kockának”.

Binomiális és hipergeometrikus

A binomiális eloszlás felfogható a Bernoulli-eloszlást követő dolgok kimenetelének összegeként.

Dobj fel egy tisztességes érmét kétszer – hányszor lesz belőle fej? Ez a szám a binomiális eloszlást követi. Paraméterei n, a kísérletek száma, és p – a „siker” valószínűsége (esetünkben fejek vagy 1). Minden dobás egy Bernoulli által elosztott eredmény vagy teszt. Használja a binomiális eloszlást, amikor megszámolja a sikerek számát olyan dolgokban, mint például egy érme feldobása, ahol minden dobás független a többitől, és azonos a siker valószínűsége.

Vagy képzeljünk el egy urnát ugyanannyi fehér és fekete golyóval. Csukd be a szemed, vedd ki a labdát, írd le a színét és tedd vissza. Ismétlés. Hányszor húzzák ki a fekete golyót? Ez a szám is követi a binomiális eloszlást.

Azért mutattuk be ezt a furcsa helyzetet, hogy könnyebben megértsük a hipergeometrikus eloszlás jelentését. Ez ugyanannak a számnak az eloszlása, de abban a helyzetben, ha mi Nem visszaadta a labdákat. Biztosan unokatestvér binomiális eloszlás, de nem ugyanaz, mivel a siker valószínűsége minden húzott labdával változik. Ha a labdák száma kellően nagy a húzások számához képest, akkor ezek az eloszlások szinte azonosak, hiszen minden döntetlennel rendkívül kis mértékben változik a siker esélye.

Amikor valaki arról beszél, hogy golyókat húz ki az urnákból anélkül, hogy visszaküldené azokat, szinte mindig nyugodtan mondhatja, hogy „igen, hipergeometrikus eloszlás”, mert életemben nem találkoztam senkivel, aki ténylegesen megtöltötte volna az urnákat golyókkal, majd kihúzta és visszavitte. , Vagy fordítva. Még csak nem is ismerek senkit, akinek a kukái vannak. Még gyakrabban ennek az eloszlásnak kell megjelennie, amikor valamely populáció egy jelentős részhalmazát választjuk ki mintaként.

jegyzet fordítás

Lehet, hogy itt nem egészen világos, de mivel az oktatóanyag egy expressz tanfolyam kezdőknek, tisztázni kell. A populációt statisztikailag szeretnénk értékelni. A becsléshez kiválasztunk egy bizonyos részt (részhalmazt), és megcsináljuk rajta a szükséges becslést (akkor ezt a részhalmazt mintának nevezzük), feltételezve, hogy a teljes sokaságra vonatkozó becslés hasonló lesz. De ahhoz, hogy ez igaz legyen, gyakran további megszorításokra van szükség a minta egy részhalmazának meghatározásához (vagy fordítva, egy ismert mintából azt kell értékelnünk, hogy kellően pontosan írja-e le a sokaságot).

Egy gyakorlati példa – egy 100 fős társaságból kell képviselőket kiválasztanunk az E3-ra. Ismeretes, hogy tavaly már 10-en utaztak oda (de ezt senki nem vallja be). Mennyi minimumot kell felvennie ahhoz, hogy nagy valószínűséggel legyen legalább egy tapasztalt elvtárs a csoportban? Ebben az esetben népesség- 100, minta - 10, mintakövetelmények - legalább egy, aki már járt az E3-on.

A Wikipédián van egy kevésbé vicces, de gyakorlatiasabb példa a kötegben lévő hibás alkatrészekre.

Poisson

Mi a helyzet a hívó ügyfelek számával forródrót minden percben technikai támogatáshoz? Ez egy olyan eredmény, amelynek eloszlása ​​binomiálisnak tűnik, ha minden másodpercet Bernoulli-tesztnek számolunk, amely során az ügyfél vagy nem hív (0), vagy hív (1). De az áramszolgáltató szervezetek nagyon jól tudják: ha kikapcsolják az áramot, két ember egy másodperc alatt hívhat. vagy akár több mint száz emberek. Az sem segít, ha 60 000 ezredmásodperces tesztnek gondolunk – több teszt van, kisebb a valószínűsége, hogy ezredmásodpercenként hívás érkezik, még ha nem is számol egyszerre kettőt vagy többet, de technikailag ez még mindig nem Bernoulli teszt. Azonban működik logikus érvelés a végtelenbe való átmenettel. Legyen n a végtelenbe, p pedig 0-ra, így np állandó. Ez olyan, mintha az idő egyre kisebb töredékeire osztanánk fel, egyre kisebb a hívás valószínűsége. A limitben megkapjuk a Poisson-eloszlást.

Csakúgy, mint a binomiális, a Poisson-eloszlás is egy számeloszlás: hányszor fog történni valami. Nem a p valószínűséggel és az n próbák számával van paraméterezve, hanem az átlagos λ intenzitással, amely a binomiálishoz hasonlóan egyszerűen egy np állandó érték. Poisson-eloszlás – miről is van szó szükséges ne feledje, amikor egy adott időn belüli események számlálásáról beszélünk, állandó adott intenzitással.

Ha valami történik, például csomagok érkeznek egy útválasztóhoz, vagy vásárlók jelennek meg az üzletben, vagy valami sorban áll, gondoljon „Poissonra”.

Geometriai és negatív binomiális

Az egyszerű Bernoulli-tesztekből egy másik eloszlás derül ki. Hányszor fog egy érme fejre szállni, mielőtt fejre esik? A farok száma geometriai eloszlást követ. A Bernoulli-eloszláshoz hasonlóan ezt is a sikeres kimenetel valószínűsége paraméterezi, p. Nincs paraméterezve az n számmal, a dobáspróbák számával, mert a sikertelen próbák száma pontosan az eredmény.

Ha a binomiális eloszlás „hány siker”, akkor a geometriai eloszlás „Hány kudarc a siker előtt?”

A negatív binomiális eloszlás az előző egyszerű általánosítása. Ez a kudarcok száma, mielőtt r, nem pedig 1 siker lenne. Ezért tovább paraméterezi ez az r. Néha úgy írják le, mint a sikerek és a kudarcok száma. De ahogy az életvezetési tanácsadóm mondja: „Ön dönti el, mi a siker és mi a kudarc”, tehát ez ugyanaz, mindaddig, amíg eszébe jut, hogy a p valószínűségnek egyben a siker vagy a kudarc helyes valószínűsége is kell lennie.

Ha egy viccre van szüksége a feszültség oldására, megemlítheti, hogy a binomiális és a hipergeometrikus eloszlás nyilvánvaló pár, de a geometriai és a negatív binomiális is meglehetősen hasonló, majd azt mondja: "Nos, ki hívja őket így, mi?"

Exponenciális és Weibula

Még egyszer a technikai támogatás hívásairól: mennyi ideig tart a következő hívás? Ennek a várakozási időnek az eloszlása ​​geometrikusnak tűnik, mert minden másodperc, amíg senki nem hív, kudarc, míg a második, amíg végre meg nem történik a hívás. A hibák száma annyi, mint a másodpercek száma, amíg senki nem hív, és ez gyakorlatilag idő a következő hívásig, de „gyakorlatilag” nem elég nekünk. A lényeg az, hogy ez az idő egész másodpercek összege lesz, és így nem lehet számolni a várakozást ezen a másodpercen belül a hívás előtt.

Nos, mint korábban, most is a geometriai eloszlás határáig haladunk az időmegosztások tekintetében - és íme. Olyan exponenciális eloszlást kapunk, amely pontosan leírja a hívás előtti időt. Ez egy folyamatos elosztás, az első a mi fajtánkból, mert az eredmény nem feltétlenül egész másodpercben van. A Poisson-eloszláshoz hasonlóan ezt is a λ intenzitás paraméterezi.

Megismételve a binomiális és a geometria közötti kapcsolatot, Poisson „hány esemény az időben?” kapcsolódik az exponenciális „meddig tart az eseményig?” Ha vannak olyan események, amelyek időegységenkénti száma engedelmeskedik a Poisson-eloszlásnak, akkor a közöttük eltelt idő az exponenciális eloszlásnak engedelmeskedik ugyanazzal a λ paraméterrel. Ezt a megfelelést a két eloszlás között meg kell jegyezni, amikor bármelyiket tárgyaljuk.

Az exponenciális eloszlásnak eszünkbe kell jutnia, amikor az „eseményig időről”, esetleg „idő a kudarcra” gondolunk. Valójában ez annyira fontos helyzet, hogy léteznek általánosabb eloszlások az MTBF leírására, például a Weibull-eloszlás. Míg az exponenciális eloszlás megfelelő, ha például a kopási arány vagy a meghibásodási arány állandó, a Weibull-eloszlás modellezheti az idővel növekvő (vagy csökkenő) meghibásodási arányokat. Az exponenciális általában egy speciális eset.

Gondoljon a "Weibull"-ra, amikor az MTBF-ről beszél.

Normál, lognormális, Student-féle t és khi-négyzet

A normál vagy Gauss-eloszlás valószínűleg az egyik legfontosabb. Harang alakú formája azonnal felismerhető. Mint például, ez egy különösen érdekes entitás, amely mindenhol megnyilvánul, még a legegyszerűbbnek tűnő forrásokból is. Vegyünk egy értékkészletet, amelyek ugyanazt az eloszlást követik – bármelyiket! - és hajtsa össze őket. Összegük eloszlása ​​(körülbelül) normál eloszlást követ. Minél több dolgot adunk össze, azok összege annál jobban megfelel a normál eloszlásnak (a fogás: a tagok eloszlásának kiszámíthatónak, függetlennek kell lennie, csak normálisra hajlik). Elképesztő, hogy ez az eredeti terjesztés ellenére igaz.

jegyzet fordítás

Meglepett, hogy a szerző nem ír az összegzett eloszlások összehasonlítható skálájának szükségességéről: ha az egyik jelentősen uralja a többit, akkor a konvergencia rendkívül rossz lesz. És általában nem szükséges az abszolút kölcsönös függetlenség, a gyenge függés.

Hát valószínűleg bulikra jó, ahogy írta.


Ezt hívják „központi határtételnek”, és tudnod kell, mi ez, miért hívják így és mit jelent, különben azonnal nevetni fogsz.

Kontextusában a normál minden eloszláshoz kapcsolódik. Bár alapvetően mindenféle összeg elosztásához kötődik. A Bernoulli-próbák összege binomiális eloszlást követ, és a kísérletek számának növekedésével ez a binomiális eloszlás közelebb kerül a normál eloszláshoz. Hasonlóképpen rokona a hipergeometrikus eloszlás. A Poisson-eloszlás – a binomiális limitáló alakja – is a normálhoz közelít az intenzitás paraméterének növekedésével.

A lognormális eloszlást követő eredmények olyan értékeket eredményeznek, amelyek logaritmusa normális eloszlású. Vagy más szóval: egy normális eloszlású érték kitevője lognormális eloszlású. Ha az összegek normál eloszlásúak, akkor ne feledje, hogy a termékek lognormális eloszlásúak.

A Student t eloszlás a t teszt alapja, amelyet sok nem statisztikus más területeken is tanulmányoz. Arra használják, hogy feltételezéseket tegyenek a normális eloszlás átlagáról, és a paramétere növekedésével a normális eloszlásra is hajlik. Megkülönböztető tulajdonság t-eloszlás - a farka, amely vastagabb, mint a normál eloszlásé.

Ha a kövérfarkú tréfa nem rázta meg eléggé a szomszédot, folytasson egy meglehetősen vicces mesével a sörről. Több mint 100 évvel ezelőtt a Guinness statisztikákat használt, hogy javítsa vaskosságát. Aztán William Seely Gosset feltalált egy teljesen új statisztikai elméletet a jobb árpatermesztésre. Gossett meggyőzte főnökét, hogy más sörfőzők nem értik, hogyan használják fel ötleteit, és engedélyt kapott a publikálásra, de „Student” álnéven. A legtöbb híres teljesítmény Gosset - pontosan ez a t-eloszlás, amelyet, mondhatni, róla neveztek el.

Végül a khi-négyzet eloszlás a normál eloszlású értékek négyzetösszegeinek eloszlása. A khi-négyzet teszt ezen az eloszláson alapul, amely maga is a normál eloszlású különbségek négyzeteinek összegén alapul.

Gamma és béta

Ezen a ponton, ha már elkezdett beszélni valami khi-négyzetről, a beszélgetés komolyan kezdődik. Lehet, hogy már valódi statisztikusokkal beszél, és valószínűleg már meg kell hajolnia, mert olyan dolgok jöhetnek szóba, mint a gamma-eloszlás. Ez egy általánosítás És exponenciális És khi-négyzet eloszlás. Az exponenciális eloszláshoz hasonlóan erre használják összetett modellek várakozási idők. Például egy gamma-eloszlás jelenik meg, amikor a következő n eseményig eltelt időt szimuláljuk. A gépi tanulásban „adjunkt előzetes disztribúcióként” jelenik meg néhány másik disztribúcióhoz.

Ne beszéljünk ezekről a konjugált eloszlásokról, de ha kell, ne felejtsünk el beszélni a béta eloszlásról sem, mert ez a legtöbb itt említett eloszlás előtti konjugátum. Az adattudósok biztosak abban, hogy pontosan erre készült. Említse meg ezt lazán, és menjen az ajtóhoz.

A bölcsesség kezdete

A valószínűségi eloszlások olyan dolgok, amelyekről nem lehet túl sokat tudni. Az igazán érdeklődők megtekinthetik ezt a szuper-részletes térképet az összes valószínűségi eloszlásról Add tags