Ako určiť interval spoľahlivosti. Zostrojenie intervalu spoľahlivosti pre matematické očakávania populácie

29.09.2019
Interval spoľahlivosti– hraničné hodnoty štatistickej veličiny, ktorá s danou pravdepodobnosťou spoľahlivosti γ bude v tomto intervale pri odbere väčšieho objemu. Označuje sa ako P(θ - ε. V praxi sa pravdepodobnosť spoľahlivosti γ vyberá z hodnôt celkom blízkych jednotke: γ = 0,9, γ = 0,95, γ = 0,99.

Účel služby. Pomocou tejto služby môžete určiť:

  • interval spoľahlivosti pre všeobecný priemer, interval spoľahlivosti pre rozptyl;
  • interval spoľahlivosti pre štandardnú odchýlku, interval spoľahlivosti pre všeobecný podiel;
Výsledné riešenie sa uloží do súboru programu Word (pozri príklad). Nižšie je video návod, ako vyplniť počiatočné údaje.

Príklad č.1. Na JZD bolo z celkového stáda 1000 oviec 100 oviec podrobených selektívnemu kontrolnému strihaniu. V dôsledku toho sa stanovil priemerný odstrih vlny 4,2 kg na ovcu. Určte s pravdepodobnosťou 0,99 strednú štvorcovú chybu vzorky pri určovaní priemerného strihu vlny na ovcu a limity, v ktorých sa nachádza hodnota strihu, ak je rozptyl 2,5. Vzorka sa neopakuje.
Príklad č.2. Zo šarže dovezených produktov na pošte Moskovskej severnej colnice bolo náhodným opakovaným odberom vzoriek odobratých 20 vzoriek produktu „A“. Ako výsledok testu bol stanovený priemerný obsah vlhkosti produktu „A“ vo vzorke, ktorý sa ukázal byť rovný 6 % so štandardnou odchýlkou ​​1 %.
Určte s pravdepodobnosťou 0,683 limity priemerného obsahu vlhkosti výrobku v celej šarži dovážaných výrobkov.
Príklad č.3. Prieskum medzi 36 žiakmi ukázal, že priemerný počet prečítaných učebníc za rok akademický rok, vyšiel rovný 6. Za predpokladu, že počet učebníc prečítaných študentom za semester má zákon normálneho rozdelenia so smerodajnou odchýlkou ​​rovnou 6, nájdite: A) so spoľahlivosťou 0,99 intervalový odhad pre matematické očakávanie tohto náhodná premenná; B) s akou pravdepodobnosťou môžeme povedať, že priemerný počet prečítaných učebníc študentom za semester, vypočítaný z danej vzorky, sa bude odchyľovať od matematického očakávania podľa absolútna hodnota nie viac ako 2.

Klasifikácia intervalov spoľahlivosti

Podľa typu hodnoteného parametra:

Podľa typu vzorky:

  1. Interval spoľahlivosti pre nekonečnú vzorku;
  2. Interval spoľahlivosti pre konečnú vzorku;
Vzorka sa nazýva prevzorkovanie, ak sa vybraný objekt vráti do populácie pred výberom ďalšieho. Vzorka sa nazýva neopakovateľná, ak sa vybraný objekt nevráti obyvateľom. V praxi sa väčšinou stretávame s neopakovateľnými vzorkami.

Výpočet priemernej výberovej chyby pre náhodný výber

Nesúlad medzi hodnotami ukazovateľov získanými zo vzorky a zodpovedajúcimi parametrami všeobecnej populácie sa nazýva chyba reprezentatívnosti.
Označenia hlavných parametrov všeobecnej a výberovej populácie.
Vzorce pre priemerné chyby vzorkovania
opätovný výberopakovať výber
za priemerna zdieľanieza priemerna zdieľanie
Vzťah medzi hranicou vzorkovacej chyby (Δ) je s určitou pravdepodobnosťou zaručený Р(t), a priemerná výberová chyba má tvar: alebo Δ = t·μ, kde t– koeficient spoľahlivosti, určený v závislosti od úrovne pravdepodobnosti P(t) podľa tabuľky Laplaceovej integrálnej funkcie.

Vzorce na výpočet veľkosti vzorky pomocou metódy čisto náhodného výberu

Inteligencia nespočíva len vo vedomostiach, ale aj v schopnosti aplikovať poznatky v praxi. (Aristoteles)

Intervaly spoľahlivosti

Všeobecný prehľad

Odobratím vzorky z populácie získame bodový odhad parametra, ktorý nás zaujíma, a vypočítame štandardnú chybu na označenie presnosti odhadu.

Vo väčšine prípadov však štandardná chyba ako taká nie je prijateľná. Oveľa užitočnejšie je kombinovať túto mieru presnosti s intervalovým odhadom pre parameter populácie.

Dá sa to urobiť pomocou znalosti teoretickej pravdepodobnosti rozdelenia štatistiky vzorky (parametra) na výpočet intervalu spoľahlivosti (CI - interval spoľahlivosti, CI - interval spoľahlivosti) pre parameter.

Vo všeobecnosti interval spoľahlivosti rozširuje odhady v oboch smeroch o určitý násobok štandardnej chyby (daného parametra); dve hodnoty (limity spoľahlivosti) definujúce interval sú zvyčajne oddelené čiarkou a uzavreté v zátvorkách.

Interval spoľahlivosti pre priemer

Použitie normálneho rozdelenia

Priemer vzorky je normálne rozdelený, ak je veľkosť vzorky veľká, takže pri zvažovaní priemeru vzorky môžete použiť znalosti o normálnom rozdelení.

Konkrétne, 95 % distribúcie priemeru vzorky je v rámci 1,96 štandardnej odchýlky (SD) priemeru populácie.

Keď máme iba jednu vzorku, nazývame to štandardná chyba priemeru (SEM) a vypočítame 95% interval spoľahlivosti pre priemer takto:

Ak tento experiment zopakujeme niekoľkokrát, interval bude obsahovať skutočný priemer populácie 95 % času.

Zvyčajne ide o interval spoľahlivosti, ako je interval hodnôt, v rámci ktorého leží skutočný priemer populácie (všeobecný priemer) s pravdepodobnosťou 95 %.

Aj keď nie je úplne presné (priemer populácie je pevná hodnota, a preto k nej nemôže byť priradená pravdepodobnosť), interpretovať interval spoľahlivosti týmto spôsobom, je koncepčne ľahšie pochopiteľné.

Použitie t- distribúcia

Ak poznáte hodnotu rozptylu v populácii, môžete použiť normálne rozdelenie. Ak je veľkosť vzorky malá, priemer vzorky sleduje normálne rozdelenie, ak sú základné údaje o populácii normálne rozdelené.

Ak údaje, ktoré sú základom populácie, nie sú normálne rozdelené a/alebo nie je rozptyl populácie známy, priemerná hodnota vzorky sa riadi Študentovo t-rozdelenie.

95 % interval spoľahlivosti vypočítame pre všeobecnú populáciu takto:

Kde je percentuálny bod (percentil) t-Študentovo t rozdelenie s (n-1) stupňami voľnosti, ktoré dáva obojstrannú pravdepodobnosť 0,05.

Vo všeobecnosti poskytuje širší rozsah ako použitie normálneho rozdelenia, pretože zohľadňuje dodatočnú neistotu zavedenú odhadom štandardnej odchýlky populácie a/alebo v dôsledku malej veľkosti vzorky.

Keď je veľkosť vzorky veľká (rádovo 100 alebo viac), rozdiel medzi týmito dvoma distribúciami ( t-Student a normálne) je bezvýznamné. Vždy však používajú t- pri výpočte intervalov spoľahlivosti, aj keď je veľkosť vzorky veľká.

Typicky sa uvádza 95 % CI. Môžu sa vypočítať ďalšie intervaly spoľahlivosti, ako napríklad 99 % CI pre priemer.

Namiesto produktu štandardná chyba a tabuľková hodnota t- rozdelenie, ktoré zodpovedá obojstrannej pravdepodobnosti 0,05, vynásobte ho (štandardná chyba) hodnotou, ktorá zodpovedá obojstrannej pravdepodobnosti 0,01. Toto je širší interval spoľahlivosti ako 95 % interval spoľahlivosti, pretože odráža zvýšenú spoľahlivosť, že interval skutočne zahŕňa priemer populácie.

Interval spoľahlivosti pre pomer

Výberové rozdelenie proporcií má binomické rozdelenie. Ak však veľkosť vzorky n je primerane veľká, potom je výberové rozdelenie podielu približne normálne s priemerom .

Hodnotíme selektívnym pomerom p=r/n(Kde r- počet jedincov vo vzorke s tými, o ktoré máme záujem charakteristické znaky) a štandardná chyba sa odhaduje:

95 % interval spoľahlivosti pre podiel sa odhaduje:

Ak je veľkosť vzorky malá (zvyčajne keď n.p. alebo n(1-p) menej 5 ), potom je potrebné použiť binomické rozdelenie na výpočet presných intervalov spoľahlivosti.

Všimnite si, že ak p vyjadrené v percentách, teda (1-p) nahradený (100-p).

Interpretácia intervalov spoľahlivosti

Pri interpretácii intervalu spoľahlivosti nás zaujímajú nasledujúce otázky:

Aký široký je interval spoľahlivosti?

Široký interval spoľahlivosti naznačuje, že odhad je nepresný; úzky označuje presný odhad.

Šírka intervalu spoľahlivosti závisí od veľkosti štandardnej chyby, ktorá zase závisí od veľkosti vzorky, a keď sa uvažuje o numerickej premennej, variabilita údajov vytvára širšie intervaly spoľahlivosti ako štúdie veľkého súboru údajov s niekoľkými premennými. .

Obsahuje KI nejaké hodnoty, ktoré sú mimoriadne zaujímavé?

Môžete skontrolovať, či pravdepodobná hodnota parametra populácie spadá do intervalu spoľahlivosti. Ak áno, výsledky tomu zodpovedajú pravdepodobná hodnota. Ak nie, potom je nepravdepodobné (pre 95 % interval spoľahlivosti je šanca takmer 5 %), že parameter má túto hodnotu.

V predchádzajúcich podkapitolách sme sa zaoberali otázkou odhadu neznámeho parametra A jedno číslo. Toto sa nazýva „bodový“ odhad. V mnohých úlohách musíte nielen nájsť parameter A vhodnú číselnú hodnotu, ale aj na vyhodnotenie jej presnosti a spoľahlivosti. Musíte vedieť, k akým chybám môže výmena parametra viesť A jeho bodový odhad A a s akou mierou istoty môžeme očakávať, že tieto chyby nepresiahnu známe limity?

Problémy tohto druhu sú relevantné najmä pri malom počte pozorovaní, keď bodový odhad a v je do značnej miery náhodné a približné nahradenie a môže viesť k vážnym chybám.

Aby ste získali predstavu o presnosti a spoľahlivosti odhadu A,

V matematickej štatistiky Používajú takzvané intervaly spoľahlivosti a pravdepodobnosti spoľahlivosti.

Nech pre parameter A nestranný odhad získaný zo skúseností A. V tomto prípade chceme odhadnúť možnú chybu. Priraďme nejakú dostatočne veľkú pravdepodobnosť p (napríklad p = 0,9, 0,95 alebo 0,99) takú, že udalosť s pravdepodobnosťou p možno považovať za prakticky spoľahlivú a nájdime hodnotu s, pre ktorú

Potom rozsah prakticky možných hodnôt chyby vznikajúcej pri výmene A na A, bude ± s; Veľké chyby v absolútnej hodnote sa objavia len s nízkou pravdepodobnosťou a = 1 - p. Prepíšme (14.3.1) ako:

Rovnosť (14.3.2) znamená, že s pravdepodobnosťou p je neznáma hodnota parametra A spadá do intervalu

Je potrebné poznamenať jednu okolnosť. Predtým sme opakovane zvažovali pravdepodobnosť, že náhodná premenná spadne do daného nenáhodného intervalu. Tu je situácia iná: veľkosť A nie je náhodný, ale interval / p je náhodný. Jeho poloha na osi x je náhodná, určená jeho stredom A; Vo všeobecnosti je dĺžka intervalu 2s tiež náhodná, pretože hodnota s sa vypočítava spravidla z experimentálnych údajov. Preto by v tomto prípade bolo lepšie interpretovať hodnotu p nie ako pravdepodobnosť „zasiahnutia“ bodu A v intervale / p a ako pravdepodobnosť, že náhodný interval / p pokryje bod A(obr. 14.3.1).

Ryža. 14.3.1

Pravdepodobnosť p sa zvyčajne nazýva pravdepodobnosť dôvery, a interval / p - interval spoľahlivosti. Hranice intervalov Ak. a x =a- s a a 2 = a + a sú povolaní hranice dôvery.

Uveďme iný výklad pojmu interval spoľahlivosti: možno ho považovať za interval hodnôt parametrov A, kompatibilné s experimentálnymi údajmi a nie sú v rozpore s nimi. Ak totiž súhlasíme, že udalosť s pravdepodobnosťou a = 1-p považujeme za prakticky nemožnú, potom tie hodnoty parametra a, pre ktoré a - a> s musia byť uznané ako protichodné experimentálne údaje a tie, pre ktoré |a - A a t na 2.

Nech pre parameter A existuje nestranný odhad A. Keby sme poznali zákon rozdelenia množstva A, úloha nájsť interval spoľahlivosti by bola veľmi jednoduchá: stačilo by nájsť hodnotu s, pre ktorú

Problém je v tom, že zákon distribúcie odhadov A závisí od distribučného zákona množstva X a následne na jeho neznáme parametre (najmä na samotný parameter A).

Na obídenie tohto problému môžete použiť nasledujúcu približnú techniku: nahraďte neznáme parametre vo výraze pre s ich bodovými odhadmi. S pomerne veľké množstvo experimenty n(asi 20...30) táto technika zvyčajne poskytuje výsledky, ktoré sú z hľadiska presnosti uspokojivé.

Ako príklad uvažujme problém intervalu spoľahlivosti pre matematické očakávania.

Nech sa vyrába n X, ktorých charakteristikou je matematické očakávanie T a rozptyl D- neznámy. Pre tieto parametre sa získali nasledujúce odhady:

Je potrebné zostrojiť interval spoľahlivosti / p zodpovedajúci pravdepodobnosti spoľahlivosti p pre matematické očakávanie T množstvá X.

Pri riešení tohto problému využijeme fakt, že množstvo T predstavuje súčet n nezávislé identicky rozdelené náhodné premenné X h a podľa centrály limitná veta s dostatočne veľkým n jeho distribučný zákon je blízky normálu. V praxi aj pri relatívne malom počte členov (asi 10...20) možno distribučný zákon súčtu považovať približne za normálny. Budeme predpokladať, že hodnota T distribuované naprieč normálny zákon. Charakteristiky tohto zákona – matematické očakávanie a rozptyl – sa rovnajú, resp T A

(pozri kapitolu 13 pododdiel 13.3). Predpokladajme, že hodnota D poznáme a nájdeme hodnotu Ep, pre ktorú

Pomocou vzorca (6.3.5) z kapitoly 6 vyjadríme pravdepodobnosť na ľavej strane (14.3.5) prostredníctvom funkcie normálneho rozdelenia

kde je štandardná odchýlka odhadu T.

Z rov.

nájdite hodnotu Sp:

kde arg Ф* (х) je inverzná funkcia Ф* (X), tie. taká hodnota argumentu, pre ktorú sa funkcia normálneho rozdelenia rovná X.

Disperzia D, prostredníctvom ktorého sa množstvo vyjadruje A 1P, nevieme presne; ako jeho približnú hodnotu môžete použiť odhad D(14.3.4) a uveďte približne:

Problém konštrukcie intervalu spoľahlivosti bol teda približne vyriešený, čo sa rovná:

kde gp je určené vzorcom (14.3.7).

Aby sa predišlo spätnej interpolácii v tabuľkách funkcie Ф* (l) pri výpočte s p, je vhodné zostaviť špeciálnu tabuľku (tabuľka 14.3.1), ktorá udáva hodnoty množstva

v závislosti od r. Hodnota (p určuje pre normálny zákon počet smerodajných odchýlok, ktoré je potrebné vykresliť vpravo a vľavo od stredu disperzie tak, aby pravdepodobnosť vstupu do výslednej oblasti bola rovná p.

Pomocou hodnoty 7 p je interval spoľahlivosti vyjadrený ako:

Tabuľka 14.3.1

Príklad 1. Uskutočnilo sa 20 experimentov s množstvom X; výsledky sú uvedené v tabuľke. 14.3.2.

Tabuľka 14.3.2

Je potrebné nájsť odhad z pre matematické očakávanie množstva X a zostrojte interval spoľahlivosti zodpovedajúci pravdepodobnosti spoľahlivosti p = 0,8.

Riešenie. Máme:

Ak ako referenčný bod zvolíme l: = 10, pomocou tretieho vzorca (14.2.14) nájdeme nezaujatý odhad D :

Podľa tabuľky 14.3.1 nájdeme

Hranice spoľahlivosti:

Interval spoľahlivosti:

Hodnoty parametrov T, ležiace v tomto intervale sú kompatibilné s experimentálnymi údajmi uvedenými v tabuľke. 14.3.2.

Interval spoľahlivosti pre rozptyl možno zostrojiť podobným spôsobom.

Nech sa vyrába n nezávislé experimenty na náhodnej premennej X s neznámymi parametrami pre A aj disperziu D bol získaný nestranný odhad:

Je potrebné približne zostrojiť interval spoľahlivosti pre rozptyl.

Zo vzorca (14.3.11) je zrejmé, že množstvo D predstavuje

čiastka n náhodné premenné formulára . Tieto hodnoty nie sú

nezávislé, pretože ktorýkoľvek z nich zahŕňa množstvo T, závislý na všetkých ostatných. Dá sa však ukázať, že s pribúdajúcimi n distribučný zákon ich súčtu sa tiež blíži k normálu. Takmer o n= 20...30 to už možno považovať za normálne.

Predpokladajme, že je to tak a nájdime charakteristiky tohto zákona: matematické očakávanie a rozptyl. Od hodnotenia D- teda nezaujatý M[D] = D.

Výpočet rozptylu D D je spojená s pomerne zložitými výpočtami, preto uvádzame jej vyjadrenie bez odvodenia:

kde q 4 je štvrtý centrálny moment veľkosti X.

Ak chcete použiť tento výraz, musíte nahradiť hodnoty \u003d 4 a D(aspoň blízkych). Namiesto toho D môžete použiť jeho hodnotenie D. V zásade môže byť štvrtý centrálny moment nahradený aj odhadom, napríklad hodnotou tvaru:

ale takáto náhrada poskytne extrémne nízku presnosť, pretože vo všeobecnosti, s obmedzeným počtom experimentov, momentov vysoký poriadok sú určené s veľkými chybami. V praxi sa však často stáva, že typ rozdelenia množstva zákon X vopred známy: neznáme sú len jeho parametre. Potom sa môžete pokúsiť vyjadriť μ 4 prostredníctvom D.

Zoberme si najbežnejší prípad, kedy je hodnota X distribuované podľa bežného zákona. Potom je jeho štvrtý centrálny moment vyjadrený rozptylom (pozri kapitolu 6, pododdiel 6.2);

a vzorec (14.3.12) dáva alebo

Nahradenie neznámeho v (14.3.14) D jeho hodnotenie D, dostaneme: odkiaľ

Moment μ 4 možno vyjadriť cez D aj v niektorých iných prípadoch, keď rozdelenie hodnoty X nie je normálny, ale jeho vzhľad je známy. Napríklad pre zákon rovnomernej hustoty (pozri kapitolu 5) máme:

kde (a, P) je interval, na ktorom je zákon špecifikovaný.

teda

Pomocou vzorca (14.3.12) dostaneme: kde približne nájdeme

V prípadoch, keď nie je známy typ distribučného zákona pre veličinu 26, pri približnom odhade hodnoty a/) sa aj tak odporúča použiť vzorec (14.3.16), pokiaľ neexistujú osobitné dôvody domnievať sa, že tento zákon sa veľmi líši od bežného (má znateľné kladné alebo záporné špičky).

Ak sa približná hodnota a/) získa tak či onak, potom môžeme zostrojiť interval spoľahlivosti pre rozptyl rovnakým spôsobom, ako sme ho vytvorili pre matematické očakávanie:

kde hodnotu závislú od danej pravdepodobnosti p nájdeme podľa tabuľky. 14.3.1.

Príklad 2. Nájdite približne 80 % interval spoľahlivosti pre rozptyl náhodnej premennej X za podmienok príkladu 1, ak je známe, že hodnota X distribuované podľa zákona blízkeho normálu.

Riešenie. Hodnota zostáva rovnaká ako v tabuľke. 14.3.1:

Podľa vzorca (14.3.16)

Pomocou vzorca (14.3.18) nájdeme interval spoľahlivosti:

Zodpovedajúci rozsah hodnôt štandardnej odchýlky: (0,21; 0,29).

14.4. Presné metódy konštrukcie intervalov spoľahlivosti pre parametre náhodnej premennej distribuovanej podľa normálneho zákona

V predchádzajúcej podkapitole sme skúmali približne približné metódy konštrukcie intervalov spoľahlivosti pre matematické očakávania a rozptyl. Tu poskytneme predstavu o presných metódach riešenia rovnakého problému. Zdôrazňujeme, že pre presné nájdenie intervalov spoľahlivosti je bezpodmienečne nutné vopred poznať formu distribučného zákona množstva X, pričom pre aplikáciu približných metód to nie je potrebné.

Idea presné metódy Konštrukcia intervalov spoľahlivosti vychádza z nasledujúceho. Akýkoľvek interval spoľahlivosti sa zistí z podmienky vyjadrujúcej pravdepodobnosť splnenia určitých nerovností, medzi ktoré patrí aj odhad, ktorý nás zaujíma A. Zákon rozdelenia ocenenia A vo všeobecnom prípade závisí od neznámych parametrov veličiny X. Niekedy je však možné prejsť v nerovnostiach z náhodnej premennej A na nejakú inú funkciu pozorovaných hodnôt X p X 2, ..., X str. ktorého distribučný zákon nezávisí od neznámych parametrov, ale závisí len od počtu pokusov a od typu distribučného zákona veličiny X. Tieto druhy náhodných premenných hrajú dôležitú úlohu v matematickej štatistike; boli najpodrobnejšie študované pre prípad normálneho rozdelenia množstva X.

Napríklad je dokázané, že pri normálnom rozdelení hodnoty X náhodná premenná

podriaďuje sa tzv Zákon o distribúcii študentov s n- 1 stupeň voľnosti; hustota tohto zákona má tvar

kde G(x) je známa funkcia gama:

Bolo tiež dokázané, že náhodná premenná

má "distribúciu %2" s n- 1 stupeň voľnosti (pozri kapitolu 7), ktorého hustota je vyjadrená vzorcom

Bez toho, aby sme sa zaoberali deriváciami rozdelení (14.4.2) a (14.4.4), ukážeme, ako ich možno použiť pri konštrukcii intervalov spoľahlivosti pre parametre ty D.

Nech sa vyrába n nezávislé experimenty na náhodnej premennej X, normálne distribuované s neznámymi parametrami T&O. Pre tieto parametre boli získané odhady

Je potrebné zostrojiť intervaly spoľahlivosti pre oba parametre zodpovedajúce pravdepodobnosti spoľahlivosti p.

Najprv zostrojme interval spoľahlivosti pre matematické očakávanie. Je prirodzené brať tento interval symetrický vzhľadom na T; nech s p označuje polovicu dĺžky intervalu. Hodnota s p musí byť zvolená tak, aby bola splnená podmienka

Skúsme sa presunúť na ľavú stranu rovnosti (14.4.5) od náhodnej premennej T na náhodnú premennú T, distribuované podľa študentského zákona. Ak to chcete urobiť, vynásobte obe strany nerovnosti |m-w?|

kladnou hodnotou: alebo pomocou zápisu (14.4.1),

Nájdite číslo / p také, aby sa hodnota / p dala nájsť z podmienky

Zo vzorca (14.4.2) je zrejmé, že (1) - dokonca funkciu, tak (14.4.8) dáva

Rovnosť (14.4.9) určuje hodnotu / p v závislosti od p. Ak máte k dispozícii tabuľku integrálnych hodnôt

potom hodnotu /p je možné nájsť reverznou interpoláciou v tabuľke. Je však pohodlnejšie vopred zostaviť tabuľku hodnôt /p. Takáto tabuľka je uvedená v prílohe (tabuľka 5). Táto tabuľka zobrazuje hodnoty v závislosti od úrovne spoľahlivosti p a počtu stupňov voľnosti n- 1. Po určení / p z tabuľky. 5 a za predpokladu

nájdeme polovičnú šírku intervalu spoľahlivosti / p a samotný interval

Príklad 1. Uskutočnilo sa 5 nezávislých experimentov s náhodnou premennou X, normálne distribuované s neznámymi parametrami T a o. Výsledky experimentov sú uvedené v tabuľke. 14.4.1.

Tabuľka 14.4.1

Nájsť hodnotenie T pre matematické očakávanie a zostrojte preň 90 % interval spoľahlivosti / p (t. j. interval zodpovedajúci pravdepodobnosti spoľahlivosti p = 0,9).

Riešenie. Máme:

Podľa tabuľky 5 žiadosti o p - 1 = 4 a p = 0,9 nájdeme kde

Interval spoľahlivosti bude

Príklad 2. Pre podmienky príkladu 1 pododdielu 14.3, za predpokladu hodnoty X normálne rozložené, nájdite presný interval spoľahlivosti.

Riešenie. Podľa tabuľky 5 v prílohe zistíme kedy p - 1 = 19ir =

0,8 / p = 1,328; odtiaľto

V porovnaní s riešením z príkladu 1 pododdielu 14.3 (e p = 0,072) sme presvedčení, že nezrovnalosť je veľmi nevýznamná. Ak zachováme presnosť na dve desatinné miesta, potom sa intervaly spoľahlivosti zistené presnou a približnou metódou zhodujú:

Prejdime ku konštrukcii intervalu spoľahlivosti pre rozptyl. Zvážte nezaujatý odhad rozptylu

a vyjadriť náhodnú premennú D cez veľkosť V(14.4.3), s rozdelením x 2 (14.4.4):

Poznať zákon rozdelenia množstva V, môžete nájsť interval /(1), do ktorého spadá s danou pravdepodobnosťou p.

Zákon distribúcie kn_x(v) magnitúda I7 má tvar znázornený na obr. 14.4.1.

Ryža. 14.4.1

Vynára sa otázka: ako zvoliť interval / p? Ak zákon rozdelenia vel V bol symetrický (ako normálny zákon alebo Studentovo rozdelenie), bolo by prirodzené brať interval /p symetrický vzhľadom na matematické očakávanie. V tomto prípade zákon k p_x (v) asymetrické. Dohodnime sa, že zvolíme interval /p tak, aby pravdepodobnosť hodnoty bola V za intervalom vpravo a vľavo (tieňované oblasti na obr. 14.4.1) boli rovnaké a rovnaké

Na vytvorenie intervalu /p s touto vlastnosťou použijeme tabuľku. 4 aplikácie: obsahuje čísla y) také že

za hodnotu V, s x 2 -distribúciou s r stupňami voľnosti. V našom prípade r = n- 1. Poďme opraviť r = n- 1 a nájdite v príslušnom riadku tabuľky. 4 dva významy x 2 - jeden zodpovedá pravdepodobnosti druhý - pravdepodobnosť Označme tieto

hodnoty o 2 A xl? Interval má y 2,ľavou stranou a y~ pravý koniec.

Teraz nájdime z intervalu / p požadovaný interval spoľahlivosti /| pre disperziu s hranicami D a D2, ktorý pokrýva pointu D s pravdepodobnosťou p:

Zostrojme interval / (, = (?> ь А), ktorý pokrýva bod D vtedy a len vtedy, ak hodnota V spadá do intervalu /r. Ukážme, že interval

spĺňa túto podmienku. Pravdaže, nerovnosti sú ekvivalentné nerovnostiam

a tieto nerovnosti sa uspokoja s pravdepodobnosťou p. Interval spoľahlivosti pre rozptyl bol teda nájdený a je vyjadrený vzorcom (14.4.13).

Príklad 3. Nájdite interval spoľahlivosti pre rozptyl za podmienok príkladu 2 pododdielu 14.3, ak je známe, že hodnota X normálne distribuované.

Riešenie. máme . Podľa tabuľky 4 prílohy

nájdeme na r = n - 1 = 19

Pomocou vzorca (14.4.13) nájdeme interval spoľahlivosti pre rozptyl

Zodpovedajúci interval pre štandardnú odchýlku je (0,21; 0,32). Tento interval len mierne presahuje interval (0,21; 0,29) získaný v príklade 2 pododdielu 14.3 približnou metódou.

  • Obrázok 14.3.1 uvažuje interval spoľahlivosti symetrický okolo a. Vo všeobecnosti, ako uvidíme neskôr, to nie je potrebné.

Skonštruujme interval spoľahlivosti v MS EXCEL, aby sme odhadli strednú hodnotu distribúcie v tomto prípade známa hodnota odchýlky.

Samozrejme výber úroveň dôveryúplne závisí od riešeného problému. Miera dôvery cestujúceho v leteckej doprave v spoľahlivosť lietadla by teda mala byť nepochybne vyššia ako miera dôvery kupujúceho v spoľahlivosť elektrickej žiarovky.

Formulácia problému

Predpokladajme, že z obyvateľov po odobratí vzorka veľkosť n. Predpokladá sa, že smerodajná odchýlka táto distribúcia je známa. Na základe toho je potrebné vzorky hodnotiť neznáme distribučný priemer(μ, ) a zostrojte zodpovedajúce obojstranný interval spoľahlivosti.

Bodový odhad

Ako je známe z štatistiky(označme to X priem) je nestranný odhad priemeru toto obyvateľov a má distribúciu N(μ;σ2/n).

Poznámka: Čo robiť, ak potrebujete stavať interval spoľahlivosti v prípade distribúcie, ktorá nie je normálne? V tomto prípade prichádza na pomoc, ktorá hovorí, že s dosť veľká veľkosť vzorky n z distribúcie nebyť normálne, vzorové rozdelenie štatistík X priem bude približne korešpondovať normálne rozdelenie s parametrami N(μ;σ 2 /n).

takže, bodový odhad priemer distribučné hodnoty máme - toto vzorový priemer, t.j. X priem. Teraz začnime interval spoľahlivosti.

Zostrojenie intervalu spoľahlivosti

Zvyčajne, keď poznáme rozdelenie a jeho parametre, vieme vypočítať pravdepodobnosť, že náhodná premenná nadobudne hodnotu z intervalu, ktorý určíme. Teraz urobme opak: nájdime interval, v ktorom bude náhodná premenná s danou pravdepodobnosťou padať. Napríklad z vlastností normálne rozdelenie je známe, že s pravdepodobnosťou 95% sa náhodná premenná rozloží normálny zákon, bude spadať do rozsahu približne +/- 2 od priemerná hodnota(pozri článok o). Tento interval nám poslúži ako prototyp interval spoľahlivosti.

Teraz sa pozrime, či poznáme distribúciu , vypočítať tento interval? Aby sme odpovedali na otázku, musíme uviesť tvar rozvodu a jeho parametre.

Poznáme formu distribúcie - toto je normálne rozdelenie(zapamätaj si to hovoríme o O distribúcia vzoriek štatistiky X priem).

Parameter μ nám nie je známy (treba ho odhadnúť pomocou interval spoľahlivosti), ale máme to odhad priem. X, vypočítané na základe vzorky, ktoré možno použiť.

Druhý parameter - štandardná odchýlka priemeru vzorky budeme to považovať za známe, rovná sa σ/√n.

Pretože nevieme μ, potom zostavíme interval +/- 2 štandardné odchýlky nie z priemerná hodnota a z jeho známeho odhadu X priem. Tie. pri výpočte interval spoľahlivosti nebudeme to predpokladať X priem spadá do rozsahu +/- 2 štandardné odchýlky od μ s pravdepodobnosťou 95% a budeme predpokladať, že interval je +/- 2 štandardné odchýlky od X priem s 95% pravdepodobnosťou pokryje μ – priemer bežnej populácie, z ktorého sa berie vzorka. Tieto dva výroky sú ekvivalentné, ale druhý výrok nám umožňuje konštruovať interval spoľahlivosti.

Okrem toho si ujasnime interval: náhodná premenná rozložená cez normálny zákon, s 95% pravdepodobnosťou spadá do intervalu +/- 1,960 štandardné odchýlky, nie +/- 2 štandardné odchýlky. Dá sa to vypočítať pomocou vzorca =NORM.ST.REV((1+0,95)/2), cm. príklad súboru Sheet Interval.

Teraz môžeme sformulovať pravdepodobnostné tvrdenie, ktoré nám poslúži na formovanie interval spoľahlivosti:
„Pravdepodobnosť, že priemer populácie nachádza sa od vzorový priemer do 1 960 " štandardné odchýlky priemeru vzorky" rovných 95 %“.

Hodnota pravdepodobnosti uvedená vo vyhlásení má špeciálny názov , ktorý je spojený s hladina významnosti α (alfa) jednoduchý výraz úroveň dôvery =1 . V našom prípade úroveň významnosti α =1-0,95=0,05 .

Teraz na základe tohto pravdepodobnostného tvrdenia napíšeme výraz na výpočet interval spoľahlivosti:

kde Z α/2 štandardná normálne rozdelenie(táto hodnota náhodnej premennej z, Čo? P(z>=Z a/2 ) = a/2).

Poznámka: Horný α/2-kvantil definuje šírku interval spoľahlivosti V štandardné odchýlky vzorový priemer. Horný α/2-kvantil štandardná normálne rozdelenie vždy väčšie ako 0, čo je veľmi výhodné.

V našom prípade s α=0,05, horný α/2-kvantil rovná sa 1,960. Pre ostatné hladiny významnosti α (10 %; 1 %) horný α/2-kvantil Z a/2 možno vypočítať pomocou vzorca =NORM.ST.REV(1-α/2) alebo, ak je známy úroveň dôvery, =NORM.ST.OBR((1+úroveň dôveryhodnosti)/2).

Zvyčajne pri stavbe intervaly spoľahlivosti pre odhad priemeru iba použiť horné α/2-kvantil a nepoužívajte nižšie α/2-kvantil. Je to možné, pretože štandardná normálne rozdelenie symetricky okolo osi x ( hustota jeho distribúcie symetrický o priemer, t.j. 0). Preto nie je potrebné počítať nižší α/2-kvantil(nazýva sa jednoducho α /2-kvantil), pretože je to rovné horné α/2-kvantil so znamienkom mínus.

Pripomeňme si, že napriek tvaru rozdelenia hodnoty x, zodpovedajúcej náhodnej premennej X priem distribuované približne Dobre N(μ;σ 2 /n) (pozri článok o). Preto vo všeobecnosti vyššie uvedený výraz pre interval spoľahlivosti je len približné. Ak je hodnota x rozdelená na normálny zákon N(μ;σ 2 /n), potom výraz pre interval spoľahlivosti je presný.

Výpočet intervalu spoľahlivosti v MS EXCEL

Poďme vyriešiť problém.
Čas odozvy elektronického komponentu na vstupný signál je dôležitá charakteristika zariadení. Inžinier chce vytvoriť interval spoľahlivosti pre priemerný čas odozvy na úrovni spoľahlivosti 95 %. Z predchádzajúcich skúseností inžinier vie, že štandardná odchýlka času odozvy je 8 ms. Je známe, že na vyhodnotenie doby odozvy inžinier vykonal 25 meraní, priemerná hodnota bola 78 ms.

Riešenie: Inžinier chce poznať čas odozvy elektronického zariadenia, no chápe, že čas odozvy nie je pevná hodnota, ale náhodná veličina, ktorá má svoje vlastné rozdelenie. Takže najlepšie, v čo môže dúfať, je určiť parametre a tvar tohto rozdelenia.

Bohužiaľ, z problémových podmienok nepoznáme tvar distribúcie času odozvy (nemusí byť normálne). , táto distribúcia je tiež neznáma. Len on je známy smerodajná odchýlka a = 8. Preto zatiaľ nevieme vypočítať pravdepodobnosti a konštruovať interval spoľahlivosti.

Avšak aj napriek tomu, že distribúciu nepoznáme čas samostatná odpoveď, vieme, že podľa CPT, distribúcia vzoriek priemerný čas odozvy je približne normálne(predpokladáme, že podmienky CPT sa vykonávajú, pretože veľkosť vzorky dosť veľké (n=25)) .

navyše priemer toto rozdelenie sa rovná priemerná hodnota distribúcia jednej odpovede, t.j. μ. A smerodajná odchýlka tohto rozdelenia (σ/√n) možno vypočítať pomocou vzorca =8/ROOT(25) .

Je tiež známe, že inžinier dostal bodový odhad parameter μ rovný 78 ms (X avg). Preto teraz môžeme vypočítať pravdepodobnosti, pretože poznáme formu distribúcie ( normálne) a jeho parametre (X avg a σ/√n).

Inžinier to chce vedieť matematické očakávanieμ distribúcie času odozvy. Ako je uvedené vyššie, toto μ sa rovná matematické očakávanie distribúcie vzorky priemerného času odozvy. Ak použijeme normálne rozdelenie N(Х avg; σ/√n), potom bude požadované μ v rozsahu +/-2*σ/√n s pravdepodobnosťou približne 95 %.

Úroveň významnosti rovná sa 1-0,95=0,05.

Nakoniec nájdime ľavú a pravú hranicu interval spoľahlivosti.
Ľavý okraj: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Pravý okraj: =78+NORM.ST.REV(1-0,05/2)*8/ROOT(25)=81,136

Ľavý okraj: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Pravý okraj: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Odpoveď: interval spoľahlivosti pri 95 % hladina spoľahlivosti a σ=8ms rovná sa 78+/-3,136 ms.

IN vzorový súbor na hárku Sigma známy, vytvoril formulár na výpočet a konštrukciu obojstranný interval spoľahlivosti za svojvoľné vzorky s daným σ a úroveň významnosti.

Funkcia CONFIDENCE.NORM().

Ak hodnoty vzorky sú v rozsahu B20:B79 , A úroveň významnosti rovná 0,05; potom vzorec MS EXCEL:
=AVERAGE(B20:B79)-CONFIDENCE.NORM(0,05;σ; COUNT(B20:B79))
vráti ľavý okraj interval spoľahlivosti.

Rovnaký limit možno vypočítať pomocou vzorca:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Poznámka: Funkcia CONFIDENCE.NORM() sa objavila v MS EXCEL 2010. V starších verziách MS EXCEL sa používala funkcia TRUST().

Interval spoľahlivosti k nám prichádza z oblasti štatistiky. Ide o určitý rozsah, ktorý slúži na odhad neznámeho parametra s vysokou mierou spoľahlivosti. Najjednoduchšie sa to dá vysvetliť na príklade.

Predpokladajme, že potrebujete študovať nejakú náhodnú premennú, napríklad rýchlosť odozvy servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétneho webu, server odpovie rôznymi rýchlosťami. Skúmaný čas odozvy je teda náhodný. Interval spoľahlivosti nám teda umožňuje určiť hranice tohto parametra a potom môžeme povedať, že s 95% pravdepodobnosťou bude server v rozsahu, ktorý sme vypočítali.

Alebo potrebujete zistiť, koľko ľudí vie o ochrannej známke spoločnosti. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí si to uvedomujú, pohybuje v rozmedzí od 27 % do 34 %.

S týmto pojmom úzko súvisí hodnota pravdepodobnosti spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Od tejto hodnoty závisí, aký veľký bude náš požadovaný rozsah. Ako vyššiu hodnotu akceptuje, tým užší je interval spoľahlivosti a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

Tento ukazovateľ je ovplyvnený aj rozptylom pozorovaní a jeho definícia je založená na predpoklade, že skúmaná charakteristika sa riadi týmto tvrdením, ktoré je známe aj ako Gaussov zákon. Normál je podľa neho rozdelenie všetkých pravdepodobností spojitej náhodnej veličiny, ktoré možno opísať hustotou pravdepodobnosti. Ak je predpoklad normálneho rozdelenia nesprávny, odhad môže byť nesprávny.

Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Existujú dva možné prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parameter z Laplaceovej distribučnej tabuľky,

σ je druhá odmocnina z rozptylu.

Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Používa sa na to nasledujúci vzorec:

σ2 = х2ср - (хср)2, kde

х2ср - priemerná hodnota druhých mocnín študovanej charakteristiky,

(хср)2 je druhá mocnina tejto charakteristiky.

Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - vzorový priemer,

α - znak,

t je parameter, ktorý sa nachádza pomocou študentskej distribučnej tabuľky t = t(ɣ;n-1),

sqrt(n) - druhá odmocnina z celkovej veľkosti vzorky,

s je druhá odmocnina z rozptylu.

Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bola študovaná charakteristika určená rovná 30 a výberový rozptyl rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu hodnotu meraného parametra.

Najprv určme, čomu sa t rovná: t = t (0,99; 7-1) = 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval spoľahlivosti pre rozptyl sa počíta tak v prípade známeho priemeru, ako aj vtedy, keď neexistujú údaje o matematickom očakávaní a je známa len hodnota bodového neskresleného odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby sa dajú vždy nájsť na internete.

Všimnime si len, že je vhodné určiť interval spoľahlivosti pomocou Excelu alebo sieťovej služby, ktorá sa tak nazýva.