Koncepti statističkog značaja i statistički kriterijumi. Osnovni pojmovi i pojmovi medicinske statistike

21.09.2019

Nivo značaja - ovo je vjerovatnoća da smo smatrali da su razlike značajne, ali su zapravo slučajne.

Kada naznačimo da su razlike značajne na nivou značajnosti od 5% ili kada r< 0,05 , tada mislimo da je vjerovatnoća da su nepouzdani 0,05.

Kada naznačimo da su razlike značajne na nivou značajnosti od 1% ili kada r< 0,01 , onda mislimo da je vjerovatnoća da su nepouzdani 0,01.

Ako sve ovo prevedemo na formalizovaniji jezik, onda je nivo značajnosti verovatnoća odbacivanja nulte hipoteze, dok je ona tačna.

greška,koji se sastoji odonajšta miodbijenonulta hipotezaiako je tačna, naziva se greškom tipa 1.(Vidi tabelu 1)

Table 1. Nulte i alternativne hipoteze i mogući uslovi testiranja.

Vjerovatnoća takve greške obično se označava kao α. U suštini, morali bismo naznačiti u zagradama ne str < 0,05 ili str < 0,01 i α < 0,05 ili α < 0,01.

Ako je vjerovatnoća greške α , tada je vjerovatnoća ispravne odluke: 1-α. Što je manji α, veća je vjerovatnoća ispravne odluke.

Istorijski gledano, u psihologiji je opšte prihvaćeno da je najniži nivo statističke značajnosti nivo od 5% (p≤0,05): dovoljan je nivo od 1% (p≤0,01), a najviši nivo od 0,1% (p≤0,001) , dakle, tabele kritičnih vrednosti obično sadrže vrednosti kriterijuma koji odgovaraju nivoima statistički značaj p≤0,05 i p≤0,01, ponekad p≤0,001. Za neke kriterijume, tabele pokazuju tačan nivo značajnosti njihovih različitih empirijskih vrednosti. Na primjer, za φ*=1,56 p=O,06.

Međutim, sve dok nivo statističke značajnosti ne dostigne p=0,05, još uvek nemamo pravo da odbacimo nultu hipotezu. Pridržavat ćemo se sljedećeg pravila za odbacivanje hipoteze o nepostojanju razlika (Ho) i prihvaćanje hipoteze o statistički značaj

razlike (H 1).

Pravilo za odbijanje Ho i prihvatanje h1

Ako je empirijska vrijednost kriterija jednaka ili veća od kritične vrijednosti koja odgovara p≤0,05, tada se H 0 odbacuje, ali još ne možemo definitivno prihvatiti H 1 .

Ako je empirijska vrijednost kriterija jednaka kritičnoj vrijednosti koja odgovara p≤0,01 ili je prelazi, tada se H 0 odbacuje, a H 1 prihvata. : G znak test, Wilcoxon T test i Mann-Whitney U test. Za njih se uspostavljaju obrnuti odnosi.

Rice. 4. Primjer "ose značaja" za Rosenbaumov Q kriterij.

Kritične vrijednosti kriterija su označene kao Q o, o5 i Q 0,01, a empirijske vrijednosti kriterija kao Q em. Zatvorena je u elipsu.

Desno od kritične vrijednosti Q 0,01 proširuje se "zona značaja" - to uključuje empirijske vrijednosti koje prelaze Q 0,01 i stoga su svakako značajne.

Lijevo od kritične vrijednosti Q 0,05 proteže se "zona beznačajnosti" - to uključuje empirijske Q vrijednosti koje su ispod Q 0,05 i stoga su svakako beznačajne.

Vidimo to Q 0,05 =6; Q 0,01 =9; Q em. =8;

Empirijska vrijednost kriterija se nalazi u području između Q 0,05 i Q 0,01. Ovo je zona “neizvjesnosti”: već možemo odbaciti hipotezu o nepouzdanosti razlika (H 0), ali još ne možemo prihvatiti hipotezu o njihovoj pouzdanosti (H 1).

U praksi, međutim, istraživač može smatrati pouzdanim one razlike koje ne spadaju u zonu beznačajnosti, proglašavajući da su pouzdane na p < 0,05, ili navođenjem tačnog nivoa značajnosti dobijene vrednosti empirijskog kriterijuma, na primer: p=0,02. Koristeći standardne tabele, koje postoje u svim udžbenicima o matematičkim metodama, to se može uraditi u odnosu na Kruskal-Wallis H kriterijum, χ 2 r Friedman, Page's L, Fisher's φ* .

Nivo statističke značajnosti ili kritične vrijednosti testa različito se određuju kada je testiranje usmjereno i neusmjereno statističke hipoteze.

Kod usmjerene statističke hipoteze koristi se jednostrani test, a kod neusmjerene hipoteze koristi se dvostrani test. Dvostrani test je stroži jer testira razlike u oba smjera, a samim tim i empirijsku vrijednost testa koja je prethodno odgovarala nivou značajnosti p < 0,05, sada odgovara samo p nivou < 0,10.

Nećemo svaki put morati sami da odlučujemo da li koristi jednostrani ili dvostrani kriterijum. Tablice kritičnih vrijednosti kriterija su odabrane na način da hipoteze usmjerenja odgovaraju jednostranom kriteriju, a neusmjerene hipoteze dvostranom kriteriju, a date vrijednosti zadovoljavaju zahtjeve koji primijeniti na svaku od njih. Istraživač samo treba osigurati da se njegove hipoteze po značenju i obliku podudaraju s hipotezama predloženim u opisu svakog od kriterija.

U bilo kojoj naučnoj i praktičnoj situaciji eksperimenta (istraživanja), istraživači mogu proučavati ne sve ljude (opću populaciju, populaciju), već samo određeni uzorak. Na primjer, čak i ako proučavamo relativno malu grupu ljudi, poput onih koji pate od određene bolesti, još uvijek je vrlo malo vjerovatno da imamo odgovarajuće resurse ili potrebu da testiramo svakog pacijenta. Umjesto toga, uobičajeno je testirati uzorak iz populacije jer je to praktičnije i oduzima manje vremena. Ako je tako, kako znamo da su rezultati dobijeni iz uzorka reprezentativni za cijelu grupu? Ili, da se poslužimo stručnom terminologijom, možemo li biti sigurni da naše istraživanje ispravno opisuje cjelinu stanovništva, uzorak koji smo koristili?

Za odgovor na ovo pitanje potrebno je utvrditi statističku značajnost rezultata testa. Statistički značaj (Značajan nivo, skraćeno potpis), ili /7-nivo značajnosti (p-nivo) - je vjerovatnoća da dati rezultat ispravno predstavlja populaciju iz koje je studija uzorkovana. Imajte na umu da je ovo samo vjerovatnoća- nemoguće je sa apsolutnom sigurnošću reći da data studija ispravno opisuje cjelokupnu populaciju. IN najboljem scenariju Na osnovu nivoa značaja, može se samo zaključiti da je to vrlo vjerovatno. Stoga se neizbježno postavlja sljedeće pitanje: koji nivo značaja mora biti da bi se dati rezultat mogao smatrati ispravnom karakterizacijom populacije?

Na primjer, pri kojoj vrijednosti vjerovatnoće ste spremni reći da su takve šanse dovoljne za preuzimanje rizika? Šta ako su šanse 10 od 100 ili 50 od 100? Šta ako je ova vjerovatnoća veća? Šta je sa kvotama kao što su 90 od 100, 95 od 100 ili 98 od 100? Za situaciju koja uključuje rizik, ovaj izbor je prilično problematičan, jer zavisi od ličnih karakteristika osobe.

U psihologiji se tradicionalno vjeruje da 95 ili više šanse od 100 znači da je vjerovatnoća da su rezultati tačni dovoljno visoka da se mogu generalizirati na cijelu populaciju. Ova brojka je ustanovljena u procesu naučne i praktične aktivnosti - ne postoji zakon prema kojem bi se ona trebala odabrati kao smjernica (i zaista, u drugim naukama ponekad se biraju druge vrijednosti nivoa značaja).

U psihologiji se ovom vjerovatnoćom upravlja na pomalo neobičan način. Umjesto vjerovatnoće da uzorak predstavlja populaciju, vjerovatnoća da uzorak ne predstavlja stanovništva. Drugim riječima, to je vjerovatnoća da su uočeni odnos ili razlike slučajni, a ne svojstvo populacije. Dakle, umjesto da kažu da postoji šansa 95 prema 100 da su rezultati studije tačni, psiholozi kažu da postoji šansa 5 od 100 da su rezultati pogrešni (baš kao što šansa 40 prema 100 da su rezultati tačni znači šansa 60 prema 100 u korist njihove netačnosti). Vrijednost vjerovatnoće se ponekad izražava u postocima, ali češće se piše kao decimalni razlomak. Na primjer, 10 šansi od 100 izraženo je kao decimalni razlomak od 0,1; 5 od 100 je zapisano kao 0,05; 1 od 100 - 0,01. Kod ovog oblika snimanja granična vrijednost je 0,05. Da bi se rezultat smatrao tačnim, njegov nivo značajnosti mora biti ispod ovaj broj (zapamtite, ovo je vjerovatnoća da će rezultat pogrešno opisuje populaciju). Da bismo maknuli terminologiju s puta, dodajmo da je “vjerovatnoća da je rezultat netačan” (što se pravilnije naziva nivo značaja) obično označavaju latinično pismo r. Opisi eksperimentalnih rezultata obično uključuju sažetu izjavu kao što je „rezultati su bili značajni na nivou pouzdanosti (str(p) manje od 0,05 (tj. manje od 5%).

Dakle, nivo značajnosti ( r) ukazuje na vjerovatnoću da će rezultati Ne predstavljaju stanovništvo. Tradicionalno u psihologiji, vjeruje se da se rezultati pouzdano odražavaju velika slika, ako vrijednost r manje od 0,05 (tj. 5%). Međutim, ovo je samo probabilistička izjava, a nikako bezuslovna garancija. U nekim slučajevima ovaj zaključak možda nije tačan. U stvari, možemo izračunati koliko često se to može dogoditi ako pogledamo veličinu nivoa značaja. Na nivou značajnosti od 0,05, 5 od 100 puta će rezultati vjerovatno biti netačni. 11a na prvi pogled izgleda da to nije baš uobičajeno, ali ako razmislite, onda je 5 šansi od 100 isto kao 1 od 20. Drugim riječima, u jednom od svakih 20 slučajeva rezultat će biti netačno. Takvi izgledi ne izgledaju posebno povoljni, a istraživači bi se trebali paziti da ne počine greške prve vrste. Ovo je naziv za grešku koja se javlja kada istraživači misle da su otkrili stvarni rezultati, ali u stvari ih nema. Suprotna greška, koja se sastoji u tome što istraživači vjeruju da nisu pronašli rezultat, ali ga zapravo postoji, zove se greške druge vrste.

Ove greške nastaju jer se ne može isključiti mogućnost da se izvršena statistička analiza ne može isključiti. Verovatnoća greške zavisi od nivoa statističke značajnosti rezultata. Već smo napomenuli da da bi se rezultat smatrao tačnim, nivo značajnosti mora biti ispod 0,05. Naravno, neki rezultati su i više nizak nivo, i nije neuobičajeno pronaći rezultate niže od 0,001 (vrijednost od 0,001 označava da rezultati imaju 1 na 1000 šanse da budu pogrešni). Kako manje vrijednosti p, to je jače naše povjerenje u ispravnost rezultata.

U tabeli 7.2 prikazuje tradicionalno tumačenje nivoa značajnosti o mogućnosti statističkog zaključivanja i obrazloženje odluke o postojanju veze (razlike).

Tabela 7.2

Tradicionalna interpretacija nivoa značaja koja se koristi u psihologiji

Na osnovu iskustva iz praktičnih istraživanja, preporučuje se: kako bi se što je više moguće izbjegle greške prvog i drugog tipa, prilikom donošenja važnih zaključaka treba donijeti odluke o prisutnosti razlika (veza), fokusirajući se na nivo r n znak.

Statistički test(Statistički test - to je alat za određivanje nivoa statističke značajnosti. Ovo je odlučujuće pravilo koje osigurava da se istinita hipoteza prihvati, a pogrešna hipoteza odbaci s velikom vjerovatnoćom.

Statistički kriterijumi takođe označavaju način izračunavanja određenog broja i sam broj. Svi kriterijumi se koriste sa jednim glavni cilj: definisati nivo značajnosti podatke koje analiziraju (tj. vjerovatnoću da podaci odražavaju pravi efekat koji ispravno predstavlja populaciju iz koje je uzorak izvučen).

Neki testovi se mogu koristiti samo za normalno raspoređene podatke (i ako se osobina mjeri na intervalnoj skali) - ovi testovi se obično nazivaju parametarski. Koristeći druge kriterije, možete analizirati podatke s gotovo bilo kojim zakonom o distribuciji - oni se nazivaju neparametarski.

Parametarski kriterijumi su kriterijumi koji uključuju parametre distribucije u formulu za proračun, tj. sredine i varijanse (Studentov t-test, Fišerov F-test, itd.).

Neparametarski kriterijumi su kriterijumi koji ne uključuju parametre distribucije u formulu za izračunavanje parametara distribucije i zasnivaju se na radu sa frekvencijama ili rangovima (kriterijum Q Rosenbaumov kriterijum U Manna - Whitney

Na primjer, kada kažemo da je značajnost razlika određena Studentovim t-testom, mislimo da je za izračunavanje empirijske vrijednosti korištena Studentova metoda t-testa, koja se zatim upoređuje sa tabeliranom (kritičnom) vrijednošću.

Po omjeru empirijske (koje smo mi izračunali) i kritične vrijednosti kriterija (tabelarni) možemo prosuditi da li je naša hipoteza potvrđena ili opovrgnuta. U većini slučajeva, da bismo prepoznali razlike kao značajne, potrebno je da empirijska vrijednost kriterija bude veća od kritične vrijednosti, iako postoje kriteriji (npr. Mann-Whitney test ili test znakova) u kojima moramo se pridržavati suprotnog pravila.

U nekim slučajevima, formula za proračun za kriterijum uključuje broj zapažanja u uzorku koji se proučava, označen kao str. Pomoću posebne tabele utvrđujemo kojem nivou statističke značajnosti razlika odgovara data empirijska vrednost. U većini slučajeva, ista empirijska vrijednost kriterija može biti značajna ili beznačajna ovisno o broju zapažanja u uzorku koji se proučava ( n ) ili iz tzv broj stepena slobode , što je označeno kao v (g>) ili kako df (Ponekad d).

Znajući n ili broj stupnjeva slobode, pomoću posebnih tablica (glavne su date u Dodatku 5) možemo odrediti kritične vrijednosti kriterija i uporediti dobivenu empirijsku vrijednost s njima. Ovo se obično piše ovako: „kada n = 22 kritične vrijednosti kriterija su t St = 2,07" ili "at v (d) = 2 kritične vrijednosti Studentovog testa su = 4,30” itd.

Tipično, prednost se i dalje daje parametarskim kriterijumima i mi se pridržavamo ovog stava. Smatraju se pouzdanijima i mogu pružiti više informacija i dublju analizu. Što se tiče složenosti matematičkih proračuna, prilikom upotrebe kompjuterski programi ova teškoća nestaje (ali se neke druge pojavljuju, međutim, prilično premostive).

  • U ovom udžbeniku ne razmatramo detaljno problem statistike
  • hipoteze (null - R0 i alternativa - Hj) i donesene statističke odluke, budući da studenti psihologije to posebno proučavaju u disciplini „Matematičke metode u psihologiji“. Osim toga, treba napomenuti da prilikom izrade izvještaja o istraživanju (nastavni rad ili teza, publikacije) statističke hipoteze i statistička rješenja, po pravilu, nisu date. Obično, kada se opisuju rezultati, oni ukazuju na kriterijum, daju potrebnu deskriptivnu statistiku (srednje vrednosti, sigma, koeficijenti korelacije, itd.), empirijske vrednosti kriterijuma, stepene slobode i obavezno p-nivo značajnosti. Zatim se formuliše smisleni zaključak u vezi sa hipotezom koja se testira, ukazujući (obično u obliku nejednakosti) na postignuti ili nepostignut nivo značajnosti.

Prije prikupljanja i proučavanja podataka, eksperimentalni psiholozi obično odlučuju kako će se podaci statistički analizirati. Često istraživač postavlja nivo značajnosti, definisan kao statistička vrijednost, viši od ( ili niže) koji sadrži vrijednosti koje nam omogućavaju da uzmemo u obzir uticaj faktora koji nisu slučajni. Istraživači obično predstavljaju ovaj nivo u obliku vjerovatnog izraza.

U mnogim psihološkim eksperimentima to se može izraziti kao " nivo 0,05" ili " nivo 0.01" To znači da će se slučajni rezultati javljati samo sa učestalošću 0.05 (1 od puta) ili 0,01 (1 od 100 puta). Rezultati statističke analize podataka koji zadovoljavaju unaprijed utvrđeni kriterij ( bilo 0,05, 0,01 ili čak 0,001), se u nastavku nazivaju statistički značajnim.

Treba napomenuti da rezultat možda nije statistički značajan, ali je ipak zanimljiv. Često, posebno u preliminarnim studijama ili eksperimentima koji uključuju mali broj ispitanika ili sa ograničenim brojem posmatranja, rezultati možda neće dostići nivo statističke značajnosti, ali sugerišu da u daljim studijama, uz precizniju kontrolu i sa većim brojem zapažanja, oni će postati pouzdaniji. Istovremeno, eksperimentator mora biti veoma oprezan u svojoj želji da namjerno promijeni eksperimentalne uslove kako bi postigao željeni rezultat po svaku cenu.

U drugom primjeru plana 2x2 Ji koristili su dvije vrste predmeta i dvije vrste zadataka za proučavanje utjecaja stručnog znanja na pamćenje informacija.

U svojoj radnoj sobi Ji učio pamćenje brojeva i šahovskih figura ( varijabla A) djeca u stolicama RECARO Young Sport i odrasli ( varijabla B), odnosno prema planu 2x2. Djeca su imala 10 godina i bila su dobra u šahu, dok su odrasli bili novi u igri. U prvom zadatku, morali ste zapamtiti lokaciju figura na ploči, kao što bi to moglo biti tijekom normalne igre, i vratiti je nakon što su figure uklonjene. Drugi dio ovog zadatka zahtijevao je pamćenje standardne serije brojeva, kao što se obično radi prilikom određivanja IQ-a.

Ispostavilo se da specijalizirana znanja, poput znanja igranja šaha, olakšavaju pamćenje informacija relevantnih za ovu oblast, ali nemaju mnogo utjecaja na pamćenje brojeva. Odrasli koji nisu previše iskusni u mudrosti najstarija igra, pamte manje cifara, ali su uspješniji u pamćenju brojeva.

U tekstu izvještaja Ji daje statistička analiza, što matematički potvrđuje prikazane rezultate.

Dizajn 2x2 je najjednostavniji od svih faktorskih dizajna. Povećanje broja faktora ili nivoa individualni faktori značajno komplikuje ove planove.

Statistička pouzdanost je od suštinskog značaja u praksi proračuna FCC-a. Ranije je napomenuto da iz istog stanovništva može se odabrati više uzoraka:

Ako su pravilno odabrani, onda se njihovi prosječni pokazatelji i indikatori opšte populacije neznatno razlikuju jedni od drugih po veličini greške reprezentativnosti, uzimajući u obzir prihvaćenu pouzdanost;

Ako su odabrani iz različitih populacija, razlika između njih se pokazuje značajnom. Statistika se svodi na poređenje uzoraka;

Ako se razlikuju neznatno, neprincipijelno, neznatno, odnosno pripadaju istoj opštoj populaciji, razlika između njih se naziva statistički nepouzdanom.

Statistički pouzdano Razlika uzorka je uzorak koji se značajno i fundamentalno razlikuje, odnosno pripada različitim općim populacijama.

U FCC-u, procjena statističke značajnosti razlika u uzorcima znači rješavanje skupa praktični problemi. Na primjer, uvođenje novih nastavnih metoda, programa, sklopova vježbi, testova, kontrolnih vježbi povezano je sa njihovim eksperimentalnim testiranjem, što bi trebalo da pokaže da se test grupa suštinski razlikuje od kontrolne grupe. Stoga, poseban statističke metode, nazvan kriterijum statističke značajnosti, koji omogućava otkrivanje prisutnosti ili odsustva statistički značajne razlike između uzoraka.

Svi kriterijumi su podeljeni u dve grupe: parametarski i neparametarski. Parametarski kriterijumi zahtevaju prisustvo normalnog zakona distribucije, tj. To znači obavezno određivanje glavnih indikatora normalnog zakona – aritmetičke sredine i standardne devijacije s. Parametarski kriterijumi su najtačniji i najtačniji. Neparametarski testovi su zasnovani na rangu (rednim) razlikama između elemenata uzorka.

Evo glavnih kriterijuma za statističku značajnost koji se koriste u FCC praksi: Studentov test i Fišerov test.

Studentov t test nazvan po engleskom naučniku K. Gossetu (Student - pseudonim), koji je otkrio ovu metodu. Studentov t test je parametarski i koristi se za poređenje apsolutni pokazatelji uzorci. Uzorci mogu varirati u veličini.

Studentov t test je ovako definisan.

1. Pronađite Studentov t test koristeći sljedeću formulu:


gdje su aritmetički prosjeci upoređenih uzoraka; t 1, t 2 - greške reprezentativnosti identifikovane na osnovu indikatora upoređenih uzoraka.

2. Praksa u FCC-u je pokazala da za sportski rad dovoljno je prihvatiti pouzdanost računa P = 0,95.

Za pouzdanost brojanja: P = 0,95 (a = 0,05), sa brojem stepeni slobode

k = n 1 + n 2 - 2 iz tabele u Dodatku 4 nalazimo vrijednost granične vrijednosti kriterija ( t gr).

3. Na osnovu svojstava zakona normalne distribucije, Studentov kriterijum poredi t i t gr.

Izvlačimo zaključke:

ako je t t gr, onda je razlika između upoređenih uzoraka statistički značajna;

ako je t t gr, onda je razlika statistički beznačajna.

Za istraživače u oblasti FCS, procena statističke značajnosti je prvi korak u rešavanju specifičnog problema: da li su uzorci koji se porede suštinski ili ne fundamentalno različiti jedan od drugog. Sljedeći korak je evaluacija ove razlike sa pedagoške tačke gledišta, koja je određena uslovima zadatka.

Razmotrimo primjenu Studentovog testa na konkretnom primjeru.

Primjer 2.14. Grupi od 18 ispitanika procijenjena je brzina otkucaja srca (bpm) prije x i i poslije y i zagrijavanje.

Procijenite efikasnost zagrijavanja na osnovu otkucaja srca. Početni podaci i proračuni prikazani su u tabeli. 2.30 i 2.31.

Tabela 2.30

Obrada indikatora otkucaja srca prije zagrijavanja


Greške za obje grupe su se poklopile, jer su uzorci jednaki (ista grupa se proučava kod različitim uslovima), a standardne devijacije su bile s x = s y = 3 otkucaja/min. Idemo dalje na definiranje Studentovog testa:

Postavili smo pouzdanost računa: P = 0,95.

Broj stepeni slobode k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Iz tabele u Dodatku 4 nalazimo t gr= 2,02.

Statistički zaključak. Kako je t = 11,62, a granica t gr = 2,02, onda je 11,62 > 2,02, tj. t > t gr, stoga je razlika između uzoraka statistički značajna.

Pedagoški zaključak. Utvrđeno je da je u pogledu broja otkucaja srca statistički značajna razlika između stanja grupe prije i poslije zagrijavanja, tj. značajno, fundamentalno. Dakle, na osnovu indikatora otkucaja srca, možemo zaključiti da je zagrijavanje efikasno.

Fisherov kriterijum je parametarski. Koristi se prilikom poređenja brzina disperzije uzoraka. To obično znači poređenje u smislu stabilnosti sportskih performansi ili stabilnosti funkcionalnih i tehničkih pokazatelja u praksi fizička kultura i sport. Uzorci mogu biti različitih veličina.

Fisherov kriterij definiran je sljedećim nizom.

1. Pronađite Fisherov kriterij F koristeći formulu


gdje su varijanse upoređenih uzoraka.

Uslovi Fisherovog kriterijuma to predviđaju u brojiocu formule F postoji velika disperzija, tj. broj F je uvijek veći od jedan.

Postavljamo pouzdanost brojanja: P = 0,95 - i određujemo broj stupnjeva slobode za oba uzorka: k 1 = n 1 - 1, k 2 = n 2 - 1.

Koristeći tabelu u Dodatku 4, nalazimo graničnu vrijednost kriterija F gr.

Poređenje F i F kriterija gr nam omogućava da formulišemo zaključke:

ako je F > F gr, onda je razlika između uzoraka statistički značajna;

ako je F< F гр, то различие между выборками статически недо­стоверно.

Navedimo konkretan primjer.

Primjer 2.15. Analizirajmo dvije grupe rukometaša: x i (n 1= 16 osoba) i y i (n 2 = 18 osoba). Ove grupe sportista su proučavane za vrijeme(a) uzleta pri ubacivanju lopte u gol.

Da li su indikatori odbijanja istog tipa?

Početni podaci i osnovni proračuni prikazani su u tabeli. 2.32 i 2.33.

Tabela 2.32

Obrada pokazatelja odbojnosti prve grupe rukometaša


Hajde da definišemo Fišerov kriterijum:





Prema podacima prikazanim u tabeli u Dodatku 6, nalazimo Fgr: Fgr = 2,4

Obratimo pažnju na činjenicu da su u tabeli u Dodatku 6 navedeni brojevi stepeni slobode i veće i manje disperzije pri približavanju veliki brojevi postaje grublji. Dakle, broj stupnjeva slobode veće disperzije slijedi ovim redom: 8, 9, 10, 11, 12, 14, 16, 20, 24 itd., a manjeg - 28, 29, 30, 40 , 50, itd. d.

To se objašnjava činjenicom da kako se veličina uzorka povećava, razlike u F-testu se smanjuju i moguće je koristiti tabelarne vrijednosti koje su bliske izvornim podacima. Dakle, u primjeru 2.15 =17 nedostaje i možemo uzeti njemu najbližu vrijednost k = 16, iz čega dobijamo Fgr = 2.4.

Statistički zaključak. Pošto je Fisherov test F= 2,5 > F= 2,4, uzorci se statistički razlikuju.

Pedagoški zaključak. Vrijednosti vremena (s) uzleta pri ubacivanju lopte u gol za rukometaše obje grupe značajno se razlikuju. Ove grupe treba smatrati različitim.

Dalja istraživanja bi trebala otkriti razlog za ovu razliku.

Primjer 2.20.(na statističku pouzdanost uzorka ). Da li su se kvalifikacije fudbalera poboljšale ako je vrijeme(a) od davanja znaka do udarca lopte na početku treninga bilo x i , a na kraju y i .

Početni podaci i osnovni proračuni dati su u tabeli. 2.40 i 2.41.

Tabela 2.40

Obrada indikatora vremena od davanja signala do udaranja lopte na početku treninga


Odredimo razliku između grupa indikatora koristeći Studentov kriterijum:

Uz pouzdanost P = 0,95 i stepene slobode k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, koristeći tabelu u Dodatku 4 nalazimo t gr= 2,02. Pošto je t = 8,3 > t gr= 2,02 - razlika je statistički značajna.

Odredimo razliku između grupa indikatora koristeći Fisherov kriterij:


Prema tabeli u Dodatku 2, sa pouzdanošću P = 0,95 i stepenom slobode k = 22-1 = 21, vrednost F gr = 21. Pošto je F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistički zaključak. Prema aritmetičkom prosjeku, razlika između grupa indikatora je statistički značajna. U smislu disperzije (disperzije), razlika između grupa indikatora je statistički nepouzdana.

Pedagoški zaključak. Kvalifikacije fudbalera su značajno poboljšane, ali treba obratiti pažnju na stabilnost njegovog svjedočenja.

Priprema za posao

Prije izvođenja ovog laboratorijskog rada iz discipline “Sportska metrologija” svi studenti u studijskoj grupi moraju formirati radne timove od po 3-4 studenta, da zajednički urade radni zadatak svih laboratorijskih radova.

U pripremi za rad pročitajte relevantne dijelove preporučene literature (vidi odjeljak 6 podataka metodološka uputstva) i bilješke s predavanja. Proučite dijelove 1 i 2 za ovaj laboratorijski rad, kao i radni zadatak za njega (odjeljak 4).

Pripremite obrazac za izvještaj na standardnim listovima papira za pisanje veličine A4 i u njega dodajte materijale potrebne za rad.

Izvještaj mora sadržavati :

Naslovna strana sa naznakom odsjeka (UC i TR), studijske grupe, prezimena, imena, patronimika studenta, broja i naziva laboratorijskog rada, datuma njegovog završetka, kao i prezimena, akademski stepen, akademsko zvanje i radno mjesto nastavnika koji prihvata posao;

Svrha rada;

Formule s numeričkim vrijednostima koje objašnjavaju srednje i konačni rezultati računarstvo;

Tablice izmjerenih i izračunatih vrijednosti;

Obavezno po zadatku grafički materijal;

Kratki zaključci na osnovu rezultata svake faze radnog zadatka i općenito na obavljenom poslu.

Svi grafikoni i tabele su pažljivo nacrtani pomoću alata za crtanje. Uslovna grafika i slovne oznake moraju biti u skladu sa GOST standardima. Dozvoljeno je sastavljanje izvještaja korištenjem računarske tehnologije.

Radni zadatak

Prije izvođenja svih mjerenja, svaki član tima mora proučiti pravila korištenja sportska igra Pikado date u Dodatku 7, koje su neophodne za provođenje sljedećih faza istraživanja.

I faza istraživanja“Proučavanje rezultata pogađanja mete sportske igre Pikado od strane svakog člana tima radi usklađenosti normalan zakon distribucije prema kriterijumu χ 2 Pearson and kriterijum tri sigma"

1. mjerite (testirajte) svoju (ličnu) brzinu i koordinaciju akcija, bacanjem pikado 30-40 puta u kružnu metu u sportskoj igri Pikado.

2. Rezultati mjerenja (testovi) x i(sa čašama) poređati u formu varijantne serije i unesite u tabelu 4.1 (kolone , uradite sve potrebne kalkulacije, popuniti potrebne tabele i doneti odgovarajuće zaključke o usklađenosti primljenog empirijska distribucija zakon normalne distribucije, po analogiji sa sličnim proračunima, tabelama i zaključcima iz primjera 2.12, datim u odjeljku 2 ovih smjernica na stranicama 7-10.

Tabela 4.1

Odgovaranje brzine i koordinacije akcija subjekata normalnom zakonu raspodjele

br. zaobljen
Ukupno

II – faza istraživanja

“Procjena prosječnih pokazatelja opšte populacije pogodaka na metu sportske igre Pikado svih studenata studijske grupe na osnovu rezultata mjerenja članova jedne ekipe”

Procijenite prosječne pokazatelje brzine i koordinacije djelovanja svih učenika u studijskoj grupi (prema spisku studijske grupe u razrednom časopisu) na osnovu rezultata gađanja mete pikado svih članova tima, dobijenih u prvoj fazi istraživanja ovog laboratorijskog rada.

1. Dokumentirati rezultate mjerenja brzine i koordinacije akcija kada bacate pikado na kružnu metu u sportskoj igri Pikado svih članova vašeg tima (2 - 4 osobe), koji predstavljaju uzorak rezultata mjerenja iz opšte populacije (rezultati mjerenja svih učenika u studijskoj grupi - npr. 15 osoba), upisujući ih u drugu i treću kolonu Tabela 4.2.

Tabela 4.2

Obrada indikatora brzine i koordinacije akcija

pripadnici brigade

br.
Ukupno

U tabeli 4.2 pod treba razumjeti , poklapao prosječan rezultat (vidi rezultate proračuna u tabeli 4.1) članovi vašeg tima ( , dobijene u prvoj fazi istraživanja. Treba napomenuti da, po pravilu, Tabela 4.2 sadrži izračunatu prosječnu vrijednost rezultata mjerenja koje je dobio jedan član tima u prvoj fazi istraživanja , budući da je vjerovatnoća da će se rezultati mjerenja različitih članova tima poklopiti vrlo mala. onda, po pravilu vrednosti u koloni Tabela 4.2 za svaki red - jednaka 1, A u redu „Ukupno " kolone " ", je napisano broj članova vašeg tima.

2. Izvršite sve potrebne proračune kako biste popunili tabelu 4.2, kao i druge proračune i zaključke slične proračunima i zaključcima primjera 2.13 datim u 2. dijelu ovog metodološki razvoj na stranicama 13-14. To treba imati na umu prilikom izračunavanja greške reprezentativnosti "m" potrebno je koristiti formulu 2.4 datu na strani 13 ove metodološke izrade, budući da je uzorak mali (n, a broj elemenata opšte populacije N je poznat, a jednak je broju studenata u studijskoj grupi, prema listi časopisa studijske grupe.

III – faza istraživanja

Procjena efikasnosti zagrijavanja prema indikatoru „Brzina i koordinacija radnji“ od strane svakog člana tima pomoću Studentovog t-testa

Za procjenu efikasnosti zagrijavanja za bacanje pikado u metu sportske igre "Pikado", koju je u prvoj fazi istraživanja ovog laboratorijskog rada izvršio svaki član tima prema indikatoru "Brzina i koordinacija akcija“, koristeći Studentov kriterijum – parametarski kriterijum za statističku pouzdanost empirijskog zakona raspodele prema normalnom zakonu raspodele.

… Ukupno

2. varijanse i RMS , rezultati mjerenja indikatora "Brzina i koordinacija akcija" na osnovu rezultata zagrijavanja, dato u tabeli 4.3, (vidi slične proračune date odmah iza tabele 2.30 primjera 2.14 na strani 16 ovog metodološkog razvoja).

3. Svaki član radnog tima izmjerite (testirajte) svoju (ličnu) brzinu i koordinaciju radnji nakon zagrijavanja,

… Ukupno

5. Izvršite prosječne proračune varijanse i RMS ,rezultati mjerenja indikatora "Brzina i koordinacija akcija" nakon zagrijavanja, dato u tabeli 4.4, zapišite ukupni rezultat mjerenja na osnovu rezultata zagrijavanja (vidi slične proračune date odmah iza tabele 2.31 primjera 2.14 na strani 17 ovog metodološkog razvoja).

6. Izvršite sve potrebne proračune i zaključke slične proračunima i zaključcima primjera 2.14 datim u 2. dijelu ovog metodološkog razvoja na stranicama 16-17. To treba imati na umu prilikom izračunavanja greške reprezentativnosti "m" potrebno je koristiti formulu 2.1 datu na strani 12 ove metodološke izrade, budući da je uzorak n, a broj elemenata u populaciji N ( je nepoznat.

IV – faza istraživanja

Procjena ujednačenosti (stabilnosti) indikatora „Brzina i koordinacija djelovanja“ dva člana tima po Fisherovom kriteriju

Procijenite ujednačenost (stabilnost) indikatora „Brzina i koordinacija djelovanja“ dva člana tima koristeći Fišerov kriterijum, na osnovu rezultata mjerenja dobijenih u trećoj fazi istraživanja u ovom laboratorijskom radu.

Da biste to uradili, potrebno je da uradite sledeće.

Koristeći podatke iz tabela 4.3 i 4.4, rezultati izračunavanja varijansi iz ovih tabela dobijeni u trećoj fazi istraživanja, kao i metodologija za izračunavanje i primenu Fišerovog kriterijuma za procenu uniformnosti (stabilnosti) sportskih pokazatelja, dati u primjer 2.15 na stranicama 18-19 ovog metodološkog razvoja, izvući odgovarajuće statističke i pedagoške zaključke.

V – faza istraživanja

Procjena grupa indikatora „Brzina i koordinacija djelovanja“ jednog člana tima prije i poslije zagrijavanja