Uzticības intervālu izmantošana secinājumu statistikā

Koledžas studenti kārto statistikas eksāmenu

PeopleImages / DigitalVision / Getty Images





Secinoša statistika savu nosaukumu ieguvis no tā, kas notiek šajā statistikas nozarē. Tā vietā, lai vienkārši aprakstītu datu kopu, secināmā statistika cenšas kaut ko secināt par populāciju, pamatojoties uz statistiskais paraugs . Viens konkrēts mērķis secinošajā statistikā ietver nezināmas populācijas vērtības noteikšanu parametrs . Vērtību diapazonu, ko izmantojam šī parametra novērtēšanai, sauc par ticamības intervālu.

Pārliecības intervāla forma

Uzticamības intervāls sastāv no divām daļām. Pirmā daļa ir populācijas parametra novērtējums. Mēs iegūstam šo aprēķinu, izmantojot a vienkāršs izlases paraugs . No šī parauga mēs aprēķinām statistiku, kas atbilst parametram, kuru vēlamies novērtēt. Piemēram, ja mūs interesētu visu ASV pirmās klases skolēnu vidējais augums, mēs izmantotu vienkāršu ASV pirmklasnieku izlases izlasi, izmērītu visus un pēc tam aprēķinātu mūsu izlases vidējo augumu.



Ticamības intervāla otrā daļa ir kļūdas robeža. Tas ir nepieciešams, jo mūsu novērtējums vien var atšķirties no populācijas parametra patiesās vērtības. Lai varētu izmantot citas parametra iespējamās vērtības, mums ir jāizveido skaitļu diapazons. Kļūdas robeža to dara, un katram ticamības intervālam ir šāda forma:

Aprēķins ± kļūdas robeža



Aprēķins atrodas intervāla centrā, un tad mēs no šī aprēķina atņemam un pievienojam kļūdas robežu, lai iegūtu parametra vērtību diapazonu.

Pārliecības līmenis

Katram ticamības intervālam ir piesaistīts uzticamības līmenis. Šī ir varbūtība vai procents, kas norāda, cik liela noteiktība mums būtu jāpiešķir mūsu ticamības intervālam. Ja visi pārējie situācijas aspekti ir identiski, jo augstāks ir ticamības līmenis, jo plašāks ir ticamības intervāls.

Šis pārliecības līmenis varradīt zināmu apjukumu. Tas nav paziņojums par izlases procedūru vai populāciju. Tā vietā tas norāda uz ticamības intervāla veidošanas procesa panākumiem. Piemēram, ticamības intervāli ar 80 procentu ticamību ilgtermiņā izlaidīs patieso populācijas parametru vienu no piecām reizēm.

Jebkuru skaitli no nulles līdz vienam teorētiski varētu izmantot ticamības līmenim. Praksē 90 procenti, 95 procenti un 99 procenti ir visi kopīgie ticamības līmeņi.



Kļūdas robeža

Uzticamības līmeņa kļūdas robežu nosaka daži faktori. Mēs to varam redzēt, pārbaudot kļūdas robežas formulu. Kļūdas robeža ir šāda:

Kļūdas robeža = (statistika ticamības līmenim) * (standarta novirze/kļūda)



Uzticamības līmeņa statistika ir atkarīga no tā, ko varbūtības sadalījums tiek izmantots un kādu ticamības līmeni esam izvēlējušies. Piemēram, ja C ir mūsu pārliecības līmenis, un mēs strādājam ar a normālais sadalījums , tad C ir laukums zem līknes starp - Ar *uz Ar *. Šis numurs Ar *ir skaitlis mūsu kļūdas robežas formulā.

Standarta novirze vai standarta kļūda

Otrs termins, kas nepieciešams mūsu kļūdas robežai, ir standarta novirze vai standarta kļūda. Šeit priekšroka tiek dota sadalījuma standarta novirzei, ar kuru mēs strādājam. Tomēr parasti populācijas parametri nav zināmi. Šis skaitlis parasti nav pieejams, praksē veidojot ticamības intervālus.



Lai novērstu šo nenoteiktību, zinot standarta novirzi, mēs izmantojam standarta kļūdu. Standarta kļūda, kas atbilst standarta novirzei, ir šīs standartnovirzes aplēse. Standarta kļūdu padara tik spēcīgu, ka tā tiek aprēķināta no vienkāršas izlases veida, ko izmanto mūsu aplēses aprēķināšanai. Papildu informācija nav nepieciešama, jo izlase veic visas aplēses mūsu vietā.

Dažādi uzticības intervāli

Pastāv dažādas situācijas, kurās ir nepieciešami ticamības intervāli. Šos ticamības intervālus izmanto, lai novērtētu vairākus dažādus parametrus. Lai gan šie aspekti ir atšķirīgi, visus šos ticamības intervālus vieno viens un tas pats kopējais formāts. Daži izplatīti ticamības intervāli ir tie, kas attiecas uz populācijas vidējo lielumu, populācijas dispersiju, populācijas proporciju, divu populācijas vidējo starpību un divu populācijas proporciju starpību.