Живот

Како конструирати интервал повјерења за удио становништва

Како конструирати интервал повјерења за удио становништва

Интервали поверења могу се користити за процену неколико параметара популације. Једна врста параметра која се може проценити употребом статистичке статистике је удео становништва. На пример, можда ћемо желети да знамо колики је проценат америчке популације која подржава одређени закон. За ову врсту питања морамо пронаћи интервал поуздања.

У овом чланку ћемо видети како да конструишемо интервал поверења за удео становништва, и испитаћемо неке теорије које стоје иза тога.

Општи оквир

Започињемо посматрањем велике слике пре него што нађемо у специфичностима. Тип интервала поверења који ћемо размотрити има следећи облик:

Процените +/- маргину грешке

То значи да морамо да одредимо два броја. Ове вредности су процена за жељени параметар, заједно са границом грешке.

Услови

Пре спровођења било ког статистичког теста или поступка, важно је да се уверите да су испуњени сви услови. За интервал поверења за удео становништва, морамо да се уверимо да следеће:

  • Имамо једноставан случајни узорак величине н од велике популације
  • Наши појединци су изабрани независно једни од других.
  • У нашем узорку има најмање 15 успеха и 15 неуспеха.

Ако последња ставка није задовољена, можда ће бити могуће мало подесити наш узорак и користити плус четири интервала поверења. У даљем тексту, претпоставит ћемо да су сви горе наведени услови испуњени.

Узорак и удио становништва

Почињемо са проценом удела у нашем становништву. Баш као што користимо узорак значи за процену просечне популације, тако користимо и узорак пропорције да проценимо удео становништва. Проценат становништва је непознат параметар. Узорак узорака је статистика. Ову статистику проналазимо бројењем броја успеха у нашем узорку, а затим дељењем са укупним бројем појединаца у узорку.

Проценат становништва означен је са п и само по себи објашњава. Забиљежавање пропорције узорка је мало више укључено. Означавамо узорак пропорције као п, а овај симбол читамо као „п-хат“ јер изгледа као слово п са шеширом на врху.

Ово постаје први део нашег интервала поверења. Процена п је п.

Узорковање дистрибуције узорака

Да бисмо одредили формулу грешке грешке, морамо размислити о дистрибуцији узорковања п дистрибутион. Мораћемо да знамо средњу вредност, стандардну девијацију и одређену дистрибуцију са којом радимо.

Дистрибуција узорковања п је биномна дистрибуција са вероватноћом успеха п и н суђења. Ова врста случајне променљиве има средњу вредност п и стандардна девијација (п(1 - п)/н)0.5. Постоје два проблема са тим.

Први проблем је што биномна дистрибуција може бити веома шкакљива за рад. Присуство фабрика може довести до врло великог броја. Овде нам услови помажу. Све док су наши услови испуњени, можемо проценити биномну дистрибуцију са стандардном нормалном дистрибуцијом.

Други проблем је што се стандардна девијација п употребе п у својој дефиницији. Непознати параметар популације процјењује се кориштењем истог параметра као граница погрешке. Ово кружно образложење је проблем који треба да се реши.

Излаз из ове загонетке је заменити стандардно одступање са његовом стандардном грешком. Стандардне грешке се заснивају на статистици, а не на параметрима. За процену стандардног одступања користи се стандардна грешка. Оно што ову стратегију чини корисном је то што више не требамо знати вриједност параметра п.

Формула

Да бисмо користили стандардну грешку, заменимо непознати параметар п са статистичким п. Резултат је следећа формула интервала поверења за удео становништва:

п +/- з * (п (1 - п) /н)0.5.

Овде је вредност з * одређује наш ниво поверења Ц.Тачно за стандардну нормалну дистрибуцију Ц процента стандардне нормалне расподјеле је између -з * и з *.Уобичајене вредности за з * укључују 1.645 за 90% поузданости и 1.96 за 95% поверења.

Пример

Погледајмо како ова метода делује на примеру. Претпоставимо да желимо с 95% поузданости знати постотак бирачког тијела у жупанији која се идентифицира као демократска. Проводимо једноставан случајни узорак од 100 људи у овој жупанији и откривамо да се њих 64 идентификује као демократа.

Видимо да су сви услови испуњени. Процена нашег удела становништва је 64/100 = 0,64. Ово је вредност пропорције узорка п и она је центар нашег интервала поверења.

Грешка се састоји од два дела. Прво је з*. Као што смо рекли, за 95% поузданост, вредност з* = 1.96.

Други део грешке дат је формулом (п (1 - п) /н)0.5. Поставили смо п = 0,64 и израчунали = стандардна грешка бити (0,64 (0,36) / 100)0.5 = 0.048.

Помножимо та два броја заједно и добијемо грешку од 0.09408. Крајњи резултат је:

0.64 +/- 0.09408,

или то можемо преписати као 54.592% до 73.408%. Стога смо 95% сигурни да је прави удио демократа у популацији негдје у границама ових постотака. То значи да ће дугорочно наша техника и формула обухватити пропорцију становништва од 95% времена.

Сродне идеје

Постоји низ идеја и тема који су повезани са овом врстом интервала поверења. На пример, могли бисмо да извршимо тест хипотезе који се односи на вредност удела становништва. Такође бисмо могли да упоредимо две пропорције из две различите популације.