Зошто се потребни пресметки на интервалот на доверба? Интервали на доверба и нивна примена

Тие нудат незаменливи и практични методи за различни статистички пресметки и анализи. Една таква карактеристика е интервалот на доверба, кој се користи за изразување на степенот на несигурност поврзан со студијата. Интервалите на доверба во Excel се проценка на настаните во комбинација со верификација на веројатностите. Тие го обезбедуваат веројатниот опсег на пропорцијата или средната вредност на примерокот од вистинската пропорција/средна вредност пронајдена во популацијата и се прикажани како: проценка +/- маргина на грешка.

Во секое истражување или студија, интервалите на доверливост се одличен начин да се разбере улогата на грешките при земање примероци во просечни проценти. За секое истражување, бидејќи истражувачите секогаш само гледаат пропорција од поголем број, постои несигурност во нивните проценки, што ќе воведе грешки при земање примероци.

Интервалот на доверба (CI) дава идеја за тоа колку вредноста може да флуктуира. Претставува опсег на вредности кои се подеднакво центрирани на познатата средина на примерокот. Колку е повисоко нивото на доверба (во проценти), колку е помал интервалот, толку попрецизни ќе бидат резултатите. Испитувањето на примероците со поголема варијабилност или поголемо стандардно отстапување генерира пошироки интервали на доверба во Excel.

Постои инверзна врска со квадратен корен помеѓу CI и големината на примерокот. Помалите големини генерираат пошироки CI, па за да се добијат попрецизни проценки или да се намали прагот на грешка за половина, големината на примерокот би требало да биде приближно четирикратно.

Изградба на население значи

За да изградите интервал на доверба за просечната популација, дадената веројатност и големината на примерокот, треба да ја користите функцијата CONFIDENCE во Excel, која ја користи нормалната дистрибуција за да ја пресмета вредноста на довербата. Да претпоставиме дека истражувачите по случаен избор избрале 100 луѓе, ја измериле нивната тежина и откриле дека просекот е 76 килограми. Ако сакате да го знаете просекот за луѓето во одреден град, малку е веројатно дека поголема група ќе има ист просек како примерок од само 100 луѓе.

Многу поверојатно е дека просечната вредност на примерокот од 76 кг може да биде приближно еднаква на (непознатата) средна популација и треба да се знае колку е точен проценетиот одговор. Оваа несигурност поврзана со проценување на интервали се нарекува ниво на доверба, обично 95%. Функцијата DOFIDENCE (алфа, сигма, n) ја враќа вредноста што се користи за конструирање на CI на средната вредност на популацијата. Се претпоставува дека податоците од примерокот ги следат стандардните нормални распределби со позната стандардна девијација сигма, а големината на примерокот е n. Пред да го пресметате интервалот на доверба во ексел за нивото од 95%, земете ја алфата како 1 - 0,95 = 0,05.

Функциски формати на ДОВЕРБА

Функцијата ДОВЕРБА или ДОВЕРБА се определува со границите на доверба - тоа се долните и горните граници на CI и се индикатори од 95%. На пример, во студија за претпочитање, беше откриено дека 70% од луѓето претпочитаат Borjomi во споредба со Pepsi со CI од 3% и ниво на доверба од 95%, тогаш има 95% шанси дека вистинската пропорција е помеѓу 67 и 73 %.

Функциите TRUST се појавуваат под различни синтакси во различни верзии на Excel. На пример, Excel 2010 има две функции: НОРМАТА НА ДОВЕРБА и ДОВЕРБА Т, кои помагаат да се пресмета ширината. НОРМАТА НА ДОВЕРБА DI се користи кога е познато стандардното отстапување на мерењето. Во спротивно се применува „CONFIDENCE.T“, оценката се базира на податоците од примерокот. Доверливите интервали во Excel до 2010 година ја имаа само функцијата „ДОВЕРБА“. Нејзините аргументи и резултати беа слични на оние на функцијата НОРМА НА ДОВЕРБА.

Првиот сè уште е достапен во подоцнежните верзии на Excel за да се обезбеди компатибилност. # NUM! Грешка - Се појавува ако алфата е помала или еднаква на 0, или поголема или еднаква на 0. Даденото стандардно отстапување е помало или еднакво на 0. Наведената големина на аргументот е помала од еден. #ЦЕНА! Грешка - Се појавува ако некој од доставените аргументи не е нумерички.

„ЌЕ ВЕРБА“. класифицирани според статистичките функции и ќе го пресметаат и враќаат CI за средната вредност. Интервалите на доверба во Excel може да бидат исклучително корисни за финансиска анализа. Како аналитичар, „Доверба“. помага во предвидувањето и прилагодувањата за широк опсег на цели преку оптимизирање на финансиското одлучување. Ова се прави со помош на графички приказ на податоци во збир на променливи.

Аналитичарите можат да донесат подобри одлуки врз основа на статистичките информации обезбедени од нормалната дистрибуција. На пример, тие можат да најдат врска помеѓу примениот приход и трошоците потрошени за луксузни стоки. За да се пресмета CI за просечната популација, вратената вредност на доверба мора да се додаде и одземе од просечната вредност на примерокот. На пример, за примерок значи x: Интервал на доверба = x ± ДОВЕРБА.

Пример за пресметување на интервал на доверба во ексел - да претпоставиме дека ни се дадени следниве податоци:

  1. Ниво на значајност: 0,05.
  2. Стандардна девијација на населението: 2.5.
  3. Големина на примерокот: 100.

Функцијата интервал на доверливост на Excel се користи за пресметување на CI од 0,05 (т.е., 95% ниво на доверба) за просечното време на примерок за проучување на времето на патување во канцеларија на 100 луѓе. Средната вредност на примерокот е 30 минути, а стандардната девијација е 2,5 минути. Интервалот на доверба е 30 ± 0,48999, што одговара на опсегот од 29,510009 и 30,48999 (минути).

Интервали и нормална дистрибуција

Најпознатата употреба на интервалот на доверба е да значи „маргина на грешка“. Анкетите имаат маргина на грешка од плус или минус 3%. DI се корисни во контексти кои ја надминуваат оваа едноставна ситуација. Тие можат да се користат со ненормални распределби кои се многу искривени. За да се пресмета прогнозата за интервал на доверба во Excel, потребни се следните градежни блокови:

  1. Средна вредност.
  2. Стандардна девијација на набљудувања.
  3. Број на анкети во примерокот.
  4. Нивото на доверба што треба да се примени на ДИ.

Пред да конструирате интервал на доверба во ексел, проучете го околу средната вредност на примерокот, започнете со одлучување колкав процент од другите средини на примерокот ќе бидат прифатени доколку се собрани и пресметани во овој интервал. Ако тоа е случај, тогаш 95% од можните примероци ќе бидат земени од CI со 1,96 стандардни отстапувања над и под примерокот.

Стандардна грешка на средната вредност

Маргината или неизвесноста не ја земаат предвид грешката при мерењето или пристрасноста во истражувањето, така што вистинската несигурност може да биде поголема од наведената. Пред да се пресмета интервал на доверба во Excel, пресметката мора да биде поддржана со добро собирање податоци, сигурни системи за мерење и задоволителен дизајн на истражување.

Интервалите на доверба за средната вредност може да се добијат на неколку начини: со користење на SigmaXL, описна статистика, хистограми, t-тест во 1 форма и интервали на доверба, еднонасочни ANOVA и Multi-Vari графици. За графички да се илустрира CI за средната вредност на задоволството, креирајте графикон со повеќе варијации (со 95% CI средни опции) користејќи податоци за Customer Data.xls. Точките одговараат на поединечни податоци. Маркерите ја означуваат максималната граница на доверба од 99%, а просечната граница на доверба од 95%.

Тестирањето на хипотезите сега ќе се користи за попрецизно просекување на резултатите на задоволството и одредување на исходите.

Интервалите на доверба се многу важни за разбирање на податоците и донесување одлуки за нив. За да го пресметате CI за дискретна пропорција, користете SigmaXL > Шаблони и калкулатори > Основни статистички обрасци > 1 интервал Пред да го пронајдете интервалот на доверливост во Excel, следете ги овие чекори:

  1. Отворете податоци за клиентот.xls.
  2. Притиснете го табот Лист 1 или F4 за да го активирате последниот работен лист. Кликнете SigmaXL > Статистички алатки > Описна статистика.
  3. Изберете го полето за избор „Користете ја целата табела со податоци“.
  4. Кликнете на „Следно“.
  5. Изберете Општо задоволство, кликнете Променливи на нумерички податоци (Y).
  6. Изберете „Тип на клиент“, кликнете на „Категорија на група“ (X1). Стандардното ниво на доверба е 95%.
  7. Кликнете на „OK“.

Имајте предвид дека интервалот на доверливост од 95% значи: во просек, вистинскиот параметар на популацијата (средна вредност, стандардна девијација или пропорција) ќе биде во интервалот 19 пати од 20. На корисникот ќе му биде претставен: 95% интервал на доверба за секој примерок . Средна вредност (95% CI). 95% интервал на доверба за стандардното отстапување (95% CI на Сигма - да не се меша со нивото на квалитет на процесот Сигма).

Статистика и нивоа на доверба

Интервалот на доверливост не е број во кој точно се наоѓа вистинската вредност на параметарот. Навистина, случајна променлива теоретски може да ги преземе сите можни вредности во рамките на законите на физиката. Интервалот на доверливост е во суштина регионот во кој вистинската (непозната) вредност на параметарот што се проучува во популацијата е најверојатно да биде вистинита со избраната веројатност. При неговото користење, интервалот се заснова на пресметка на прагот на доверба, грешка и безбедносен фактор.

Пред да се дефинира интервал на доверба во Excel, се одредуваат овие елементи, кои зависат од параметрите:

  1. Варијабилност на измерените карактеристики.
  2. Големина на примерокот: колку е поголема, толку е поголема точноста.
  3. Ниво на доверба - с.

Нивото на доверба претставува загарантирана сигурност. На пример, со ниво на доверба од 90%, тоа значи дека постои ризик од 10% да се биде погрешен. Генерално е добра практика да се избере ниво на доверба од 95%. Така, максималното ниво на доверба е поголемо колку е поголема големината на примерокот. Односот на маржата е индикатор кој произлегува директно од прагот на доверба. Табелата дава неколку примери за најчестите вредности.

Ниво на доверба с

Коефициент на маргина за n> 30

Кога е неопходно да се процени средната вредност на популацијата од нејзиниот примерок, се одредува интервал на доверба. Тоа зависи од големината на примерокот и законот на променливата. Формулата за пресметување на интервал на доверба во Excel е како што следува:

  1. Долна граница на интервалот = средна километража - коефициент на поле * стандардна грешка.
  2. Горна граница на опсег = Проценета средна вредност + коефициент на поле * Стандардна грешка.
  3. Вредноста на t ќе зависи од големината на примерокот: n > 30: нормалниот безбедносен фактор, наречен z. n<30: коэффициент запаса, называемый t для n-1.

Во оваа ситуација, соодветните единици се самите просечни вредности. Истражувачот ќе треба да го знае стандардното отстапување не од оригиналните и индивидуалните набљудувања, туку од средствата што се пресметуваат од нив. Ова отстапување има име - стандардна грешка на средната вредност.

Претставите на варијабилноста на податоците се користат во графиконите за да се покаже грешка или несигурност во мерењето. Тие даваат општа идеја за тоа колку е точно мерењето, или, обратно, колку е далеку од пријавената вистинска вредност и се претставени како ленти за грешки. Тие претставуваат едно стандардно отстапување на несигурноста, една стандардна грешка или одреден интервал на доверба (на пример, интервал од 95%). Овие количини не се исти, затоа избраната мерка мора да биде наведена во графиконот или во текстот.

Лентите за грешки може да се користат за споредување на две количини доколку се исполнети статистички значајни услови. Линиите за грешка укажуваат на прифатливоста на вклопувањето на функцијата, односно колку добро ги опишува податоците. Истражувачките трудови во експерименталните науки вклучуваат грешки во сите графикони, иако практиката донекаде варира и секој истражувач има свој стил на грешки.

Лентите за грешки може да се користат како директен интерфејс за манипулација за да се поттикнат веројатни алгоритми за приближно пресметување. Лентите за грешка може да се изразат како знак плус или минус (±). Плус е горната граница, а минус е долната граница на грешката.

За правилно одредување на CI, постојат онлајн калкулатори кои во голема мера ја поедноставуваат работата. Процесот на дефинирање започнува со избор на податоци. Тоа е основа на сите истражувања. Сигурното земање примероци ви помага да донесувате деловни одлуки со доверба. Првото прашање што треба да се реши е правилното дефинирање на целната група, тоа е од одлучувачко значење. Ако истражувачот спроведе анкета со луѓе надвор од оваа група, невозможно е успешно да ја заврши задачата. Следниот чекор е да одлучите колку луѓе треба да интервјуирате.

Експертите знаат дека мал, репрезентативен примерок ќе ги одразува мислењата и однесувањето на групата од која е извлечен. Колку е поголем примерокот, толку попрецизно ја претставува целната група. Сепак, стапката на подобрување на точноста се намалува како што се зголемува големината на примерокот. На пример, зголемувањето од 250 на 1000 ја удвојува точноста. Одлучете за големината на примерокот врз основа на фактори како што се достапното време, буџетот и степенот на потребната прецизност.

Постојат три фактори кои ја одредуваат големината на CI за ова ниво на доверба:

  • големина на примерокот;
  • процент на примерок;
  • големината на населението.

Ако 99% од учесниците во анкетата кажале „Да“, а 1% „Не“, шансата за грешка е мала, без оглед на големината на примерокот. Меѓутоа, ако процентите се 51% и 49%, шансата за грешка е многу поголема. Полесно е да се биде сигурен во екстремните одговори отколку во просечните. При одредување на големината на примерокот потребна за дадено ниво на прецизност, треба да се користи процентот во најлош случај (50%).

Подолу е онлајн формулата за калкулатор за големина на примерок за пресметување на интервалот на доверба во Excel.

Пресметките на интервалот на доверба претпоставуваат дека постои вистински случаен примерок од релевантната популација. Освен ако истражувањето не е случајно, не може да се потпираат на интервали. Неслучајните примероци обично произлегуваат од недостатоци во постапката.

Креирање на линиски графикони

Креирањето на заплет на интервал на доверба во Excel е релативно едноставно. Прво, креирајте сопствена линиска табела. Потоа, со избраниот ред, изберете Алатки за графикони > Распоред > Панел за грешки > Напредни опции на панелот. Од скокачкото мени што се појавува, можете или да изберете позитивни или негативни ленти за грешки, или и двете. Можете да изберете стил и да ја изберете количината што сакате да ја прикажете. Ова може да биде фиксна вредност, процент, стандардно отстапување или прилагоден опсег.

Ако податоците имаат стандардно стандардно отстапување за секоја точка, изберете приспособена и кликнете на копчето Дефинирај вредност. Потоа се појавува друго скокачко мени и можете да изберете опсег на ќелии и за позитивни и за негативни панели.

  1. Подгответе податоци. Прво, покрај средствата, ќе треба да го пресметате стандардното отстапување (или грешка).
  2. Потоа во редот 4 треба да ја пресметате горната граница на групата, односно за Б4 пресметката ќе биде: =B2+B3 Во линијата 5 треба да ја пресметате долната граница на опсегот, т.е. за Б5 пресметката ќе биде : =B2-B4
  3. Направете графикон. Изберете ги редовите 1, 2, 4 и 5 од табелата, а потоа кликнете Вметни > График > Линиски графикон. Excel ќе создаде линиска табела.
  4. Отстранете ги линиите на легендата и мрежата.
  5. Потоа кликнете со десното копче на групата од горниот опсег и изберете Промени го типот на графиконот.
  6. Опсезите на доверба форматирајте. За да ја завршите табелата, едноставно форматирајте ја горната серија со светло сино полнење (за да одговара на сината линија) и долната серија со бело полнење.

Лесно е да се видат маргините на грешка во оваа табела, но ако има многу податоци, ќе изгледа пренатрупано. На прв поглед, границата на доверливост е многу поочигледна со оглед на просечната вредност на примерокот, и ќе станува сè построга како што се зголемува бројот на примероци

Еден од методите за решавање на статистички проблеми е пресметување на интервалот на доверба. Се користи како претпочитана алтернатива за точна проценка кога големината на примерокот е мала. Треба да се напомене дека самиот процес на пресметување на интервалот на доверба е доста сложен. Но, програмските алатки на Excel ви дозволуваат малку да го поедноставите. Ајде да дознаеме како тоа се прави во пракса.

Овој метод се користи за интервална проценка на различни статистички големини. Главната задача на оваа пресметка е да се ослободи од несигурноста на проценката на поени.

Во Excel, постојат две главни опции за извршување на пресметки користејќи овој метод: кога варијансата е позната и кога е непозната. Во првиот случај, функцијата се користи за пресметки ДОВЕРБА.НОРМА, а во втората - ДОВЕРНИК.УЧЕНИК.

Метод 1: Функција НОРМА НА ДОВЕРБА

Оператор ДОВЕРБА.НОРМА, која припаѓа на статистичката група на функции, првпат се појави во Excel 2010. Претходните верзии на оваа програма користат нејзин аналог ДОВЕРБА. Целта на овој оператор е да пресмета нормално распределен интервал на доверба за средната вредност на населението.

Неговата синтакса е како што следува:

DOFIDENCE.NORM(алфа;стандардна_исклучена;големина)

„Алфа“— аргумент кој го означува нивото на значајност што се користи за пресметување на нивото на доверба. Нивото на доверба е еднакво на следниот израз:

(1-„Алфа“)*100

"Стандардна девијација"- Ова е аргумент, чија суштина е јасна од името. Ова е стандардното отстапување на предложениот примерок.

"Големина"— аргумент кој ја дефинира големината на примерокот.

Сите аргументи на овој оператор се потребни.

Функција ДОВЕРБАги има токму истите аргументи и можности како и претходниот. Неговата синтакса е:

TRUST (алфа, стандардно_исклучено, големина)

Како што можете да видите, разликите се само во името на операторот. Од причини за компатибилност, оваа функција е оставена во Excel 2010 и поновите верзии во посебна категорија "Компатибилност". Во верзиите на Excel 2007 и порано, тој е присутен во главната група на статистички оператори.

Ограничувањето на интервалот на доверба се одредува со помош на следнава формула:

X+(-) НОРМА НА ДОВЕРБА

Каде Xе просечната вредност на примерокот, која се наоѓа во средината на избраниот опсег.

Сега да погледнеме како да пресметаме интервал на доверба конкретен пример. Беа направени 12 тестови, што резултираше со различни резултати пријавени во табелата. Ова е нашата севкупност. Стандардното отстапување е 8. Треба да го пресметаме интервалот на доверба на ниво на доверба од 97%.

  1. Изберете ја ќелијата каде што ќе се прикаже резултатот од обработката на податоците. Кликнете на копчето „Вметни функција“.
  2. Се појавува Волшебник за функции. Одете во категоријата „статистички“и означете го името „TRUST.NORM“. После тоа, кликнете на копчето "ДОБРО".
  3. Се отвора прозорецот со аргументи. Нејзините полиња природно одговараат на имињата на аргументите.
    Поставете го курсорот во првото поле - „Алфа“. Тука треба да го посочиме нивото на значајност. Како што се сеќаваме, нашето ниво на доверба е 97%. Во исто време, рековме дека се пресметува на овој начин:

    (1-ниво на доверба)/100

    Тоа е, заменувајќи ја вредноста, добиваме:

    Со едноставни пресметки дознаваме дека аргументот „Алфа“еднакви 0,03 . Внесете ја оваа вредност во полето.

    Како што е познато, по услов стандардното отстапување е еднакво на 8 . Затоа, на терен "Стандардна девијација"само запишете го овој број.

    На терен "Големина"треба да го внесете бројот на извршени тест елементи. Како што се сеќаваме, нивните 12 . Но, за да ја автоматизираме формулата и да не ја уредуваме секогаш кога спроведуваме нов тест, ајде да ја поставиме оваа вредност не со обичен број, туку со помош на операторот ПРОВЕРЕТЕ. Значи, да го ставиме курсорот во полето "Големина", а потоа кликнете на триаголникот, кој се наоѓа лево од лентата со формула.

    Се појавува список на неодамна користени функции. Доколку операторот ПРОВЕРЕТЕе користен од вас неодамна, треба да биде на оваа листа. Во овој случај, само треба да кликнете на неговото име. Во спротивно, ако не го најдете, тогаш одете на поентата „Други функции...“.

  4. Се појавува веќе позната Волшебник за функции. Ајде повторно да се вратиме во групата „статистички“. Таму го истакнуваме името „ПРОВЕРЕТЕ“. Кликнете на копчето "ДОБРО".
  5. Се појавува прозорецот со аргументи за горната изјава. Оваа функција е дизајнирана да го пресмета бројот на ќелии во одреден опсег што содржат нумерички вредности. Неговата синтакса е како што следува:

    COUNT (вредност 1, вредност 2,…)

    Аргументирана група „Вредности“е упатување на опсегот во кој сакате да го пресметате бројот на ќелии исполнети со нумерички податоци. Може да има до 255 такви аргументи вкупно, но во нашиот случај ни треба само еден.

    Поставете го курсорот во полето „Вредност 1“и, држејќи го левото копче на глувчето, на листот изберете го опсегот што ја содржи нашата колекција. Потоа неговата адреса ќе биде прикажана во полето. Кликнете на копчето "ДОБРО".

  6. По ова, апликацијата ќе ја изврши пресметката и ќе го прикаже резултатот во ќелијата каде што се наоѓа. Во нашиот конкретен случај, формулата изгледаше вака:

    НОРМА НА ДОВЕРБА (0,03,8, COUNT(B2:B13))

    Севкупниот резултат од пресметките беше 5,011609 .

  7. Но, тоа не е се. Како што се сеќаваме, границата на интервалот на доверба се пресметува со собирање и одземање на пресметковниот резултат од средната вредност на примерокот ДОВЕРБА.НОРМА. На овој начин се пресметуваат соодветно десната и левата граница на интервалот на доверба. Самото средство за примерок може да се пресмета со помош на операторот ПРОСЕК.

    Овој оператор е дизајниран да ја пресмета аритметичката средина на избраниот опсег на броеви. Ја има следната прилично едноставна синтакса:

    ПРОСЕК (број 1, број 2,…)

    Аргумент "Број"може да биде или една нумеричка вредност или референца за ќелии или дури цели опсези што ги содржат.

    Значи, изберете ја ќелијата во која ќе се прикаже пресметката на просечната вредност и кликнете на копчето „Вметни функција“.

  8. Се отвора Волшебник за функции. Да се ​​вратиме во категоријата „статистички“и изберете име од списокот „ПРОСЕК“. Како и секогаш, кликнете на копчето "ДОБРО".
  9. Се отвора прозорецот со аргументи. Поставете го курсорот во полето "Број 1"и држејќи го левото копче на глувчето, изберете го целиот опсег на вредности. Откако ќе се прикажат координатите во полето, кликнете на копчето "ДОБРО".
  10. После тоа ПРОСЕКго прикажува резултатот од пресметката во елемент на лист.
  11. Ја пресметуваме вистинската граница на интервалот на доверба. За да го направите ова, изберете посебна ќелија и ставете го знакот «=» и ја собираме содржината на елементите на листот во кои се наоѓаат резултатите од пресметките на функциите ПРОСЕКИ ДОВЕРБА.НОРМА. За да ја извршите пресметката, притиснете го копчето Внесете. Во нашиот случај, ја добивме следнава формула:

    Резултат од пресметката: 6,953276

  12. На ист начин ја пресметуваме левата граница на интервалот на доверба, само овој пат од резултатот од пресметката ПРОСЕКодземете го резултатот од пресметката на операторот ДОВЕРБА.НОРМА. Резултирачката формула за нашиот пример е од следниов тип:

    Резултат од пресметката: -3,06994

  13. Се обидовме детално да ги опишеме сите чекори за пресметување на интервалот на доверба, па затоа детално ја опишавме секоја формула. Но, можете да ги комбинирате сите дејства во една формула. Пресметката на десната граница на интервалот на доверба може да се запише на следниов начин:

    ПРОСЕК(B2:B13)+ДОВЕРБА.НОРМА(0.03,8, COUNT(B2:B13))

  14. Слична пресметка за левата граница би изгледала вака:

    ПРОСЕК(B2:B13)-ДОВЕРБА.НОРМА(0.03,8, COUNT(B2:B13))

Метод 2: Функција ТРУСТ.УЧЕНИК

Покрај тоа, Excel има уште една функција која е поврзана со пресметување на интервалот на доверба - ДОВЕРНИК.УЧЕНИК. Се појави само во Excel 2010. Овој оператор го пресметува интервалот на доверливост на населението користејќи ја распределбата Студент. Многу е погодно да се користи кога варијансата и, соодветно, стандардното отстапување се непознати. Синтаксата на операторот е:

ДОВЕРБА.УЧЕНИК (алфа, стандардно_исклучено, големина)

Како што можете да видите, имињата на операторите останаа непроменети во овој случај.

Ајде да видиме како да ги пресметаме границите на интервалот на доверба со непознато стандардно отстапување користејќи го примерот на истата популација што ја разгледавме во претходниот метод. Да го земеме нивото на доверба како минатиот пат на 97%.

  1. Изберете ја ќелијата во која ќе се изврши пресметката. Кликнете на копчето „Вметни функција“.
  2. Во отворените Волшебник за функцииоди во категорија „статистички“. Изберете име „ДОВЕРБЕН СТУДЕНТ“. Кликнете на копчето "ДОБРО".
  3. Се отвора прозорецот со аргументи за наведениот оператор.

    На терен „Алфа“, со оглед на тоа што нивото на доверба е 97%, го запишуваме бројот 0,03 . По втор пат нема да се задржиме на принципите на пресметување на овој параметар.

    По ова, поставете го курсорот во полето "Стандардна девијација". Овој пат овој индикатор ни е непознат и треба да се пресмета. Ова е направено со помош на специјална функција - STDEV.V. За да го отворите прозорецот на овој оператор, кликнете на триаголникот лево од лентата со формули. Ако не го најдеме саканото име во списокот што се отвора, тогаш одете до ставката „Други функции...“.

  4. Започнува Волшебник за функции. Преместување во категорија „статистички“и означете го името во него „STDEV.B“. Потоа кликнете на копчето "ДОБРО".
  5. Се отвора прозорецот со аргументи. Задача на операторот STDEV.Vе да се одреди стандардната девијација на примерокот. Неговата синтакса изгледа вака:

    СТАНДАРДНА ДЕВИИЈАЦИЈА.Б (број 1; број 2;…)

    Не е тешко да се погоди дека аргументот "Број"е адресата на елементот за избор. Ако изборот е поставен во една низа, тогаш можете да користите само еден аргумент за да обезбедите врска до овој опсег.

    Поставете го курсорот во полето "Број 1"и, како и секогаш, држејќи го левото копче на глувчето, изберете ја колекцијата. Откако координатите се на терен, не брзајте да го притиснете копчето "ДОБРО", бидејќи резултатот ќе биде неточен. Прво треба да се вратиме во прозорецот за аргументи на операторот ДОВЕРНИК.УЧЕНИКза да се додаде конечниот аргумент. За да го направите ова, кликнете на соодветното име во лентата со формули.

  6. Повторно се отвора прозорецот со аргументи за веќе познатата функција. Поставете го курсорот во полето "Големина". Повторно, кликнете на триаголникот со кој веќе сме запознаени за да отидете до изборот на оператори. Како што разбирате, ни треба име „ПРОВЕРЕТЕ“. Бидејќи ја користевме оваа функција во пресметките во претходниот метод, таа е присутна во оваа листа, па само кликнете на неа. Ако не го најдете, тогаш следете го алгоритмот опишан во првиот метод.
  7. Еднаш во прозорецот со аргументи ПРОВЕРЕТЕ, поставете го курсорот во полето "Број 1"и со притиснато копче на глувчето, изберете ја колекцијата. Потоа кликнете на копчето "ДОБРО".
  8. По ова, програмата врши пресметка и ја прикажува вредноста на интервалот на доверба.
  9. За да ги одредиме границите, повторно ќе треба да ја пресметаме просечната вредност на примерокот. Но, со оглед на тоа што пресметковниот алгоритам со помош на формулата ПРОСЕКисто како и во претходниот метод, па дури и резултатот не е променет, ние нема да се задржиме на ова во детали по втор пат.
  10. Собирање на резултатите од пресметката ПРОСЕКИ ДОВЕРНИК.УЧЕНИК, ја добиваме вистинската граница на интервалот на доверба.
  11. Одземање од пресметковните резултати на операторот ПРОСЕКрезултат од пресметката ДОВЕРНИК.УЧЕНИК, ја имаме левата граница на интервалот на доверба.
  12. Ако пресметката е напишана во една формула, тогаш пресметката на десната граница во нашиот случај ќе изгледа вака:

    ПРОСЕК(B2:B13)+ДОВЕРБА.СТУДЕНТ(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

  13. Соодветно на тоа, формулата за пресметување на левата граница ќе изгледа вака:

    ПРОСЕК(B2:B13)-ДОВЕРБА.СТУДЕНТ(0.03,STDEV.B(B2:B13),COUNT(B2:B13))

Како што можете да видите, алатките на Excel го олеснуваат пресметувањето на интервалот на доверба и неговите граници. За овие цели се користат посебни оператори за примероци чија варијанса е позната и непозната.

Ајде да конструираме интервал на доверба во MS EXCEL за да ја процениме средната вредност на распределбата во случај на позната вредност на дисперзија.

Се разбира изборот ниво на довербацелосно зависи од проблемот што се решава. Така, степенот на доверба на патникот во воздух во доверливоста на авионот несомнено треба да биде повисок од степенот на доверба на купувачот во доверливоста на електричната сијалица.

Формулација на проблемот

Да претпоставиме дека од популацијаоткако е земен примерголемина n. Се претпоставува дека Стандардна девијацијаоваа дистрибуција е позната. Потребно е врз основа на ова примероциоцени го непознатото дистрибутивна средина(μ, ) и конструирај го соодветниот двострано интервал на доверба.

Точка проценка

Како што е познато од статистика(да го означиме X просечно) е непристрасна проценка на средната вредностова популацијаи има распределба N(μ;σ 2 /n).

Забелешка: Што да направите ако треба да изградите интервал на довербаво случај на распределба која не е нормално?Во овој случај, доаѓа на помош, во која се наведува дека со доволно голема големина примероци n од дистрибуција не битие нормално, дистрибуција на примероци на статистика X просечноќе приближнокореспондира нормална дистрибуцијасо параметри N(μ;σ 2 /n).

Значи, точка проценка просек дистрибутивни вредностиимаме - ова примерок значи, т.е. X просечно. Сега да почнеме интервал на доверба.

Конструирање интервал на доверба

Обично, знаејќи ја дистрибуцијата и нејзините параметри, можеме да ја пресметаме веројатноста случајната променлива да земе вредност од интервалот што го одредуваме. Сега да го направиме спротивното: најдете го интервалот во кој случајната променлива ќе падне со дадена веројатност. На пример, од својствата нормална дистрибуцијапознато е дека со веројатност од 95%, распределена е случајна променлива нормален закон, ќе падне во опсег од приближно +/- 2 од средна вредност(види статија за). Овој интервал ќе ни послужи како прототип интервал на доверба.

Сега да видиме дали ја знаеме дистрибуцијата , да се пресмета овој интервал? За да одговориме на прашањето, мора да ја наведеме формата на дистрибуцијата и нејзините параметри.

Ја знаеме формата на дистрибуција - ова е нормална дистрибуција(се сеќавам дека ние зборуваме заО дистрибуција на примероци статистика X просечно).

Параметарот μ ни е непознат (само треба да се процени со користење интервал на доверба), но имаме проценка за тоа X просечно,пресметано врз основа на примероци,кои можат да се користат.

Втор параметар - стандардна девијација на средната вредност на примерокот ќе го сметаме за познато, тоа е еднакво на σ/√n.

Бидејќи не знаеме μ, тогаш ќе го изградиме интервалот +/- 2 стандардни отстапувањане од средна вредност, и од неговата позната проценка X просечно. Оние. при пресметување интервал на довербатоа НЕМА да го претпоставуваме X просечноспаѓа во опсегот +/- 2 стандардни отстапувањаод μ со веројатност од 95%, и ќе претпоставиме дека интервалот е +/- 2 стандардни отстапувањаод X просечносо 95% веројатност ќе покрие μ – просек од општата популација,од кој се зема пример. Овие две тврдења се еквивалентни, но втората изјава ни овозможува да конструираме интервал на доверба.

Дополнително, да го разјасниме интервалот: случајна променлива дистрибуирана нормален закон, со 95% веројатност спаѓа во интервалот +/- 1,960 стандардни отстапувања,не +/- 2 стандардни отстапувања. Ова може да се пресмета со помош на формулата =NORM.ST.REV((1+0,95)/2), цм. пример интервал на лист со датотека.

Сега можеме да формулираме веројатност што ќе ни послужи да го формираме интервал на доверба:
„Веројатноста дека популација значилоциран од примерок просекво рок од 1.960" стандардни отстапувања на средната вредност на примерокот", еднакво на 95%“.

Вредноста на веројатноста спомената во изјавата има посебно име , кој е поврзан сониво на значајност α (алфа) со едноставен израз ниво на доверба =1 . Во нашиот случај ниво на значајност α =1-0,95=0,05 .

Сега, врз основа на оваа веројатност, пишуваме израз за пресметување интервал на доверба:

каде Z α/2 стандарден нормална дистрибуција(оваа вредност на случајната променлива z, Што П(z>=Z α/2 )=α/2).

Забелешка: Горна α/2-квантилаја дефинира ширината интервал на довербаВ стандардни отстапувања примерок значи. Горна α/2-квантила стандарден нормална дистрибуцијасекогаш поголем од 0, што е многу погодно.

Во нашиот случај, со α=0,05, горна α/2-квантила изнесува 1.960. За други нивоа на значајност α (10%; 1%) горна α/2-квантила Z α/2 може да се пресмета со помош на формулата =NORM.ST.REV(1-α/2) или, доколку е познато ниво на доверба, =NORM.ST.OBR((1+ ниво на доверба)/2).

Обично кога се гради интервали на доверба за проценка на средната вредносткористете само горен α/2-квантили не користете пониски α/2-квантил. Ова е можно затоа што стандарден нормална дистрибуцијасиметрично околу оската x ( неговата густина на дистрибуцијасиметрично за просек, т.е. 0). Затоа, нема потреба да се пресметува пониска α/2-квантила(тоа едноставно се нарекува α /2-квантила), бидејќи тоа е еднакво горен α/2-квантилсо знак минус.

Да потсетиме дека, и покрај обликот на распределбата на вредноста x, соодветната случајна променлива X просечнодистрибуирани приближно Добро N(μ; σ 2 /n) (види статија за). Затоа, генерално, горенаведениот израз за интервал на довербае само приближна. Ако вредноста x се дистрибуира над нормален закон N(μ;σ 2 /n), потоа изразот за интервал на довербае точен.

Пресметка на интервал на доверба во MS EXCEL

Ајде да го решиме проблемот.
Времето на одговор на електронската компонента на влезниот сигнал е важна карактеристика на уредот. Инженерот сака да изгради интервал на доверба за просечното време на одговор на ниво на доверба од 95%. Од претходното искуство, инженерот знае дека стандардното отстапување на времето на одговор е 8 ms. Познато е дека за да се оцени времето на одговор, инженерот направил 25 мерења, просечната вредност била 78 ms.

Решение: Инженерот сака да го знае времето на одговор на електронскиот уред, но разбира дека времето на одговор не е фиксна вредност, туку случајна променлива која има своја дистрибуција. Значи, најдоброто на што може да се надева е да ги одреди параметрите и обликот на оваа дистрибуција.

За жал, од проблематичните услови не ја знаеме формата на распределбата на времето на одговор (не мора да биде нормално). , оваа дистрибуција е исто така непозната. Само тој е познат Стандардна девијацијаσ=8. Затоа, додека не можеме да ги пресметаме веројатностите и да конструираме интервал на доверба.

Сепак, и покрај тоа што не ја знаеме распределбата време посебен одговор, знаеме дека според CPT, дистрибуција на примероци просечно време на одговоре приближно нормално(ќе претпоставиме дека условите CPTсе спроведуваат, бидејќи големина примероцидоста голем (n=25)) .

Згора на тоа, просековаа распределба е еднаква на средна вредностдистрибуција на еден одговор, т.е. μ. А Стандардна девијацијана оваа распределба (σ/√n) може да се пресмета со формулата =8/ROOT(25) .

Познато е и дека инженерот примил точка проценкапараметар μ еднаков на 78 ms (X средна). Затоа, сега можеме да пресметаме веројатности, бидејќи ја знаеме формата на дистрибуција ( нормално) и неговите параметри (X avg и σ/√n).

Инженерот сака да знае очекуваната вредностμ распределби на времето на одговор. Како што е наведено погоре, ова μ е еднакво на математичко очекување на распределбата на примерокот на просечното време на одговор. Доколку користиме нормална дистрибуција N(X avg; σ/√n), тогаш саканиот μ ќе биде во опсегот +/-2*σ/√n со веројатност од приближно 95%.

Ниво на значајностеднакво на 1-0,95=0,05.

Конечно, да ја најдеме левата и десната граница интервал на доверба.
Лева граница: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Десна граница: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Лева граница: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Десна граница: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Одговори: интервал на довербана 95% ниво на доверба и σ=8msecеднакви 78+/-3,136 ms.

ВО пример датотека на листот Сигмапознат, создаде образец за пресметка и конструкција двострано интервал на довербаза произволни примероцисо дадени σ и ниво на значење.

Функција DOFIDENCE.NORM().

Доколку вредностите примероцисе во опсегот Б20: Б79 , А ниво на значајностеднакво на 0,05; потоа формулата MS EXCEL:
=ПРОСЕК(B20:B79)-ДОВЕРБА.НОРМА(0.05;σ; COUNT(B20:B79))
ќе ја врати левата граница интервал на доверба.

Истата граница може да се пресмета со формулата:
=ПРОСЕК(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Забелешка: Функцијата CONFIDENCE.NORM() се појави во MS EXCEL 2010. Во претходните верзии на MS EXCEL, се користеше функцијата TRUST().

интервали на доверба ( Англиски Интервали на доверба) еден од видовите проценки на интервали кои се користат во статистиката, кои се пресметуваат за дадено ниво на значајност. Тие ни овозможуваат да дадеме изјава дека вистинската вредност на непознат статистички параметар на популацијата е во рамките на добиениот опсег на вредности со веројатност што е специфицирана со избраното ниво на статистичка значајност.

Нормална дистрибуција

Кога е позната варијансата (σ 2) на популацијата на податоци, z-оценката може да се користи за пресметување на границите на доверба (крајните точки на интервалот на доверба). Во споредба со користењето на t-дистрибуцијата, користењето на z-оценката ќе ви овозможи да изградите не само потесен интервал на доверба, туку и посигурни проценки на очекуваната вредност и стандардното отстапување (σ), бидејќи z-оценката се заснова на нормална дистрибуција.

Формула

За да се одредат граничните точки на интервалот на доверба, под услов да се знае стандардното отстапување на популацијата на податоци, се користи следнава формула

L = X - Z α/2 σ
√n

Пример

Да претпоставиме дека големината на примерокот е 25 набљудувања, очекуваната вредност на примерокот е 15, а стандардното отстапување на популацијата е 8. За ниво на значајност од α=5%, Z-оценката е Z α/2 =1,96. Во овој случај, долните и горните граници на интервалот на доверба ќе бидат

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Така, можеме да кажеме дека со 95% веројатност математичкото очекување на населението ќе падне во опсег од 11.864 до 18.136.

Методи за стеснување на интервалот на доверба

Да претпоставиме дека опсегот е премногу широк за целите на нашата студија. Постојат два начини да се намали опсегот на интервалот на доверба.

  1. Намалете го нивото на статистичка значајност α.
  2. Зголемете ја големината на примерокот.

Намалувајќи го нивото на статистичка значајност на α=10%, добиваме Z-оценка еднаква на Z α/2 =1,64. Во овој случај, долните и горните граници на интервалот ќе бидат

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

И самиот интервал на доверба може да се напише во форма

Во овој случај, можеме да направиме претпоставка дека со 90% веројатност математичкото очекување на населението ќе падне во опсегот.

Ако сакаме да не го намалиме нивото на статистичка значајност α, тогаш единствената алтернатива е да ја зголемиме големината на примерокот. Зголемувајќи го на 144 набљудувања, ги добиваме следните вредности на граници на доверба

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Самиот интервал на доверба ќе ја има следната форма

Така, стеснувањето на интервалот на доверба без намалување на нивото на статистичка значајност е можно само со зголемување на големината на примерокот. Ако зголемувањето на големината на примерокот не е можно, тогаш стеснувањето на интервалот на доверба може да се постигне единствено со намалување на нивото на статистичка значајност.

Конструирање интервал на доверба за дистрибуција различна од нормалната

Ако стандардното отстапување на популацијата не е познато или дистрибуцијата е различна од нормалната, t-распределбата се користи за да се изгради интервал на доверба. Оваа техника е поконзервативна, што се рефлектира во пошироки интервали на доверба, во споредба со техниката базирана на Z-оценката.

Формула

За да ги пресметате долните и горните граници на интервалот на доверба врз основа на т-дистрибуцијата, користете ги следните формули

L = X - t α σ
√n

Студентската распределба или t-дистрибуцијата зависи само од еден параметар - бројот на степени на слобода, што е еднаков на бројот на поединечни вредности на атрибутот (бројот на набљудувања во примерокот). Вредноста на Студентскиот t-тест за даден број степени на слобода (n) и нивото на статистичка значајност α може да се најдат во референтните табели.

Пример

Да претпоставиме дека големината на примерокот е 25 поединечни вредности, очекуваната вредност на примерокот е 50, а стандардната девијација на примерокот е 28. Потребно е да се изгради интервал на доверба за нивото на статистичка значајност α=5%.

Во нашиот случај, бројот на степени на слобода е 24 (25-1), па затоа соодветната табела вредност на Студентскиот t-тест за нивото на статистичка значајност α=5% е 2,064. Затоа, долните и горните граници на интервалот на доверба ќе бидат

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

И самиот интервал може да се напише во форма

Така, можеме да кажеме дека со 95% веројатност математичкото очекување на населението ќе биде во опсегот .

Користењето на распределбата t ви овозможува да го стесните интервалот на доверба или со намалување на статистичката значајност или со зголемување на големината на примерокот.

Намалувајќи ја статистичката значајност од 95% на 90% во условите на нашиот пример, ја добиваме соодветната табела вредност на Студентскиот t-тест од 1,711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Во овој случај, можеме да кажеме дека со 90% веројатност математичкото очекување на населението ќе биде во опсегот .

Ако не сакаме да ја намалиме статистичката значајност, тогаш единствената алтернатива е да ја зголемиме големината на примерокот. Да речеме дека се работи за 64 поединечни набљудувања, а не 25 како во првобитната состојба на примерот. Табелата вредност на Студентскиот t-тест за 63 степени на слобода (64-1) и нивото на статистичка значајност α=5% е 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Ова ни овозможува да кажеме дека со 95% веројатност математичкото очекување на населението ќе биде во опсегот.

Големи примероци

Големите примероци се примероци од популација на податоци во кои бројот на поединечни набљудувања надминува 100. Статистичките студии покажаа дека поголемите примероци имаат тенденција да бидат нормално распределени, дури и ако распределбата на популацијата не е нормална. Дополнително, за такви примероци, употребата на z-оценка и t-распределба дава приближно исти резултати при конструирање интервали на доверба. Така, за големи примероци, прифатливо е да се користи z-оценката за нормална дистрибуција наместо t-дистрибуција.

Ајде да го сумираме

Интервалот на доверба ни доаѓа од областа на статистиката. Ова е одреден опсег кој служи за проценка на непознат параметар со висок степен на доверливост. Најлесен начин да се објасни ова е со пример.

Да претпоставиме дека треба да проучите некоја случајна променлива, на пример, брзината на одговор на серверот на барање на клиентот. Секој пат кога корисникот ќе ја напише адресата на одредена локација, серверот реагира со различна брзина. Така, времето на одговор што се проучува е случајно. Значи, интервалот на доверба ни овозможува да ги одредиме границите на овој параметар, а потоа можеме да кажеме дека со 95% веројатност серверот ќе биде во опсегот што го пресметавме.

Или треба да дознаете за колку луѓе знаат заштитен знаккомпании. Кога ќе се пресмета интервалот на доверба, ќе може да се каже, на пример, дека со 95% веројатност уделот на потрошувачите свесни за тоа е во опсег од 27% до 34%.

Тесно поврзана со овој термин е вредноста на веројатноста за доверба. Ја претставува веројатноста дека саканиот параметар е вклучен во интервалот на доверба. Колку голем ќе биде нашиот посакуван опсег зависи од оваа вредност. Колку е поголема вредноста што ја зема, толку е потесен интервалот на доверба и обратно. Вообичаено е поставено на 90%, 95% или 99%. Вредноста 95% е најпопуларна.

Овој индикатор е исто така под влијание на дисперзијата на набљудувањата и неговата дефиниција се заснова на претпоставката дека карактеристиката што се испитува се покорува.Оваа изјава е позната и како Гаусовиот закон. Според него, нормално е распределба на сите веројатности на континуирана случајна променлива што може да се опише со густина на веројатност. Ако претпоставката за нормална распределба е неточна, тогаш проценката може да биде неточна.

Прво, ајде да дознаеме како да го пресметаме интервалот на доверба за Постојат два можни случаи овде. Дисперзијата (степенот на ширење на случајна променлива) може или не може да биде позната. Ако е познато, тогаш нашиот интервал на доверба се пресметува со следнава формула:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - знак,

t - параметар од табелата за распределба на Лаплас,

σ е квадратен корен на варијансата.

Ако варијансата е непозната, тогаш може да се пресмета ако ги знаеме сите вредности на саканата карактеристика. За ова се користи следнава формула:

σ2 = х2ср - (хср)2, каде

х2ср - просечна вредност на квадратите на проучуваната карактеристика,

(хср)2 е квадратот на оваа карактеристика.

Формулата со која се пресметува интервалот на доверба во овој случај малку се менува:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - примерок просек,

α - знак,

t е параметар што се наоѓа со помош на табелата за распределба на Student t = t(ɣ;n-1),

sqrt(n) - квадратен корен од вкупната големина на примерокот,

s е квадратниот корен на варијансата.

Размислете за овој пример. Да претпоставиме дека врз основа на резултатите од 7 мерења, проучената карактеристика е одредена дека е еднаква на 30, а варијансата на примерокот е еднаква на 36. Неопходно е да се најде, со веројатност од 99%, интервал на доверба кој ја содржи вистинската вредност на измерениот параметар.

Прво, да одредиме што е еднакво на t: t = t (0,99; 7-1) = 3,71. Користејќи ја горната формула, добиваме:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Интервалот на доверливост за варијансата се пресметува и во случај на позната средина и кога нема податоци за математичкото очекување, а позната е само вредноста на точката непристрасна проценка на варијансата. Ние нема да дадеме формули за пресметување овде, бидејќи тие се доста сложени и, по желба, секогаш може да се најдат на Интернет.

Само да забележиме дека е погодно да се одреди интервалот на доверливост користејќи Excel или мрежна услуга, која се нарекува така.



Што друго да се прочита