Отворете
Близо

Коя оценка на параметъра се счита за последователна, безпристрастна, ефективна? Съгласувана оценка Оценката на параметър се нарича последователна, ако

Разпределението на случайна променлива (разпределение на популацията) обикновено се характеризира с редица числени характеристики:

  • за нормално разпределение N(a, σ) е математическото очакване a и стандартното отклонение σ;
  • за равномерно разпределение R(a,b) е границите на интервала, в който се наблюдават стойностите на тази случайна променлива.
Такива числени характеристики, обикновено неизвестни, се наричат параметри на населението . Оценка на параметъра - съответната числена характеристика, изчислена от извадката. Оценките на параметрите на населението попадат в два класа: точкаИ интервал.

Когато резултатът се определя от едно число, той се извиква точкова оценка. Точковата оценка, като функция на извадката, е случайна променлива и варира от проба на проба с повтарящи се експерименти.
Точковите оценки имат изисквания, на които трябва да отговарят, за да бъдат „доброкачествени“ във всеки смисъл. Това неразместен, ефективностИ богатство.

Интервални оценкисе определят от две числа - краищата на интервала, който покрива оценявания параметър. За разлика от точковите оценки, които не дават представа колко далеч може да бъде оцененият параметър от тях, интервалните оценки ни позволяват да установим точността и надеждността на оценките.

Като точкови оценки на математическото очакване, дисперсията и стандартното отклонение се използват характеристиките на извадката, съответно средната стойност на извадката, дисперсията на извадката и стандартното отклонение на извадката.

Свойство на безпристрастна оценка.
Желателно изискване за оценка е липсата на систематична грешка, т.е. при многократно използване вместо параметъра θ неговата оценка, средната стойност на апроксимационната грешка е нула - това е свойство на безпристрастна оценка.

Определение. Една оценка се нарича безпристрастна, ако нейното математическо очакване е равно на истинската стойност на оценения параметър:

Средната аритметична извадка е безпристрастна оценка на математическото очакване, а дисперсията на извадката - предубедена оценка на общата дисперсия д. Безпристрастната оценка на общата дисперсия е оценката

Свойство на последователност на оценката.
Второто изискване за оценка - нейната последователност - означава, че оценката се подобрява с увеличаване на размера на извадката.

Определение. Степен се нарича последователен, ако се сближава по вероятност към оценения параметър θ като n→∞.


Конвергенцията във вероятността означава, че при голям размер на извадката вероятността от големи отклонения на оценката от истинската стойност е малка.

Свойство за ефективна оценка.
Третото изискване ви позволява да изберете най-добрата оценка от няколко оценки на един и същ параметър.

Определение. Един безпристрастен оценител е ефективен, ако има най-малката дисперсия сред всички безпристрастни оценители.

Това означава, че ефективната оценка има минимална дисперсия спрямо истинската стойност на параметъра. Обърнете внимание, че не винаги съществува ефективна оценка, но от две оценки обикновено е възможно да се избере по-ефективната, т.е. с по-малко отклонение. Например, за неизвестен параметър a на нормална популация N(a,σ), както средната аритметична извадка, така и медианата на извадката могат да се приемат като безпристрастна оценка. Но дисперсията на медианата на извадката е приблизително 1,6 пъти по-голяма от дисперсията на средната аритметична стойност. Следователно по-ефективна оценка е средната аритметична извадка.

Пример №1. Намерете безпристрастна оценка на дисперсията на измерванията на някаква случайна променлива с помощта на едно устройство (без систематични грешки), резултатите от измерването на което (в mm): 13,15,17.
Решение. Таблица за изчисляване на показатели.

х|x - x av |(x - x ср.) 2
13 2 4
15 0 0
17 2 4
45 4 8

Обикновено средно аритметично(безпристрастна оценка на математическото очакване)


дисперсия- характеризира мярката за дисперсия около нейната средна стойност (мярка за дисперсия, т.е. отклонение от средната - предубедена оценка).


Безпристрастен оценител на дисперсията- последователна оценка на дисперсията (коригирана дисперсия).

Пример №2. Намерете безпристрастна оценка на математическото очакване на измерванията на определена случайна променлива от едно устройство (без систематични грешки), чиито резултати от измерване (в mm): 4,5,8,9,11.
Решение. m = (4+5+8+9+11)/5 = 7,4

Пример №3. Намерете коригираната дисперсия S2 за размер на извадката от n=10, ако дисперсията на извадката е D = 180.
Решение. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

За да могат статистическите оценки да предоставят добро приближение на оценените параметри, те трябва да бъдат безпристрастни, ефективни и последователни.

Безпристрастенсе нарича статистическа оценка на параметъра , чието математическо очакване е равно на оценения параметър за всеки размер на извадката.

Разместенинаречена статистическа оценка
параметър , чието математическо очакване не е равно на оценения параметър.

Ефективеннаречена статистическа оценка
параметър , което за даден размер на извадката има най-малка дисперсия.

Богатнаречена статистическа оценка
параметър , която при
клони по вероятност към оценения параметър.

т. е. за всякакви

.

За проби с различни размери се получават различни стойности на средната аритметична и статистическа дисперсия. Следователно средноаритметичното и статистическата дисперсия са случайни променливи, за които има математическо очакване и дисперсия.

Нека изчислим математическото очакване на средното аритметично и дисперсията. Нека означим с математическо очакване на случайна променлива

Тук следните се считат за случайни променливи: – S.V., чиито стойности са равни на първите стойности, получени за различни обемни проби от общото население,
–S.V., чиито стойности са равни на вторите стойности, получени за различни обемни проби от общото население, ...,
– С.В., чиито стойности са равни -та стойност, получена за различни обемни проби от общото население. Всички тези случайни променливи се разпределят по един и същи закон и имат едно и също математическо очакване.

От формула (1) следва, че средноаритметичното е безпристрастна оценка на математическото очакване, тъй като математическото очакване на средноаритметичното е равно на математическото очакване на случайната променлива. Тази оценка също е валидна. Ефективността на тази оценка зависи от вида на разпределението на случайната променлива
. ако напр.
е нормално разпределен, оценяването на математическото очакване с помощта на средното аритметично ще бъде ефективно.

Нека сега намерим статистическа оценка на дисперсията.

Изразът за статистическа дисперсия може да се трансформира по следния начин

(2)

Нека сега намерим математическото очакване на статистическата дисперсия

. (3)

Като се има предвид това
(4)

получаваме от (3) -

От формула (6) става ясно, че математическото очакване на статистическата дисперсия се различава с фактор от дисперсията, т.е. е предубедена оценка на дисперсията на популацията. Това е така, защото вместо истинската стойност
, което е неизвестно, статистическата средна стойност се използва при оценката на дисперсията .

Затова въвеждаме коригираната статистическа дисперсия

(7)

Тогава математическото очакване на коригираната статистическа дисперсия е равно на

тези. коригираната статистическа дисперсия е безпристрастна оценка на дисперсията на популацията. Получената оценка също е последователна.

Едно от основните изисквания при конструирането на оценките е да се получат оценки с минимална дисперсия или минимална дисперсия (ако има такива). В тази връзка в математическата статистика беше въведена концепцията за ефективни оценки,

Във връзка с пристрастните оценки на сигнален параметър, оценката се нарича ефективна, ако средната стойност на квадратното отклонение на оценката от истинската стойност на оценения параметър I не надвишава средната стойност на квадратното отклонение на всяка друга оценка y , т.е. неравенството е изпълнено

За безпристрастен оценител дисперсията на оценителя е същата като нейната дисперсия; следователно ефективният безпристрастен оценител се определя като оценител с минимална дисперсия.

S. Rao и Cramer независимо един от друг са получили изрази за долните граници на условните дисперсии и дисперсията на оценките, които са дисперсията и дисперсията на ефективните оценки, при условие че съществуват за дадените параметри.

Нека представим извеждането на този израз, като приемем, че необходимите допускания са валидни.

Представяме оценката на параметър y в съкратена форма, където X е многомерна извадка от изпълнението за интервал от време

Нека осредним израза

за всички възможни стойности на многомерна извадка X, която се описва с условна плътност на вероятността.Вземайки предвид известната връзка за производната на естествения логаритъм след осредняване, получаваме

Поради свойството за нормализиране на плътността на вероятността последният член в (1.3.3) е равен на нула. Интегралът на първия член представлява средната стойност на оценката

Като се вземе предвид последното, осреднената стойност може да бъде записана във формата

Лявата страна на този израз е средната стойност на произведението на две случайни променливи с крайни стойности на първите два момента. При тези условия неравенството на Буняковски-Шварц, известно от математическата статистика, е валидно за случайни променливи

което се превръща в равенство, ако случайните величини са свързани с детерминирана зависимост. Като вземем предвид (1.3.6), от израза (1.3.5) можем да получим

За непредубедени и постоянно предубедени оценители дисперсията на оценителя удовлетворява неравенството на Рао-Крамер

Трябва да се отбележи, че във всички връзки осредняването се извършва върху многомерна извадка от наблюдавани данни X (с непрекъсната обработка - върху всички възможни реализации на

производните се вземат в точката на истинската стойност на оценения параметър.

Знакът за равенство в изразите (1.3.7) и (1-3.8) се постига само за ефективни оценки.

Във връзка с израза (1.3.7), разглеждаме условията, при които неравенството се превръща в равенство, т.е., оценката на параметъра е ефективна предубедена оценка.Съгласно (1.3.6), това изисква коефициентът на кръстосана корелация между да бъде равен на единица, т.е. така че тези произволни функции да са свързани с детерминирана линейна връзка.

Наистина, нека представим производната на логаритъма на функцията на вероятността във формата

където е функция, която не зависи от оценката на y и извадката от наблюдавани данни, но може да зависи от оценения параметър. Когато заместваме (1.3.5) и (1.3.9) в неравенство (1.3.7), тя се превръща в равенство. Въпреки това, представянето на производната на логаритъма на функцията на вероятността във формата (1.3.9) е възможно, ако е изпълнено условието за достатъчност (1.2.9) за оценка на y, от което следва, че

и следователно, ако производната на логаритъма на съотношението на вероятността зависи линейно от достатъчната оценка, тогава коефициентът на пропорционалност не зависи от извадката

Следователно, за съществуването на пристрастна ефективна оценка, трябва да бъдат изпълнени две условия: оценката трябва да е достатъчна (1.2.9) и връзката (1.3.9) трябва да бъде изпълнена. Подобни ограничения се налагат върху съществуването на ефективни непредубедени оценки, при които в израз (1.3.8) знакът за неравенство се превръща в равенство.

Полученият по-горе израз за долната граница на дисперсията на отклонената оценка е валиден и за долната граница на дисперсията на отклонената оценка, тъй като т.е.

Последното неравенство се превръща в равенство, ако в допълнение към условието за достатъчност на оценката е вярно следното отношение:

където има същото значение като в израз (1.3.9).

Формула (1.3.10) се извежда подобно на (1.3.7), ако в оригиналния израз (1.3.2) вместо да се вземе предвид

От естеството на условията (1.2.9) и (1.3.9) става ясно, че ефективни оценки съществуват само в много специфични случаи. Трябва също така да се отбележи, че ефективната оценка непременно принадлежи към класа на достатъчни оценки, докато достатъчната оценка не е непременно ефективна.

Анализът на израза за дисперсията на ефективния смесен оценител 1.3.7) показва, че може да има предубедени оценители, които осигуряват по-малка дисперсия на оценителя от непредубедените. За целта е необходимо производната на отместването да има отрицателна стойност и да е близка до единица по абсолютна стойност в точката на истинската стойност на параметъра.

Тъй като в повечето случаи представлява интерес средният квадрат на получената грешка в оценката (дисперсия), има смисъл да се говори за средния квадрат на грешката в оценката, която за всяка оценка е ограничена отдолу:

В този случай за ефективните оценки има знак за равенство.

Лесно е да се покаже, че отношенията (1.3.10) и (1.3.12) съвпадат, ако са изпълнени съответно условията (1.3.11) и (1.3.9). Наистина, замествайки стойностите, изразени чрез функции в числителя и знаменателя (1.3.10), получаваме (1.3.12).

Използвайки свойствата на ефективните оценки, обсъдени по-горе, ще изясним тяхното определение. Ще наречем оценка y ефективна, ако условията (1.2.9) и (1.3.11) са изпълнени за нея или ако има дисперсия за дадено отклонение

или разпръскване

или с нулево отклонение тази оценка има дисперсия

Обърнете внимание, че характеристиките на ефективната оценка (1.3.13) - (1.3.15) могат също да бъдат изчислени за онези параметри, за които няма ефективна оценка. В този случай стойностите (1.3.13) - (1.3.15) определят долната граница (недостижима) за съответните характеристики на оценка.

За да се сравнят реалните оценки с ефективните в математическата статистика, е въведена концепцията за относителна ефективност на оценките, представляваща отношението на средното квадратно отклонение на ефективната оценка спрямо истинската стойност на параметъра към средното квадратно отклонение на реалното оценка спрямо истинската стойност на параметъра:

Тук y е реалната оценка, чиято ефективност е равна на ефективната оценка.

От дефиницията на дисперсията на ефективната оценка (1.3.1) става ясно, че относителната ефективност на оценката варира в

В допълнение към концепцията за ефективни оценки съществува концепцията за асимптотично ефективни оценки. Приема се, че при достатъчно дълго време на наблюдение или неограничено увеличение на съотношението сигнал/шум граничната стойност на относителната ефективност на реалната оценка е равна на единица. Това означава, че при асимптотично ефективна оценка, дисперсията на оценката за дадено отклонение се определя от израз (1.3.13), а при липса на отклонение, от израз (1.3.15).

) проблеми на математическата статистика.

Нека приемем, че има параметрично семейство от вероятностни разпределения (за простота ще разгледаме разпределението на случайни променливи и случая на един параметър). Ето числов параметър, чиято стойност е неизвестна. Изисква се да се оцени въз основа на наличната извадка от стойности, генерирани от това разпределение.

Има два основни вида оценки: точкови оценкиИ доверителни интервали.

Точкова оценка

Точковата оценка е вид статистическа оценка, при която стойността на неизвестен параметър се апроксимира с отделно число. Тоест, необходимо е да се уточни функцията на извадката (статистика)

,

чиято стойност ще се счита за приближение на неизвестната истинска стойност.

Общите методи за конструиране на точкови оценки на параметри включват: метод на максималното правдоподобие, метод на моментите, метод на квантила.

По-долу са някои свойства, които точковите оценки могат или не могат да имат.

Богатство

Едно от най-очевидните изисквания за точкова оценка е, че може да се очаква сравнително добро приближение до истинската стойност на параметъра за достатъчно големи размери на извадката. Това означава, че оценката трябва да се сближава с истинската стойност при . Това свойство за оценка се нарича богатство. Тъй като говорим за случайни променливи, за които има различни видове конвергенция, това свойство може да бъде прецизно формулирано по различни начини:

Когато просто използвате термин богатство, тогава обикновено имаме предвид слаба консистенция, т.е. конвергенция във вероятността.

Условието за съгласуваност е практически задължително за всички оценки, използвани в практиката. Оценките за отказ се използват изключително рядко.

Безпристрастност и асимптотична безпристрастност

Оценката на параметъра се нарича безпристрастен, ако неговото математическо очакване е равно на истинската стойност на оценения параметър:

.

По-слабо състояние е асимптотичен безпристрастен, което означава, че математическото очакване на оценката се сближава с истинската стойност на параметъра с увеличаване на размера на извадката:

.

Безпристрастността е препоръчително свойство за оценки. Неговото значение обаче не трябва да се надценява. Най-често съществуват безпристрастни оценки на параметрите и след това се опитват да вземат предвид само тях. Възможно е обаче да има статистически проблеми, при които не съществуват безпристрастни оценки. Най-известният пример е следният: разгледайте разпределението на Поасон с параметър и поставете проблема за оценка на параметъра. Може да се докаже, че няма безпристрастен оценител за този проблем.

Сравнение на рейтинги и ефективност

За сравняване на различни оценки на един и същ параметър се използва следният метод: изберете някои рискова функция, който измерва отклонението на оценката от истинската стойност на параметъра, като за най-добър се счита този, за който тази функция приема по-малка стойност.

Най-често математическото очакване на квадрата на отклонението на оценката от истинската стойност се разглежда като функция на риска

За безпристрастни оценки това е просто дисперсията.

Има долна граница на тази рискова функция, наречена Неравенство на Крамър-Рао.

(Непристрастни) оценители, за които е постигната тази долна граница (т.е. имащи възможно най-малката дисперсия), се наричат ефективен. Наличието на ефективна оценка обаче е доста силно изискване за задачата, което не винаги е така.

По-слабо състояние е асимптотична ефективност, което означава, че съотношението на дисперсията на безпристрастната оценка към долната граница на Cramer-Rao клони към единица при .

Имайте предвид, че при достатъчно широки допускания за изследваното разпределение, методът на максималната вероятност дава асимптотично ефективна оценка на параметъра и ако съществува ефективна оценка, тогава тя дава ефективна оценка.

Достатъчна статистика

Статистиката се нарича достатъчноза параметъра, ако условното извадково разпределение при условие, че не зависи от параметъра за всички.

Важността на концепцията за достатъчна статистика се определя от следното одобрение. Ако е достатъчна статистика и е безпристрастна оценка на параметъра, тогава условното очакване също е безпристрастна оценка на параметъра и неговата дисперсия е по-малка или равна на дисперсията на първоначалната оценка.

Спомнете си, че условното очакване е случайна променлива, която е функция на . По този начин, в класа на безпристрастните оценки е достатъчно да се разгледат само тези, които са функции на достатъчна статистика (при условие, че такава статистика съществува за даден проблем).

Оценката на (безпристрастния) ефективен параметър винаги е достатъчна статистика.

Можем да кажем, че достатъчната статистика съдържа цялата информация за оценявания параметър, която се съдържа в извадката.

Тема 7. Статистически оценки на параметрите на разпределението: точкови и интервални оценки

Смисълът на статистическите методи е да се използва ограничена извадка, тоест определена част от генералната съвкупност, за да се направи разумна преценка за нейните свойства като цяло.

Естествено, замяната на изследване на населението с изследване на извадка повдига редица въпроси:

1. До каква степен извадката отразява свойствата на популацията, тоест до каква степен извадката е представителна за популацията?

2. Каква информация за стойностите на параметрите на популацията могат да предоставят параметрите на извадката?

3. Възможно ли е да се каже, че статистическите характеристики, получени чрез извадка (средни стойности, дисперсия или други производни стойности), са равни на тези характеристики, които могат да бъдат получени от генералната съвкупност?

Проверката показва, че стойностите на параметрите, получени за различни проби от една и съща популация, обикновено не съвпадат. Числените стойности на параметрите на извадката, изчислени чрез вземане на проби, са само резултат от приблизителна статистическа оценкастойности на тези параметри в популацията. Статистическата оценка, поради променливостта на наблюдаваните явления, ни позволява да получим само техните приблизителни стойности.

Забележка. Строго погледнато, в статистиката оценката е правило за изчисляване на оценен параметър, а терминът оценка, т.е. извършване на оценка, означава да се посочи приблизителна стойност.

Има различни оценки точкаИ интервални оценки.

Точкова оценка на параметрите на разпределението

Позволявам x 1, x 2, …, x n– обем на пробата нот популация с разпределителна функция Е(х).

Числените характеристики на тази извадка се наричат селективен (емпиричен) числови характеристики.

Имайте предвид, че числените характеристики на извадката са характеристики на дадена извадка, но не са характеристики на разпределението на генералната съвкупност. Тези характеристики обаче могат да се използват за оценка на параметрите на населението.

Споте статистическа оценка, която се определя от едно число.

Точковата оценка се характеризира с Имоти:безпристрастност, последователност и ефективност.

Безпристрастеннаречена точкова оценка, чието математическо очакване е равно на оценения параметър за всеки размер на извадката.

Точковата оценка се нарича богат , ако с неограничено увеличение на размера на извадката ( н® ¥) той се сближава по вероятност към истинската стойност на параметъра, т.е. клони към истинската стойност на оценения параметър на популацията.

Ефективене точкова оценка, която (за даден размер на извадката н) има възможно най-малката дисперсия, т.е. гарантира най-малкото отклонение на оценката на извадката от същата оценка на генералната съвкупност.

В математическата статистика е показано, че последователна, безпристрастна оценка на общата средна стойност a е средната стойност на извадката:

Където x i– опция за вземане на проби, n i– честотни опции x i, – размер на извадката.

Безпристрастна оценка на общата дисперсияслужи за коригиране на дисперсията на пробата

,

По-удобна формула .

Степен с 2 за общата дисперсия също е последователна, но не е ефективна. Въпреки това, в случай на нормално разпределение, то е „асимптотично ефективно“, т.е. с нарастване нсъотношението на неговата дисперсия към минималната възможна неограничено се доближава до единица.

Така че, ако се даде извадка от разпределението Е(х) случайна величина хс неизвестно математическо очакване Аи дисперсия s 2, тогава за изчисляване на стойностите на тези параметри имаме право да използваме следните приблизителни формули:

Точковите оценки имат недостатъка, че при малък размер на извадката те могат да се различават значително от оценените параметри. Следователно, за да се добие представа за близостта между даден параметър и неговата оценка, в математическата статистика се въвеждат така наречените интервални оценки.

Доверителен интервал

Ако по време на статистическата обработка на резултатите е необходимо да се намери не само точкова оценка на неизвестния параметър θ, но и да се характеризира точността на тази оценка, тогава се намира доверителен интервал.

Доверителен интервал– това е интервалът, в който неизвестният параметър на популацията се намира с предварително определена доверителна вероятност.

Вероятност за довериее вероятността, с която неизвестен параметър на популацията принадлежи към доверителния интервал.

Дължината на доверителния интервал характеризира точността на оценката на интервала и зависи от размера на извадката и доверителната вероятност. С увеличаването на размера на извадката дължината ще се увеличи. интервалът намалява (точността се увеличава) и тъй като доверителната вероятност клони към 1, дължината ще бъде надеждна. интервалът се увеличава (точността намалява) Наред с доверителната вероятност p в практиката често се използва нивото на значимост α = 1 - p.

Обикновено се приема р = 0,95 или (по-рядко) 0,99. Тези вероятности се считат за достатъчни за уверена преценка относно общите параметри въз основа на известни примерни индикатори.

Доверителният интервал на математическото очакване има формата: където S е стандартното отклонение, е критичната стойност на разпределението на Стюдънт (Вижте ПРИЛОЖЕНИЕ 1 към Тема 7)