Поиск в словарях
Искать во всех

Математическая энциклопедия - статистических гипотез проверка

Статистических гипотез проверка

статистических гипотез проверка

один из основных разделов математич. статистики, в к-ром развиваются идеи и методы статистич. проверки соответствия между экспериментальными данными и гипотезами об их вероятностной природе.

Пусть наблюдается случайный вектор Х= (Х 1, . . ., Xn), принимающий значения х= (х 1, . . ., х п )в измеримом пространстве и пусть известно, что распределение вероятностей этого случайного вектора . принадлежит заданному множеству вероятностных распределений где нек-рое параметрич. множество. Множество Нназ. множеством допустимых гипотез, а любое его непустое подмножество Hi статистич. гипотезой или просто гипотезой. Если Hi содержит ровно один элемент, то такая гипотеза наз. простой, в противном случае сложной. Далее, пусть в Нвыделены две т. н. конкурирующие между собой гипотезы

и

одну из к-рых, напр. H0, наз. основной, а другую альтернативной гипотезой или просто альтернативой к H0. В терминах гипотез H0 и H1, удобно формулировав, основную задачу теории С. г. н. в рамках модели Неймана Пирсона (см. [1], [2]). Именно, найти оптимальный способ, пользуясь к-рым можно было бы на основе наблюденной реализации случайного вектора . проверить, справедлива ли гипотеза согласно к-рой распределение вероятностей вектора X принадлежит множеству или же справедлива альтернативная гипотеза согласно к-poй распределение вероятностей наблюдаемого вектора Xпринадлежит множеству

Пример 1. Пусть наблюдается случайный вектор X=(X1, . .., Х п), компоненты к-рого Х 1, . . ., Х п суть независимые случайные величины, подчиняющиеся одному и тому же нормальному закону математич. ожидание к-рого неизвестно а дисперсия равна 1, т. е. для любого действительного числа х

В этих условиях можно, напр., рассмотреть задачу проверки гипотезы против альтернативы где нек-рое заданное число. В данном примере гипотеза H0 является простой, а конкурирующая с ней гипотеза H1сложной.

Формально, конкурирующие гипотезы H0 и Н 1 являются равноправными в задаче различения гипотез и вопрос о том, какое из двух непересекающихся и взаимно дополняющих множеств из Нназвать основной гипотезой, не является существенным и не влияет на построение самой теории С. г. п. Однако, как правило, на выборе основной гипотезы сказывается отношение экспериментатора к самой задаче, в результате чего основной гипотезой чаще наз. то множество H0 из множества всех допустимых гипотез Н, к-рое, по мнению экспериментатора, но природе изучаемого явления либо из каких-либо физич. соображений, должно лучше согласовываться с ожидаемыми экспериментальными данными. Именно поэтому гипотезу Н 0 часто наз. проверяемой гипотезой. В теоретич. плане различие между гипотезами H0 и H1 часто сказывается в том, что, как правило, множество H0 оказывается более просто устроенным, чем H1, что отражает желание экспериментатора иметь дело с более простой моделью.

В теории С. г. п. суждение о справедливости H0 или H1 делается на основании наблюденной реализации случайного вектора X;при этом решающее правило, с помощью к-рого принимается решение лсправедлива гипотеза наз. статистическим критерием. Структура любого статистич. критерия полностью определяется его т. н. критич. функцией Согласно статистич. критерию, имеющему критич. функцию проверяемая гипотеза H0 отвергается с вероятностью в пользу альтернативы H1, а гипотеза H1 отвергается с вероятностью в пользу H0. С практич. точки зрения наибольший интерес представляют т. н. нерандомизированные критерии, критич. функции к-рых принимают лишь два значения: 0 и 1. Какой бы критерий не применялся для различения гипотез H0 и H1, в результате его применения можно либо принять правильное решение, либо прийти к ошибочному. В теории С. г. п. ошибочные выводы принято классифицировать следующим образом.

Если критерий бракует проверяемую гипотезу H0. когда она в действительности верна, то говорят, что совершена ошибка 1-го рода. Напротив, если статистич. критерий не отклоняет проверяемую гипотезу H0 (и, значит, согласно этому критерию, гипотеза H0 принимается), когда она на самом деле неверна, то говорят, что совершена ошибка 2-го рода. Задачу проверки гипотезы H0 против Н 1 желательно провести таким образом, чтобы минимизировать вероятности этих ошибок. К сожалению, управлять обеими вероятностями ошибок одновременно при фиксированной размерности пвектора наблюдений . невозможно: уменьшение одной из них ведет, как правило, к увеличению другой. Численно вероятности этих ошибок выражаются в терминах т. н. функции мощности статистич. критерия, определенной на множестве по следующему правилу:

Из определения функции мощности следует, что если случайный вектор X подчиняется закону то статистич. критерий, основанный на критич. функции будет отклонять проверяемую гипотезу H0 с вероятностью Таким образом, сужении функции мощности на будет показывать вероятности ошибок 1-го рода, т. е. вероятности напрасного отклонения H0. Напротив, сужение функции мощности с на называемое мощностью статистич. критерия, показывает другое важное качество статистич. критерия: вероятности отклонения проверяемой гипотезы H0,. когда в действительности справедлива конкурирующая гипотеза H1. Иногда мощностью статистич. критерия наз. число

Дополнение же мощности до 1, т. е. функция заданная на множестве позволяет вычислять вероятности ошибок 2-го рода.

В рамках классич. модели С. г. п. Неймана Пирсона задачу проверки H0 против H1 начинают с выбора верхней границы для вероятности напрасного отклонения проверяемой гипотезы H0, т. е. для вероятности ошибки 1-го рода, и уже при заданной границ стараются построить такой критерий, к-рый имел бы наибольшую мощность. Исходя из особой роли, к-рую играет гипотеза H0 для экспериментатора, число наз. уровнем значимости критерия, выбирают достаточно малым, напр. равным 0,01; 0,05; 0,1 и т. п. Выбор уровня значимости означает, что множество всех статистич. критериев, предназначенных для проверки H0 против H1, сужается до множества критериев, удовлетворяющих условию:

(Иногда вместо условия (1) требуют, чтобы что никак не отражается на построении общей теории С. г. п.) Статистич. критерий, удовлетворяющий условию (1), наз. критерием уровня Таким образом, в классич. постановке задача проверки H0 против Н 1 сводится к построению такого статистич. критерия уровня функция мощности к-рого удовлетворяла бы условию

где функция мощности произвольного критерия уровня В случае, когда гипотезы H0 и H1 являются простыми, эффективное решение этой вариационной задачи дает отношения правдоподобия критерий. Если же гипотеза H1 является сложной, то статистич. критерий, удовлетворяющий условию (2), удается построить редко. Но если такой критерий существует, то именно этот критерий признается наилучшим для проверки H0 против H1 и его наз. равномерно наиболее мощным критерием уровня в задаче различения статистич. гипотез H0 и H1. В силу того что равномерно наиболее мощные критерии существуют редко, приходится сужать класс статистич. критериев с помощью нек-рых дополнительных требований, таких, как несмещенность, подобие, полнота и др., и ужо в более узком классе строить наилучший критерий в смысле (2). Напр., требование несмещенности критерия означает, что его функция мощности должна удовлетворять соотношению

Пример 2. В условиях примера 1 при любом фиксированном уровне значимости существует нерандомизированный равномерно наиболее мощный несмещенный критерий уровня для проверки H0 против альтернативы H1 - отношения правдоподобия критерий. Критич. функция этого наилучшего критерия определяется следующим образом:

где

.

В силу того что статистика X., называемая статистикой критерия, подчиняется нормальному закону с параметрами и т. е. для любого действительного числа х

функция мощности наилучшего критерия для проверки H0 против Н 1 выражается формулой

причем Рисунок дает графич. представление о поведении функции мощности

Наименьшее значение, равное уровню значимости функция достигает в точке и, по мере удаления от ее значения растут, приближаясь тем ближе к 1, чем больше величина

Теория С. г. п . позволяет с единой точки зрения трактовать различные задачи, выдвигаемые практикой: построение интервальных оценок для неизвестных параметров, оценка расхождения между средними значениями вероятностных законов, проверка гипотез о независимости наблюдений, задачи статистич. контроля качества и др. Так, напр., в примере 2 зона принятия гипотезы H0 представляет собой наилучший доверительный интервал с коэффициентом доверия для неизвестного математич. ожидания

Наряду с классич. подходом Неймана Пирсона к решению задачи различения гипотез существуют и другие: бейесонский подход, минимаксный подход, метод последовательного различения Вальда и др. Кроме того, в теории С. г. п. рассматриваются приближенные методы, основанные на изучении асимптотич. поведения последовательности функций мощности статистич. критериев, предназначенных для проверки H0 против H1 когда размерность пвектора наблюдений X=(X1,. . ..Х n) неограниченно растет. В такой ситуации обычно требуют, чтобы построенная последовательность критериев была состоятельной, т. е. чтобы

что означает, что с ростом пгипотезы H0 и H1 можно будет различать с любой степенью достоверности. В примере 2 построена состоятельная последовательность критериев (если

В любом случае, каким бы статистич. критерием не пользоваться в задаче различения гипотез H0 и H1,принятие гипотезы H0(H1) означает не то, что эта гипотеза H0(H1) в действительности истинна, а лишь факт отсутствия противоречий результатов наблюдений с принимаемой гипотезой на данном этапе исследований. Именно в силу этого согласия опыта и теории у экспериментатора нет оснований не верить в истинность H0(H1 )до тех нор, пока не появятся новые наблюдения, к-рые могут заставить изменить его отношение к принятой ранее гипотезе, а может даже и ко всей модели вообще.

Лит.:[1] Neyman J., Реаrsоn Б. S., лBlometrika

Математическая энциклопедия. — М.: Советская энциклопедия

И. М. Виноградов

1977—1985

Рейтинг статьи:
Комментарии:

Вопрос-ответ:

Похожие слова

Ссылка для сайта или блога:
Ссылка для форума (bb-код):