Главная Обратная связь

Дисциплины:






Интервальные оценки.



Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности оценок становится очень важным.

Введем понятие интервальной оценки неизвестного параметра генеральной совокупности (или случайной величины x, определенной на множестве объектов этой генеральной совокупности). Обозначим этот параметр черезD. По сделанной выборке по определенным правилам найдем числа D1 и D2, так чтобы выполнялось условие:

P(D1<D<D2) =P (DÎ(D1; D2)) = g

Числа D1 и D2 называются доверительными границами, интервал (D1, D2) — доверительным интервалом для параметра D. Число g называется доверительной вероятностью или надежностью сделанной оценки.

Сначала задается надежность. Обычно ее выбирают равной 0,95, 0,99 или 0,999. Тогда вероятность того, что интересующий нас параметр попал в интервал (D1, D2) достаточно высока. Число (D1 + D2) / 2 – середина доверительного интервала – будет давать значение параметра D с точностью (D2 D1) / 2, которая представляет собой половину длины доверительного интервала.

Границы D1 и D2 определяются из выборочных данных и являются функциями от случайных величин x1, x2,...,xn, а следовательно – сами случайные величины. Отсюда – доверительный интервал (D1, D2) тоже случаен. Он может покрывать параметр Dили нет. Именно в таком смысле нужно понимать случайное событие, заключающееся в том, что доверительный интервал покрывает число D.

 

 

11. Графические характеристики случайных величин. Гистограмма. Характеристики положения (мода, медиана, выборочная средняя).

Медиа́на (50-й процентиль, квантиль 0,5) — возможное значение признака, которое делит ранжированную совокупность (вариационный ряд выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана.

Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки . Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты и соединяют точки отрезками прямых.

Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты .



В случае непрерывного признака строится гистограмма, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала – сумму частот вариант, попавших в i–й интервал.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которой служат частичные интервалы длиною h, а высоты равны отношению . Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии (высоте) . Площадь i–го прямоугольника равна – сумме частот вариант i–о интервала, поэтому площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. Условимся обозначать моду буквой . На рис. 5.6.1 и 5.6.2 показана мода соответственно для прерывной и непрерывной случайных величин.

Рис. 5.6.1

 

 

В качестве точечной оценки для “a” берут выборочную среднюю .

Def: выборочной средней называется среднее арифметическое выборки.

(2)

Теорема: выборочная средняя является состоятельной и несмещенной оценкой математического ожидания .

 


 

12. Понятие о задаче статистической проверки гипотез. Нулевая и альтернативная гипотезы. Оценка достоверности различий по t-критерию Стьюдента

Нулевая гипотеза подразумевает под собой следующее: формально выдвигается предположение о принадлежности двух исследуемых выборок одной и той же генеральной совокупности и определяется доверительная вероятность принятия или отвержения этой гипотезы. Нулевая гипотеза отвергается, если используя метод доверительных интервалов с заданной доверительной вероятностью, эти интервалы не пересекаются.

Альтернативная гипотеза— это предположение, принимаемое в случае отклонения нулевой гипотезы. Альтернативная гипотеза утверждает положительную связь между изучаемыми переменными. "Температура воздуха зависит от интенсивности солнечного излучения" - это альтернативная гипотеза.
Понятие о задаче статистической проверки гипотез. Нулевая и альтернативная гипотезы. Оценка достоверности различий по t-критерию Стьюдента.

Нулевая гипотеза подразумевает под собой следующее: формально выдвигается предположение о принадлежности двух исследуемых выборок одной и той же генеральной совокупности и определяется доверительная вероятность принятия или отвержения этой гипотезы. Нулевая гипотеза отвергается, если используя метод доверительных интервалов с заданной доверительной вероятностью, эти интервалы не пересекаются.

 

 

Этот критерий относится к параметрическим и предполагает, что генеральные совокупности сравниваемых выборок распределены по нормальному закону, а отличие их дисперсий является незначительным. Тогда t - критерий определяется по формуле

tk - переменная величина, следующая t - распределению Стьюдента с числом степеней свободы

k = (n1-1)+(n2-1) = n1+n2 -2, а коэффициент N12 равен

Нулевую гипотезу отвергают, если фактически установленная величина tk превзойдет критическое значение этой величины tak для принятого значения доверительной вероятности (а) и числа степеней свободы k = n1 +n2 -2, то есть при условии tak > \tk\. Если же наблюдается соотношение tak <\tk\, то оснований отвергнуть Н0 с заданным уровнем доверительной вероятности ос не имеется. Критические значения tak приводятся в специальных таблицах. (Например, такая таблица дана в приложении 4 к данному пособию).

Если дисперсии сравниваемых групп не равны, то величину t - критерия находят по формуле:

Число степеней свободы вычисляют по следующим формулам:

1. При n1=n2

1. При n1=/=n2





sdamzavas.net - 2019 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...