Главная Обратная связь

Дисциплины:






Исследователь вносит гипотезу о структуре ящика



Рассматривая экспериментально полученные данные, предположим, что они подчиняются линейной гипотезе, то есть выход Y зависит от входа X линейно, то есть гипотеза имеет вид:Y = A1X + A0 (рис. 2.2).

2) Определение неизвестных коэффициентов A0 и A1 модели

Линейная одномерная модель (рис. 2.3).

Рис. 2.3. Одномерная модель черного ящика

Для каждой из n снятых экспериментально точек вычислим ошибку (Ei) между экспериментальным значением (YiЭксп.) и теоретическим значением (YiТеор.), лежащим на гипотетической прямой A1X + A0 (см. рис. 2.2):

Ei = (YiЭксп.YiТеор.), i = 1, …, n;

Ei = YiA0A1 · Xi, i = 1, …, n.

Ошибки Ei для всех n точек следует сложить. Чтобы положительные ошибки не компенсировали в сумме отрицательные, каждую из ошибок возводят в квадрат и складывают их значения в суммарную ошибку F уже одного знака:

Ei2 = (YiA0A1 · Xi)2, i = 1, …, n.

Цель метода — минимизация суммарной ошибки F за счет подбора коэффициентов A0, A1. Другими словами, это означает, что необходимо найти такие коэффициенты A0, A1 линейной функцииY = A1X + A0, чтобы ее график проходил как можно ближе одновременно ко всем экспериментальным точкам. Поэтому данный метод называется методом наименьших квадратов.

Суммарная ошибка F является функцией двух переменных A0 и A1, то есть F(A0, A1), меняя которые, можно влиять на величину суммарной ошибки (см. рис. 2.4).

Рис. 2.4. Примерный вид функции ошибки

Чтобы суммарную ошибку минимизировать, найдем частные производные от функции F по каждой переменной и приравняем их к нулю (условие экстремума):

После раскрытия скобок получим систему из двух линейных уравнений:

Для нахождения коэффициентов A0 и A1 методом Крамера представим систему в матричной форме:

Решение имеет вид:

Вычисляем значения A0 и A1.

Проверка

Чтобы определить, принимается гипотеза или нет, нужно, во-первых, рассчитать ошибку между точками заданной экспериментальной и полученной теоретической зависимости и суммарную ошибку:

Ei = (YiЭксп.YiТеор.), i = 1, …, n

И, во-вторых, необходимо найти значение σ по формуле , где F — суммарная ошибка, n — общее число экспериментальных точек.

Если в полосу, ограниченную линиями YТеор.S и YТеор. + S (рис. 2.5), попадает 68.26% и более экспериментальных точек YiЭксп., то выдвинутая нами гипотеза принимается. В противном случае выбирают более сложную гипотезу или проверяют исходные данные. Если требуется большая уверенность в результате, то используют дополнительное условие: в полосу, ограниченную линиямиYТеор. – 2S и YТеор. + 2S, должны попасть 95.44% и более экспериментальных точек YiЭксп..



Рис. 2.5. Исследование допустимости принятия гипотезы

Расстояние S связано с σ следующим соотношением:

S = σ/sin(β) = σ/sin(90° – arctg(A1)) = σ/cos(arctg(A1)),

что проиллюстрировано на рис. 2.6.

Рис. 2.6. Связь значений σ и S

Условие принятия гипотезы выведено из нормального закона распределения случайных ошибок (см. рис. 2.7). P — вероятность распределения нормальной ошибки.

Рис. 2.7. Иллюстрация закона нормального распределения ошибок

Наконец, приведем на рис. 2.8 графическую схему реализации одномерной линейной регрессионной модели.

Рис. 2.8. Схема реализации метода наименьших квадратов в среде моделирования

 

Практическая часть

Задача №1.

По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1998 г.

Район Потребительские расходы в расчете на душу населения тыс. руб. у Средняя заработная плата и выплаты социального характера, тыс. руб., х
Волго-Вятский район
Респ. Марий Эл
Респ. Мордовия
Чувашская респ.
Кировская обл.
Нижегородская обл.
Центрально-Черноземный
Белгородская обл.
Воронежская обл.
Курская обл.
Липецкая обл.
Тамбовская обл.
Поволжский
Респ. Калмыкия
Респ. Татарстан
Астраханскаяобл.
Волгоградская обл.
Пензенская обл.
Саратовская обл.
Ульяновская обл.

Задание

1. Постройте поле корреляции и сформируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической парной регрессии.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Рассчитайте коэффициент эластичности.

5. Оцените качество уравнений с помощью средней ошибки аппроксимации.

6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.

7. Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости a=0,05.

8. Оцените полученные результаты.

 

 

Решение:

Построим поле корреляции:

В данном случае можно сформулировать гипотезу о наличии связи между расходами и заработной платы, носящей скорее всего гиперболический характер.

1.1 Построить линейную модель.

 
 

Определим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1 приложения.

Можно сказать, что связь между размером потребительских расходов и средней заработной платы и выплат социального характера.

 
 

Уравнение линейной регрессии имеет вид:

Значения параметров линейной модели определим, используя данные таблицы 1.

, .

 
 

Уравнение регрессии имеет вид:

Рассчитаем коэффициент детерминации:

 
 

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера.


F> Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15, то уравнение регрессии с вероятностью 0,95 в целом статистически значимое.

Определим среднюю ошибку:

 
 

В среднем расчетные значения ý для линейной модели отличаются от фактических значений на 4,04%.

1.2 Построение степенной модели парной регрессии

Уравнение степенной регрессии имеет вид:


Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:


Данные приведены в таблице 2 приложения.

Обозначим Y=lgŷ, X=lg x, A=lga.

Тогда уравнение примет вид: Y=A+bX-линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.

A=0,001

Уравнение регрессии будет иметь вид: Y=0,001+0,915X

Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:

Ŷ=10-0,0010,915

Получим уравнение степенной модели регрессии: Ŷ=0,998*х0,915

Определим индекс корреляции:


Связь между показателем у и фактором х можно считать достаточно сильной. Коэффицент детерминации равен R2=r2XY=0,728

Рассчитаем критерий Фишера.

 
 

F> Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15

Средняя относительная ошибка

 
 

В среднем расчетные значения ý для степенной модели отличаются от фактических значений на 1,28%.

1.3 Построение экспоненциальной функции

Ŷ=аbx

Для построения этой модели необходимо провести линериаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения.

Lgŷ=lga+xlgb

Обозначим Y=lgŷ, B=lgb, A=lga

Получим линейное уравнение регрессии:

Y=A+Bx

Рассчитаем его параметры, используя данные таблицы 4 приложения.

, .

Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:

Ŷ=100,026*(100,004)x=1,06*1,01x

 
 

Определим индекс корреляции:

Связь между показателем у и фактором х можно считать недостаточно сильной. Коэффицент детерминации равен R2=r2XY=0,404

 
 

Рассчитаем критерий Фишера.

F< Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15

 
 

Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F> Fтабл.

Средняя относительная ошибка

В среднем расчетные значения ý для экпоненциальной модели отличаются от фактических значений на 5,16%.

1.4 Построение гиперболической функции

Уравнение гиперболической функции:

Ŷ=a+b/x

Проведем линеаризацию модели путем замены Х=1/х. В результате получим линейное уравнение ŷ=a+bX

Рассчитаем его параметры по данным таблицы 5.

, .

Получим следующее уравнение гиперболической модели:

Ŷ=31,001+215709,49/х

 
 

Определим индекс детерминации:r2=0,951

Вариация результата Y на 95,1% объясняется вариацией фактора Х.

 
 

Рассчитаем критерий Фишера.

F> Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15

Средняя относительная ошибка: 0,067*44,106=2,955%

В среднем расчетные значения ý для гиперболической модели отличаются от фактических значений на 2,955%.

1.5 Выбор лучшей модели

Для выбора лучшей модели построим сводную таблицу результатов

  Коэффициент детерминации F-критерий Фишера Индекс корреляции Средняя относительная ошибка
Линейная 0,346 7,9 0,588 4,04
Степенная 0,728 40,2 0,924 1,28
Экспоненциальная 0,636 0,404 10,17 5,16
Гиперболическая 0,951 291,1 0,975 2,955

Наибольшее значение коэффициента детерминации и критерия Фишера имеет гиперболическая модель. Она же имеет практически наименьшую среднюю относительную ошибку, значит, ее можно взять в качестве лучшей для построения прогноза.

1.6 Расчет прогнозного значения результативного показателя.

.

Подставим значение xр в уравнение гиперболической регрессии:

Ŷ=31,001+215709,49/х

Доверительный интервал прогноза для уровня значимости a определяется в виде:

где

Рассчитаем необходимые величины:

;

;

; ;

.

В результате доверительный интервал прогноза для уровня значимости 0,05 равен:

505,8-0,275*145,8 .

465,7

8. Полученные результаты, в целом удовлетворительные. Модель гиперболической парной регрессии описывает реальную зависимость рассматриваемыми показателями.

 

Задача 2

Вариант 2 (10). Исходные данные: среднедушевые денежные доходы населения России за 2009г. (руб/месяц)

 

Задание:

1.Построить график динамики

2.Рассчитать параметры тренда

3.Оценить качество тренда через среднюю ошибку аппроксимации, коэффициент автокорреляции отклонений.

4.Оценить статистическую значимость тренда через F-критерий, значимость параметров тренда – через t-критерий.

5.По форме тренда выполнить прогноз на январь 2010г. (точечный, доверительный интервал для уровня значимости 0,05).

 

январь февраль март апрель май июнь июль август сентябрь октябрь ноябрь декабрь

 

Решение:

 

Линейный тренд имеет вид:

Y =10114.2 + 1207.8*t

Наблюдение Предсказанное у(t) Остатки Y(t) Относительная ошибка аппроксимации,%
12529.8 2639.2 17,4
13737.6 2221.4 13,9
14945.4 2185.6 12,8
16153.2 529.8 3,2
0,2
18568.8 1277.8 7,4
19776.6 3441.6 21,1
20984.4 4116.4 24,4
22192.2 4370.2 24,5
33,7
24607.8 0.2 0,0008
Средняя ошибка аппроксимации,% 5,8

Список литературы:

1. Балабонов И.Т. Анализ и планирование финансов хозяйствующего субъекта. М.: Финансы и статистика, 2004.

2. http://univer-nn.ru/econometrica/regresmnozh.php

3. http://stratum.ac.ru/textbooks/modelir/lection02.html

4. http://www.statsoft.ru/home/portal/applications/Multivariatadvisor/GLM/Overview.htm

5. http://miest.narod.ru/iissvit/rass/vip11.htm





sdamzavas.net - 2018 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...