Таблица 2. Коэффициенты корреляции между показателями
Газпром ВТБ GMKN USDRUB MICEX
Газпром 1 0,359 0,065 0,568 -0,537
ВТБ 0,359 1 -0,203 0,936 0,378
GMKN 0,065 -0,203 1 -0,132 -0,011
USDRUB 0,568 0,936 -0,132 1 0,127
MICEX -0,537 0,378 -0,011 0,127 1
Интерпретация полученных данных. Наблюдается тесная прямая взаимосвязь между показателями стоимость акций Банк ВТБ и валютной парой USD/RUB так как коэффициент корреляции близок к единице. Наблюдается умеренная прямая взаимосвязь между стоимостью акций ОАО Газпром и валютной парой USD/RUB. Так же присутствует умеренная обратная взаимосвязь между стоимостью акций ОАО Газпром и биржевым индексом MICEX.
Вывод. Для модели множественной регрессии выбираем в качестве объясняемой переменной валютную пару USD/RUB, в качестве объясняющих переменных стоимость акций ОАО Газпром и стоимость акций Банк ВТБ. Остальные показатели в дальнейших моделях не используем.
Линейная множественная регрессия
Таблица 3. Коэффициенты корреляции между показателями, выбранными для построения модели
Газпром ВТБ USDRUB
Газпром 1 0,359 0,568
ВТБ 0,359 1 0,936
USDRUB 0,568 0,936 1
Построим линейную множественную регрессию:
y = m1x1 + m2x2 + b
где в качестве объясняемой переменной y возьмем валютную пару USD/RUB;
объясняющие переменные выбраны в следующем порядке:
х1 - стоимость акций ОАО Газпром;
х2 - стоимость акций Банк ВТБ;
Таблица 4. Коэффициенты множественной линейной регрессии
m2 m1 b
67,35 -0,09 39,46
y = -0,09x1 + 67,35x2 +39,46
Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации по формуле:
= 0,661
Так как , то скорректированный коэффициент детерминации не рассчитывается.
После определения значения коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику:
= 39,98
Полученное фактическое значение сравниваем с критическим Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели.
Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации:
= 0,0057
Так как значение не превышает 0,15 (15%), то модель достаточно хорошо описывает фактические данные.
Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид:
H0 : b = 0(m1=0, m2=0)
H1 : b ≠ 0(m1≠ 0, m2≠ 0)
Для проверки этой гипотезы пользуются t-статистикой: . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии.
Таблица 5. t-статистики для коэффициентов множественной линейной регрессии
коэффициент t-статистика сравнение вывод
b 22,914 t (Y) > t кр свободный член значим
m1 -7,919 |t (Х1)| > t кр коэффициент перед Х1 значим
m2 6,719 t (Х2) > t кр коэффициент перед Х2 значим
Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента:
для b – . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α.
Таблица 6. Доверительные интервалы для коэффициентов множественной линейной регрессии
коэффициент значение доверительный интервал
b 39,46 35,980 42,935
m1 -0,09 -0,112 -0,067
m2 67,35 47,109 87,595
Так как ни по одному из коэффициентов линейной модели множественной регрессии в доверительные интервалы 0 не попал, то можно сделать вывод о значимости всех коэффициентов.
Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона:
DW= 1,067
Границы интервала – dL=1,35; du=1,49
Так как DW< dL, то модель автокоррелирована.
Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова.
Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора х=|x1|+|x2|.
Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части.
Шаг 3. Для первой и третьей частей выборки строятся модели линейной множественной регрессии, т.е. для них вычисляются оценки параметров a0 и a1.
В результате получаются две модели парной регрессии (для каждой части общей выборки):
Y1=ã01 + ã11x1 + ã21x2 +u1
Y3=ã03 + ã13x1 + ã23x2 +u3
Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется.
Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3.
Где ESS=Σ(ui2)=Σ(yi-ã0-ã1x1i-ã2x2i)2
Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3.
5.1. Формируется случайная переменная GQ в виде:
5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3):
Если GQ ≤ Fкр(Pдов,n1,n3)
и 1/GQ ≤ Fкр(Pдов,n1,n3),
то гипотеза о гомоскедастичности случайных возмущений принимается.
Делаем расчеты для нашей модели:
Fкр(0,05;14;14)= 2,48; GQ= 4,104; 1/GQ= 0,244
Так как GQ= 4,104> Fкр(0,05,14,24)= 2,48, то нет оснований принимать гипотезу о гомоскедастичности случайных возмущений. Значит можно считать, что гомоскедастичность в нашей модели отсутствует.
Нелинейная множественная регрессия
Для нашей модели возьмем модель степенной множественной регрессии:
.
Для лианерезации этой модели сделаем следующие замены:
; ; .
Тогда
Построим вспомогательную линейную множественную регрессию:
z = m1t1 + m2t2 + b
Таблица 7. Коэффициенты вспомогательной множественной линейной регрессии
m2 m1 ln b
0,19 -0,48 6,33
z = -0,48t1 + 0,19t2 +6,33
Пересчитаем для степенной множественной регрессии: b=562,15
Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации по формуле:
= 0,659
Так как , то скорректированный коэффициент детерминации не рассчитывается.
После определения значения коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику:
= 38,50
Полученное фактическое значение сравниваем с критическим
Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели.
Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации:
= 0,0521
Так как значение не превышает 0,15 (15%), то модель достаточно хорошо описывает фактические данные.
Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид:
H0 : b = 0(m1=0, m2=0)
H1 : b ≠ 0(m1≠ 0, m2≠ 0)
Для проверки этой гипотезы пользуются t-статистикой: . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии.
Таблица 8. t-статистики для коэффициентов множественной степенной регрессии
коэффициент t-статистика сравнение вывод
lnb 18,362 t (Y) > t кр свободный член значим
m1 -7,844 |t (Х1)| > t кр коэффициент перед t1 значим
m2 6,579 t (Х2) > t кр коэффициент перед t2 значим
Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента:
для b – . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α.
Таблица 6. Доверительные интервалы для коэффициентов множественной линейной регрессии
коэффициент значение доверительный интервал
lnb 6,33 5,635 7,028
m1 -0,48 -0,606 -0,358
m2 0,19 0,129 0,242
Так как ни по одному из коэффициентов вспомогательной линейной модели множественной регрессии в доверительные интервалы 0 не попал, то можно сделать вывод о значимости всех коэффициентов степенной множественной регрессии.
Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона:
DW= 1,044
Границы интервала – dL=1,35; du=1,49
Так как DW< dL, то модель автокоррелирована.
Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова.
Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора t=|t1|+|t2|.
Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части.
Шаг 3. Для первой и третьей частей выборки строятся модели парной регрессии, т.е. для них вычисляются оценки параметров a0 и a1.
В результате получаются две модели парной регрессии (для каждой части общей выборки):
z1=ã01 + ã11t1 + ã21t2 +u1
z3=ã03 + ã13t1 + ã23t2 +u3
Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется.
Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3.
Где ESS=Σ(ui2)=Σ(zi-ã0-ã1t1i-ã2t2i)2
Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3.
5.1. Формируется случайная переменная GQ в виде:
5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3):
Если GQ ≤ Fкр(Pдов,n1,n3)
и 1/GQ ≤ Fкр(Pдов,n1,n3),
то гипотеза о гомоскедастичности случайных возмущений принимается.
Делаем расчеты для нашей модели:
Fкр(0,05;14;14)= 2,48; GQ= 1,284; 1/GQ= 0,779
Так как GQ ≤ Fкр(Pдов,n1,n3) и 1/GQ ≤ Fкр(Pдов,n1,n3), то гипотеза о гомоскедастичности случайных возмущений принимается. Значит можно считать, что степенная множественная модель гомоскедастична.
Выводы:
1. При выполнении данной работы изучено построение множественной линейной и ненилейной (степенной) регрессий для ряда экономических данных:
y = -0,09x1 + 67,35x2 +39,46 и
, где
в качестве объясняемой переменной y возьмем валютную пару USD/RUB;
объясняющие переменные выбраны в следующем порядке:
х1 - стоимость акций ОАО Газпром;
х2 - стоимость акций Банк ВТБ;
2. Рассмотрены методы установления адекватности моделей. Рассчитаны коэффициенты детерминации и средние ошибки аппроксимации. Обе модели показали надежную адекватность.
3. Установлено, что все коэффициенты при переменных в регрессионных моделях значимы и найдены доверительнее интервалы для коэффициентов построенных моделей.
4. Обе модели изучены на автокорреляцию, для чего был использован тест Дарбина-Уотсона. Обе модели оказались автокоррелированными.
5. Обе модели изучены на отсутствие гетероскедастичности, для чего был использован тест Готвальда-Квандта. Оказалось, что в линейной модели гетероскедастичность отсутствует, а степенная модель гетероскедастична.
6. В результате выполнения работы можно сделать вывод, что линейная модель обладает чуть лучшими свойствами, чем степенная. Поэтому можно выбрать линейную модель.
7. В работе даны подробные комментарии ко всем вычислениям в соответствии с материалами лекций, предложенными вместе с заданием для данной работы. Поэтому данную работ можно рассматривать как краткий конспект лекций.