СКАЧАТЬ РАБОТУ БЕСПЛАТНО -
Коэффициент детерминации . Вариация результата Y на 93% объясняется вариацией признака Х.
1.1. Для характеристики Y от Х построим линейную модель , параметры которой находим по формулам и .
Таблица 1.3.
Расчетная таблица для линейной модели
Y X X^2 Y^2 XY Y рег Y-Y рег Еотн
1 50 50 2500 2500 2500 51,61 -1,61 3,23%
2 54 54 2916 2916 2916 54,57 -0,57 1,06%
3 60 60 3600 3600 3600 59,01 0,99 1,65%
4 62 62 3844 3844 3844 60,49 1,51 2,44%
5 70 70 4900 4900 4900 66,41 3,59 5,13%
6 66 74 5476 4356 4884 69,37 -3,37 5,10%
7 74 81 6561 5476 5994 74,54 -0,54 0,73%
сумма 436 451 29797 27592 28638 19,34%
среднее 62,286 64,43 4256,71 3941,71 4091,14 2,76%
Имеем, b= 0,74 и a= 14,63. Уравнение линейной регрессии
Оценку значимости уравнения регрессии проведем с помощью F –критерия Фишера:
=65,86. Для m=1, n-m-1=5, =0,05 .
Так как, F> , то можно утверждать, что уравнение линейной регрессии значимо.
Проследим среднюю относительную ошибку:
=2,76%.
В среднем расчетные значения отличаются от фактических на 2,76%.
1.2. Для характеристики Y от Х построим степенную модель .
Для линеаризации модели произведем логарифмирование обеих частей уравнения
Таблица 1.4.
Расчетная таблица для степенной модели
Y X lgY lgX lgX^2 lgY^2 lgXlgY lgY рег Y-Y рег Еотн
1 50 50 1,699 1,699 2,886 2,886 2,8865 1,7 -1,179 2,36%
2 54 54 1,732 1,732 3,001 3,001 3,0012 1,7 -0,352 0,65%
3 60 60 1,778 1,778 3,162 3,162 3,1618 1,8 0,982 1,64%
4 62 62 1,792 1,792 3,213 3,213 3,2127 1,8 1,449 2,34%
5 70 70 1,845 1,845 3,404 3,404 3,4044 1,8 3,424 4,89%
6 66 74 1,820 1,869 3,494 3,311 3,4011 1,8 -3,531 5,35%
7 74 81 1,869 1,908 3,642 3,494 3,5674 1,9 -0,622 0,84%
сумма 12,536 12,625 22,803 22,471 22,635 18,07%
среднее 1,791 1,804 3,258 3,210 3,2336 2,58%
Имеем, b= 0,782 и lga= 0,381. Уравнение степенной регрессии
Вернемся к исходным переменным:
Определим индекс корреляции
=0,966.
Связь между показателем y и фактором х можно считать сильной.
Коэффициент детерминации . Вариация результата Y на 93% объясняется вариацией признака Х.
Оценку значимости уравнения регрессии проведем с помощью F –критерия Фишера:
=69,66. Для m=1, n-m-1=5, =0,05 .
Так как, F> , то есть основание утверждать, что уравнение степенной регрессии значимо.
Проследим среднюю относительную ошибку:
=2,58%.
В среднем расчетные значения отличаются от фактических на 2,58%.
1.3. Для характеристики Y от Х построим показательную модель .
Для линеаризации модели произведем логарифмирование обеих частей уравнения
Таблица 1.5.
Расчетная таблица для показательной модели
Y X lgY X^2 lgY^2 XlgY lgY рег Y-Y рег Еотн
1 50 50 1,699 2500 2,886 84,949 1,7 -1,935 3,87%
2 54 54 1,732 2916 3,001 93,549 1,7 -0,495 0,92%
3 60 60 1,778 3600 3,162 106,689 1,8 1,427 2,38%
4 62 62 1,792 3844 3,213 111,128 1,8 2,001 3,23%
5 70 70 1,845 4900 3,404 129,157 1,8 3,942 5,63%
6 66 74 1,820 5476 3,311 134,646 1,8 -3,314 5,02%
7 74 81 1,869 6561 3,494 151,408 1,9 -1,401 1,89%
сумма 12,536 29797 22,471 811,526 22,94%
среднее 1,791 4256,714 3,210 115,932 3,28%
Имеем, lgb= 0,005 и lga= 1,454. Уравнение показательной модели
Вернемся к исходным переменным:
Определим индекс корреляции
=0,955.
Связь между показателем y и фактором х можно считать тесной.
Коэффициент детерминации . Вариация результата Y на 91% объясняется вариацией признака Х.
Оценку значимости уравнения регрессии проведем с помощью F –критерия Фишера:
= 51,52. Для m=1, n-m-1=5, =0,05 .
Так как, F> , то есть основания утверждать, что уравнение показательной модели значимо.
Проследим среднюю относительную ошибку:
=3,28%.
В среднем расчетные значения отличаются от фактических на 6,33%.
1.4. Для характеристики Y от Х построим гиперболическую модель .
Для линеаризации модели произведем замену переменной:
Таблица 1.6.
Расчетная таблица для гиперболической модели
Y X 1/x (1/X)^2 Y^2 (1/X)Y Y рег Y-Y рег Еотн
1 50 50 0,020 0,000400 2500 1 50,0 0,048 0,10%
2 54 54 0,019 0,000343 2916 1 54,4 -0,434 0,80%
3 60 60 0,017 0,000278 3600 1 60,0 -0,035 0,06%
4 62 62 0,016 0,000260 3844 1 61,7 0,338 0,55%
5 70 70 0,014 0,000204 4900 1 67,2 2,762 3,95%
6 66 74 0,014 0,000183 4356 0,8919 69,6 -3,573 5,41%
7 74 81 0,012 0,000152 5476 0,9136 73,1 0,894 1,21%
сумма 451 0,111 0,001820 27592 6,8055 0,000 12,07%
среднее 64,43 0,016 0,000260 3941,714 0,9722 0,000 1,72%
Имеем, b= -3024,89 и a= 110,45. Уравнение гиперболической модели
Определим индекс корреляции
= 0,975.
Связь между показателем y и фактором х можно считать сильной.
Коэффициент детерминации . Вариация результата Y на 95% объясняется вариацией признака Х.
Оценку значимости уравнения регрессии проведем с помощью F –критерия Фишера:
= 96,24. Для m=1, n-m-1=5, =0,05 .
Так как, F> , то есть основания утверждать, что уравнение гиперболической модели значимо.
Проследим среднюю относительную ошибку:
=1,72%.
В среднем расчетные значения отличаются от фактических на 1,7%.
1.5. Для выбора лучшей модели построим сводную таблицу результатов.
Таблица 1.7.
Сводная таблица результатов
коэффициент детерминации F - критерий Фишера Индекс корреляции Средняя относительная ошибка
линейная 0,929 65,860 0,964 2,76%
степенная 0,933 69,658 0,966 2,58%
показательная 0,912 51,525 0,955 3,28%
гиперболическая 0,951 96,236 0,975 1,72%
Все модели имеют примерно одинаковые характеристики. Но лучше показатели у гиперболической модели, так как больше коэффициент детерминации и F - критерий Фишера. Показательную модель можно взять для расчета прогнозного значения.
1.6. Расчет прогнозного значения итогового признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.
=67,8.
1.7. Графическое отображение полученных результатов.
Рис.1.1. Прогноз лучшей модели.
Задача 2.
По десяти кредитным учреждениям получены данные, характеризующие зависимость объема прибыли (Y) от среднегодовой ставки по кредитам (Х1), ставки по депозитам (Х2) и размера внутри банковских расходов (Х3).
Требуется:
1. Осуществить выбор факторных признаков для построения двухфакторной регрессивной модели.
2. Рассчитать параметры модели.
3. Для характеристики модели определить:
- линейный коэффициент множественной корреляции,
- коэффициент детерминации;
- бета-, дельта- коэффициенты.
Дать их интерпретацию.
4. Осуществить оценку надежности уравнения регрессии.
5. Оценить с помощью t – критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
6. Построить точечный и интервальный прогнозы результирующего показателя.
7. Отразить результаты расчетов на графике.
Таблица 2.1.
Y 21 29 33 41 28 45 45 21 30 33
X1 43 44 61 66 43 50 54 59 52 62
X2 36 28 66 76 80 84 82 98 112 96
X3 40 44 28 52 50 64 70 68 78 90
Решение:
1. Осуществим выбор факторных признаков для построения двухфакторной регрессивной модели.
В таблице 2.2. приведены промежуточные результаты при вычислении коэффициента корреляции между Y и X1.
Таблица 2.2.
Расчетная таблица для коэффициента корреляции
Y X1 Y-Yср (Y-Yср)^2 X1-Xср (X1-Xср)^2 (X1-Xср)*(Y-Yср)
1 21 43 -11,6 134,56 -10,4 108,16 120,64
2 29 44 -3,6 12,96 -9,4 88,36 33,84
3 33 61 0,4 0,16 7,6 57,76 3,04
4 41 66 8,4 70,56 12,6 158,76 105,84
5 28 43 -4,6 21,16 -10,4 108,16 47,84
6 45 50 12,4 153,76 -3,4 11,56 -42,16
7 45 54 12,4 153,76 0,6 0,36 7,44
8 21 59 -11,6 134,56 5,6 31,36 -64,96
9 30 52 -2,6 6,76 -1,4 1,96 3,64
10 33 62 0,4 0,16 8,6 73,96 3,44
сумма 326 534 0 688,4 1E-14 640,4 218,6
среднее 32,6 53,4
Коэффициент корреляции вычисляем по формуле:
=0,329
Для вычисления таблицы корреляции используем функцию Excel – корреляция (таблица 2.3.).
Таблица 2.3.
Матрица коэффициентов парной корреляции
Y X1 X2 X3
Y 1
X1 0,33 1
X2 0,21 0,48 1
X3 0,20 0,27 0,75 1
Для двухфакторной модели выберем Х1 и Х2, т.к. они имеют наибольшие коэффициенты корреляции с зависимой переменной r(Y,X1)= 0,33 и r(Y,X2)= 0,21, Х3 имеет меньший коэффициент корреляции, что позволяет ее не выбрать.
2. Рассчитаем параметры модели.
Расчеты производим по формуле для параметров регрессивного уравнения . Таблица исходных данных 2.4 (для параметра а0 добавим столбец Х0).
Таблица 2.4.
Данные для расчета параметров регрессивного уравнения
Y Х0 X1 X2
21 1 43 36
29 1 44 28
33 1 61 66
41 1 66 76
28 1 43 80
45 1 50 84
45 1 54 82
21 1 59 98
30 1 52 112
33 1 62 96
Уравнение регрессии можно записать в виде: .
Для параметров регрессивного уравнения используем сервис Excel анализ данных – регрессия и получим те же результаты. А также данные в таблицах 2.5, 2.6, 2.7, 2.8.
Таблица 2.5.
Регрессионная статистика
Регрессионная статистика
Множественный R 0,335
R-квадрат 0,112
Нормированный R-квадрат -0,141
Стандартная ошибка 9,343
Наблюдения 10
Таблица 2.6.
Дисперсионный анализ
df SS MS F
Регрессия 2 77,397 38,699 0,443
Остаток 7 611,003 87,286
Итого 9 688,4
Таблица 2.7.
Коэффициенты Стандартная ошибка t-статистика
Y-пересечение 14,496 19,947 0,727
X1 0,305 0,422 0,723
X2 0,024 0,134 0,178
Таблица 2.8.
Вывод остатков
Наблюдение Предсказанное Y Остатки
1 28,47 -7,47
2 28,59 0,41
3 34,68 -1,68
4 36,45 4,55
5 29,53 -1,53
6 31,76 13,24
7 32,93 12,07
8 34,84 -13,84
9 33,04 -3,04
10 35,71 -2,71
Рис.2.1. График остатков
Проверку независимости проведем с помощью d – критерия Дарбина – Уотсона.
= 1150,0/ 611,0=1,9.
По таблице значений для n=15 dL=0,98, dU=1,54.
Так как d > dU, то гипотеза не отвергается.
Оценим с помощью t – критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
Значимость коэффициентов оценим с использованием t – критерия Стьюдента:
=
Значения t – статистик возьмем из таблицы 2.7:
=0,727
=0,723
=0,178
=2,306
Так как для коэффициентов < , то вывод о существенности коэффициентов сделать нельзя.
среднее дисперсия S2 среднее квадратическое отклонение S
Х1 53,4 64,04 8,00 0,50 39,54 115,80
Х2 75,8 629,96 25,10 0,06 84,70 152,56
Y 32,6 68,84 8,30
Коэффициент эластичности показывает, как меняется зависимая переменная при изменении фактора.
Бэта – коэффициенты показывает, на какую часть среднего квадратического отклонения меняется результирующая переменная при соответствующем изменении фактора.
Дельта коэффициенты показывают долю влияния в суммарном влиянии всех факторов.
Для расчета точечного прогноза Y строится прогнозные значения факторов. Так как в задаче не даны временные ряды, то в качестве прогнозных значений факторов возьмем Х1=58,7 и Х2=83,38. (эти значения на 10% выше средних).
Точечный прогноз Y = 34,41.
Длину доверительного интервала для интервальной оценки прогнозного значения Y рассчитываем по формуле:
при надежности р=95%
Получим u(1)= 7,600
Упреждение Y = 34,41
Нижняя граница доверительного интервала: 26,811.
Верхняя граница доверительного интервала: 42,010.
|