кор - Реферат - бесплатно - КАТАЛОГ ДИПЛОМНЫХ, КУРСОВЫХ РАБОТ

Статистика

Онлайн всего: 1

Гостей: 1

Пользователей: 0

Форма входа

Поиск

Категории раздела

Диплом [327]	Курсовая [699]
Реферат [397]	Отчет [11]

	Пт, 03.01.2025, 15:15
	Приветствую Вас Гость \| RSS
	ДИПЛОМНИК т.8926-530-7902,strokdip@mail.ru Дипломные работы на заказ.
	Главная \| Регистрация \| Вход

КАТАЛОГ ДИПЛОМНЫХ, КУРСОВЫХ РАБОТ

Главная » Каталог дипломов » бесплатно » Реферат

[ Добавить материал ]

кор

Контрольная \|	28.09.2014, 14:58
СКАЧАТЬ РАБОТУ БЕСПЛАТНО - 1) Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные. Для выполнения работы рассмотрим социально-экономические данные по Приволжскому, Уральскому, Западносибирскому и Дальневосточному федеральным округам за 2008г: Таблица 1. Статистические данные 39 наблюдения 5 показателей. 1. Рассчитаем корреляцию между представленными показателями Ввод в действие квартир (единиц) на 1000 человек населения Изменение численности населения (прирост за год; в процентах) Реальные денежные доходы населения (в процентах к предыдущему году) Число зарегистриро-ванных преступлений на 100 000 человек населения Число малых предприятий (на конец года), тыс Республика Башкортостан 6,9 0,1 112,3 1922 25,6 Республика Марий Эл 5,1 -0,4 110,6 3128 5,5 Республика Мордовия 4,6 -0,9 118,4 1269 4,3 Республика Татарстан 7,1 0,2 108,5 2156 27,2 Удмуртская Республика 3,7 -0,3 105,8 2936 16,8 Чувашская Республика 7,8 -0,3 110,2 1852 10,5 Пермский край 3,9 -0,4 100,7 3599 14,8 Кировская область 4,6 -0,9 120,2 1855 9,6 Нижегородская область 4,8 -0,6 108,2 2616 46,4 Оренбургская область 3,7 -0,4 115,4 2018 15,1 Пензенская область 5 -0,6 108,5 1611 9,6 Самарская область 5,2 -0,04 99,2 2833 39,3 Саратовская область 5 -0,4 109,6 1748 18,2 Ульяновская область 4,2 -0,6 107,2 1714 8,6 Курганская область 3,9 -0,8 113,3 2955 4 Свердловская область 4,6 -0,02 104 2773 39,2 Тюменская область 9,4 0,8 111,2 2761 21,4 Челябинская область 6,9 -0,1 116,1 2572 27,9 Республика Алтай 3,9 1 130,5 2945 1,8 Республика Бурятия 4,2 0,1 112,7 3494 5,7 Республика Тыва 2,1 0,7 117,9 2342 1,5 Республика Хакасия 3,8 0,2 118,7 2761 2,6 Алтайский край 3 -0,5 113,2 2452 21,8 Забайкальский край 3,3 -0,2 117,8 2788 3,3 Красноярский край 5,6 -0,02 110 2918 33,6 Иркутская область 3 -0,1 110,9 3496 17,7 Кемеровская область 5,4 -0,1 110 2433 19,3 Новосибирская область 7 0,2 109,4 3175 46,2 Омская область 6,9 -0,2 105,5 2138 16,6
СКАЧАТЬ РАБОТУ БЕСПЛАТНО - Томская область 7,2 0,3 100,3 3019 15,4 Республика Саха (Якутия) 4,4 -0,2 108,6 2182 4,2 Камчатский край 2,5 -0,6 104,9 1827 2,7 Приморский край 2 -0,4 104 3291 25,7 Хабаровский край 3 -0,1 95,1 3940 10,5 Амурская область 3,2 -0,6 111,5 2486 6,5 Магаданская область 1,6 -1,7 101 2624 1,5 Сахалинская область 3,9 -0,8 106,8 2659 3,3 Еврейская автономная область 3,5 -0,1 112 2580 0,8 Чукотский автономный округ 0,6 -1,5 105,2 1878 0,2 Таблица 2. Коэффициенты корреляции между показателями квартиры рост нас ден. % преступления малых Квартиры 1 0,478 0,037 0,466 -0,102 рост нас 0,478 1 0,298 0,247 0,329 ден. % 0,037 0,298 1 -0,266 -0,258 преступления 0,466 0,247 -0,266 1 0,187 малых -0,102 0,329 -0,258 0,187 1 Интерпретация полученных данных. Корреляционно показатели мало связанны между собой. Поэтому оставим только показатели, у которых коэффициенты корреляции больше 0,3. Вывод. Для модели множественной регрессии выбираем в качестве объясняемой переменной ввод в действие квартир (единиц) на 1000 человек населения (квартиры), в качестве объясняющих переменных изменение численности населения (прирост за год; в процентах) (прирост) и число зарегистрированных преступлений на 100 000 человек населения (преступ). Остальные показатели в дальнейших моделях не используем. 2) Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д. Линейная множественная регрессия Таблица 3. Коэффициенты корреляции между показателями, выбранными для построения модели Квартиры прирост преступления Квартиры 1 0,478 0,466 прирост 0,478 1 0,247 преступления 0,466 0,247 1 2. Построим линейную множественную регрессию: y = m1x1 + m2x2 + b где в качестве объясняемой переменной y возьмем ввод в действие квартир (единиц) на 1000 человек населения; объясняющие переменные выбраны в следующем порядке: х1 - изменение численности населения (прирост за год; в процентах); х2 - число зарегистрированных преступлений на 100 000 человек населения; Таблица 3. Коэффициенты множественной линейной регрессии m2 m1 b -0,00088 1,97841 7,29061 y = 1,97841x1 -0,00088x2 +7,29061 Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации по формуле: = 0,303 Так как , то рассчитываем скорректированный коэффициент детерминации: =0,265 После определения значения скорректированного коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику: = 6,48 Полученное фактическое значение сравниваем с критическим Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели. Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации: = 0,33 Так как значение превышает 0,15 (15%), то модель не достаточно хорошо описывает фактические данные. Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид: H0 : b = 0(m1=0, m2=0) H1 : b ≠ 0(m1≠ 0, m2≠ 0) Для проверки этой гипотезы пользуются t-статистикой: . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии. Таблица 5. t-статистики для коэффициентов множественной линейной регрессии коэффициент t-статистика сравнение вывод b 5,9977 t (Y) > t кр свободный член значим m1 3,8902 \|t (Х1)\| > t кр коэффициент перед Х1 значим m2 -1,9715 \|t (Х2)\| < t кр коэффициент перед Х2 не значим Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента: для b – . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α. Таблица 6. Доверительные интервалы для коэффициентов множественной линейной регрессии коэффициент значение доверительный интервал b 7,291 4,825 9,756 m1 1,978 0,947 3,010 m2 -0,001 -0,002 0,000 Так как по повторому коэффициенту линейной модели множественной регрессии в доверительный интервал попал 0, то можно сделать вывод о возможной не значимости второго коэффициента. Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона: DW= 1,430 Границы интервала – dL=1,35; du=1,49 Так как dL <DW< du, то невозможно с уверенностью сказать, является ли данная модель автокоррелированой. Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова. Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора х=\|x1\|+\|x2\|. Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части. Шаг 3. Для первой и третьей частей выборки строятся модели линейной множественной регрессии, т.е. для них вычисляются оценки параметров a0 и a1. В результате получаются две модели парной регрессии (для каждой части общей выборки): Y1=ã01 + ã11x1 + ã21x2 +u1 Y3=ã03 + ã13x1 + ã23x2 +u3 Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется. Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3. Где ESS=Σ(ui2)=Σ(yi-ã0-ã1x1i-ã2x2i)2 Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3. 5.1. Формируется случайная переменная GQ в виде: 5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3): Если GQ ≤ Fкр(Pдов,n1,n3) и 1/GQ ≤ Fкр(Pдов,n1,n3), то гипотеза о гомоскедастичности случайных возмущений принимается. Делаем расчеты для нашей модели: Fкр(0,05;14;14)= 2,48; GQ= 1,773; 1/GQ= 0,564 Таким образом, гипотеза о гомоскедастичности случайных возмущений принимается. Нелинейная множественная регрессия Для нашей модели возьмем смешанную нелинейную модель й множественной регрессии: . Для лианерезации этой модели сделаем следующие замены: ; ; . Построим вспомогательную линейную множественную регрессию: z = m1t1 + m2t2 + b Таблица 7. Коэффициенты вспомогательной множественной линейной регрессии m2 m1 b 4607,86 2,00 3,14 z = 2,00t1 + 4607,86t2 +3,14 Пересчитаем для нелинейной множественной регрессии: Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации по формуле: = 0,296 Так как , то рассчитываем скорректированный коэффициент детерминации: = 0,257 После определения значения коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику: = 7,58 Полученное фактическое значение сравниваем с критическим Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели. Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации: = 0,3342 Так как значение превышает 0,15 (15%), то модель не достаточно хорошо описывает фактические данные. Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид: H0 : b = 0(m1=0, m2=0) H1 : b ≠ 0(m1≠ 0, m2≠ 0) Для проверки этой гипотезы пользуются t-статистикой: . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии. Таблица 8. t-статистики для коэффициентов множественной степенной регрессии коэффициент t-статистика сравнение вывод b 3,084 t (Y) > t кр свободный член значим m1 3,862 \|t (Х1)\| > t кр коэффициент перед t1 значим m2 1,868 \|t (Х2)\| < t кр коэффициент перед t2 не значим Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента: для b – . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α. Таблица 6. Доверительные интервалы для коэффициентов множественной линейной регрессии коэффициент значение доверительный интервал b 3,136 1,074 5,199 m1 2,002 0,951 3,053 m2 4607,857 -393,755 9609,468 Так как по повторому коэффициенту линейной модели множественной регрессии в доверительный интервал попал 0, то можно сделать вывод о возможной не значимости второго коэффициента. Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона: DW= 1,397 Границы интервала – dL=1,35; du=1,49 Так как dL <DW< du, то невозможно с уверенностью сказать, является ли данная модель автокоррелированой. Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова. Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора t=\|t1\|+\|t2\|. Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части. Шаг 3. Для первой и третьей частей выборки строятся модели парной регрессии, т.е. для них вычисляются оценки параметров a0 и a1. В результате получаются две модели парной регрессии (для каждой части общей выборки): z1=ã01 + ã11t1 + ã21t2 +u1 z3=ã03 + ã13t1 + ã23t2 +u3 Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется. Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3. Где ESS=Σ(ui2)=Σ(zi-ã0-ã1t1i-ã2t2i)2 Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3. 5.1. Формируется случайная переменная GQ в виде: 5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3): Если GQ ≤ Fкр(Pдов,n1,n3) и 1/GQ ≤ Fкр(Pдов,n1,n3), то гипотеза о гомоскедастичности случайных возмущений принимается. Делаем расчеты для нашей модели: Fкр(0,05;14;14)= 2,48; GQ= 2,539; 1/GQ= 0,394 Так как GQ ≤ Fкр(Pдов,n1,n3) и 1/GQ ≤ Fкр(Pдов,n1,n3), то гипотеза о гомоскедастичности случайных возмущений принимается. Значит можно считать, что степенная множественная модель гомоскедастична. Выводы: 1. При выполнении данной работы изучено построение множественной линейной и нелинейной регрессий для ряда экономических данных: y = 1,97841x1 -0,00088x2 +7,29061 и , где где в качестве объясняемой переменной y возят ввод в действие квартир (единиц) на 1000 человек населения; объясняющие переменные выбраны в следующем порядке: х1 - изменение численности населения (прирост за год; в процентах); х2 - число зарегистрированных преступлений на 100 000 человек населения; 2. Рассмотрены методы установления адекватности моделей. Рассчитаны коэффициенты детерминации и средние ошибки аппроксимации. Обе модели показали надежную адекватность. 3. Установлено, что второй коэффициент при переменных в регрессионных моделях не значим. Найдены доверительнее интервалы для коэффициентов построенных моделей. 4. Обе модели изучены на автокорреляцию, для чего был использован тест Дарбина-Уотсона. Обе модели оказались автокоррелированными. 5. Обе модели изучены на отсутствие гетероскедастичности, для чего был использован тест Готвальда-Квандта. Оказалось, что в линейной модели гетероскедастичность отсутствует, а нелинейная модель гетероскедастична. 6. В результате выполнения работы можно сделать вывод, что линейная модель обладает чуть лучшими свойствами, чем нелинейная. Поэтому можно выбрать линейную модель.
Добавил: Демьян \|
Просмотров: 389

Всего комментариев: 0

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

магазин дипломов, диплом на заказ, заказ диплома, заказать дипломную работу, заказать дипломную работу mba

Хостинг от uCoz