Статистика


Онлайн всего: 1
Гостей: 1
Пользователей: 0

Форма входа

Поиск

Категории раздела

Диплом [327] Курсовая [699]
Реферат [397] Отчет [11]




Пт, 03.01.2025, 15:15
Приветствую Вас Гость | RSS
ДИПЛОМНИК т.8926-530-7902,strokdip@mail.ru Дипломные работы на заказ.
Главная | Регистрация | Вход
КАТАЛОГ ДИПЛОМНЫХ, КУРСОВЫХ РАБОТ


Главная » Каталог дипломов » бесплатно » Реферат [ Добавить материал ]

кор
Контрольная | 28.09.2014, 14:58

СКАЧАТЬ РАБОТУ БЕСПЛАТНО - 

1)    Рассчитайте корреляцию между,  экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Для выполнения работы рассмотрим социально-экономические данные по Приволжскому, Уральскому, Западносибирскому и Дальневосточному федеральным округам за 2008г:
Таблица 1. Статистические данные 39 наблюдения 5 показателей.
1. Рассчитаем корреляцию между представленными показателями 
    Ввод в действие квартир (единиц) на 1000 человек населения    Изменение численности населения (прирост за год; в процентах)    Реальные денежные доходы населения (в процентах к предыдущему году)    Число зарегистриро-ванных преступлений на 100 000 человек населения    Число малых предприятий (на конец года), тыс
Республика Башкортостан    6,9    0,1    112,3    1922    25,6
Республика Марий Эл    5,1    -0,4    110,6    3128    5,5
Республика Мордовия    4,6    -0,9    118,4    1269    4,3
Республика Татарстан    7,1    0,2    108,5    2156    27,2
Удмуртская Республика    3,7    -0,3    105,8    2936    16,8
Чувашская Республика    7,8    -0,3    110,2    1852    10,5
Пермский край    3,9    -0,4    100,7    3599    14,8
Кировская область    4,6    -0,9    120,2    1855    9,6
Нижегородская область     4,8    -0,6    108,2    2616    46,4
Оренбургская область    3,7    -0,4    115,4    2018    15,1
Пензенская область    5    -0,6    108,5    1611    9,6
Самарская область    5,2    -0,04    99,2    2833    39,3
Саратовская область    5    -0,4    109,6    1748    18,2
Ульяновская область    4,2    -0,6    107,2    1714    8,6
Курганская область    3,9    -0,8    113,3    2955    4
Свердловская область     4,6    -0,02    104    2773    39,2
Тюменская область    9,4    0,8    111,2    2761    21,4
Челябинская область    6,9    -0,1    116,1    2572    27,9
Республика Алтай    3,9    1    130,5    2945    1,8
Республика Бурятия    4,2    0,1    112,7    3494    5,7
Республика Тыва    2,1    0,7    117,9    2342    1,5
Республика Хакасия    3,8    0,2    118,7    2761    2,6
Алтайский край    3    -0,5    113,2    2452    21,8
Забайкальский край    3,3    -0,2    117,8    2788    3,3
Красноярский край    5,6    -0,02    110    2918    33,6
Иркутская область    3    -0,1    110,9    3496    17,7
Кемеровская область    5,4    -0,1    110    2433    19,3
Новосибирская область     7    0,2    109,4    3175    46,2
Омская область    6,9    -0,2    105,5    2138    16,6

 

СКАЧАТЬ РАБОТУ БЕСПЛАТНО - 

Томская область    7,2    0,3    100,3    3019    15,4
Республика Саха (Якутия)    4,4    -0,2    108,6    2182    4,2
Камчатский край    2,5    -0,6    104,9    1827    2,7
Приморский край    2    -0,4    104    3291    25,7
Хабаровский край     3    -0,1    95,1    3940    10,5
Амурская область    3,2    -0,6    111,5    2486    6,5
Магаданская область    1,6    -1,7    101    2624    1,5
Сахалинская область    3,9    -0,8    106,8    2659    3,3
Еврейская автономная область    3,5    -0,1    112    2580    0,8
Чукотский автономный округ    0,6    -1,5    105,2    1878    0,2

 

Таблица 2. Коэффициенты корреляции между показателями
    квартиры    рост нас    ден.  %    преступления    малых
Квартиры    1    0,478    0,037    0,466    -0,102
рост нас    0,478    1    0,298    0,247    0,329
ден.  %    0,037    0,298    1    -0,266    -0,258
преступления    0,466    0,247    -0,266    1    0,187
малых    -0,102    0,329    -0,258    0,187    1
Интерпретация полученных данных. Корреляционно показатели мало связанны между собой. Поэтому оставим только показатели, у которых коэффициенты корреляции больше 0,3.
Вывод. Для модели множественной регрессии выбираем в качестве объясняемой переменной ввод в действие квартир (единиц) на 1000 человек населения (квартиры), в качестве объясняющих переменных изменение численности населения (прирост за год; в процентах) (прирост) и число зарегистрированных преступлений на 100 000 человек населения (преступ). Остальные показатели в дальнейших моделях не используем.
2)    Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
Линейная множественная регрессия
Таблица 3. Коэффициенты корреляции между показателями, выбранными для построения модели
    Квартиры    прирост     преступления
Квартиры    1    0,478    0,466
прирост     0,478    1    0,247
преступления    0,466    0,247    1
2. Построим линейную множественную регрессию:
y = m1x1 + m2x2 + b
где в качестве объясняемой переменной y возьмем ввод в действие квартир (единиц) на 1000 человек населения;
объясняющие переменные выбраны в следующем порядке:
х1 - изменение численности населения (прирост за год; в процентах);
х2 - число зарегистрированных преступлений на 100 000 человек населения;
Таблица 3. Коэффициенты множественной линейной регрессии
m2    m1    b
-0,00088    1,97841    7,29061
y = 1,97841x1 -0,00088x2 +7,29061
 Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации   по формуле:
 = 0,303
Так как  , то рассчитываем скорректированный коэффициент детерминации:
 =0,265
После определения значения скорректированного коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику:
 = 6,48
Полученное фактическое значение сравниваем с критическим Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели. 
Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации:
 = 0,33
Так как значение   превышает 0,15 (15%), то модель не достаточно хорошо описывает фактические данные.
Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид:
H0 : b = 0(m1=0, m2=0)
H1 : b ≠ 0(m1≠ 0, m2≠ 0)
Для проверки этой гипотезы пользуются t-статистикой:  . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим  =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии. 
Таблица 5. t-статистики для коэффициентов множественной линейной регрессии

коэффициент    t-статистика    сравнение    вывод
b    5,9977    t (Y) > t кр    свободный член значим
m1    3,8902    |t (Х1)| > t кр    коэффициент перед Х1 значим
m2    -1,9715    |t (Х2)| < t кр    коэффициент перед Х2 не значим

Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента:
для b –  . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α.
Таблица 6. Доверительные интервалы  для коэффициентов множественной линейной регрессии

коэффициент    значение    доверительный интервал
b    7,291    4,825    9,756
m1    1,978    0,947    3,010
m2    -0,001    -0,002    0,000
Так как  по повторому коэффициенту линейной модели множественной регрессии в доверительный интервал попал 0, то можно сделать вывод о возможной не значимости второго коэффициента.
Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона:
DW= 1,430
Границы интервала – dL=1,35;    du=1,49
    Так как dL <DW< du, то невозможно с уверенностью сказать, является ли данная модель автокоррелированой.
Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова.
Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора х=|x1|+|x2|.
Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части.
Шаг 3. Для первой и третьей частей выборки строятся модели линейной множественной регрессии, т.е. для них вычисляются оценки параметров a0 и a1.
В результате получаются две модели парной регрессии (для каждой части общей выборки):
     Y1=ã01 + ã11x1 + ã21x2 +u1        
    Y3=ã03 + ã13x1 + ã23x2 +u3        
Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется.
Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3.
Где    ESS=Σ(ui2)=Σ(yi-ã0-ã1x1i-ã2x2i)2
Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3.
5.1.    Формируется случайная переменная GQ в виде:
5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3):
    Если    GQ       ≤ Fкр(Pдов,n1,n3)
    и        1/GQ ≤ Fкр(Pдов,n1,n3),
 то гипотеза о гомоскедастичности случайных возмущений принимается.

Делаем расчеты для нашей модели:
Fкр(0,05;14;14)= 2,48;    GQ= 1,773;          1/GQ= 0,564
Таким образом, гипотеза о гомоскедастичности случайных возмущений принимается.

Нелинейная множественная регрессия

Для нашей модели возьмем смешанную нелинейную модель й множественной регрессии:
 .
Для лианерезации этой модели сделаем следующие замены:
 
 ;  ;  .
Построим вспомогательную линейную множественную регрессию:
z = m1t1 + m2t2 + b
Таблица 7. Коэффициенты вспомогательной множественной линейной регрессии
m2    m1    b
4607,86    2,00    3,14
z = 2,00t1 + 4607,86t2 +3,14
Пересчитаем для нелинейной множественной регрессии: 
 
Оценка адекватности модели в целом осуществляется на основе расчета коэффициента детерминации   по формуле:
 = 0,296
Так как  , то рассчитываем скорректированный коэффициент детерминации:
 = 0,257
После определения значения коэффициента детерминации проанализируем его статистическую значимость. Статистическая значимость проверяется путем проверки гипотезы о равенстве коэффициента детерминации 0. Если гипотеза отвергается, то делается вывод о том, что коэффициент детерминации отличен от 0 и статистически значим. Для проверки используют F-статистику:
 = 7,58
Полученное фактическое значение сравниваем с критическим 
Fα; m; n-m-1= 3,23 так как оно больше критического, то нулевая гипотеза отвергается и делается вывод о статистической значимости коэффициента детерминации и существенности построенной модели. 
Для множественной регрессии оценка качества модели в целом также может осуществляться с использованием средней ошибки аппроксимации:
 = 0,3342

Так как значение   превышает 0,15 (15%), то модель не достаточно хорошо описывает фактические данные.
Оценка статистической значимости коэффициентов регрессии осуществляется путем проверки гипотезы о равенстве этого коэффициента 0. Для коэффициента b(m1, m2) такая гипотеза будет иметь вид:
H0 : b = 0(m1=0, m2=0)
H1 : b ≠ 0(m1≠ 0, m2≠ 0)
Для проверки этой гипотезы пользуются t-статистикой:  . Это соотношение имеет распределение Стьюдента с числом степеней свободы, равным (n – 2). Расчетное значение t сравнивают с критическим  =2,325, где α – уровень значимости. Если фактическое значение оказывается больше критического, то нулевая гипотеза отвергается, и делается вывод о статистической значимости коэффициента регрессии. 
Таблица 8. t-статистики для коэффициентов множественной степенной регрессии

коэффициент    t-статистика    сравнение    вывод
b    3,084    t (Y) > t кр    свободный член значим
m1    3,862    |t (Х1)| > t кр    коэффициент перед t1 значим
m2    1,868    |t (Х2)| < t кр    коэффициент перед t2 не значим

Интервальная оценка коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента:
для b –  . Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α.
Таблица 6. Доверительные интервалы  для коэффициентов множественной линейной регрессии

коэффициент    значение    доверительный интервал
b    3,136    1,074    5,199
m1    2,002    0,951    3,053
m2    4607,857    -393,755    9609,468
Так как  по повторому коэффициенту линейной модели множественной регрессии в доверительный интервал попал 0, то можно сделать вывод о возможной не значимости второго коэффициента.
Для проверки модели на автокорреляцию используем тест Дарбина-Уотсона:
DW= 1,397
Границы интервала – dL=1,35;    du=1,49
    Так как dL <DW< du, то невозможно с уверенностью сказать, является ли данная модель автокоррелированой.
Тест Готвальда-Квандта предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова.
Шаг 1. Имеющаяся выборка из n наблюдений сортируется по возрастанию значений регрессора t=|t1|+|t2|.
Шаг 2. Полученная в результате сортировки выборка делится на три примерно равные части.
Шаг 3. Для первой и третьей частей выборки строятся модели парной регрессии, т.е. для них вычисляются оценки параметров a0 и a1.
В результате получаются две модели парной регрессии (для каждой части общей выборки):
     z1=ã01 + ã11t1 + ã21t2 +u1        
    z3=ã03 + ã13t1 + ã23t2 +u3        
Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется.
Шаг 4. Для уравнений (9.1) и (9.2) вычисляются значения ESS1 и ESS3.
Где    ESS=Σ(ui2)=Σ(zi-ã0-ã1t1i-ã2t2i)2
Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3.
5.1.    Формируется случайная переменная GQ в виде:
5.2. Вычисленное значение GQ сравнивается с критическим значением Fкр(Pдов,n1,n3):
    Если    GQ       ≤ Fкр(Pдов,n1,n3)
    и        1/GQ ≤ Fкр(Pдов,n1,n3),
 то гипотеза о гомоскедастичности случайных возмущений принимается.

Делаем расчеты для нашей модели:
Fкр(0,05;14;14)= 2,48;    GQ= 2,539;          1/GQ= 0,394
Так как GQ       ≤ Fкр(Pдов,n1,n3) и 1/GQ ≤ Fкр(Pдов,n1,n3), то гипотеза о гомоскедастичности случайных возмущений принимается. Значит можно считать, что степенная множественная модель гомоскедастична.

Выводы:

1.    При выполнении данной работы изучено построение множественной линейной и нелинейной регрессий для ряда экономических данных:
y = 1,97841x1 -0,00088x2 +7,29061  и 
 , где
где в качестве объясняемой переменной y возят ввод в действие квартир (единиц) на 1000 человек населения;
объясняющие переменные выбраны в следующем порядке:
х1 - изменение численности населения (прирост за год; в процентах);
х2 - число зарегистрированных преступлений на 100 000 человек населения;

2.    Рассмотрены методы установления адекватности моделей. Рассчитаны коэффициенты детерминации  и средние ошибки аппроксимации. Обе модели показали надежную адекватность.
3.    Установлено, что второй коэффициент при переменных в регрессионных моделях не значим.   Найдены доверительнее интервалы для коэффициентов построенных моделей. 
4.    Обе модели изучены на автокорреляцию, для чего был  использован тест Дарбина-Уотсона. Обе модели оказались автокоррелированными.
5.    Обе модели изучены на отсутствие гетероскедастичности, для чего был  использован тест Готвальда-Квандта. Оказалось, что в линейной модели  гетероскедастичность отсутствует, а нелинейная модель гетероскедастична.
6.    В результате выполнения работы можно сделать вывод, что линейная модель обладает чуть лучшими свойствами, чем нелинейная. Поэтому можно выбрать линейную модель.

Добавил: Демьян |
Просмотров: 389
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Дипломник © 2025
магазин дипломов, диплом на заказ, заказ диплома, заказать дипломную работу, заказать дипломную работу mba