Главная      Учебники - Экономика     Лекции по экономической теории - часть 2

 

поиск по сайту            

 

 

 

 

 

 

 

 

 

содержание   ..  402  403  404   ..

 

 

Выполнение корреляционного и регрессионного анализа

Выполнение корреляционного и регрессионного анализа

Раздел I. Практическая часть

Задание 1

Перевезено грузов, тыс. тонн Расходы, млн, руб
Владимирская 594,6 258,3
Брянская 3178,9 656,5
Белгородская 523,8 824,4
Воронежская 2572,3 220,1
Ивановская 308,5 73,8
Костромская 580,5 82,7
Рязанская 203,7 65,4
Смоленская 389,3 86,6
Тульская 225,8 36,5
Ярославская 693,4 279,9
Теснота связи Значение коэффициента корреляции при наличии:
прямой связи обратной связи
Слабая 0,1 - 0,3 (-0,1) - (-0,3)
Умеренная 0,3 - 0,5 (-0,3) - (-0,5)
Заметная 0,5 - 0,7 (-0,5) - (-0,7)
Высокая 0,7 - 0,9 (-0,7) - (-0,9)
Весьма высокая 0,9 - 0,99 (-0,9) - (-0,99)
r = 0,116
r = 0,821
r = 0,578
r = 0,511
r = 0,455
r = 0,949
r = 0,824
Парный двухвыборочный t-тест для средних
r = 0,454
Переменная 1 Переменная 2
Среднее 927,08 258,42
Дисперсия 1101362,746 73524,47289
Наблюдения 10 10
Корреляция Пирсона 0,454062283
Гипотетическая разность средних 0
df 9
t-статистика 2, 208751921
P (T<=t) одностороннее 0,027278104
t критическое одностороннее 1,833112923
P (T<=t) двухстороннее 0,054556208
t критическое двухстороннее 2,262157158

Задание 2

2. По исходным данным выполнить регрессионный анализ:

2.1. Рассчитать параметры уравнения линейной парной регрессии;

Линейное уравнение парной регрессии имеет вид:

,

где - оценка условного математического ожидания y ;

b 0 , b 1 - эмпирические коэффициенты регрессии, подлежащие определению.

Эмпирические коэффициенты регрессии b 0 , b 1 будем определять с помощью инструмента Регрессия MS Excel.

Парный двухвыборочный t-тест для средних
r = 0,455
Переменная 1 Переменная 2
Среднее 696,0125 137,9125
Дисперсия 607399,8755 9534,678393
Наблюдения 8 8
Корреляция Пирсона 0,510547416
Гипотетическая разность средних 0
df 7
t-статистика 2,149664636
P (T<=t) одностороннее 0,034323806
t критическое одностороннее 1,894578604
P (T<=t) двухстороннее 0,068647613
t критическое двухстороннее 2,364624251
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,454062283
R-квадрат 0, 206172557
Нормированный R-квадрат 0,106944127
Стандартная ошибка 991,7552465
Наблюдения 10
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 2043636,965 2043636,965 2,078 0,187
Остаток 8 7868627,751 983578,469
Итого 9 9912264,716
Коэффициенты Стандартная ошибка
Y-пересечение 472,939 444,546
Переменная X 1 1,757 1,219

Таким образом, эмпирические коэффициенты регрессии соответственно равны b 0 = 472,94, b 1 = 1,76.

Тогда уравнение парной линейной регрессии, связывающей объемы перевозимых грузовыми автомобилями крупных и средних организаций автомобильного транспорта в 2006 году, y с величиной расходов на перевозку x , имеет вид:

2.2. Дать с помощью общего (среднего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом

Оценим тесноту статистической связи между расходами на перевозки, производимые грузовыми автомобилями крупных и средних организаций в 2006 году, x и их объемами y . Эта оценку производится с помощью коэффициента корреляции rxy .

Величина этого коэффициента рассчитана в п.1.2 и равна r = 0,454. Как говорилось выше, связь между переменными умеренная прямая.

Параметр R-квадрат представляет собой квадрат коэффициента корреляции rxy 2 и называется коэффициентом детерминации. Величина данного коэффициента характеризует долю дисперсии зависимой переменной y , объясненную регрессией (объясняющей переменной x ).

Соответственно величина 1 - rxy 2 характеризует долю дисперсии переменной y , вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных.

Таким образом, доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 1 - 0, 206 = 0,794 или 79,4%. Степень связи объясняющей переменной x с зависимой переменной y определяется при помощи коэффициента эластичности, который для модели парной линейной регрессии определяется в виде:

.

Тогда

Следовательно, при изменении величины расходов на грузоперевозки на 1% их объем изменяется на 0,49%.

2.3. Оценить качество уравнения с помощью средней ошибки аппроксимации.

Средняя ошибка аппроксимации оценивается по зависимости:

Для этого исходную таблицу дополняем двумя колонками, в которых определяем значения , рассчитанные с использованием зависимости и значения разности .

Перевезено грузов, тыс. тонн Расходы, млн, руб
Владимирская 594,6 258,3 926,869 0,559
Брянская 3178,9 656,5 1626,656 0,488
Белгородская 523,8 824,4 1921,720 2,669
Воронежская 2572,3 220,1 859,737 0,666
Ивановская 308,5 73,8 602,633 0,953
Костромская 580,5 82,7 618,274 0,065
Рязанская 203,7 65,4 587,871 1,886
Смоленская 389,3 86,6 625,128 0,606
Тульская 225,8 36,5 537,083 1,379
Ярославская 693,4 279,9 964,828 0,391
сумма = 9,662

Средняя ошибка аппроксимации составляет:

Практически полагают, что значение средней ошибки аппроксимации не должно превышать 12-15% для грубого приближения регрессии к реальной зависимости. В нашем случае ошибка чрезмерна велика.

Воспользуемся результатами исследования, проведенного в п.1, т. е исключим из рассматриваемой выборки данные по Брянской и Белгородской областям.

В этом случае уравнение парной регрессии примет вид:

.

Доля неучтенных в полученной эконометрической модели объясняющих переменных составит: 1 - 0,260 = 0,74 или 74%.

Коэффициент эластичности составит:

,

а средняя ошибка аппроксимации:

Исключение точек выброса из рассматриваемой выборки снизило ошибку аппроксимации, однако её значение превышает допустимое значение.

2.4. Оценить статистическую надежность результатов регрессионного моделирования с помощью критерия Стъюдента и F-критерия Фишера.

Проведем более строгую оценку статистической надежности моделирования с помощью F-критерия Фишера.

Для этого проверим нулевую гипотезу H 0 о статистической незначимости полученного уравнения регрессии по условию: если при заданном уровне значимости α = 0,05 теоретическое (расчетное) значение F-критерия (F ) больше его критического значения (FКРИТ ), то нулевая гипотеза отвергается и полученное уравнение регрессии принимается значимым.

Расчетное значение F , определенное с помощью инструмента Регрессия MS Excel, составило F = 2,078.

Критическое значение FКРИТ определим при помощи статистической функции FРАСПОБР. Входными параметрами функции является уровень значимости (вероятность) и число степеней свободы 1 и 2. Для модели парной регрессии число степеней свободы соответственно равно 1 (одна объясняющая переменная) и n - 2 = 10 - 2 = 8.

FКРИТ = 5,318.

Расчетное значение F = 2,078 меньше критического FКРИТ = 5,318, поэтому нулевая гипотеза H 0 о статистической незначимости уравнения регрессии принимается, что подтверждает вывод, сделанный в п.2.3.

При расчете критериев Фишера для сокращенной выборки (исключая данные по Брянской и Белгородской областям) получаем аналогичный результат.

F = 2,115< FКРИТ = 5,987.

2.5. Сделать итоговые выводы.

1. Уравнение парной линейной регрессии, связывающее объемы перевозимых грузовыми автомобилями крупных и средних организаций автомобильного транспорта в 2006 году, y с величиной расходов на перевозку x , имеет вид:

При этом доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет 79,4%, т.е. учтенными остаются лишь 20,6 % параметров.

Величина коэффициента эластичности говорит о том, что при изменении величины расходов на грузоперевозки на 1% их объем должен измениться на 0,49%.

Расчет средней ошибки аппроксимации (А = 96,62 %), а также анализ при помощи критерия Фишера показал, что полученное уравнение регрессии не соответствует реальной зависимости (в силу большой доли неучтенных в зависимости параметров).

2. Уравнение парной линейной регрессии для выборки исходных данных, исключающей данные по Брянской и Белгородской областям, которые по результатам выполнения задания 1 признаны точками выброса, имеет вид:

При этом доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет 74%.

Величина коэффициента эластичности говорит о том, что при изменении величины расходов на грузоперевозки на 1% их объем должен измениться на 0,81%.

Расчет средней ошибки аппроксимации (А = 56,25 %), а также анализ при помощи критерия Фишера показал, что полученное уравнение регрессии также не соответствует реальной зависимости (в силу большой доли неучтенных в зависимости параметров).

Результаты регрессионного моделирования не надежны.