Главная              Рефераты - Математика

Автокорреляция и ее устранение - реферат

Введение


Автокорреляция обычно встречается в регрессионном анализе при использовании данных временных рядов. Естественно, что при создании модели разработчик не в состоянии учесть все факторы, влияющие на зависимую переменную. Воздействию этих неучтенных факторов подвергается случайный член u уравнения регрессии. Для того, чтобы выполнялось третье условие Гаусса-Маркова, то есть cov(uk,ui)=0, при k ≠ j , необходимо, чтобы скрытые в u факторы тоже были некоррелированные со своими значениями в предыдущих наблюдениях.

Естественно, что в большинстве реальных экономических задач условие некоррелированности ошибок невыполнимо.

Наличие автокорреляции затрудняет применение ряда классических методов анализа временных рядов. В моделях регрессии, описывающих зависимости между случайными значениями взаимосвязанных величин, она снижает эффективность применения метода наименьших квадратов. Поэтому выработаны и применяются специальные статистические приемы для ее выявления и элиминирования, а также для модификации самого метода наименьших квадратов.

Данная работа посвящена автокорреляции и ее устранению.

Целью реферата является осветить вопросы, касающиеся понятия автокорреляции.

Задачами реферата являются:

раскрыть определение автокорреляции;

рассмотреть автокорреляцию первого порядка;

рассмотреть способы устранения автокорреляции.


1 Автокорреляция и ее устранение


До сих пор предполагалось, что значение случайного члена u в любом наблюдении определяется независимо от его значений во всех других наблюдениях, то есть предполагалось, что удовлетворено третье условие Гаусса – Маркова.

Автокорреляция – нарушение третьего условия Гаусса – Маркова, которое заключается в том, что случайные члены регрессии в разных наблюдениях являются зависимыми: cov(uk,ui) №_ 0, при k №_ i.

Последствия автокорреляции в некоторой степени сходны с последствиями гетероскедастичности. Коэффициенты регрессии остаются несмещенными, но становятся неэффективными, и их стандартные ошибки оцениваются неправильно (чаще всего они смещаются вниз, то есть занижаются).

Автокорреляция обычно встречается только в регрессионном анализе при использовании данных временных рядов. Случайный член u в уравнении рег­рессии подвергается воздействию тех переменных, влияющих на зависимую переменную, которые не включены в уравнение регрессии. Если значение u в любом наблюдении должно быть независимым от его значения в предыдущем наблюдении, то и значение любой переменной, “скрытой” в u, должно быть некоррелированным с ее значением в предыдущем наблюдении.

Положительная автокорреляция – ситуация, когда случайный член регрессии в следующем наблюдении ожидается того же знака, что и случайный член в настоящем наблюдении. Соответствует случаю .

Постоянная направленность воздействия не включенных в уравнение пере­менных является наиболее частой причиной положительной автокорреляции — ее обычного для экономического анализа типа. Предположим, что оценива­ем уравнение спроса на мороженое по ежемесячным данным и что состояние погоды является единственным важным фактором, “скрытым” в u. Вероятно, будет несколько последовательных наблюдений, когда теплая погода спо­собствует увеличению спроса на мороженое u, таким образом, u положитель­но, и после этого — несколько последовательных наблюдений, когда ситуация складывается противоположным образом, после чего идет еще один ряд теп­лых месяцев.

Если доход постоянно возрастает со временем, схема наблюдений может быть такой, как показано в Приложении 1. При обозначении объема продаж мороженого через у и дохода через х имеет место трендовая зависимость, отражающая рост объема продаж: у = + х. Фактические наблюдения будут в основном сна­чала находиться выше линии регрессии, затем ниже ее и затем опять выше [7, C.36].

Изменения экономической конъюнктуры часто приводят к похожим резуль­татам, особенно наглядным в макроэкономическом анализе, и в литературе о циклах деловой активности есть много таких примеров.

Здесь важно отметить, в частности, что автокорреляция в целом представ­ляет тем более существенную проблему, чем меньше интервал между наблю­дениями. Очевидно, что чем больше этот интервал, тем менее правдоподоб­но, что при переходе от одного наблюдения к другому характер влияния неучтенных переменных будет сохраняться.

Если в примере с мороженым наблюдения проводятся не ежемесячно, а ежегодно, то автокорреляции, вероятно, вообще не будет. Маловероятно, что­бы совокупное влияние погодных условий в одном году корреллировало с ана­логичным влиянием в следующем году [5, C.29].

Автокорреляция может также быть отрицательной.

Отрицательная автокорреляция – ситуация, когда случайный член регрессии в следующем наблюдении ожидается знака, противоположного знаку случайного члена в настоящем наблюдении. Соответствует случаю .

Это озна­чает, что корреляция между последовательными значениями случайного члена отрицательна. В этом случае, скорее всего, за положительным значением в од­ном наблюдении идет отрицательное значение в следующем, и наоборот; ди­аграмма рассеяния при этом выглядит так, как показано в Приложении 2.

Здесь снова предполагается, что х со временем растет. Линия, соединяющая последовательные наблюдения друг с другом, будет пересекать линию, пока­зывающую зависимость между у и х, чаще, чем можно было ожидать, если бы значения случайного члена не зависели друг от друга.

В экономике отрицательная автокорреляция встречается относительно редко. Но иногда она появляется при преобразовании первоначальной спецификации модели в форму, подходящую для регрессионного анализа.

Автокорреляция первого порядка – ситуация, когда коррелируют случайные члены регрессии в последовательных наблюдениях: .

Авторегрессионная схема первого порядка – частный случай автокорреляции первого порядка, когда зависимость между последовательными случайными членами описывается формулой: uk+1= puk + ek+1, где p – константа, ek+1 – новый случайный член [2, C.55].

Это означает, что величина случайного члена в любом наблюдении равна его значению в предшествующем наблюдении умноженному на p, плюс новый . Данная схема называется авторегресси­онной, поскольку и определяется значениями этой же самой величины с за­паздыванием, и схемой первого порядка, потому что в этом простом случае мак­симальное запаздывание равно единице. Предполагается, что значение в каж­дом наблюдении не зависит от его значений во всех других наблюдениях. Если p положительно, то автокорреляция положительная; если p отрицательно, то автокорреляция отрицательная. Если p = 0, то автокорреляции нет и третье ус­ловие Гаусса—Маркова удовлетворяется.

Не располагая способом измерения значений случайного чле­на, невозможно оценить регрессию uk+1= puk + ek+1 непосредственно. Тем не менее можно оценивать p путем оценивания регрессионной зависимости еk от еk-1 с использованием обычного Метода наименьших квадратов. При этом оценка p равна .

Можно показать, что аппроксимируется выражением .

Критерий Дарбина – Уотсона – метод обнаружения автокорреляции первого порядка с помощью статистики Дарбина – Уотсона.

Статистика критерия Дарбина – Уотсона вычисляется по формуле:

, где ek – остатки в наблюдениях авторегрессионной схемы первого порядка uk+1 = сuk + ee k+1.

Значение DW-статистики будем обозначать также через d.

Критерий Дарбина – Уотсона обнаруживает только ярко выраженную автокорреляцию первого порядка и лишь при отсутствии лаговых переменных в регрессии.

Если автокорреляция отсутствует, то p = 0, и поэтому величина d должна быть близкой к двум. При наличии положительной автокорреляции величина будет меньше двух; при отрицательной автокорреляции она будет превышать 2. Так как p должно находиться между значениями 1 и – 1, то d должно лежать между 0 и 4 [8, C.46].

Критическое значение d при любом данном уровне значимости зависит от числа объясняющих переменных в уравнении регрес­сии и от количества наблюдений в выборке. К сожалению, оно также зависит oт конкретных значений, принимаемых объясняющими переменными. Поэто­му невозможно составить таблицу с указанием точных критических значений для всех возможных выборок, как это можно сделать для t- и F-статистик; но можно вычислить верхнюю и нижнюю границы для критического значения d. Для положительной автокорреляции они обычно обозначаются как dU и dL.

На схеме 1.1 представлена данная ситуация. Стрелка указывает критический уровень d, который обозначается как dкрит. Если знать зна­чение dкрит, то можно сравнить с ним значение d, рассчитанное для регрессии. Если бы оказалось, что d dкрит, то невозможно было бы отклонить ну­левую гипотезу об отсутствии автокорреляции. В случае d dкрит возможно отклонить нулевую гипотезу и сделать вывод о наличии положительной автокор­реляции.


Схема 1.1 Тест Дарбина – Уотсона на автокорреляцию (положительная автокорреляция)


Вместе с тем знаем только, что dкрит находится где-то между dL и dU. Это предполагает наличие трех возможностей.

1. Величина d меньше, чем dL. В этом случае она будет также мень­ше, чем dкрит, и поэтому делаем вывод о наличии положитель­ной автокорреляции.

2. Величина d больше, чем dU. В этом случае она также больше кри­тического уровня, и поэтому невозможно отклонить нулевую гипо­тезу.

3. Величина d находится между dL и dU. В этом случае она может быть больше или меньше критического уровня. Поскольку нельзя опреде­лить, которая из двух возможностей налицо, невозможно ни отклон­ить, ни принять нулевую гипотезу.

В случаях 1 и 2 тест Дарбина—Уотсона дает определенный ответ, но случай 3 относится к зоне невозможности принятия решения, и изменить создавше­еся положение нельзя [6, C.18].

Таким образом, зона неопределенности критерия Дарбина – Уотсона – промежуток значений статистики Дарбина–Уотсона, при попадании в который критерий не дает определенного ответа о наличии или отсутствии автокорреляции первого порядка.

Проверка на отрицательную автокорреляцию проводится по аналогичной схеме, причем зона, содержащая критический уровень, расположена симмет­рично справа от 2. Так как отрицательная автокорреляция встречается относи­тельно редко, предполагается, что при необходимости самостоятельно вычисляются гра­ницы зоны на основе соответствующих значений для положительной автокор­реляции при данном числе наблюдений и объясняющих переменных. Как показано на Схеме 1.2 величина (4 - dU) есть нижний предел, ниже которого признается отсутствие автокорреляции, а (4 - dL) — верх­ний предел, выше которого делается вывод о наличии отрицательной автокор­реляции.


Схема 1.2 Тест Дарбина – Уотсона на автокорреляцию (отрицательная автокорреляция)


2 Поправка Прайса–Уинстена и метод Кохрейна–Оркатта устранения автокорреляции


Наилучший, но не всегда возможный, способ устранения автокорреляции – установление ответственного за нее фактора и включение соответствующей объясняющей переменной в регрессию.

В других случаях процедура, которую следует принять для устранения автокорреляции, будет зависеть от ха­рактера зависимости между значениями случайного члена. В литературе наиболь­шее внимание уделяется авторегрессионной схеме первого по­рядка uk+1= puk + ek+1, так как она интуитивно правдоподобна, но для того, чтобы было целесообразным ее использование в более сложных моделях, оснований обыч­но не хватает. Вместе с тем если наблюдения проводятся ежеквартально или ежемесячно, могут оказаться более подходящими другие модели.

Если бы уравнение uk+1= puk + ek+1 было правильной спецификацией для измерения величины случайного члена, то возможно было бы полностью устранить автокорре­ляцию, если бы знали величину p. Это будет продемонстрировано на примере уравнения регрессии, включающего только одну объясняющую переменную, од­нако при большем их числе действует тот же принцип [9, C.91].

Предположим, что истинная модель задается выражением ,

так что наблюдения t и t - 1 формируются как .

Теперь вычтем из обеих частей уравнения умноженное на p соотноше­ние и получим: .

Обозначим и .

Тогда формулу мож­но переписать как

.

Вместе с тем из уравнения uk+1= puk + ek+1 имеем . Таким образом, фор­мула принимает вид:

Если p известно, тогда можно вычислить величины , , и (последняя одинакова для всех наблюдений) для наблюдений, включающих от 2 до Т исходных данных. Если теперь оценить регрессию между , , и (за­метим, что в уравнение не должна включаться постоянная), то будут получены оценки и , не связанные с проблемой автокорреляции, поскольку, согласно предположению, значения е не зависят друг от друга.

Остается небольшая проблема. Если в выборке нет данных, пред­шествующих первому наблюдению, то невозможно вычислить , и по­теряется первое наблюдение. Число степеней свободы уменьшается на единицу, и это вызовет потерю эффективности, которая может в небольших выборках пе­ревесить повышение эффективности от устранения автокорреляции [4, C.72].

Эту проблему можно довольно легко обойти, пользуясь так поправкой Прайса – Уинстена.

Поправка Прайса–Уинстена – метод спасения первого наблюдения в автокорреляционной схеме первого порядка.

Случайный член , согласно определению, не зависит от значения и в любом предшествующем на­блюдении. В частности, все величины не зависят от u1. Следовательно, если при устранении автокорреляции все другие наблюдения преобразуются, то не требуется преобразовывать первое наблюдение. Можно сохранить его, включив в новую схему, полагая, что

Таким способом возможно спасти первое наблюдение, но здесь есть неболь­шая проблема, которую требуется решить. Если p велико, то первое наблюде­ние будет оказывать непропорционально большое воздействие на оценки, ис­численные по уравнению регрессии. Чтобы нейтрализовать этот эффект, умень­шим вес данного наблюдения умножением его на величину , полагая и

Конечно, на практике величина р неизвестна, его оценка получается одновременно с оценками и . Имеется несколько стандартных способов такого оценивания, например, метод Кокрана - Оркатта.

Метод Кокрана–Оркатта – компьютерный итерационный метод устранения автокорреляции первого порядка.

Метод Кокрана–Оркатта с поправкой Прайса – Уинстена итерационно оценивает a, b1, b2, .. bm и коэффициент r в авторегрессионной схеме, пока разница между результатами итераций не станет очень малой. Реализуется только на компьютере.

Метод Кокрана – Оркатта включает следующие этапы.

1. Оценивается регрессия с исходными непреобразованными дан­ными.

2. Вычисляются остатки.

3. Оценивается регрессионная зависимость еt от еt-1, соответствующая формуле uk+1= puk + ek+1, и коэффициент при еt-1, представляет собой оценку p .

4. С этой оценкой р уравнение преобразуется в , оценива­ние которого позволяет получить пересмотренные оценки и .

5. Повторно вычисляются остатки, и процесс возвращается к этапу.


Заключение


При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.

Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

По знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.

Последовательность коэффициентов автокорреляции уровней первого, второго и других порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, то есть при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Наилучший, но не всегда возможный, способ устранения автокорреляции – установление ответственного за нее фактора и включение соответствующей объясняющей переменной в регрессию.


Глоссарий


№ п/п Новое понятие Содержание
1 2 3
1 Автокорреляция нарушение третьего условия Гаусса – Маркова, которое заключается в том, что случайные члены регрессии в разных наблюдениях являются зависимыми: cov(uk,ui) №_ 0, при k №_ i.
2 Автокорреляция первого порядка

ситуация, когда коррелируют случайные члены регрессии в последовательных наблюдениях: .

3 Авторегрессионная схема первого порядка частный случай автокорреляции первого порядка, когда зависимость между последовательными случайными членами описывается формулой: uk+1= puk + ek+1, где p – константа, ek+1 – новый случайный член.
4 Зона неопределенности критерия Дарбина – Уотсона промежуток значений статистики Дарбина–Уотсона, при попадании в который критерий не дает определенного ответа о наличии или отсутствии автокорреляции первого порядка.
5 Критерий Дарбина – Уотсона метод обнаружения автокорреляции первого порядка с помощью статистики Дарбина – Уотсона.
6 Лаг запаздывание, экономический показатель, характеризующий временной интервал между двумя взаимосвязанными экономическими явлениями, одно из которых является причиной, а второе - следствием.
7 Метод Кокрана–Оркатта компьютерный итерационный метод устранения автокорреляции первого порядка.
8 Отрицательная автокорреляция ситуация, когда случайный член регрессии в следующем наблюдении ожидается знака, противоположного знаку случайного члена в настоящем наблюдении.
9 Положительная автокорреляция ситуация, когда случайный член регрессии в следующем наблюдении ожидается того же знака, что и случайный член в настоящем наблюдении.
10 Поправка Прайса–Уинстена