3.3. Коррелограмма и идентификация лаговых переменных в уравнениях AR и ARMA
При практическом построении модели ARMA(p,q) наиболее трудным является определение параметров p и q, то есть определение оптимального количества лагов. При этом инструментами для нахождения соответствующих лаговых переменных являются автокорреляционная функция и частная автокорреляционная функция, о которых мы расскажем ниже.
Программа EViews позволяет довольно быстро найти оптимальные параметры p и q для модели ARMA. Для этого используется коррелограмма зависимости между различными лагами временного ряда с ежемесячными курсами американского доллара к российскому рублю.
Алгоритм действий № 5 «Как построить коррелограмму в EViews»
Шаг 1. Выбор основных опций для построения коррелограммы
С этой целью загрузим в EViews ежемесячные данные по курс доллара (столбец с данными обозначим как USDOLLAR) в соответствии с алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews».
Далее строим коррелограмму, тем более что в EViews это сделать довольно просто. С этой целью в Workfile (рабочем файле) данной программы открываем файл USDOLLAR. После чего в файле USDOLLAR нам необходимо выбрать опции View/Correlogram, а в появившемся окне (см. рис. 3.1) Correlogram Specification (спецификация коррелограммы) оставить заданные по умолчанию опцию Level (исходный уровень) и опцию LAGS TO INCLUDE (максимальную величину лага, включенного в коррелограмму). В результате у нас получится коррелограмма исходных уровней (фактических значений курса доллара) временного ряда USDOLLAR с величиной лага от 1 до 36.
Шаг 2. Дополнительные возможности, которые можно использовать для построения коррелограммы
В том случае, если бы мы выбрали, например, опцию 1st difference (разница исходных уровней первого порядка) или 2nd difference (разница исходных уровней второго порядка), то тогда бы была построена коррелограмма не исходных уровней временного ряда, а соответственно, их первых и вторых разностей. Например, исходный уровень для курса доллара по состоянию на апрель 2010 г. был равен 29,2886 рублям. В то время как разница исходных уровней первого порядка на эту же дату оказалась равна -0,0752 рубля (то есть по сравнению с прошлым месяцем курс доллара снизился на 7,52 коп.), а разница исходных уровней второго порядка составила 0,5094 рубля (то есть падение курса доллара по сравнению с предыдущим месяцем уменьшилось на 50,94 коп.).
Рис. 3.1. Использование опций Level и Lags to include для построения кореллограммы
В полученной коррелограмме (см. табл. 3.1) можно увидеть, как меняется коэффициенты автокорреляции (Autocorrelation или АС) и частной автокорреляции (Partial Correlation или РАС) в зависимости от изменения величины лага. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Так, коэффициент автокорреляции уровней первого порядка измеряет корреляционную зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-1, то есть в нашем случае измеряется коэффициент автокорреляции при лаге в один месяц. В свою очередь, коэффициент автокорреляции уровней второго порядка измеряет зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-2, то есть при лаге в два месяца. И так далее, вплоть до коэффициента автокорреляции уровней 36 порядка, измеряющего зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-36, то есть с лагом в 36 месяцев.
При этом коэффициент автокорреляции уровней k-ого (то есть первого, второго… тридцать шестого) порядка находится в EViews по формуле (3.7):
где n – количество наблюдений во временном ряде; k – величина лага; Yt – динамика курса доллара временного ряда t;Y t-k – динамика курса доллара временного ряда t-k; Y – с черточкой сверху средняя для всей выборки.
Следует заметить, что коэффициент автокорреляции, рассчитываемый в EViews, несколько отличается от обычно вычисляемого коэффициента автокорреляции. Дело в том, что в EViews с целью упрощения вычислений в качестве Y ‑ взята средняя для всей выборки, в то время как обычно для рядов Y t и Y t – k берутся свои средние.
Частной автокорреляционной функцией называют серию частных коэффициентов
автокорреляции г, измеряющих связь между текущим лагом временного ряда Y t и предыдущими лагами временного ряда Y t-1 , Y t – 2 …., Y t– k – 1 с устранением влияния других промежуточных временных лагов. Вполне естественно, что при нулевом лаге коэффициент частной корреляции ρ0 = 1, а при лаге k = 1 ρ1 = r 1 , т. е. коэффициент частной корреляции равен коэффициенту автокорреляции.
Для лага k больше 1 EViews рекурсивно вычисляет частную автокорреляцию по следующей формуле (3.8):
где r k – коэффициент автокорреляции для лага k.
Этот алгоритм вычисления коэффициента частной корреляции, предложенный Боксом и
Дженкинсом в 1976 г., представляет собой аппроксимацию. Чтобы найти его более точную оценку, следует решить следующее уравнение регрессии (3.9), с помощью которого мы найдем коэффициент частной корреляции ρ k для лага k:
где е t – остатки.
Судя по полученной коррелограмме (см. табл. 3.1), уровень автокорреляции (AC) между исходными уровнями временного ряда USDOLLAR, постоянно убывает, начиная с первого лага. В свою очередь, уровень частной корреляции (PAC) резко снижается уже после первого лага, а после второго лага осциллирующим образом стремится к нулю (то есть колеблется вокруг нуля).
Таблица 3.1 «Коррелограмма исходных уровней временного ряда USDOLLAR с величиной лага от 1 до 36»
В том случае, когда мы хотим построить модель авторегрессионного процесса AR(p), то для определения оптимального числа p мы должны использовать частную автокорреляционную функцию. При этом следует исходить из следующего критерия: оптимальное число p в уравнении авторегрессии должно быть меньше лага, в котором частная автокорреляционная функция начинает стремиться к нулю. Судя по коррелограмме, помещенной в таблице 3.1, коэффициент частной автокорреляции для лага один месяц (или лага первого порядка) равен 0.990, а для лага два месяца (или лага второго порядка) =-0.250. Однако, для третьего порядка коэффициент частной автокорреляции равен-0,014, причем, начиная с этого лага величина данного коэффициента колеблется вокруг нулевого уровня. Следовательно, можно сделать вывод, что для прогнозирования курса доллара с помощью модели авторегрессии необходимо использовать модель AR(2), которая у нас примет следующий вид (3.10):
В свою очередь, при идентификации модели ARMA(p,q) в качестве лага p выбирается лаг, после которого начинает убывать частная автокорреляционная функция, а в качестве лага q выбирается лаг, после которого начинает убывать автокорреляционная функция. Исходя из таблицы 3.1, легко прийти к выводу, что коэффициент автокорреляции начинает убывать уже с лага второго порядка. Аналогичный вывод можно сделать и относительно коэффициент частной автокорреляции. Поэтому для прогнозирования курса доллара с помощью модели авторегрессии со скользящими средними в остатках необходимо использовать модель ARMA(1,1), которая у нас примет следующий вид (3.11):
Две последних столбца в таблице 3.1 показывают соответственно Q-статистику Люнга-Бокса, (Q-Stat) и ее значимость (Prob) для каждого лага. Следует иметь в виду, что Q-статистика для лага k является тестовой статистикой при нулевой гипотезе об отсутствии автокорреляции между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-k.
При этом Q-статистика Люнга-Бокса для лага k-го порядка находится по следующей формуле (3.12):
Следует иметь в виду, что в том случае, когда в таблице 3.1 значимость (Prob) Q-статистики будет больше 0,05, то нулевую гипотезу об отсутствие автокорреляции между уровнями ряда с лагом k-го порядка нельзя считать опровергнутой с 95 % уровнем надежности. Если значимость Q-статистики будет больше 0,01, но меньше 0,05, то нулевую гипотезу об отсутствие автокорреляции между уровнями ряда с лагом k-го порядка нельзя считать опровергнутой с 99 % уровнем надежности. Судя по коррелограмме исходных уровней временного ряда USDOLLAR (см. табл. 3.1), значимость Q-статистики для всех 36 лагов равна нулю, поэтому нулевая гипотеза об отсутствии автокорреляции в остатках отклоняется для всех лагов.