Глава 2.
Метод наименьших квадратов и решение уравнения регрессии в Excel
2.1. Характеристика метода наименьших квадратов и его применение при прогнозировании курса доллара
Как мы выяснили в главе 1, динамика курса валют представляет собой временной ряд, имеющий не только тренд, но и случайную компоненту, поэтому в качестве метода оценки параметров прогностической модели, как правило, используется регрессионный анализ. Как известно, задачей регрессионного анализа является определение аналитического выражения (математической формулы), аппроксимирующего связь между зависимой переменной Y (ее называют также результативным признаком) и независимыми (их называют также факторными) переменными X1, X2…Xn. При этом форма связи результативного признака Y с факторами X1, X2…Xn, либо с одним фактором X, получила название уравнения регрессии. В качестве метода аппроксимации (приближения) в уравнении регрессии используется метод наименьших квадратов (МНК), который минимизирует сумму квадратов отклонений фактических значений Y от его предсказываемых значений, рассчитанных по определенной математической формуле. Причем, решение уравнения регрессии относительно интересующих нас переменных у (курс доллара) и х (время или порядковый номер месяца), по сути, заключается в подборе прямой линии к совокупности данных, состоящих из пар данных, характеризующих динамику курса доллара и соответствующие порядковые номера месяцев. При этом линию, которая лучше всего подойдет к этим данным, выбирают так, чтобы сумма квадратов значений вертикальных отклонений зависимой переменной (фактического курса доллара) от линии, рассчитанной по уравнению регрессии (предсказанный курс доллара), была минимальной.
Математические подробности оценки параметров уравнения регрессии методом наименьших квадратов
В самом общем виде формулу МНК можно представить следующим образом (2.1):
где Yt и Yрасч. – фактические и расчетные значения зависимой (результативной) переменной для различных моментов времени;
– минимальная сумма квадратов отклонений (остатков) фактических значений Y от его расчетных (предсказываемых) значений.
Поскольку Yрасч. =a +bX (где а – свободный член уравнения регрессии, а b – коэффициент регрессии), то уравнение (2.1) примет следующий вид (2.1.1):
Для отыскания параметров a и b, при которых функция f(a,b) принимает минимальное значение, необходимо найти частные производные по каждому из параметров этой функции a и b и приравнять их нулю. Если минимальную сумму квадратов отклонений (остатков) e2 обозначить через S, то в результате мы получим систему нормальных уравнений МНК для прямой (2.1.2):
Преобразовав систему уравнений (2.1.2) получим (2.1.3):
Решив систему уравнений (2.1.3) методом последовательного исключения переменных найдем следующие оценки параметров:
С помощью оцененного таким образом уравнения регрессии можно предсказать, как в среднем изменится признак Y в результате роста факторов X1, X2…Xt (или одного фактора X). В зависимости от того, какая математическая функция используется для прогнозирования результирующей переменной Y, различают линейную и нелинейную регрессию. При этом в основе линейной регрессии лежит уравнение линейного тренда, а в основе нелинейной регрессии – целое семейство уравнений нелинейных трендов (полиномиальный второй, третьей и прочих степеней, степенной, экспоненциальный, логарифмический и другие). В случае если результативный признак Y зависит от одного фактора X, то такое уравнение регрессии называется парным, а если Y зависит от нескольких факторов X1, X2…Xt – то уравнением множественной регрессии.
Практически в любом учебнике по общей теории статистики и по эконометрике можно более подробно познакомиться со спецификой уравнений регрессии. (См., например, учебник «Эконометрика» под ред. И.И. Елисеевой. – 2-е изд., пер. и доп. – М,: Финансы и статистика, 2006, стр. 43-132).
Существуют формулы, по которым можно самостоятельно найти параметры, как уравнения линейной регрессии, так и различных видов уравнений нелинейной регрессии. Однако с внедрением в широкую практику компьютеров и соответствующих компьютерных программ уже нет необходимости оценивать параметры уравнения регрессии вручную, тем более что этот процесс довольно трудоемкий.