Временные ряды

Временно́й ряд (time series) — ряд последовательных значений, характеризующих изменение некоторого(ых) показателя(ей) во времени.

Ана́лиз временны́х рядо́в — совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогнозирования.

Математические модели временных рядов могут иметь различные формы и представлять различные стохастические процессы. Можно выделить три широких класса моделей, в которых последующие данные линейно зависят от предшествующих:

  • авторегрессионые модели;
  • интегральные модели;
  • модели скользящего среднего.

На их основе построены модели авторегрессионного скользящего среднего (Autoregressive Moving Average, ARMA) и модель авторегрессии и проинтегрированного скользящего среднего (Autoregressive Integrated Moving Average, ARIMA).

Среди нелинейных моделей временных рядов можно выделить: GARCH, TARCH, EGARCH, FIGARCH, CGARCH и др.

Расчёт прибыли

Рассмотрим временной ряд \(S_t\), каждый член которого представляет стоимость некоторого актива в \(t\)-й момент времени.

Прибыль за единичный период времени (one-period simple return, линейная доходность, иначе говоря, относительное приращение стоимости) вычисляется по формуле:

\[R_t = (S_t - S_{t-1}) / S_{t-1} = \frac{S_t}{S_{t-1}} - 1 .\]

Обычно выражается в процентах, в этом случае надо результат умножить на 100.

Прибыль за любой период времени (k-period simple return):

\[R_t(k) = (S_t - S_{t-k}) / S_{t-k} = \frac{S_t}{S_{t-k}} - 1 .\]
\[R_t(k) = \prod_{j=0}^{k-1}{(1+R_{t-j})} - 1 \; \approx \; R_t + R_{t-1} + \ldots + R_{t-k+1} .\]

Логарифмическая доходность за единичный период времени (log-return, обычно используют натуральный логарифм):

\[r_t = \log (S_{t} / S_{t-1}) = \log(S_{t}) - \log(S_{t-1})\]
\[r_t = \log (1 + R_t) \approx R_t\]

Логарифмическая доходность за любой период времени (k-period log-return):

\[r_t(k) = r_t + r_{t-1} + \ldots + r_{t-k+1} .\]

Всегда выполняется неравенство:

\[r_t (k) \leq R_t (k)\]

Лаговый оператор

Лаговый оператор (оператор задержки, оператор запаздывания) \(L\) — это линейный оператор, осуществляющий сдвиг назад по времени:

\[L x_t = x_{t-1}; \;\;\; L^k x_t = x_{t-k} .\]

C помощью лагового оператора взвешенная сумма элементов временного ряда \(x_t\)

\[s_t = a_0 x_t + a_1 x_{t-1} + \ldots + a_n x_{t-n} = \sum_{i=0}^{n} {a_i x_{t-i}}\]

может быть записана в виде

\[s_t = \sum_{i=0}^n {a_i L^i x_t} = a(L) x_t ,\]

где \(a(L)\) — лаговый многочлен:

\[a(L) = \sum_{i=0}^n {a_i L^i} = a_0 + a_1 L^1 + a_2 L^2 + \ldots + a_{n-1} L^{n-1} + a_n L^n .\]

Разностный оператор

Разностный оператор определяется следующим образом:

\[\Delta = 1 - L ,\]

где \(L\) — лаговый оператор.

Ряд первых разностей определяется следующим образом:

\[\Delta x_t = (1 - L) x_t = x_t - x_{t-1} .\]

Например, если рассматривать ряд 5, 12, 8, 14, 17,..., то ряд первых разностей будет: 7, -4, 6, 3,...

Аналогично вводится ряд вторых разностей (ряд первых разностей от ряда первых разностей):

\[\Delta^2 x_t = \Delta (\Delta x_t) = (1 - L)^2 x_t = (1 - 2L + L^2) x_t = x_t - 2 x_{t-1} + x_{t-2} .\]

Для нашего примера ряд вторых разностей: -11, 10, -3,...

Ряд \(k\)-х разностей:

\[\Delta^k x_t = \Delta (\Delta^{k-1} x_t) = (1 - L)^k x_t .\]

Авторегрессионная модель

Авторегрессионная модель (Autoregressive model, AR, модель авторегрессии) — модель временного ряда, в которой значения в данный момент линейно зависят от предыдущих значений этого же ряда.

Авторегрессионный процесс порядка p (AR(p)-процесс) определяется следующим образом:

\[x_k = c + \varepsilon_k + \sum_{i=1}^p {a_i x_{k-i}} ,\]

где \(a_i\) — параметры модели (коэффициенты авторегрессии); \(c\) — постоянная; \(\varepsilon_k\) — белый шум, т.е. последовательность независимых и одинаково распределённых случайных величин (как правило, нормальных), с нулевым средним.

Процесс AR(1) (т.е. авторегрессионный процесс первого порядка):

\[x_k = c + r x_{k-1} + \varepsilon_k .\]

Для AR(1) коэффициент авторегрессии совпадает с коэффициентом автокорреляции первого порядка.

Процесс AR(2) (т.е. авторегрессионный процесс второго порядка, или процесс Юла):

\[x_k = c + a_1 x_{k-1} + a_2 x_{k-2} + \varepsilon_k .\]

Модель скользящего среднего

Модель скользящего среднего (Moving-average model) q-го порядка MA(q) — это модель временного ряда следующего вида:

\[x_k = \mu + \varepsilon_k + \sum_{i=1}^{q}{b_i \varepsilon_{k-i}},\]

где \(b_i\) — параметры модели (без ограничения общности параметр \(b_0\) можно считать равным 1); \(\mu\) — константа; \(\varepsilon_k\) — белый шум.

Процесс белого шума формально можно считать процессом скользящего среднего нулевого порядка MA(0) при нулевом значении константы \(\mu\).

Процесс скользящего среднего первого порядка MA(1):

\[x_k = \mu + \varepsilon_k + b \varepsilon_{k-1}.\]

Модель авторегрессии — скользящего среднего

Модель авторегрессии — скользящего среднего (АРСС, autoregressive moving-average model, ARMA) — одна из математических моделей, использующихся для анализа и прогнозирования стационарных временных рядов в статистике. Модель ARMA обобщает две более простые модели временных рядов — модель авторегрессии (AR) и модель скользящего среднего (MA).

Моделью ARMA(p, q), где p и q — целые числа, задающие порядок модели, называется следующий процесс генерации временного ряда:

\[x_k = c + \varepsilon_k + \sum_{i=1}^{p}{a_i x_{k-i}} + \sum_{i=1}^{q}{b_i \varepsilon_{k-i}} ,\]

где \(a_i\) и \(b_i\) — параметры модели (действительные числа, соответственно, авторегрессионные коэффициенты и коэффициенты скользящего среднего); \(c\) — константа; \(\varepsilon_k\) — белый шум.

Такая модель может интерпретироваться как линейная модель множественной регрессии, в которой в качестве объясняющих переменных выступают прошлые значения самой зависимой переменной, а в качестве регрессионного остатка — скользящие средние из элементов белого шума.

ARIMA

ARIMA (autoregressive integrated moving average; модель Бокса — Дженкинса; модель авторегрессии и проинтегрированного скользящего среднего, АРПСС) — модель и методология анализа временных рядов. Является расширением моделей ARMA для нестационарных временных рядов, которые можно сделать стационарными взятием разностей некоторого порядка от исходного временного ряда (так называемые интегрированные или разностно-стационарные временные ряды). Модель ARIMA(p, d, q) означает, что разности временного ряда порядка d подчиняются модели ARMA(p, q).

Стационарность

Временной ряд называется строго стационарным (strictly stationarity) или стационарным в узком смысле, если все его свойства не зависят от времени.

Ряд называется слабо стационарным (weak stationarity) или стационарным в широком смысле, если его среднее значение и дисперсия не зависят от времени, а ковариационная функция зависит только от сдвига. Если нарушается хотя бы одно из этих условий, то ряд является нестационарным.

Строгая стационарность подразумевает слабую стационарность, но не наоборот.

Стационарность может нарушаться по математическому ожиданию или по дисперсии. В зависимости от выбранной характеристики говорят о стационарности временного ряда относительно среднего значения или относительно дисперсии.

Временной ряд \(y(t)\) называется стационарным относительно детерминированного тренда \(f(t)\), если ряд, образованный разностью \((y(t) - f(t))\), является стационарным. Ряды, стационарные относительно детерминированного тренда, ещё называют TS-рядами (TS-trend stationarity).

В класс TS-рядов можно включить также стационарные ряды, не имеющие детерминированного тренда, т.е. когда \(f(t)=0\).

Временной ряд \(y(t)\) называется интегрированным порядка \(k\) (где \(k = 1, 2,\ldots\)), если выполнены следующие условия:

  • ряд \(y(t)\) не является стационарным или стационарным относительно детерминированного тренда (т.е. не является TS-рядом);
  • ряд \(\Delta^k y\), полученный в результате \(k\)-кратного взятия разностей (дифференцирования) ряда \(y(t)\), является стационарным рядом;
  • ряд \(\Delta^{k-1} y\), полученный в результате \(k-1\)-кратного взятия разностей (дифференцирования) ряда \(y(t)\), не является TS-рядом.

Другими словами, ряд называется интегрируемым порядка \(k\), если его разности порядка \(k-1\) включительно нестационарны, а \(k\)-я разность — стационарна.

Если ряд \(y\) является интегрированным порядка \(k\), то данный факт обозначают \(y \sim I(k)\).

В данной системе обозначений \(y \sim I(0)\), если временной ряд \(y\) является стационарным и при этом не является результатом дифференцирования TS-ряда.

(продолжение следует...)

Список литературы

  1. Андерсон Т. Статистический анализ временных рядов. — М.: Мир, 1976. — 757 с.
  2. Box, George; Jenkins, Gwilym. Time series analysis: forecasting and control, rev. ed. // Oakland, California: Holden-Day. — 1976.
  3. Cowpertwait P., Metcalfe A. Introductory Time Series with R. — Springer, 2009. — 272 p.

Ссылки


Теги: Временные ряды




Комментарии

Комментариев пока нет.

* Обязательные поля
(Не публикуется)
 
Жирный Курсив Подчеркнутый Перечеркнутый Степень Индекс Код PHP Код Кавычки Вставить линию Вставить маркированный список Вставить нумерованный список Вставить ссылку Вставить e-mail Вставить изображение Вставить видео
 
Улыбка Печаль Удивление Смех Злость Язык Возмущение Ухмылка Подмигнуть Испуг Круто Скука Смущение Несерьёзно Шокирован
 
1000
Captcha
Refresh
 
Введите код:
 
Запомнить информацию введенную в поля формы.