Skip to content

Анализ временных рядов

PonizovaV edited this page Jul 21, 2016 · 12 revisions

При анализе времянных рядов принято выделять 4 компоненты:

  1. тренд (T) – плавно изменяющаяся компонента, описывающая чистое влияние долговременных факторов (рост население, изменение структуры возрастного состава и т.д.);

  2. сезонная компонента (S) – состоит из последовательности почти повторяющихся циклов (объем продаж накануне Нового Года, объем перевозок пассажиров городским транспортом);

  3. случайная компонента (e) – остается после полного вычленения закономерных компонент.

Временной ряд представляет собой:

  1. либо сумму этих компонент X = T + C + e в аддитивной модели(если амплитуда сезонных колебаний не меняется во времени),

  2. либо произведение X = T * C * e в мультипликативной модели(если амплитуда сезонных колебаний изменяется во времени).

Расчет сезонной компоненты

Прежде чем рассчитывать сезонную компоненту, исходный временной ряд необходимо выровнять. Для этого применяются методы механического выравнивания, к которым относятся:

Метод скользящих средних

Простое скользящее среднее численно равно среднему арифметическому значений исходной функции за установленный период и вычисляется по формуле:

где — значение простого скользящего среднего в точке t; n — количество значений исходной функции для расчёта скользящего среднего (сглаживающий интервал), чем шире сглаживающий интервал, тем более плавным получается график функции; — значение исходной функции в точке t-i.

ДОСТОИНСТВА: отлично описывает ряды с линейным трендом. НЕДОСТАТКИ: в равной степени учитывает как новейшие наблюдения, так и очень старые, что негативно влияет на оценку нелинейного тренда.

LOESS-метод (LOcal regrESSions - метод локальных регрессий)

Идея - сгладить ряд значений, используя простую линейную либо полиномиальную зависимость тренда от значений ряда. При этом модель строится не все наблюдения, а по отдельным частям (отсюда слово local). При этом в расчете используются наблюдения, попавшие в "окно": где параметр окна coef есть коэффициент сезонности наблюдаемого ряда. Каждому значению, попавшему в окно задаются некоторые веса по принципу: чем дальше наблюдение от рассматриваемого (центра окна), тем меньше его вес. В качестве весовой используется трикубическая функция:

.

Далее рассчитываются коэффициенты выбранной модели (линейной или полиномиальной) взвешенным методом наименьших квадратов:

Затем выбираем следующее наблюдение, для него строим окно и т.д. Подробнее...

ДОСТОИНСТВА: высокая точность достигается за счет множества итераций по "окнам". НЕДОСТАТКИ: на самом деле довольно требователен в вычислительном плане и требует проверки сходимости итерационных процессов в том числе => на большом ряде может долго считаться.

Фильтр Ходрика-Прескотта

Двусторонний линейный фильтр, который вычисляет сглаженный ряд минимизируя сумму квадратов отклонений и учитывает требование достаточной гладкости результата. Т.о. минимизируется следующее выражение по всем t:

Параметр, управляющий гладкостью получаемого ряда берется либо из следующих значений:

либо рассчитывается по формуле

Веса:

ДОСТОИНСТВА: чувствителен к выбросам данных. НЕДОСТАТКИ: может применяться исключительно для сглаживания (считает только тренд).

Метод Хольта-Винтерса

Рассчитывается по формулам

где α, β, γ — постоянные сглаживания для уровня, тренда и сезонности, соответственно; s - длительность периода сезонного колебания. Они в свою очередь вычисляются путем минимизации суммы квадратов отклонений сглаженного ряда от реально наблюдаемого.

ДОСТОИНСТВА: модель учитывает экспоненциальный тренд и аддитивную сезонность. НЕДОСТАТКИ: ряд может описываться мультипликативно, а не аддитивно.

Анализ многомерных рядов.

В предположении о том, что многомерный ряд подается в виде data.frame, анализ такого ряда сводится к разбиению data.frame по столбцам (переменным), чтобы вычислить все компоненты в отдельности для каждого столбца (переменной), а затем вновь скомпоновать их в data.frame.

Литература

Википедия(Методы сглаживания)

Расчет сезонной компоненты

Расчет тренда

Светуньков С.Г., "Методы социально-экономического прогнозирования" т.2 HSE 2009

Development

  1. Project structure
  2. Heroku
  3. Coding Guidelines

Вычисляемые статистики

Architecture

R

Matlab

Выбор базы данных

Angular 2

Источники данных

Random

  1. Interpolation
  2. [Charts comparison](displaying graphs control)
  3. What is Servlet?
  4. Ace-editor

GDS

  1. Библиотека CoreArray
  2. Сборка CoreArray
  3. Сравнение скоростей способов доступа к CoreArray
  4. Переделка Gdsfmt под java
  5. Разбор структуры файла из центра биоинформатики

Институт биоинформатики

Темы:

  1. Классические категориальные тесты на независимость
Clone this wiki locally