В онлайне: 2 (гостей - 2, участников - 0)  Вход | Регистрация

 
УДК 004.942

Анализ временных рядов в пакете R


Цеховая Т.В., доцент, Павлов А.С., студент,
Белорусский государственный университет, Беларусь

Рассмотрен временной ряд наблюдений температуры воды с 1975 по 2012 гг. для озера Баторино. Обработка и анализ данных выполнены с помощью пакета R.

Данная работа посвящена статистическому анализу, обработке и прогнозированию реальных временных рядов. В настоящее время, в условиях глобального потепления и крайне нестабильной климатической ситуации, наблюдения за состоянием озёрных экосистем представляют особую ценность как с научной, так и с практической стороны, поскольку только на основе таких наблюдений возможно выделить последствия антропогенного воздействия на фоне изменения природных факторов. Задачи такого рода решались в работах [1, 2], где было исследовано влияние температуры воды на экосистему в озере Байкал и Великих озёрах.

В качестве исследуемого материала в данной работе используется база данных с реальными наблюдениями, зафиксированными на озере Баторино (Республика Беларусь) в июле месяце за период с 1975 по 2012 годы. Данные получены от учебно-научного центра "Нарочанская биологическая станция им. Г.Г.Винберга". В работе исследуется временной ряд наблюдений температуры воды. Заметим, что данный показатель принадлежит к числу наиболее важных и фундаментальных характеристик любого водоёма. Для решения поставленной задачи был выбран пакет статистического анализа R.

В процессе первичного анализа временного ряда были вычислены и проанализированы основные описательные статистики. Например, выборочное среднее равно 20.08, выборочная дисперсия - 5.24. Коэффициент вариации равен 26.10%, что означает однородность исходных данных. По полученным значениям коэффициентов асимметрии ( A = 0.14) и эксцесса (Ex = -0.85), можно сделать вывод о незначительной правосторонней асимметрии и пологости кривой выборочного распределения относительно нормального закона. Следует отметить, что вышеуказанные коэффициенты, вследствие небольшого объёма выборки (n = 38), после проверки соответствующих критериев [3] не оказались значимыми для генеральной совокупности.

В дальнейшем исследовании проверено соответствие выборочного распределения нормальному закону с помощью различных критериев: Шапиро-Уилка, χ2 -Пирсона, Колмогорова-Смирнова. Результаты проверки критериев подтвердили сделанное предположение.

График квантилей


Рис. 1 - График квантилей


Используя инструменты пакета R построен график квантилей (Рис. 1). Нетрудно видеть, что элементы выборки, за исключением нескольких наблюдений, ложатся на прямую нормального распределения. Таким образом, сделан вывод о близости выборочного распределения к гауссовскому закону N(20.08,5.24).

Далее вычислен коэффициент корреляции (rxt = 0.52) и проверена его значимость. Обнаружена прямая умеренная зависимость между температурой воды и временем. При уровне надёжности γ = 0.05, полученный коэффициент корреляции является значимым.


График временного ряда с линией регрессии


Рис. 2 - График временного ряда с линией регрессии


Была построена аддитивная модель временного ряда и выделен линейный тренд x = 0.108t + 17.98 (Рис. 2). Выполнен регрессионный анализ. Применяя критерий Фишера при уровне значимости α = 0.05 , показана адекватность регрессионной модели, так как Fнабл ≈ 14.01 > Fкр(1,36,0.05) = 4.11. Однако точность модели не высока, поскольку коэффициент детерминации ηx(t) = 0.275. Это, в свою очередь означает, что изменение температуры зависит не только от времени, но также и от каких-то других, неучтённых ранее, факторов.

Путём удаления тренда из исходного ряда, вычислен ряд остатков и проведён его анализ. Следует отметить, что не удалось опровергнуть гипотезу о нормальном распределении остатков. Также была построена автокорреляционная функция и проверен тест Льюнга-Бокса. Данный тест не выявил значимых автокорреляций. Вследствие затухания автокорреляций с увеличением лага, можно сделать вывод о стационарности исследуемого ряда. Проведённый расширенный тест Дики-Фуллера подтвердил предположение о стационарности.

Таким образом показано, что полученная модель не достаточно хорошо описывает поведение исходного ряда. Поэтому прогноз, вычисленный на основе тренда, не будет обладать высокой точностью. В связи с этим, возникает необходимость дальнейших исследований для уточнения модели.


Библиографический список

  1. Katz, S.L.; Hampton, S.E.; Izmest'eva, L.R.; Moore, M.V. Influence of Long-Distance Climate Teleconnection on Seasonality of Water Temperature in the World's Largest Lake - Lake Baikal, Siberia. s.l. : PLoS ONE 6(2): e14688., 2011.
  2. O'Brien, Timothy P.; Taylor, William W.; Briggs, A. Influence of water temperature on rainbow smelt spawning and early life history dynamics in St. Martin Bay, Lake Huron. Journal of Great Lakes Research. 2012, Vol. 38, 4, с. 776-785.
  3. Cramer Duncan. Basic Statistics for Social Research. s.l. : Routledge, 1997, с. 85-89.


 

Разделы конференции

  1. Государственный кадастр недвижимости и земельно-имущественные отношения
  2. Мониторинг природных ресурсов и охрана окружающей среды
  3. Комплексное использование природных ресурсов
  4. Современные вопросы геологии
  5. Физика горных пород
  6. Новые технологии в природопользовании
  7. Применение современных информационных технологий
  8. Экономические аспекты недвижимости
  9. Мониторинг использования объектов недвижимости