|
УДК 004.942Анализ временных рядов в пакете R
Цеховая Т.В., доцент, Павлов А.С., студент,
Белорусский государственный университет, Беларусь |
Рассмотрен временной ряд наблюдений температуры воды с 1975 по 2012 гг. для озера Баторино. Обработка и анализ данных выполнены с помощью пакета R.
Данная работа посвящена статистическому анализу, обработке и прогнозированию реальных временных рядов. В настоящее время, в условиях глобального потепления и крайне нестабильной климатической ситуации, наблюдения за состоянием озёрных экосистем представляют особую ценность как с научной, так и с практической стороны, поскольку только на основе таких наблюдений возможно выделить последствия антропогенного воздействия на фоне изменения природных факторов. Задачи такого рода решались в работах [1, 2], где было исследовано влияние температуры воды на экосистему в озере Байкал и Великих озёрах.
В качестве исследуемого материала в данной работе используется база данных с реальными наблюдениями, зафиксированными на озере Баторино (Республика Беларусь) в июле месяце за период с 1975 по 2012 годы. Данные получены от учебно-научного центра "Нарочанская биологическая станция им. Г.Г.Винберга". В работе исследуется временной ряд наблюдений температуры воды. Заметим, что данный показатель принадлежит к числу наиболее важных и фундаментальных характеристик любого водоёма. Для решения поставленной задачи был выбран пакет статистического анализа R.
В процессе первичного анализа временного ряда были вычислены и проанализированы основные описательные статистики. Например, выборочное среднее равно 20.08, выборочная дисперсия - 5.24. Коэффициент вариации равен 26.10%, что означает однородность исходных данных. По полученным значениям коэффициентов асимметрии ( A = 0.14) и эксцесса (Ex = -0.85), можно сделать вывод о незначительной правосторонней асимметрии и пологости кривой выборочного распределения относительно нормального закона. Следует отметить, что вышеуказанные коэффициенты, вследствие небольшого объёма выборки (n = 38), после проверки соответствующих критериев [3] не оказались значимыми для генеральной совокупности.
В дальнейшем исследовании проверено соответствие выборочного распределения нормальному закону с помощью различных критериев: Шапиро-Уилка, χ2 -Пирсона, Колмогорова-Смирнова. Результаты проверки критериев подтвердили сделанное предположение.
Рис. 1 - График квантилей |
Используя инструменты пакета R построен график квантилей (Рис. 1). Нетрудно видеть, что элементы выборки, за исключением нескольких наблюдений, ложатся на прямую нормального распределения. Таким образом, сделан вывод о близости выборочного распределения к гауссовскому закону N(20.08,5.24).
Далее вычислен коэффициент корреляции (rxt = 0.52) и проверена его значимость. Обнаружена прямая умеренная зависимость между температурой воды и временем. При уровне надёжности γ = 0.05, полученный коэффициент корреляции является значимым.
Рис. 2 - График временного ряда с линией регрессии |
Была построена аддитивная модель временного ряда и выделен линейный тренд x = 0.108t + 17.98 (Рис. 2). Выполнен регрессионный анализ. Применяя критерий Фишера при уровне значимости α = 0.05 , показана адекватность регрессионной модели, так как Fнабл ≈ 14.01 > Fкр(1,36,0.05) = 4.11. Однако точность модели не высока, поскольку коэффициент детерминации ηx(t) = 0.275. Это, в свою очередь означает, что изменение температуры зависит не только от времени, но также и от каких-то других, неучтённых ранее, факторов.
Путём удаления тренда из исходного ряда, вычислен ряд остатков и проведён его анализ. Следует отметить, что не удалось опровергнуть гипотезу о нормальном распределении остатков. Также была построена автокорреляционная функция и проверен тест Льюнга-Бокса. Данный тест не выявил значимых автокорреляций. Вследствие затухания автокорреляций с увеличением лага, можно сделать вывод о стационарности исследуемого ряда. Проведённый расширенный тест Дики-Фуллера подтвердил предположение о стационарности.
Таким образом показано, что полученная модель не достаточно хорошо описывает поведение исходного ряда. Поэтому прогноз, вычисленный на основе тренда, не будет обладать высокой точностью. В связи с этим, возникает необходимость дальнейших исследований для уточнения модели.
Библиографический список - Katz, S.L.; Hampton, S.E.; Izmest'eva, L.R.; Moore, M.V. Influence of Long-Distance Climate Teleconnection on Seasonality of Water Temperature in the World's Largest Lake - Lake Baikal, Siberia. s.l. : PLoS ONE 6(2): e14688., 2011.
- O'Brien, Timothy P.; Taylor, William W.; Briggs, A. Influence of water temperature on rainbow smelt spawning and early life history dynamics in St. Martin Bay, Lake Huron. Journal of Great Lakes Research. 2012, Vol. 38, 4, с. 776-785.
- Cramer Duncan. Basic Statistics for Social Research. s.l. : Routledge, 1997, с. 85-89.
| |