В онлайне: 1 (гостей - 1, участников - 0)  Вход | Регистрация

 

УДК 519.24

Методы проверки соответствия модели семивариограммы исходным данным

 

Цеховая Т. В., доцент, Коваленко Я. В., студент

Белорусский государственный университет, Белоруссия

 

Рассмотрен -критерий Хотеллинга для проверки соответствия выбранной модели семивариограммы исходным данным. Результаты получены в среде Mathematica и могут быть использованы при решении задач прогнозирования в различных прикладных областях.

 

В настоящее время современные информационные технологии находят широкое применение для решения задач геологии, гидрологии, экологии, природопользования, охраны окружающей среды, почвоведения и других областей. При этом актуальны геостатистические методы построения прогнозов [1-2]. Одним из этапов метода кригинга является подбор модели семивариограммы. Точность подбора – наиболее значимый фактор успешного использования методов прогнозирования семейства кригинга. В связи с этим важна диагностика, проверка надежности и качества выбранной модели.

Данная работа является продолжением исследований [3] и основана на применении -критерия Хотеллинга. Инструментом для моделирования, проведения расчетов и анализа данных выбрана среда Mathematica.

Приведем вспомогательный результат [4]. -критерий Хотеллинга предназначен для проверки гипотезы , согласно которой истинное значение неизвестного вектора математических ожиданий невырожденного р-мерного нормального закона ковариационная матрица B которого тоже неизвестна, есть вектор Пусть — независимые р-мерные случайные векторы, подчиняющиеся невырожденному нормальному закону и пусть

,

где

Тогда статистика

имеет - распределение Фишера с р и k – р степенями свободы

Следовательно [4], для проверки гипотезы против альтернативной гипотезы можно по реализациям независимых случайных векторов вычислить значение статистики F. Согласно критерию Хотеллинга с уровнем значимости гипотезу следует отвергнуть, если где верхняя -квантиль F-распределения. Заметим, что последнее неравенство эквивалентно

Пусть стационарный гауссовский случайный процесс с нулевым математическим ожиданием и неизвестной семивариограммой В качестве оценки семивариограммы,построенной по последовательным полученным через одинаковые промежутки времени наблюдениям , рассмотрим статистику вида:

, (1)

где Положим также , и для .

В [5] доказано, что при условии оценка , задаваемая равенством (1), имеет асимптотически нормальное распределение с математическим ожиданием, равным и предельной ковариационной структурой, удовлетворяющей соотношению

Обозначим p количество рассматриваемых лагов , по которым будет осуществляться сравнение точности подбора модели семивариограммы. Параметр p может принимать значения от 1 до n – 1;

– количество подходов моделирования наблюдений за случайным процессом;

оценка семивариограммы случайного процесса, наблюдения за которым получены в i-той итерации моделирования, .

Составим векторы размерности из значений оценок семивариограммы, соответствующим различным лагам для i-той итерации моделирования, т.е.

= , .

Заметим, что во введенных выше обозначениях вспомогательного результата

,

= = , … , = = .

Тогда

,

где

.

Составим вектор размерности из значений подобранной модели семивариограммы в точках, соответствующим различным лагам, т.е.

.

Тогда нулевая гипотеза против альтернативы где – вектор-столбец размерности из значений неизвестной семивариограммы в точках, соответствующим различным лагам.

Рассмотрим тестовый случай: процесс с известной ковариационной функцией , , и семивариограммой

(2)

Осуществим моделирование случайного процесса раз по 150 наблюдений в каждом из подходов и построим для каждого оценку семивариограммы по формуле (1). Рассмотрим значения оценок семивариограммы в точках h1 = 1, h2 = 5, h3 = 9 ( . Заметим, что все выбранные точки лежат около радиуса корреляции (ранга). Результаты приведены в таблице 1.

 

Таблица 1 – Значения 10 оценок семивариограмм в точках 1, 5, 9

 

Номер подхода

моделирования, i

Значения оценок семивариограмм в точке
1 5 9
1 0,628637 1,21337 1,121366
2 0,519644 1,041947 0,960978
3 0,374692 0,559094 0,614744
4 0,677606 1,124578 1,106538
5 0,534041 1,083136 1,071303
6 0,494309 0,921249 0,940076
7 0,61416 1,014115 1,108139
8 0,65801 1,049205 0,945776
9 0,575098 1,022011 1,024115
10 0,588522 1,000233 0,972124

Из данных таблицы 1, учитывая вид семивариограммы (2), найдем значения векторов и .

 

 

Далее вычислим:

 

S =

 

S-1 =

 

Используя полученные результаты, найдем значение T2 – статистики:

.

Сравним полученную Т2 – статистику со значением F-распределения для p = 3, k = 10, ? = 0,05, т.е. :

.

Поскольку , мы отклоняем гипотезу о соответствии подобранной модели семивариограммы исходным данным.

Из этого примера можем сделать вывод о том, что, если в ходе проверки использовать большое количество подходов моделирования k и не рассмотреть при этом достаточное количество значений p оценок семивариограммы в точках hi, то выдвинутая гипотеза может дать ложноотрицательный результат.

Изменим входные данные. Увеличим число рассматриваемых точек h1 = 1, h2 = 3, h3 = 5, h4 = 7, h5 = 9, , количество подходов моделирования

Теперь значение T2 – статистики равно Сравним его со значением F-распределения для p = 5, k = 10, ? = 0,05:

Поскольку Т2 = < 45.45, мы не можем отвергнуть гипотезу и стоит говорить о том, что модель семивариограммы может соответствовать исходным данным.

Далее рассмотрим число подходов моделирования k = 20, количество лагов h1 = 1, h2 = 61, h3 = 121. Получим Сравним полученную Т2 – статистику со значением F-распределения для p = 3, k = 20, ? = 0,05:

Поскольку Т2 = < , мы не можем отвергнуть гипотезу и стоит говорить о том, что модель семивариограммы может соответствовать исходным данным.

Также были рассмотрены случаи, когда количество подходов моделирования менее 10. При этом критерий Хоттелинга выполнялся нестабильно. Из этого можно сделать вывод, что не стоит рассматривать k < 10.

Так же были изучены случаи больших значений лагов, расположенных близко друг к другу вне интервала корреляции. Такие параметры часто приводили к ложноотрицательному результату.

Стоит отметить, что применение критерия Хотеллинга в случаях, когда нулевая гипотеза не может быть отвергнута, указывает лишь на возможную адекватность подбора модели семивариограммы.

На основе приведенных примеров можно сформулировать рекомендации для выбора параметров для проверки гипотезы о соответствии модели семивариограммы исходным данным с помощью критерия Хотеллинга:

  1. Контрольные точки hi не должны располагаться слишком близко друг к другу.

  2. Стоит рассматривать не менее 5 контрольных точек hi, равномерно расположенных на интервале корреляции.

  3. Число подходов моделирования k не должно быть менее 10.

 

Библиографический список

  1. Cressie N. Statistics for Spatial Data. – New York. – Wiley, 2015. – 928 p.

  2. Демьянов В.В., Савельева Е.А. Геостатистика: теория и практика. М.: Наука, 2010. – 327 с.

  3. Ortiz Cabrera, Julian; Leuangthong, Oy. A practical approach to validate the variogram reproduction from geostatistical simulation. Technical Report 125,CCG Annual Report 9, Edmonton, AB, 2007, https://repositorio.uchile.cl/handle/2250/125293. Дата обращения: 23.12.2021.

  4. https://dic.academic.ru/dic.nsf/enc_mathematics/6069. Дата обращения: 23.12.2021.

  5. Цеховая Т.В. Асимптотическое распределение оценки семивариограммы гауссовского случайного процесса // Вестник БГУ. Серия 1, Физика. Математика. Информатика. - 2015. - № 1. - С. 89-95.


 

Разделы конференции »

  1. Единый государственный реестр недвижимости и земельно-имущественные отношения
  2. Мониторинг природных ресурсов и охрана окружающей среды
  3. Комплексное использование природных ресурсов
  4. Современные вопросы геологии
  5. Физика горных пород
  6. Новые технологии в природопользовании
  7. Применение современных информационных технологий
  8. Экономические аспекты недвижимости
  9. Мониторинг использования объектов недвижимости
  10. Топографо-геодезическое обеспечение кадастровых работ
  11. Современные технологии в профессиональном образовании