Метод взвешенных расстояний

Метод взвешенных (обратных) расстояний

Интерполяция по методу взвешенных расстояний (IDW) ис­пользует предположение, что объекты, расположенные ближе к другу в большей степени похожи, чем удаленные друг от друга. Чтобы найти значение в какой-либо точке, метод IDW использу­ет опорные точки, находящиеся в окрестностях искомой.

Если выборки с высотами относительно равномерно распределены, и характеристики поверхности не меняют­ся в различных частях ландшафта, вы можете с достаточной точ­ностью интерполировать значения поверхности на основе значе­ний в близлежащих точках. Чтобы учесть различную удаленность точек от искомой точки, значениям опорных точек, расположен­ных ближе к ней, присваивается больший вес.

Это основа метода интерполяции, известного как Метод (обрат­ных) взвешенных расстояний -Inverse Distance Weighting (IDW). Как следует из названия, вес значения уменьшается по мере уве­личения расстояния от искомой точки.

Эти опорные точки будут оказывать большее влияние на интерполи­руемое значение, чем те, которые от нее удалены на значитель­ное расстояние. Таким образом, метод IDW предполагает, что каждая опорная точка оказывает локальное влияние, которое уменьшается с расстоянием. Точкам, находящимся в окрестно­стях искомой, присваиваются весовые значения большие, чем удаленным от нее точкам. Отсюда и вытекает название метода: метод (обратных) взвешенных расстояний.

Где — искомое значение для точки S0 ;

λi — веса, присвоенные каждой опорной точке, из числа тех, ко­торые будут использованы в вычислениях. Эти веса уменьша­ются с расстоянием;

Z(si) — измеренное значение в точке si ;

N — число опорных точек, находящихся в окрестности искомой точки и используемых в вычислениях.

Веса определяются по следующей формуле:

где: dio — это расстояние между искомой точкой so, и i-той опорной точкой, si.

С увеличением расстояния вес уменьшается за счет коэффици­ента р.

Параметр степени р влияет на присвоение весов опорным точ­кам; это означает, что по мере того, как увеличивается расстоя­ние между опорными точками и искомой точкой, влияние (или вес), которое опорная точка будет оказывать на искомую точку, уменьшается по экспоненте.

Сумма весов опорных точек, которые будут использованы при выполнении интерполяции, должна быть равна 1.

Оптимальное значение р определяется путем минимизации сред­неквадратичной ошибки вычислений (RMSPE). Значение сред­неквадратичной ошибки является статистической величиной и рассчитывается при перекрестной проверке. При перекрестной проверке каждая опорная точка исключается из вычислений и сравнивается с проинтерполированным значением для этого местоположения.

Среднеквадра­тичная ошибка RMSPE — это суммарная статистическая величи­на, количественно определяющая ошибку интерполируемой по­верхности.

Модуль Geostatistical Analyst подставляет несколько вариантов значения степени в формулу метода взвешенных рас­стояний (IDW), чтобы определить, при каком значении степени среднеквадратичная ошибка минимальна.

На графике (рис. 15 ) внизу показано, как модуль Geostatistical Analyst вычисляет оптималь­ную степень. Значение RMSPE наносится на график относи­тельно различных степеней, использованных для одного и того же набора данных. Через точки проводится кривая (описывае­мая локальным полиномом второй степени), и по этой кривой определяется оптимальное значение степени, при котором сред­неквадратичная ошибка минимальна.

Рисунок 15 — Вычисление оптимальной степени

Веса обратно пропорциональны расстоянию, возведенному в сте­пень р. В результате, по мере увеличения расстояния, веса бы­стро уменьшаются. Насколько быстро это происходит, зависит от значения р. Если р=0, с увеличением расстояния веса не уменьшаются, и поскольку каждый вес λi будет иметь одно и то же значение 1, искомый результат будет представлять собой сред­нее из всех значений опорных точек.

По мере возрастания сте­пени р, веса для удаленных точек быстро уменьшаются, что вид­но на диаграмме (рис.16 ), приведенной внизу.

Если значение р очень ве­лико, то только точки, находящиеся в непосредственной близости от искомой, будут влиять на полученное значение.

В модуле Geostatistical Analyst используются функции со степе­нью выше 1. При значении р = 2 метод носит название интерпо­ляции по методу квадратичных взвешенных расстояний (inverse distance squared weighted).

Рисунок 16 — Изменение веса в зависимости от расстояния

Поиск соседей

Поскольку объекты, расположенные ближе друг к другу более похожи, чем удаленные друг от друга, при удалении точек зна­чения опорных точек будут иметь все меньшую взаимосвязь со значением искомой точки.

Чтобы ускорить процесс вычисле­ния, мы можем принять вес значительно удаленных точек, с небольшим влиянием на искомую точку, за ноль. В результате, обычно ограничивают количество опорных точек, которые бу­дут использованы при расчете искомого значения, путем опре­деления области поиска соседства.

Заданная форма, в пределах которой выбираются соседние точки, ограничивает дальность и направление поиска опорных точек, которые будут использова­ны при выполнении интерполяции. На рисунке 17 по­казано, какие пять опорных точек (соседей) будут участвовать при вычислении значения искомой точки, обозначенной жел­тым цветом.

Рисунок 17– Выбор точек, для участия в вычислениях

Форма области соседства зависит от исходных данных и поверх­ности, которую вы хотите построить. Если определение весов не зависит от влияния по направлениям, мы должны учитывать точки равномерно во всех направлениях.

Для этого область со­седства должна иметь форму круга. Однако, если для ваших дан­ных характерно влияние по направлениям, такое, как, напри­мер, преобладающий ветер, вы можете использовать для опре­деления области соседства эллипс, большая ось которого направ­лена параллельно ветру.

Регулирование области поиска соседей для такого направленного влияния обоснованно, поскольку вы знаете, что точки, расположенные в направлении по ветру, даже удаленные друг от друга, будут больше похожи, чем точки, рас­положенные перпендикулярно к преобладающему направлению ветра.

После того, как определена форма области поиска соседей, вы можете также ограничить, какие точки, попадающие в эту об­ласть, должны быть использованы. Вы можете определить мак­симальное и минимальное количество используемых точек, а также вы можете разделить область поиска соседей на сектора. Если вы разделите эту область на сектора, ограничения по мак­симальному и минимальному количеству точек будут примене­ны к каждому сектору. Существуют различные способы деления на сектора (см. рисунок 18).

Рисунок 18– Выбор формы области поиска соседей

Точки, выделенные в виде данных диалога Поиск соседей, пока­зывают опорные точки с весами, которые будут использованы для поиска значения искомой точки в центре эллипса. Соседи попадают в показанный эллипс. В данном примере, двум точкам (красным) в западном секторе и одной в южном секторе будут присвоены веса более 10 процентов. Вес точки (желтой), распо­ложенной в северном секторе, будет от 3 до 5 процентов.

Поверхность, построенная по методу взвешенных расстояний (IDW), зависит от выбора степени (р) и способа поиска соседей. Метод взвешенных расстояний — это жесткий интерполятор, при котором максимальные и минимальные значения на проинтерполированной поверхности (см. рисунок 19) могут иметь только опорные точки. Результирующая поверхность чувствительна к кластеризации и присутствию в данных экстремальных значе­ний. Метод взвешенных расстояний предполагает, что поверх­ность была получена с использованием локальной вариации, ко­торая может быть учтена с помощью определения области поис­ка соседей.

Рисунок 19– Поверхность, полученная по методу взвешенных расстояний

Фактически большинство интерполяционных методов используют формулу (2.1) для расчета значений функций в произвольных точках. Различаются принципы, используемые для за­дания весовых коэффициентов wi и, соответственно, выражения для них расчета.

В методе обратных расстояний использу­ется обратно пропорциональная зависимость весовых коэффици­ентов от некоторой степени расстояния между расчетной точкой и точкой наблюдения (di):

Разновидности детерминистских методов интерполяции

В зависимости от количества используемых опорных точек выделяют:

-глобальные методы — вычисляют искомые значения с использованием всего набора опорных точек (метод глобального полинома);

-локальные методы — вычисляют неизвестные значения по опорным точкам, расположенным в окрестностях искомой (ОВР, сплайн).

В зависимости от того, проходит или не проходит поверхность, построенная с помощью детерминистских методов, через опорные точки, выделяют:

-жесткий интерполятор — дает в опорной точке значение, равное измеренному (методы ОВР и сплайн).

-нежесткий интерполятор — дает в опорной точке значение, отличное от измеренного, т.е., аппроксимирует значение в опорной точке (глобальный полином).

32. Методы интерполяции поверхностей: ОВР, тренд, сплайн (общее представление о каждом из методов, их особенности, условия применения).

Метод обратных взвешенных расстояний:

-рассчитывает значение каждой ячейки растра, усредняя значения опорных точек в заданной окрестности данной ячейки, при условии, что чем ближе точка нах-ся к центру расчетной ячейки, тем больше ее вклад в интерполир. значение по сравнению с более удаленными.

Z=сумма(wi*zj)/сумма(wj)

Z-вес, среднее значение;

zj-значения опорных точек, попавших в заданную окрестность;

wi-некоторая обратная функция расстояния.

Чем больше степень обратной функции расстояния, тем большее влияние имеют ближайшие точки и меньшее — удаленные.

В результате поверхность становится более детальной и менее сглаженной.

Для расчета значений каждой ячейки может исп-ся:

-либо фиксированный радиус поиска опорных точек с переменным кол-вом опорных точек;

-либо переменный радиус с фиксированным кол-вом опорных точек.

Сплайн-интерполяция — создает поверхность с минимальной кривизной, точно проходящую через заданные опорные точки.

(Аналогия с куском тонкой растягиваемой резины, проходящей через заданные точки с минимизацией общей кривизны поверхности).

Сплайн-метод позволяет строить поверхности, учитывающие глобальный тренд наряду с локальными вариациями.

Минимальная кривизна поверхности означает, что сумма квадратов величин второй производной, взятых в каждой точке поверхности, должна быть минимальной.

Сплайн — это кусочно-заданная функция, совпадающая с функциями более простой природы на каждом элементе разбиения своей области определения.

При сплайн-интерполяции:

-все пространство делится на равные участки для локальной аппроксимации;

-для каждого участка подбирается математическая функция, точно проходящая через уточненное количество ближайших опорных точек;

-максимальная степень из использованных полиномов называется степенью сплайна.

Метод обеспечивает гладкость поверхности — ее непрерывность, дифференцируемость и непрерывность первой производной.

Лучше всего подходит для плавно изменяющихся поверхностей (рельеф, концентрация загрязнений).

Не годится для поверхностей с резкими изменениями.

Тренд-интерполяция — создает поверхность, подбирая математическую функцию (полином заданного порядка) ко всем входным точкам методом наименьших квадратов.

При этом результирующая поверхность f(х,у) минимизирует отклонения от входных опорных точек (чем меньше среднеквадратическая ошибка между рассчитанными и входными значениями, тем точнее интерполированная поверхность представляет входные точки).

суммаEi^2 = сумма^2 -> min

Полученная поверхность редко когда проходит через заданные опорные точки.

Используется, когда больше интересуют общие тенденции поверхности, а не точное моделирование мелких локальных неровностей, при этом моделируемый атрибут в пределах изучаемой территории должен меняться медленно.

Степень используемого полинома определяет величину волнистости поверхности.

33. Метод Кригинга для интерполяции поверхности:к какому классу методов интерполяции относится; гипотеза, лежащая в его основе; общее представление о методе; основные разновидности метода Кригинга; как происходит определение неизвестного значения в методе Кригинга (основные задачи, решаемые при интерполяции методом Кригинга, и этапы реализации Кригинга).

Кригинг — ключевой метод геостатистики для анализа пространственно-распределенных данных.

Основывается на гипотезе пространственной однородности («стационарность 2-го порядка»):

— пространственная изменчивость, представленная значениями Z в исходных опорных точках, статистически однородна по всей поверхности;

— вариации в значениях исходных опорных точек зависят от расстояния между ними, но не зависят от их местоположения.

Наборы точек, включающие аномальные впадины, высоты или другие какие-либо резкие изменения, не предназначены для кригинг-метода.

Кригинг обрабатывает поверхность, считая пространственные изменения значений Z(s) в точках s в общем случае суммой трех компонент:

Z(s)= m(s)+e(s)+ сигма , где

m(s) — структурная (неслучайная) компонента, которая представляет поверхность как общий тренд в определенном направлении и может быть описана какой-либо математической функцией.

e(s) — случайная, но пространственно-коррелированная компонента — некоторые отклонения от общей тенденции (тренда), которые являются случайными, но связанными друг с другом пространственно. Предположения, которые делаются относительно данной компоненты:

-среднее всех e(s) =0;

сигма — случайный шум, не связанный с общей тенденцией и не имеющий пространственной автокорреляции (остаточная ошибка).

Основные виды Кригинга:

1)Ординарный:

Z(s)= m+e(s) , где m – неизвестная константа (неизвестное постоянное среднее всех значений Z(s) )

2)Простой

Z(s)= m+e(s) , где m – известная константа (известное среднее)

3)Универсальный:

Z(s)= m(s)+e(s) , где m(s) – некоторая детерминистская функция (данные имеют тренд!)

В методе Кригинга для определения неизвестного значения в некоторой точке значения исходных опорных точек, попавших в некую окрестность вокруг обрабатываемой точки, взвешиваются.

В методе Кригинга (в отличие от ОВР) веса опорных точек в окрестности искомой точки зависят не только от расстояния между опорной точкой и искомой, но и от пространственной структуры данных в целом.

Поэтому для установления весов лямдаi в Кригинге сначала необходимо определить пространственную структуру данных, т.е. количественно установить пространственную автокорреляцию данных.

Кригинг включает 2 основные задачи:

1. установить пространственную структуру данных — подобрать к данным модель пространственной изменчивости (вариограмму).

Вариограмма — это функция, которая связывает различие в значениях опорных точек и расстояние, на которое они отстоят друг от друга.

Служит средством для исследования пространственной автокорреляции (связей) между точками.

2.построить поверхность, используя для расчета (прогноза) неизвестных значений подобранную вариограмму, расположение и известные значения опорных точек, находящихся в пределах заданного радиуса поиска вокруг точки с искомым значением.

Этапы интерполяции по методу Кригинга:

1.Расчет эмпирической семивариограммы

2.Подбор теоретической функции к полученной эмпирической семивариограмме (по методу наименьших квадратов).

3.Нахождение весов лямдаi на основе полученной модели вариограммы

4.Выполнение интерполяции — на основе рассчитанных весов кригинга лямбдаi и известных значений Zi в опорных точках в пределах заданного радиуса поиска вычисляется значение в искомой точке Z0.

Окрестность поиска

Поскольку объекты, находящиеся поблизости друг от друга, более сходны, чем объекты, находящиеся на большом расстоянии, то по мере удаления от местоположений измеренные значения будут находиться в несущественных отношениях со значением проинтерполированного местоположения. Для увеличения скорости вычислений можно исключить большинство удаленных точек, которые оказывают незначительное влияние на интерполяцию. В результате общей принятой практикой стало ограничение количества измеренных значений с помощью определения окрестности поиска. Форма окрестности накладывает ограничения на дальность и место поиска измеренных значений, используемых для интерполяции. Другие параметры окрестности ограничивают местоположения, которые будут использоваться в форме. На следующем рисунке представлено пять измеренных точек (соседи), которые используются для прогнозирования значения в точке, где измерения не проводились (показана желтым цветом).

Пример окрестности поиска

Форма окрестности оказывает влияние на входные данные и поверхность, которую необходимо создать. При отсутствии направленных воздействий на данные можно рассматривать точки одновременно во всех направлениях. Для этого определите окрестность поиска как окружность. Но если присутствует направленное воздействие на данные, например преобладающий ветер, можно изменить форму окрестности поиска на эллипс с большой осью, параллельной ветру. Настройка на такое направленное воздействие оправдана, поскольку известно, что положения с наветренной стороны от интерполируемого местоположения более сходны на отдаленных расстояниях, чем положения, которые перпендикулярны ветру, но расположены ближе к интерполируемой точке.

После определения формы окрестности можно наложить ограничение на использование местоположения точек данных в этой окрестности. Можно задать максимальное и минимальное количество положений для использования и разделить окрестность на сектора. При разделении окрестности на сектора к каждому сектору применяются максимальные и минимальные ограничения. Несколько различных секторов, которые могут использоваться, приведены ниже.

Точки, выделенные в виде данных, демонстрируют положения и веса, которые используются для интерполяции местоположения в центре эллипса (положение перекрестия). Окрестности поиска ограничиваются внутренним пространством эллипса. В приведенном ниже примере двум красным точки будет присвоен вес больше 10 процентов. В восточном секторе вес точки (коричневой) составит 5–10 %. Веса остальных точек окрестности поиска будут ниже.

Пример весов сектора окрестности

Пространственная интерполяция. Метод обратных взвешенных расстояний (ОВР IDW)

⇐ ПредыдущаяСтр 19 из 19

Интерполяция — вычисление промежуточных значений какой-либо величины по некоторым известным ее значениям. Интерполяция используется во многих прикладных направлениях наук о Земле. В метеорологии интерполируются данные наблюдений метеостанций для получения карт погоды на большие территории, интерполируются данные океанологических и гидрологических измерений, строятся поля концентраций веществ в различных средах и др. В геологии интерполяция применяется для построения двумерных и трехмерных моделей подземных массивов по данным точечных скважин.

Для создания интерполированного карты как минимум необходимый набор точек с данными об их пространственное положение (координаты х, у в пользовательской системе или в виде широты / долготы) и количественное значение параметра (z) в этих точках — высота, давление, температура, концентрация загрязнителя и др. В большинстве практических случаев сеть таких исходных точек (data point) нерегулярная, имеет разную плотность, большие разрывы т.д.

Задачей пространственной интерполяции является построение на основе сети исходных точек сплошной поверхности с заданным размером шага сетки узлов рассчитываются. В зависимости от требуемой пространственной точности выбирается разный шаг (например, участок размером 10×10 км может быть интерполированные с шагом 100 м (100×100 узлов сетки) или с шагом 10 м (1000×1000 узлов) На основании числовых значений точек данных рассчитывается значение для каждого узла сети, что интерполируется. Обычно процедура интерполяции выполняется для области прямоугольной формы — растра.

В англоязычной научной литературе процедура построения регулярной прямоугольной сетки числовых значений на основе сети нерегулярных точек получила устоявшееся наименование gridding, массив интерполированных по регулярной сетке данных — grid, отдельный узел интерполированного сетки — node. На основе регулярного массива данных х, у, z возможно проведение большого количества аналитических процедур, а также построение различных видов графических отображений поверхностей: изолинейных изображений, блок-диаграмм, полутоновых или градиентных изображений.

Существующие методы интерполяции можно разделить на две большие группы -глобальные и локальные. Локальные методы интерполяции, в свою очередь, делятся на локальные детерминированы и локальные стохастические.

Метод ОВР исходит из предположения, что чем ближе друг к другу находятся точки данных, тем ближе их значения. Например, двигаясь по склону холма, вы можете отметить большее сходство в значениях высоты в близлежащих к вашему текущему положению точках по сравнению с точками, которые удалены гораздо дальше. Тоже можно было бы сказать, если бы вы двигались по равнине. Измеряется расстояние между каждой парой точек и от каждой начальной точки. Затем значение высоты в каждой точке взвешивается в зависимости от расстояния, так что более близкие точки вносят больший вклад в определение интерполируемой высоты по сравнению с более удаленными.

Интерполяция пространственных данных. Особенности применения в экологии и почвоведении.

Интерполяция — вычисление промежуточных значений какой-либо величины по некоторым известным ее значениям. Интерполяция используется во многих прикладных направлениях наук о Земле. В метеорологии интерполируются данные наблюдений метеостанций для получения карт погоды на большие территории, интерполируются данные океанологических и гидрологических измерений, строятся поля концентраций веществ в различных средах и др. В геологии интерполяция применяется для построения двумерных и трехмерных моделей подземных массивов по данным точечных скважин.

Для создания интерполированной карты как минимум необходимый набор точек с данными об их пространственном положение (координаты х, у в пользовательской системе или в виде широты / долготы) и количественное значение параметра (z) в этих точках — высота, давление, температура, концентрация загрязнителя и др. В большинстве практических случаев сеть таких исходных точек нерегулярная, имеет разную плотность, большие разрывы т.д.

Задачей пространственной интерполяции является построение на основе сети исходных точек сплошной поверхности с заданным размером шага сетки. В зависимости от требуемой пространственной точности выбирается разный шаг (например, участок размером 10×10 км может быть интерполированные с шагом 100 м (100×100 узлов сетки) или с шагом 10 м (1000×1000 узлов) На основании числовых значений точек данных рассчитывается значение для каждого узла сети, что интерполируется. Обычно процедура интерполяции выполняется для области прямоугольной формы — растра.

Тест на знание английского языка Проверь свой уровень за 10 минут, и получи бесплатные рекомендации по 4 пунктам:

  • Аудирование
  • Грамматика
  • Речь
  • Письмо

Проверить

Использование известных значений той или иной величины в определенных точках для оценки неизвестных значений в неизвестных точках называется пространственной интерполяцией. Например, создавая карту температур какой-либо страны, Вы не найдете достаточно метеостанций, равномерно распределенных по ее территории. Пространственная интерполяция помогает оценить температуры на всей территории, используя существующие данные, взятые с метеостанций. Результат такой интерполяции часто называют статистической поверхностью. Модели рельефа, карты осадков и накопления снега, а также карты плотности населения – вот некоторые примеры результатов пространственной интерполяции.

Например, чтобы создать цифровую модель рельефа на основе высотных данных, собранных с помощью GPS-устройства в определенных точках, выбирается метод интерполяции, подходящий для оптимальной оценки высоты в тех точках, где данные отсутствуют. Полученная модель может быть использована для проведения анализа или как основание для другой модели.

Существует целый ряд методов интерполяции. Два самых широко используемых метода: IDW (англ. Inverse Distance Weighting, рус. Обратное Взвешенное Расстояние) и TIN (англ. Triangulated Irregular Networks, рус. Нерегулярная Триангуляционная Сеть).

Интерполяция использует векторные точки с известными значениями той или иной величины для оценки этой величины в неизвестных точках и создает растровую поверхность, покрывающую всю область исследования.

§ Результат интерполяции – растровый слой того или иного формата.

§ Для оптимальной оценки величины важно выбрать подходящий метод интерполяции.

Узнай стоимость написания работы Получите ответ в течении 5 минут. Скидка на первый заказ 100 рублей!

§ IDW-интерполяция присваивает входным точкам коэффициенты взвешивания так, что воздействие точек затухает с увеличением расстояния до новой точки, где производится оценка значения величины.

§ TIN-интерполяция использует входные точки для создания поверхности, состоящей из прилегающих друг к другу треугольников, основываясь на пространственном распределении этих точек.

ПРИМЕНЕНИЕ МЕТОДОВ ПРОСТРАНСТВЕННОЙ ИНТЕРПОЛЯЦИИ К ГИДРОЛОГИЧЕСКИМ ДАННЫМ НА ПРИМЕРЕ ВОДОСБОРА Р. КАРУН (ИРАН)

Опубликовано в 2019, Выпуск №2(80) Февраль 2019, ТЕХНИЧЕСКИЕ НАУКИ | Нет комментариев

ПРИМЕНЕНИЕ МЕТОДОВ ПРОСТРАНСТВЕННОЙ ИНТЕРПОЛЯЦИИ К ГИДРОЛОГИЧЕСКИМ ДАННЫМ НА ПРИМЕРЕ ВОДОСБОРА Р. КАРУН (ИРАН)

Научная статья

Джалалванд А.1, Гайдукова Е.В.2, *, Бурлов В.Г.3, Ахондали А.М.4

1 ORCID: 0000-0003-2311-5065;

2 ORCID: 0000-0002-3547-5538,

1, 2, 3 Российский государственный гидрометеорологический университет (РГГМУ), Санкт-Петербург, Россия;

4 ORCID: 0000-0001-5455-1658;

4 Университет Шахида Чамрана, Ахваз, Иран

* Корреспондирующий автор (oderiutmail.ru)

Аннотация

В статье рассматриваются два метода пространственной интерполяции: метод обратных взвешенных расстояний (IDW) и метод Kriging. Произведено построение карт распределения коэффициента стока перечисленными методами, сделано сравнение фактических и интерполированных значений. Получено, что метод IDW подходит при интерполяции значений достаточно большого числа точек, расположенных равномерно по рассматриваемому водосбору; метод Kriging позволяет получать сглаженные изолинии гидрологических характеристик, которые обобщают информацию по территории.

Ключевые слова: коэффициент стока, создание карты, геоинформационные системы, метод IDW, метод Kriging.

APPLYING METHODS OF SPATIAL INTERPOLATION TO HYDROLOGICAL DATA ON EXAMPLE OF RECEPTION BASIN OF KARUN RIVER (IRAN)

Research аrticle

Dzhalalvand A.1, Gaidukova E.V.2, *, Burlov V.G.3, Akhondali A.M.4

1 ORCID: 0000-0003-2311-5065;

2 ORCID: 0000-0002-3547-5538;

1, 2, 3 Russian State Hydrometeorological University (RSHU), St. Petersburg, Russia;

4 ORCID: 0000-0001-5455-1658;

4 Shahid Chamran University, Ahwaz, Iran

* Corresponding author (oderiutmail.ru)

Keywords: flow coefficient, map creation, geographic information systems, IDW method, Kriging method.

Введение

Для получения интегрированной и непрерывной карты распределения характеристик необходимы методы интерполяции, производящие прогнозирование неизвестных значений. Существуют различные методы интерполяции, но оптимального метода не предлагается: выбор метода зависит от выборок, их плотности, пространственных условий и распределения рассматриваемых выборок .

В инженерной гидрологии требуется моделирование и анализ гидрологических данных с различным пространственным разрешением. В связи с этим ГИС-технологии являются востребованным инструментом управления поверхностными водами и представляют взаимосвязь между пространственными и гидрологическими данными речных бассейнов . Описание данного направления можно найти и в работах иранских исследователей.

Целью статьи является анализ и сравнение методов IDW и Kriging при пространственной интерполяции гидрологических характеристик на примере речного бассейна р. Карун (Иран).

Методы интерполяции гидрологических данных

Метод Kriging относится по классификации к методам нелинейной интерполяции и является синонимом «оптимального прогнозирования». Этот метод определяет неизвестные значения по данным наблюдений с известным пространственным положением, используя вариограммы для передачи изменений и минимизации ошибок определяемых значений . В методе Kriging предполагается, что расстояние или направление между опорными точками отражает пространственную корреляцию, которая может использоваться для объяснения изменения на поверхности.

Основная формула для метода интерполяции Kriging формируется как взвешенная сумма данных :

(1)

где – измеряемое значение в местоположении i; – неизвестный вес для измеряемого значения в местоположении i; – местоположение прогноза; N – количество измеряемых значений.

Метод обратных взвешенных расстояний (IDW) является также одним из наиболее распространенных методов интерполяции. IDW определяет значения ячеек с помощью линейно-взвешенного набора опорных точек. Определенный вес является функцией расстояния от точки ввода до вывода ячейки. Чем больше расстояние, тем меньше влияние ячейки на выходную величину .

Основная идея метода idw заключается в том, что значения точек, близких друг к другу по расстоянию, как правило, более похожи, чем значения точек, расположенных дальше друг от друга .

В этом методе, в отличие от метода kriging, нет жесткой пространственной взаимосвязи между данными и в алгоритм расчета не включено построение вариограмм. предполагается, что используемый вес пунктов или точек уменьшается с увеличением расстояния, вследствие чего интерполяция в этом методе достаточно локальна .

Простейшая форма интерполяции idw называется shepard метод , который использует весовую функцию wi:

(2)

где p – положительное вещественное число, называемое степенным параметром (обычно p = 2). расстояния от точек рассеивания к точке интерполяции hi рассчитывается по формуле:

(3)

где (x, y) – координаты точки интерполяции; (xi, yi) – координаты каждой точки рассеивания.

интерполированное значение точки e (x, y) находится как :

(4)

Итак. Метод Kriging предполагает, что расстояние или направление между точками отражает пространственную корреляцию, которая может быть использована для объяснения изменения на поверхности . Но значения такой гидрологической характеристики как слой стока для отдельных речных бассейнов, разделенных водоразделом, не зависят друг от друга. Поэтому метод IDW может дать лучшие результаты интерполяции, так как в нем предполагается, что каждая входная точка имеет локальное влияние, которое зависит напрямую от расстояния (взаимосвязь между точками уменьшается с расстоянием).

Результаты исследования

Апробация методов интерполяции IDW и Kriging производилась на водосборе р. Карун (Иран) при построении карт распределения слоя стока и коэффициента стока.

Река Карун впадает в Персидский залив и имеет площадь водосбора около 67,3 тыс. км2. Для исследования выбрано 32 гидрологических поста, местоположение которых показано на рис. 1.

Среднегодовой расход р. Карун около 575 м³/с. Среднее значение годовых осадков на территории бассейна примерно 630 мм. Минимальное количество осадков выпадает в южной части водосбора – менее чем 160 мм, а в гористых частях количество осадков может достигать более чем 2000 мм.

На рис. 2 показано распределение слоя стока и коэффициента стока по рассматриваемому водосбору. Коэффициент стока представляет отношение между слоем стока Y и осадками X: k = Y/X.

Рис. 1 – Гидрологические посты в бассейне р. Карун

Для получения карт гидрологических характеристик метод интерполяции IDW должен подойти лучше метода Kriging, так как по его принципу объекты, находящиеся поблизости, более подобны друг другу, чем объекты, удаленные друг от друга.

Рис. 2 – Карты распределения слоя стока (а, б) и коэффициента стока (в, г), построенные методом IDW (а, в) и методом Kriging (б, г)

Для определения точности карт использовалось два показателя Mean Absolute Error (MAE) и Root Mean Square (RMS) :

(5)

(6)

Oi – фактическое значение; Pi – расчетное значение; n – количество пунктов.

Результаты сопоставления фактических и интерполированных значений показаны в таблице. Видно, что значения показателей для метода IDW значительно меньше, чем для метода интерполяции Kriging. Отличия в показателях точности для карт коэффициентов стока не превышают погрешность определения этого коэффициента, поэтому можно сделать вывод, что карта коэффициента стока строится с одинаковой точностью методом IDW и методом Kriging.

Таблица 1 – Оценка методов интерполяции IDW и Kriging

Рис. 3 – Карта слоя стока (а) и коэффициента стока (б) из Атласа Мирового водного баланса с выделенной р. Карун

На рис. 2, а и в видно, что при интерполяции методом IDW появляются локальные зоны расположенные относительно недалеко друг от друга, т. е. не происходит обобщение информации по территории. Хотя при интерполяции методом Kriging на рис. 2, б и г эти локальные зоны объединяются изолинией одного значения. Следует отметить, что при экстраполяции значений в устье р. Карун, метод IDW может давать излишнюю, неправдивую информацию (см., рис. 2, в). Изолинии методом Kriging имеют более плавную форму, без резких очертаний, как можно увидеть на рис. 2, а и в.

При сравнении рис. 2 с картами Атласа Мирового Водного баланса рис. 3, видно, что изолинии должны иметь плавные очертания, без локальных областей. Т. е. визуальное сравнение карт показывает, что метод интерполяции Kriging дает более схожие результаты с картами Атласа.

Выводы

Результаты исследования показали, что метод IDW подходит при интерполяции значений достаточно большого числа точек, расположенных равномерно на рассматриваемой территории.

Метод Kriging позволяет получать сглаженные изолинии гидрологических характеристик, которые обобщают информацию по водосбору. Экстраполированные значения метод Kriging рассчитывает по адаптированным для этого формулам, предназначенным именно для «прогнозирования» значений.

Для представления географического распределения гидрологических характеристик на водосборе р. Карун больше подходит метод интерполяции Kriging.

Конфликт интересов

Не указан.

Conflict of Interest

None declared.

Список литературы / References

  1. Методические рекомендации по определению расчетных гидрологических характеристик при недостаточности данных наблюдений. Государственный гидрологический институт. – СПб: Ротапринт ГНЦ ААНИИ, 2007. – 66 с.
  2. Методические рекомендации по определению расчетных гидрологических характеристик при отсутствии данных гидрометрических наблюдений. Государственный гидрологический институт. – СПб: Нестор-История, 2009. – 193 с.
  3. ArcGIS for Desktop // Environmental Systems Research Institute, 2016. – Режим доступа: http://desktop.arcgis.com/ru/arcmap/10.3/tools/3d-analyst-toolbox/how-kriging-works.htm (дата обращения 27.09.2018).
  4. Azpurua M. A comparison of spatial interpolation methods for estimation of average electromagnetic filed magnitude / М. Azpurua, K. D. Ramos // Progress in Electromagnetics Research, Vol. 14, 2010. – Pages 135–145.
  5. Baiyinbaoligao Ding. Application of ArcGIS in the calculation of basins rainfall-runoff / Ding Baiyinbaoligao, L. XiangYang // Procedia Environmental Sciences, 10, Part C, 2011. – Pages 1980–1984.
  6. Di Piazza A. Comparative analysis of different techniques for spatial interpolation of rainfall data to create a serially complete monthly time series of precipitation for Sicily, Italy / Di Piazza, F. Lo Conti, L.V. Noto, F. Viola, G. La Loggia// International Journal of Applied Earth Observation and Geoinformation, Volume 13, Issue 3, 2011. – Pages 396–408.
  7. Ghasemi M. Compare Kriging and IDW interpolation methods for soil mapping / Ghasemi, A. Mahdavi, A. A. Jafarzadeh // The 2nd National Conference on Environment Hazard of Zagros, Tehran, 5 March 2015.
  8. Hammouri N. Hydrological modeling of ungauged wadis in arid environments using GIS: a case study of Wadi Madoneh in Jordan / Hammouri, A. El-Naqa // Revista mexicana de ciencias geológicas, 24, 2007. – Pages 185–196.
  9. Interpolating Surfaces in ArcGIS Special Analyst // ESRI Education Service, 2004. – Режим доступа: https://www.esri.com/news/arcuser/0704/files/interpolating.pdf (дата обращения08.2018).
  10. Jalalvand A. Ascertaining appropriate site for the artificial recharge using GIS and RS / Jalalvand, N. Kalantari, M. R. Keshavarzi // 10th geological society of Iran, Tehran. 2006. (in Persian)
  11. Khatami S. Benefits of GIS Application in Hydrological Modeling: A Brief Summary / S. Khatami, B. Khazaei // Journal of Water Management and Research, 2014. – Pages 41–49.
  12. Kusre B.C. Assessment of hydropower potential using GIS and hydrological modeling technique in Kopili River basin in Assam (India) / B.C. Kusre,C. Baruah, P.K. Bordoloi S.C. Patra // Applied Energy, Volume 87, Issue 1, January, 2010. – Pages 298–309, doi.org/10.1016/j.apenergy.2009.07.019.
  13. Shepard D. A two-dimensional interpolation function for irregularly-spaced data / Shepard // ACM Annual Conference/Annual Meeting, 1968. – Pages 517–524.
  14. StudFiles // Сургутский Государственный Университет, 2018. – Режим доступа: https://studfiles.net/preview/ 3816778/page:14/ (дата обращения 21.09.2018).
  15. SuiZ. Integrating GIS with hydrological modeling: practices, problems, and prospects / D.Z. Sui, R.C. Maggio // Computers, Environment and Urban Systems? Volume 23, Issue 1. 1999. – Pages 33–51, doi.org/10.1016/S0198-9715(98)00052-0
  16. Types of Interpolation Methods // GIS Resources, 2016. – Режим доступа: http://www.gisresources.com/types-interpolation-methods_3/ (дата обращения 20.08.2018).

Список литературы на английском языке / References in English

Обзор методов интерполяции

Интерполяция — восстановление функции на заданном интервале по известным ее значениям конечного множества точек, принадлежащих этому интервалу. В настоящее время известны десятки методов интерполяции поверхностей, наиболее распространенные из которых мы здесь кратко рассмотрим.

Линейная интерполяция

Этот простой метод основан на априорном утверждении, что каждое последующее число числовой последовательности определяется простым математическим действием. Если это действие известно, то можно восстановить пропущенные значения.

В примере из рис. 4, при предположении, что поверхность меняется линейным образом, как в арифметической прогрессии, четыре числа между 100 и 150 на равных промежутках друг от друга могут быть проинтерполированы как 110, 120, 130, 140, то есть можно создать карту изолиний, позволяющие визуализировать объекты по высоте.

Рисунок 4 — Линейная интерполяция

Метод обратных взвешенных расстояний (ОВР)

Этот метод основан на предположении, что чем ближе друг к другу находятся исходные точки, тем ближе их значения. Для точного описания топографии набор точек, по которым будет осуществляться интерполяция, необходимо выбирать в некоторой окрестности определяемой точки, так как они оказывают наибольшее влияние на ее высоту. Это достигается несколькими приемами поиска, включая определение окрестности на заданном удалении от каждой точки, предварительным заданием числа точек выборки данных или выбором определенного числа точек в квадрантах или октантах (когда, например, для интерполяции используется одна точка из каждого квадранта). Какой бы метод ни использовался, измеряется расстояние между каждой парой точек и от каждой начальной точки. Затем значение высоты в каждой точке взвешивается в зависимости от квадрата расстояния, так что более близкие точки вносят больший вклад в определение интерполируемой высоты по сравнению с более удаленными (Рис.5). Существуют множество модификаций этого подхода. Одни методы сокращают объем вычислений применением «поиска с обучением», другие используют в качестве весового коэффициента вместо второй степени третью или более высокую, третьи учитывают барьеры, представляющие береговую линию, скалы или иные непреодолимые объекты, которые могут воздействовать на результаты интерполяции. Как и при использовании барьеров в других задачах моделирования, процесс интерполяции не может распространяться через барьер.

Рисунок 5 — Интерполяция со взвешиванием по расстоянию. Недостающая величина будет ближе к отметке высоты 350

Метод поверхности тренда (тренд-интерполяция)

В некоторых случаях исследователя интересуют общие тенденции поверхности, которые характеризуются поверхностью тренда.

Аналогично методу обратных взвешенных расстояний для поверхности тренда используется набор точек в пределах заданной окрестности. В пределах каждой окрестности строится поверхность наилучшего приближения на основе математических уравнений, таких как полиномы или сплайны (polynomials, splines). Эти уравнения являются нелинейными зависимостями, которые аппроксимируют кривые или другие формы числовых последовательностей. Чтобы построить поверхность тренда, каждое из значений в окрестности подставляется в уравнение. Из уравнения, использованного для построения поверхности наилучшего приближения, получается одно значение и присваивается интерполируемой точке. Процесс продолжается для других целевых точек; кроме того, поверхность тренда может быть расширена на все покрытие.

Число, присваиваемое целевой ячейке, может быть простым средним всех значений поверхности в окрестности, или оно может быть взвешенным с учетом определенного направления, в котором ориентирован тренд. Поверхности тренда могут быть плоскими, показывая общую тенденцию для всего покрытия, или они могут быть более сложными. Тип используемого уравнения (или степень полинома) определяет величину волнистости поверхности. Чем проще выглядит поверхность тренда, тем меньший порядок, как говорят, оно имеет. Например, поверхность тренда первого порядка будет выглядеть как плоскость, простирающаяся под некоторым углом по всему покрытию, т.е. она имеет тенденцию в одном направлении. Если поверхность имеет один изгиб, то такую поверхность называют поверхностью тренда второго порядка (Рис.6), и т.д.

Рисунок 6 — Поверхности первого, второго и третьего порядка в зависимости от сложности полинома, используемого для представления поверхности

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *