Важно отметить, что современные глобальные ЦМР основаны на съемке, во много раз более грубой, чем лидарная, поэтому FABDEM не является конкурентом для локальных ЦМР на основе лидарной съемки. Однако, поскольку высококачественные локальные ЦМР охватывают менее
1% земного шара, существует острая необходимость в улучшении глобальных ЦМР для остального мира.
Машинное обучение в построении ЦМР При создании FABDEM использовались методы машинного обучения для оценки высот растительности и зданий на ЦМР относительно уровня земли, а затем эти оценки были вычтены из высот Copernicus DEM.
Двумя ключевыми входными данными для алгоритма машинного обучения были высококачественные справочные данные, представляющие высоты местности, и наборы данных для прогнозирования, которые можно использовать для оценки высоты растительности и зданий.
Справочные данные В дополнение к глобальным ЦМР, на многие территории есть локальные ЦМР с более высоким разрешением, например, созданные с помощью лидарной съемки с самолета. Эти ЦМР чрезвычайно точны и могут обеспечивать разрешение в плане порядка нескольких сантиметров.
В алгоритме машинного обучения для удаления растительности и зданий в FABDEM использовались локальные ЦМР из 12 разных стран. Важно было использовать данные из разных мест, т.к. обучение модели на ограниченных типах ландшафтов имеет тенденцию к избыточному обучению и получению результатов, которые менее применимы для других территорий.
Прогнозные данные Наборы данных с предикторами используются алгоритмом машинного обучения для разработки правил или связей между значениями в наборах данных и целевыми значениями (высотами лесов или зданий).
Поскольку наборы данных для прогнозирования различаются в зависимости от лесов и зданий, были применены отдельные модели машинного обучения для каждого из этих случаев. Например, использовались наборы данных
о высоте леса и полога в качестве ключевых показателей для удаления леса.
Однако при рассмотрении удаления городов среди других наборов данных использовались площади застройки (
мировые площади поселений), плотность населения и время в пути до городских центров.
Хотя каждый из отдельных наборов данных предикторов по отдельности не идеален, с помощью комбинации различных полезных данных алгоритму машинного обучения была предоставлена информация, необходимая для получения надежных оценок.