Сегментация крон: как выделить отдельные деревья по данным LiDAR

Лесная инвентаризация по данным воздушного лазерного сканирования может идти двумя принципиально разными путями. Площадной подход оценивает характеристики древостоя усредненно для участка размером 15–20 метров: средняя высота, суммарный запас, общая полнота. Поштучный подход ставит задачу амбициознее — выделить каждое дерево как самостоятельный объект, измерить его высоту, определить диаметр кроны, оценить породу и рассчитать объем ствола. Именно поштучная сегментация крон открывает путь к точной таксации на уровне отдельных стволов, и именно она остается одной из наиболее сложных задач в дистанционном зондировании лесов.

Сегментация крон: CHM → локальные максимумы → сегменты

Зачем нужна поштучная сегментация

Традиционная повыдельная таксация оперирует усредненными показателями. Таксатор описывает выдел как «сосняк 1-го класса бонитета с полнотой 0.7 и запасом 280 м3/га». Эта характеристика верна для выдела в целом, но ничего не сообщает о конкретных деревьях: о крупномерных стволах, пригодных для пиловочника, о тонкомерных деревьях, которые целесообразно направить на балансовую древесину, о больных экземплярах, подлежащих санитарной рубке. Поштучная сегментация восполняет этот пробел.

Выделив каждое дерево, можно решить целый спектр задач. Точная поштучная таксация позволяет определить запас, сортиментную структуру и товарную стоимость на уровне отдельных стволов. Мониторинг состояния леса выигрывает от возможности выявлять усыхающие и поврежденные деревья поименно. Планирование рубок выходит на новый уровень, когда оптимизация объемов заготовки учитывает пространственное расположение каждого дерева. Экологические исследования получают детальные данные для моделирования конкурентных взаимодействий и динамики леса.

По данным скандинавских исследований, поштучная инвентаризация на основе данных беспилотных воздушных судов дает оценки запаса древесины на пятьдесят процентов точнее по сравнению с традиционным площадным подходом. Канадская служба лесных ресурсов подтверждает, что поштучный подход на основе данных с дронов уже является реалистичной и экономически эффективной альтернативой для операционного планирования (White et al., 2025, DOI: 10.1139/cjfr-2024-0255). Подробнее о том, как данные лазерного сканирования превращаются в таксационные показатели, рассказано в статье От облака точек к таксационным показателям.

Растровые подходы: модель высот крон и водораздельная сегментация

Исторически первые и до сих пор широко используемые методы сегментации работают не с трехмерным облаком точек напрямую, а с его двумерной проекцией — моделью высот крон (Canopy Height Model, CHM). CHM представляет собой растровую карту, где значение каждого пикселя равно максимальной высоте растительности в этой точке. По сути, CHM — это разность между цифровой моделью поверхности (DSM) и цифровой моделью рельефа (DTM). Подробнее об этих моделях можно прочитать в статье ЦМР, ЦМП и модель высот крон.

Поиск локальных максимумов

Первый этап растровой сегментации — обнаружение вершин крон. На сглаженной CHM алгоритм ищет пиксели с максимальным значением высоты в скользящем окне. Каждый такой пиксель считается вершиной кроны отдельного дерева. Размер окна — ключевой параметр, определяющий качество результата. Слишком малое окно порождает ложные вершины на крупных кронах, слишком большое — пропускает мелкие деревья. Адаптивные варианты алгоритма подбирают размер окна в зависимости от локальной высоты CHM, используя эмпирическую зависимость между высотой дерева и диаметром его кроны. Этот подход был впервые предложен финским исследователем Юха Хюппя еще в 1999 году (Hyyppä, Inkinen, 1999, Photogrammetric Journal of Finland, 16(2), 27–42) и с тех пор лег в основу десятков модификаций.

Водораздельная сегментация

После обнаружения вершин необходимо определить границы крон. Наиболее распространенный подход — водораздельная сегментация (marker-controlled watershed). CHM инвертируется: вершины крон становятся впадинами, а межкроновые промежутки — водоразделами. Затем применяется классическое водораздельное преобразование с маркерами, где маркеры — найденные ранее локальные максимумы. Границы водосборных бассейнов принимаются за границы крон.

Другой вариант — наращивание областей от вершин крон с учетом высотных градиентов. Алгоритм Далпонте (Dalponte, Coomes, 2016, DOI: 10.1111/2041-210X.12575) реализует именно такой подход, последовательно присоединяя соседние пиксели к ближайшей вершине при условии, что перепад высот не превышает заданного порога.

Преимущества растровых методов очевидны: простота реализации, низкие вычислительные затраты, хорошая работа в одноярусных насаждениях с хорошо разделенными кронами. Недостатки столь же очевидны: проецирование трехмерного облака на двумерный растр приводит к потере информации о вертикальной структуре леса. Деревья нижних ярусов, скрытые под пологом доминантных деревьев, в CHM просто невидимы.

Точечные подходы: работа с трехмерным облаком

Альтернативный класс методов работает непосредственно с трехмерным облаком точек, сохраняя полную пространственную информацию. Это принципиально важно для многоярусных лесов, где деревья нижнего яруса полностью скрыты за кронами верхнего яруса и невидимы на CHM.

Кластеризация по плотности

DBSCAN и его модификации группируют точки по принципу пространственной плотности: точки, имеющие достаточное число соседей в заданном радиусе, объединяются в кластер, а изолированные точки отбрасываются как шум. Для деревьев часто применяется двухэтапная схема. На первом этапе DBSCAN обнаруживает стволы в нижних горизонтальных срезах облака, где стволы представлены плотными скоплениями точек. На втором этапе от каждого обнаруженного ствола кроновая часть наращивается вверх. При наземном и мобильном лазерном сканировании, где плотность точек в зоне стволов высока, такой подход обеспечивает обнаружение около девяноста процентов деревьев.

Трехмерное наращивание областей

Алгоритм Ли (Li et al., 2012) переносит идею наращивания областей из двумерного пространства в трехмерное. Отправной точкой служат вершины крон, обнаруженные в верхнем горизонтальном слое облака. От каждой вершины алгоритм последовательно наращивает кластер, присоединяя соседние точки сверху вниз при условии, что расстояние между точками не превышает порогового значения.

Графовые методы

Облако точек можно представить в виде графа, где узлы — точки или воксели, а ребра — взвешенные связи на основе пространственной близости. Метод нормализованных разрезов (Normalized Cut) делит граф на подграфы, минимизируя связи между кластерами и максимизируя внутрикластерные связи. По результатам международного сравнительного исследования под руководством финских ученых (Kaartinen et al., 2012, DOI: 10.3390/rs4040950), комбинация водораздельной сегментации с нормализованными разрезами (WST-Ncut) показала один из лучших результатов — F-score 0.91 на тестовых участках в субтропическом широколиственном лесу. Графовые методы успешно работают даже в густых лесах с плотностью более тысячи деревьев на гектар при условии достаточной плотности точек.

По результатам масштабного международного бенчмарка EuroSDR/ISPRS (Kaartinen et al., 2012), в котором участвовали исследовательские группы из Финляндии, Германии, Канады и других стран, точечные методы в среднем демонстрируют более высокую точность, чем растровые, особенно для мелких и подпологовых деревьев. Однако вычислительная стоимость точечных методов существенно выше, что ограничивает их применение на больших территориях.

Новые подходы: глубокое обучение для сегментации деревьев

С 2017 года, когда была представлена архитектура PointNet (Qi et al., 2017, DOI: 10.1109/CVPR.2017.16), глубокое обучение стало проникать в область обработки лесных облаков точек. Если классические методы опираются на заранее определенные правила и пороговые значения, нейронные сети учатся распознавать деревья на примерах, самостоятельно извлекая информативные признаки из данных.

PointNet и его развитие

PointNet — первая архитектура глубокого обучения, способная работать непосредственно с неупорядоченными множествами трехмерных точек. Каждая точка обрабатывается индивидуально через общие полносвязные слои, затем применяется симметричная функция агрегации для получения глобального дескриптора облака. Для задачи сегментации глобальные и локальные признаки объединяются, что позволяет каждой точке «знать» и о своем ближайшем окружении, и о контексте всего облака.

Расширение PointNet++ добавляет иерархическую группировку: точки разбиваются на локальные подмножества, к каждому применяется PointNet, результаты агрегируются на следующем уровне иерархии. Это позволяет учитывать локальную геометрию на разных масштабах — от отдельных ветвей до целых крон.

В лесном применении PointNet++ используется для семантической сегментации — классификации каждой точки как «ствол», «крона» или «земля» — и как основа для последующей инстанс-сегментации, то есть выделения отдельных деревьев. Китайские исследователи из Северного Китая провели масштабное сравнение PointNet++ с другими методами машинного и глубокого обучения на данных БПЛА-LiDAR, охватывающих 2622 дерева на двенадцати пробных площадях (Zhang et al., 2025, DOI: 10.3389/ffgc.2025.1431603). Результаты показали, что усовершенствованные архитектуры, такие как PointMLP, достигают точности классификации пород 96.94%, тогда как базовый PointNet++ — 85.65%. Другая группа китайских исследователей продемонстрировала эффективность PointNet++ для классификации пород непосредственно по облакам точек, без ручного извлечения признаков (Zou et al., 2024, DOI: 10.1080/01431161.2024.2377837).

Transformer-архитектуры

Механизм внимания (self-attention), лежащий в основе архитектур Transformer, позволяет модели «видеть» дальние пространственные зависимости в облаке точек. Это критически важно для разделения сросшихся крон, где локальной информации недостаточно для определения границы между двумя деревьями.

ForestFormer3D (Xiang et al., 2025, arXiv: 2506.16991) — Transformer-архитектура, специально разработанная для панопической сегментации лесных облаков точек. Модель включает направленный выбор запросных точек и стратегию обучения «один ко многим» для сопоставления инстансов. ForestFormer3D достигает F1-score 73.3% по инстанс-сегментации, превосходя лучший неконтролируемый метод на 25.9 процентных пункта. Особенно примечательно, что модель превосходит конкурентов именно в сегментации подпологовых деревьев — той самой категории, которая наиболее сложна для классических методов — и демонстрирует способность обобщаться на невиданные ранее тестовые наборы.

ForAINet и SegmentAnyTree

Фреймворк ForAINet (Xiang et al., 2024, DOI: 10.1016/j.rse.2024.114078) выполняет одновременно семантическую и инстанс-сегментацию лесных облаков точек, достигая F-score более 85% для отдельных деревьев и mean IoU более 73% по пяти семантическим категориям. Код модели открыт, что позволяет исследователям и практикам адаптировать ее для своих задач.

Развитием ForAINet стал SegmentAnyTree (Wielgosz et al., 2024, DOI: 10.1016/j.rse.2024.114367) — модель, принципиально агностичная к типу сенсора и платформы. Ключевая инновация — стратегия аугментации данных с рандомизированным прореживанием обучающих облаков, которая обеспечивает устойчивость модели к разной плотности точек. Благодаря этому SegmentAnyTree сохраняет высокую точность при работе как с плотными данными наземного лазерного сканирования, так и с разреженными данными воздушного LiDAR.

TreeLearn и другие подходы

TreeLearn (Henrich et al., 2024, DOI: 10.1016/j.ecoinf.2024.102828) — метод для инстанс-сегментации по данным наземного LiDAR, обучаемый исключительно на уже сегментированных облаках точек. Подход минимизирует зависимость от предопределенных признаков и ручной настройки параметров, что делает его привлекательным для практических задач.

Отдельного внимания заслуживает работа китайских исследователей из Академии лесного хозяйства КНР по денойзингу облаков точек. Алгоритм DEN4 (Liu et al., 2025, DOI: 10.3389/fpls.2025.1490660) — неконтролируемый метод очистки облаков от шума на основе глубокого обучения — снижает среднеквадратичную ошибку на 70.2% и увеличивает отношение сигнал-шум на 37.8%. Качественное удаление шума критически влияет на последующую сегментацию, поскольку шумовые точки могут создавать ложные вершины крон или размывать межкроновые промежутки.

Типичная точность: что показывают бенчмарки

Точность сегментации существенно варьируется в зависимости от типа леса, плотности облака точек, породного состава и используемого алгоритма. Приведенная ниже таблица обобщает результаты ключевых исследований.

Метод	F-score	Условия	Источник
CHM + Watershed (Dalponte, 2016)	0.22	Хвойный лес, низкая плотность ALS	Kaartinen et al., 2012
CHM + Region Growing	0.23	Хвойный лес, низкая плотность ALS	Kaartinen et al., 2012
AMS3D (Mean Shift)	0.67	Смешанный лес	Kaartinen et al., 2012
Фиксированное окно 3x3 м на CHM	0.65	Смешанный лес, UAV-LiDAR	—
ForestFormer3D (Transformer)	0.73	Различные типы леса, наземный LiDAR	Xiang et al., 2025
ForAINet (3D deep learning)	0.85+	Бореальные леса, высокоплотный ALS	Xiang et al., 2024
WST-Ncut (Watershed + Normalized Cut)	0.91	Субтропический широколиственный лес	Kaartinen et al., 2012

Масштабный бенчмарк EuroSDR/ISPRS, проведенный финскими учеными (Kaartinen et al., 2012, DOI: 10.3390/rs4040950), стал одним из наиболее цитируемых исследований в этой области. В нем точность обнаружения деревьев варьировалась от 25% до 90% в зависимости от метода и структуры леса. Доминантные деревья верхнего яруса обнаруживались с точностью до 83%, тогда как общая точность, включая подпологовые деревья, составляла около 40% в финских бореальных лесах при плотности 675 деревьев на гектар. Эти результаты наглядно показывают, что оценка качества сегментации без указания типа леса и яруса практически бессмысленна.

Финская национальная программа лазерного сканирования с плотностью пять точек на квадратный метр демонстрирует, что при достаточной плотности данных возможно обнаружение приблизительно 92% деревьев с диаметром более двадцати сантиметров — именно тех деревьев, которые составляют основу деловой древесины (Hyyppä et al., 2024, DOI: 10.3390/ijgi13120424). Финская лесная база данных, содержащая информацию о 5.8 миллиардах индивидуальных деревьев на площади более двадцати миллионов гектаров, является одной из крупнейших в мире и убедительно демонстрирует масштабируемость поштучного подхода.

Основные проблемы и ограничения

Несмотря на значительный прогресс, сегментация крон остается задачей с многочисленными нерешенными проблемами.

Подпологовые деревья

Существующие алгоритмы обнаруживают более 90% деревьев верхнего яруса, но лишь около 60% подпологовых деревьев (Hamraz et al., 2017, DOI: 10.1038/s41598-017-07200-0). Причина — эффект затенения верхним пологом: лазерные импульсы, перехваченные кронами доминантных деревьев, не достигают нижних ярусов. Для точной идентификации подпологовых деревьев требуется плотность сканирования не менее 20–30 импульсов на квадратный метр, а для сложных многоярусных тропических и субтропических лесов — до 170 точек на квадратный метр. ForestFormer3D демонстрирует существенный прогресс именно в этом направлении, превосходя неконтролируемые методы на 25.9 процентных пункта по подпологовым деревьям.

Сросшиеся кроны

В сомкнутых древостоях границы между кронами размыты или отсутствуют. На CHM несколько сросшихся деревьев создают единый максимум, что приводит к систематическому недосчету (omission errors). Точечные методы справляются лучше за счет анализа вертикальной структуры — даже если кроны слились в верхней части, стволы остаются разделенными — но и они теряют точность при горизонтальной сомкнутости крон более 80%. Именно эту проблему призваны решить Transformer-архитектуры, способные «видеть» дальние пространственные зависимости и находить границы между деревьями там, где локальный анализ бессилен.

Опушечный эффект

Деревья на опушках, краях вырубок и просек формируют асимметричные кроны, вытянутые в сторону свободного пространства. Большинство алгоритмов сегментации предполагают радиальную симметрию кроны и систематически ошибаются при обработке краевых деревьев. Комбинация DBSCAN для обнаружения стволов и kNN-классификации для уточнения границ кроны может снизить эти ошибки, но универсального решения пока не существует.

Перенос между типами леса

Алгоритмы, настроенные на один тип леса, часто плохо работают на другом. Параметры, оптимальные для однородного соснового бора, дают неудовлетворительные результаты в сложном широколиственном лесу с дубом, буком и подлеском. Норвежские исследователи из NIBIO показали, что «полу-ITC» подход на основе многоспектральных данных ALS может частично решить эту проблему (Breidenbach et al., 2021, DOI: 10.1186/s40663-021-00338-4). SegmentAnyTree целенаправленно адресует задачу обобщения через аугментацию с прореживанием: обучаясь на облаках разной плотности, модель становится устойчивой к вариации входных данных.

Масштабируемость

Обработка больших территорий с высокой плотностью точек требует значительных вычислительных ресурсов. Норвежский проект SR16 демонстрирует успешное масштабирование площадного подхода на семнадцать миллионов гектаров, но поштучная сегментация в таком масштабе остается вызовом. Решения включают тайловую обработку с перекрытием по краям, воксельную дискретизацию для снижения числа точек и распределенные облачные вычисления. Глубокое обучение масштабируется лучше точечных классических методов, поскольку нейронные сети обрабатывают фиксированные батчи точек с предсказуемыми затратами памяти.

Влияние породного состава

Однородные хвойные древостои с конической формой крон сегментируются значительно лучше, чем смешанные лиственно-хвойные. Широколиственные породы с нерегулярной раскидистой формой крон — дуб, бук, клен — создают наибольшие трудности: их кроны сильно перекрываются, а границы между соседними деревьями практически неразличимы ни на CHM, ни в облаке точек.

От сегментации к поштучной таксации

Сегментация крон — не самоцель, а первый этап цепочки создания стоимости в точном лесном хозяйстве. Выделив каждое дерево, можно последовательно решить ряд задач: измерить высоту (достижимая точность — RMSE 0.69 м), определить диаметр ствола по аллометрическим моделям (RMSE 7.2 см), классифицировать породу по геометрическим и спектральным признакам, оценить объем ствола и сортиментную структуру, и наконец — оптимизировать логистику лесозаготовки, направляя нужное сырье на нужное предприятие.

Работа Пулити и соавторов (Puliti et al., 2024, arXiv: 2312.15084) на высокоплотных данных ALS с трехмерным глубоким обучением демонстрирует возможность одновременного извлечения высоты, диаметра и породы каждого дерева без ручного вмешательства. Это приближает отрасль к полностью автоматизированной лесной инвентаризации (Automated Forest Inventory), где роль человека сводится к контролю качества и принятию управленческих решений.

Финляндия уже движется в этом направлении на национальном уровне. Инвентаризация на уровне отдельных деревьев ожидается операционной в стране с 2026 года как часть третьей фазы национальной программы лазерного сканирования. По оценкам Национальной земельной службы Финляндии, новые методы сбора лесных данных обеспечивают экономию в десятки миллионов евро ежегодно. Канада, обладающая бореальными лесами, наиболее близкими по составу к российским, также активно движется от площадного подхода к поштучному: провинция Онтарио развернула технологию single photon LiDAR для провинциальной инвентаризации на площади более 400 000 квадратных километров.

Текущий тренд — интеграция поштучной сегментации по LiDAR с многоспектральными спутниковыми данными. Канадские исследования показывают, что совмещение данных лазерного сканирования с данными Sentinel-2 позволяет картировать доминантные породные группы на площадях свыше 580 000 гектаров, масштабируя преимущества поштучного подхода на территории, недоступные для сплошного лазерного сканирования.

Для российского лесного хозяйства, управляющего крупнейшим в мире лесным фондом, путь от экспериментальной сегментации к операционной инвентаризации неизбежен. Вопрос не в том, произойдет ли этот переход, а в том, насколько быстро отрасль сможет адаптировать международный опыт. Алгоритмы, разработанные в Финляндии и Скандинавии для бореальных лесов, методы глубокого обучения из Китая и Канады, практика масштабирования из Норвегии — все это прямо применимо к задачам российского лесоустройства.