Оцифровка пространственных данных в России

09.02.2024

Российские власти переходят к управлению развитием территорий на основе Национальной системы пространственных данных (НСПД). Для этого разрабатывают цифровую модель страны на основе актуализированной информации всех государственных ведомств. На первом этапе в электронный вид переводят данные о земельных угодьях. Как проходит эта работа? Почему нужно оцифровать архивные карты? Применим ли для их распознавания ИИ? Можно ли ускорить работу?

Переход к экономике данных

Одна из целей НСПД – помочь руководству регионов понять, какие ресурсы есть в их распоряжении и как ими эффективно управлять в условиях динамических изменений.

Например, вырубаются леса и это влияет на всю окружающую экосистему. Где ещё пять лет назад на поле можно было посеять определённую сельскохозяйственную культуру, сегодня может ничего не вырасти. Причина? Исчез лес, холод стал беспрепятственно поступать на поле с ближайшей возвышенности. Посадки замерзнут и фермерское предприятие прогорит. Инвестиция не окупится.

После оцифровки и актуализации данных правительство сможет точно узнать инвестиционный потенциал и привлекательность территорий. Понять, какие шаги необходимы для развития и какой доход можно извлечь в пользу бюджета.

Как происходит оцифровка пространственных данных?

Сначала создают цифровую топографическую основу на базе существующих физических карт. Для этого топографические планшеты — так называются листы с географическими картами, наклеенными на основу, — сканируют, параллельно собирая дополнительные сведения в виде отчетов и пояснений в Росреестре и других ведомствах.

Информацию сводят в единый цифровой фрагмент карты местности. Работу выполняют с помощью программного обеспечения для векторизации – геоинформационной системы. ПО нужно, чтобы сформировать 2D, 3D или 4D-карту с учетом естественного изгиба земной поверхности.

Когда все планшеты с картами местности оцифрованы, все электронные копии склеиваются в единую карту пространства. На эту подложку наносится семантика – дают разъяснения, какой участок карты что именно обозначает, где земля определенной категории, где водоохранная зона, река, ручей и пр.

Почему нужна оцифровка старых карт?

Почему для подготовки цифровой топологической основы нельзя использовать данные, например, Яндекс.карт? Или спутниковые снимки, данные дистанционного зондирования Земли? Зачем нужно обязательно сканировать архивные ведомственные карты, которые могут местами быть неточны, использовать специальное сканирующее оборудование и ПО?

Дело в том, что только ведомственные планшеты содержат детальную информацию, из которой понятно, где, например, земля под пастбище, пашню, а где под застройку.  Без планшетов не получится определить высоту и вид деревьев, состав леса.

Может быть и такая ситуация: на поле болото, на болоте остров, на острове – лес. К чему его отнести? К полю? К болоту? Такие вопросы важны для ведения хозяйственной деятельности.

ИИ споткнулся о географию

Нейросети довольно хорошо справляются с типовыми задачами, когда их обучают на качественном массиве. Оцифровка границ земельных участков, если речь идёт о естественных территориях России – задача нетривиальная. Все границы нестандартные.

Есть целый ряд факторов, препятствующих эффективному применению ИИ для подготовки цифровой подложки НСПД.

  1. Сроки работ. Как правило, проекты имеют определенные временные рамки. Для разработки и обучения нейросетей требуется время. Да и разметка данных для обучения в этом случае по смыслу и объёму работ равна ручной оцифровке.
  2. Может быть много изменений в изначальном техническом задании, которые приходится вносить на ходу. Меняющееся ТЗ осложняет и удорожает применение на проекте ИИ, что приведет к значительному увеличению сроков.
  3. Качество топографических планшетов местами может быть не очень хорошее, проблемы с определением контуров и границ местности. Такие данные может распознать только человеческий глаз, нейросеть ошибется в 80, а может и в 90 процентах случаев. Если включить автораспознавание, без ручной верификации не обойтись. ИИ оказывается лишним.
  4. Сложные контуры местности. В некоторых районах контуры лесов и пастбищ, сенокосов очень извилистые и протяженные, что порождает ошибки геометрии. При данных по сельхозугодьям постоянно вручную выделять их из территорий лесов.

Кроме того, в процессе оцифровки постоянно возникают некоторые неточности. Их приходится вручную устранять профессиональным картографам.

На каком этапе ИИ все-таки можно применять?

Технологии искусственного интеллекта могут пригодиться на следующем этапе работы с пространственными данными – ИИ поможет актуализировать оцифрованные массивы.

Например, с помощью ИИ можно проводить мониторинг динамики изменений. Анализировать данные спутниковых снимков и сопоставлять их с представленными электронными данными. Таким образом можно выявлять несоответствия между подготовленными цифровыми основами и реальной ситуацией. Отслеживать изменившиеся границы участков. Можно будет понять, что где-то стоит незарегистрированная постройка или дом, который зарегистрировали как сарай, что вырубили лес и пр.

Таким образом, ИИ можно будет успешно применять, когда для его работы будут подготовлены полные и качественно размеченные данные.

Опыт работы: как можно ускорить работу по оцифровке?

В ходе одного из недавних проектов по оцифровке с/х угодий в электронный вид перевели 9 млн гектаров – это немногим меньше размеров Португалии*. В среднем, в обычных условиях для оцифровки такой территории требуется около 4 месяцев.

Ускорить оцифровку в 2 раза получилось за счет краудсорсинга. Профессиональные картографы и обученные ими операторы работали через облачный модуль из разных часовых поясов. Для этого в облако интегрировали геоинформационную систему, в которой работали люди. Таким образом большой объём данных был обработан на единой площадке в короткие сроки. Финальные данные сводились централизованно и проверялись экспертами.

Несостыковки в процессе сбора оцифрованных фрагментов в единую карту решали с помощью автоматического скрипта и ручных правок профессиональных картографов.

Применение облачной платформы также решило вопрос точечной нагрузки на рабочие станции, ПК операторов. Все вычислительные процессы, связанные с требовательной к ресурсам геоинформационной системой, не осуществлялись локально, а происходили в облаке.

Справочно

С 1 января 2022 года действует Постановление Правительства РФ «Об утверждении государственной программы Российской Федерации «Национальная система пространственных данных (НСПД)» (№ 2148).

НСПД станет цифровой моделью страны, будет содержать полные сведения о земле и недвижимости, включая информацию о правах, кадастровой оценке, сведения о виде и статусе различных территорий —  земель, водных, лесных угодий и др.

Инициатива направлена на переход к эффективному управлению развитием территорий.  Вероятно, станет важной частью нового нацпроекта «Экономика данных», старт которого Владимир Путин наметил на лето 2024 года.

На момент старта программы не были учтены сведения о правообладателях почти 50 миллионов объектов. Отсутствовали установленные границы у более чем 23 миллионов земельных участков. В Едином государственном реестре недвижимости содержалось значительное количество ошибок. Всё это могло снизить темпы территориального развития и лишить возможности получить объективную картину.

 

НСПД, схематично

НСПД, схематично

После оцифровки и актуализации данных станет возможно:

— повысить качество госуслуг по кадастровому учету и госрегистрации прав в электронном виде

— создать и внедрить цифровое отечественное геопространственное обеспечение, интегрированное с муниципальными и региональными инфосистемами;

— обеспечить полноту и качество сведений в ЕГРН

Формирование единой цифровой платформы пространственных данных планируется к 2030 году.

Читать на Digital Russia.

Об авторе

Александр Миронов – директор направления госпрограмм компании «Биорг». Реализовал более 50 госконтрактов с 2018 года. Руководил комплексными проектами по распознаванию и переводу в электронный вид актов гражданского состояния органов ЗАГС – более 40 млн. записей. Реализовал пилотный проект в Архангельской области по распознаванию документации госзакупок на базе технологий машинного обучения и краудсорсинга. Курирует проекты векторизации.

* Данные конфиденциальны

 

Работаем только с юридическими лицами

Работаем только с юридическими лицами.

    На указанный вами email мы автоматически пришлем презентацию.

    Работаем только с юридическими лицами.

    Вся информация по трудоустройству на странице "Вакансии"
    [contact-form-7 404 "Не найдено"]
    [contact-form-7 404 "Не найдено"]