Большой индекс: как подготовить ведомственные данные для НСУД?

14.09.2021

Какими будут требования к работе с информацией при переходе к национальной системе управления данными (НСУД). Как им соответствовать? Как с помощью технологий ИИ подготовить ведомственный массив данных для цифровой трансформации?  Наконец, чем НСУД отличается от системы электронного документооборота (СЭД)? Расскажем об этом на примерах в статье.

От лоскутной автоматизации к единой системе данных

 

Когда создавали региональные порталы госуслуг по единому шаблону (задачу решал Ростелеком), основа сервиса была единой, но в каждом регионе  информационные системы дорабатывали, исходя из бюджета и своего понимания задачи. В результате получались «кастомные решения», которые не соответствовали концепции единообразия.

Затем, уже под флагом экстерриториальности, более 80 региональных систем госуслуг стали объединять в единый портал госуслуг — ЕПГУ. В отсутствие единого порядка по внедрению технологий, каждый внедрял, что мог. По этой же причине с таким трудом сегодня вводится единая медицинская информационная система на все больницы и поликлиники.

Связность и качество данных

НСУД — это эталонная система данных, которые полностью структурированы и описаны. Это тот самый системный подход, который должен был лечь в основу ЕПГУ, став самым первым шагом на пути к цифровизации государства.

Если государственная информационная система (ГИС) или СЭД — это программные оболочки, в которых данные представлены тем или иным образом (полно или неполно, достоверно или нет), то НСУД — это свод единых для всех правил предоставления информации и система-маршрутизатор. С  её помощью можно определить источники юридически значимых сведений, непрерывно контролировать их достоверность, актуальность и непротиворечивость.

Например, есть информация, что на земельный участок X наложено обременение. Качественно предоставленные данные будут содержать информацию о том, какое именно обременение наложено, когда и кто обременил. Если речь идёт о координатах участков, то они не должны накладываться друг на друга.

Аналогия с бизнесом

на предприятии внедрены системы CRM и ERP. Скорее всего, в них по-разному называются контрагенты. Однако существует ещё и мастер-система, эталонный справочник, где все данные связаны между собой и  отформатированы. На этой системе замкнута вся деятельность компании. Данные из неё транслируют во все остальные информационные системы компании, по ним можно отследить любой процесс. НСУД и есть такая мастер-система для государства. 

На пути к единому массиву данных

Ранее концепция НСУД — единообразно представленных и структурированных данных — обсуждалась на уровне Минэкономразвития и Аналитического центра при Правительстве России. С приходом нового премьера и нового министра цифрового развития появилось четкое понимание, что такая система жизненно необходима. Её собираются внедрять на федеральном, региональном и муниципальном уровне.

Недавно на общественное обсуждение вынесли пять ( 1, 2, 3, 4, 5)  приказов Минцифры, которые касаются будущей нацсистемы. В них ведомство разъяснило, как госорганы должны предоставлять данные: на постоянной или временной основе, в каком формате, с какой периодичностью и в каком качестве. После обсуждения регламенты приобретут силу закона.

Кого коснётся НСУД?

Короткий ответ — всех. Но, в первую очередь, тех, кто накопил много уникальных данных об объектах (имуществе), субъектах (физических или юридических лицах) и их правах.

Федеральные ведомства, — например, МВД РФ, Пенсионных фонд и другие.

Регионы — им отданы полномочия в сфере социальной защиты населения. Они могут самостоятельно устанавливать надбавки, на местном уровне контролировать занятость, оформлять проездные документы и т.д. Это серьезный массив данных, которые надо будет передавать в НСУД.

Муниципалитеты — на них лежит обязанность контролировать все сведения о земельных участках. Эта информация нужна для расчета налоговой базы и, следовательно, тоже попадает в сферу регулирования системы.

Концепция витрины данных

В регламентах предполагается, что каждое ведомство (от муниципалитета до министерства) сможет скачать и использовать единую программную оболочку, посредством которой будет предоставлять данные по утвержденной форме.

НСУД эти данные проиндексирует, после чего любое ведомство сможет увидеть, например, что в районе N есть земельный участок X c определенным кадастровым номером и четко установленной историей владения. Система-большой маршрутизатор, расскажет всем, какие данные, где и в какой форме лежат, чтобы отследить с их помощью всю цепочку событий. 

На основе структурированных и взаимосвязанных данных можно будет реализовать модель “Государство как сервис”, концепция которой напоминает идею большого торгового центра, где каждое ведомство — это магазин, который выставляет свои услуги на витрине. Если витрина плохая, посетителей будет мало, магазин обеднеет, не сможет платить арендную плату и съедет. Незаполненные участки – минус для торгового центра. Витрина должна быть богатой.

Качество данных придётся доказывать непрерывно

Каждый орган власти предоставляет сведения на «витрину» в установленном качестве. Данные должны отвечать требованиям:

  • полноты
  • актуальности
  • непротиворечивости внутренним и внешним источникам

Управлять качеством государственных данных будут по определенным правилам, а оценок качества будет только две: низкая и высокая. Высокая оценка  – если данные соответствуют всем перечисленным критериям. Если не соответствует хотя бы одному –  оценка низкая.

Например, данные по контрольно-надзорной деятельности будут представлены со сведениями о датах проверок и должностных лицах, которые их проводили. На всех уровнях эта информация будет отражена в едином установленном порядке.

Чем это грозит ведомствам? Фактически, они в режиме 24/7 будут доказывать государству и обществу работоспособность своей  IT-инфраструктуры. Логично предположить, что качество ведомственных данных станет одним из критериев KPI руководителей.

Например, данные о погашенном штрафе с опозданием попали в информационную систему судебных приставов. Из-за этого человек не смог вылететь за границу. Он будет вправе подать в суд на государство и получить компенсацию на основании того, что государственный оператор данных не предоставил информацию вовремя. Из-за этого ведомство может не выполнить KPI.

Трудности перехода

Многие не смогут сразу обеспечить полноту данных – один из нескольких критериев их высокого качества.

Всей необходимой информации попросту нет в ведомственных IT-системах. Причина в том, что с началом цифровой трансформации никто не отказался от бумажного документооборота. Достаточно сказать, что только три года назад массово стали вводить электронную подпись руководителя в качестве эквивалента подписи собственноручной. Всё, что накапливалось до этого времени, лежит в бумаге.

Очень многим придётся не только контролировать качество текущих данных, но и оцифровать накопившиеся архивы. То же самое недавно происходило в российских ЗАГСах, когда по распоряжению Правительства они переводили на цифровые рельсы архивы актов гражданского состояния с 1926 года.

Пример ПФР

С момента внедрения АИС ПФР все выплатные дела ведутся в электронном режиме. В то же время приличный массив данных по-прежнему лежит в бумаге. Его надо перевести в цифру, чтобы обеспечить экстерриториальность госуслуг. Зачем это нужно? Например, гражданин проработал всю жизнь в одной части страны, а когда вышел на пенсию, переехал жить в другую часть России. На новом месте он подаёт заявление на перерасчет пенсии в соответствии со стажем и условиями труда, но ему не хватает справки, которая есть только в регионе изначального проживания. А значит, необходимо поднять дело в месте изначального проживания, внести правки и передать его по новому месту проживания. С введением национальной системы эта работа займёт несколько минут, а не дни, недели или даже месяцы.

Как оцифровать данные для НСУД

Чтобы создать цифровую витрину данных нужно перевести в машиночитаемый вид накопленные бумажные архивы. Для этого их надо отсканировать и распознать с помощью специального программного обеспечения (ПО). Как правило, за автоматизацию распознавания во всех современных решениях отвечают нейросети.

Существует несколько вариантов оцифровки.

“Коробочные” системы

ПО устанавливают в контуре заказчика. Для этого настраивают шаблоны документов, которые предстоит оцифровать, закупают лицензии на определённый объём документов (если оплаченный объём выбрали — лицензии надо докупать), обучают сотрудников работе с системой. 

Преимущество: всё происходит на территории заказчика, данные не выходят за контур — это считается дополнительной гарантией конфиденциальности. 

Недостатки:

  • стоимость
  • сложность
  • длительные сроки интеграции и отложенный старт запуска проекта

Резюме: точность распознавания с помощью коробочных версий — около 98%, если речь идёт о печатных формах. Для рукописных документов этот процент может быть гораздо ниже. При этом все нераспознанные значения приходится забивать в систему силами сотрудников.

Облачные сервисы

С их помощью можно автоматизировать процесс распознавания документов без сложной интеграции решения и обучения сотрудников.

Преимущества: ПО находится в “облаке”, его не надо устанавливать на компьютеры заказчика. Информация передается по защищенному каналу. Старт проекта можно осуществить быстрее.

Недостатки: при точности распознавания как у коробочных версий, большие проблемы остаются с рукописными формами документов. 

Резюме: невозможна полная автоматизация процесса распознавания, его точность не превосходит коробочные версии на печатных и на бумажных формах. Сотрудники вручную вносят в систему нераспознанные системой значения.

Облачный сервис: нейросетевое распознавание + краудсорсинг (верификация данных операторами)

Альтернатива перечисленным вариантам — полный аутсорс и автоматизация оцифровки документов через облачную платформу. Это инновационный подход, в котором технологии (работа искусственных нейросетей) объединены с краудсорсингом (работой биологических нейросетей — операторов верификации данных)

Преимущества:

  • отсутствие сложной интеграции в систему заказчика (ПО для распознавания работает через облако)
  • возможность обрабатывать сложные рукописные формы с гарантией качества
  • Полная автоматизация процесса распознавания документов —  обработанные и проверенные данные сразу попадают в систему заказчика
  • Данные передаются по защищённому каналу (ГОСТ)

На российском рынке представлен отечественный облачный сервис от компании Биорг, который обладает всеми необходимыми уровнями защиты и соответствия ФЗ-152, внесен в реестр отечественного ПО.

Платформенное решение Биорг — это нейросетевое распознавание документов в облаке и краудсорсинговый контроль обработанных данных со стороны человека. Последнее возможно благодаря тому, что к облачной платформе удалённо подключены операторы верификации данных, работающие в разных точках России. Они подхватывают нераспознанную нейросетями информацию и вносят её в ручном режиме. Заказчик получает только готовый результат, полную автоматизацию,непрерывность и конфиденциальность процесса распознавания документов, которые поступают операторам на обработку в деперсонализированном виде, фрагментами.

Недостатки: повышенное внимание со стороны службы безопасности, которая обычно очень пристально смотрит на решения, связанные с облаками, и выдвигает дополнительные требования к использованию таких сервисов.

Резюме по облачному решению, объединенному с краудсорингом: (облачная платформа от Биорг):

  • На территории заказчика документы только сканируют
  • Нет необходимости закупать дополнительные лицензии, оборудование, нанимать штат операторов оцифровки
  • Все данные обрабатывают и верифицируют без участия заказчика через облако с помощью ИИ и проверяют люди
  • Заказчик получает только результат — готовую и проверенную информацию в своей системе, которая выгружена с учетом всех существующих требований
  • При необходимости  документы не только оцифровывают, но и формируют из них размеченный массив данных (датасет)
  • Не существует никаких законодательных ограничений на обработку в облаках документов, в том содержащих персональные данные

Кейс “Биорг” — федеральный проект по оцифровке данных АГС ЗАГС

В соответствии с распоряжением Правительства РФ, субъекты федерации проводили оцифровки актовых книг с 1926 по 1999 годы. Это было необходимо, чтобы сформировать Единый государственный реестр записей актов гражданского состояния (ЕГР ЗАГС). В дальнейшем он послужил основой федерального информационного регистра основных сведений о населении РФ. 

Для конвертации 1 млн записей администрации Тамбовской области потребовалось бы привлечь около 500 новых сотрудников. Кроме того, требовалось дополнительное помещение для размещения сотрудников и закупка техники и квалификация по расшифровке старых и нечетких записей. В этой связи администрация приняла решение автоматизировать процесс, выбрав для этого решение Beorg Smart Vision.

По итогам проекта удалось:

  • оптимизировать ресурсоемкий процесс обработки полного комплекта из 10 документов
  • сократить время ввода персональных данных почти в 4 раза, а себестоимость – на 30%. 
  • оцифровать четверть данных АГС уже в первые недели после старта проекта, 
  • завершить в несколько раз быстрее, чем было запланировано. 

Помимо этого, проект приобрел социальное значение (социальный импакт) – население области получило возможность удаленной работы и дополнительного заработка, что было актуально в условиях пандемии COVID-19.

Благодаря технологиям Биорг для обработки кадровой документации всего лишь в течение нескольких суток оказалось возможно официально трудоустроить и подключить к операторскому пулу платформы более 500 жителей края.

    На указанный вами email мы автоматически пришлем презентацию.

    Вся информация по трудоустройству на странице "Вакансии"
    [contact-form-7 404 "Не найдено"]
    [contact-form-7 404 "Не найдено"]