Цифровой профиль страны: зачем старые документы переводят в электронный вид и почему об этом говорит президент?

20.06.2024

26 июня Владимир Путин провёл совещание* по вопросам развития кораблестроения для обеспечения обороны и безопасности государства. Отмечена необходимость цифровизации отрасли и, в частности, перевода конструкторской и эксплуатационной документации в электронный вид.

Президент не в первый раз заявляет о важности оцифровки документов. В числе инструментов решения этой задачи он называет искусственный интеллект.

В начале 2022 года глава государства дал поручение подумать об оцифровке документов, накопленных в российских архивах. Тогда эксперты оценили потенциал рынка эксперты в 200 млрд руб.

Ранее, 2018-20 годах в России реализовали масштабный проект по переводу в электронный вид данных из архивов органов ЗАГС. В результате получился единый цифровой реестр населения страны. Сначала правительство использовало подготовленную базу данных, чтобы целевым образом назначать социальные выплаты в период пандемии коронавируса COVID-19. Позже массив стал основой для развития проактивных социальных сервисов, в том числе с применением ИИ: когда положенные льготы население получает на в заявительном, а в уведомительном порядке.

Почему же глава государства регулярно поднимает вопрос о необходимости создать электронные копии накопленных в стране документов, инициирует крупные проекты оцифровки?

оцифровка архивов

оцифровка архивных данных: обложка архивного дела, подлежащая распознаванию

 

Почему оцифровка документов в числе приоритетных задач до 2030 года?

С января 2025 года в России стартует новый нацпроект «Экономика данных», который придет на смену «Цифровой экономике». Работа в этом направлении в том числе подразумевает «разработку современных надёжных решений для обработки и хранения данных, перевод экономики и социальной сферы на качественно новые принципы работы с использованием системы управления, основанной на больших данных». Что это значит?

На практике это означает, что многократно увеличивается ценность машиночитаемой информации – той, которую ИИ может анализировать автоматически.

Например, создадут специальные автоматизированные системы для предиктивной аналитики. Они будут выполнять роль цифровых помощников — помогать представителям госуправления, правительствам регионов, принимать информированные решения о развитии на основе актуальных данных о ресурсах страны.

Анализ данных будет отдан на откуп технологиям искусственного интеллекта. Машина проведёт анализ, а роль человека будет заключаться в том, чтобы принять финальное решение, основываясь на совокупности факторов.

Инициатива будет оправдана только если системы будут работать на основе полных, актуальных и непротиворечивых данных. А если данных будет недостаточно или с их качеством будут проблемы – получим мусор на выходе.

Получить консультацию

Как используют электронные данные для развития территорий? Несколько примеров

  1. Представьте, стоит задача построить экономическую модель рудного месторождения. Корректно оценить потенциал проекта можно на основе анализа данных геологической разведки: описания что, где и в каком количестве находится. Как правило, это актуальная, но архивная информация, которая хранится в бумаге, в рукописных формах и чертежах, на кальке. То есть сначала данные нужно оцифровать. Или лучше провести дорогостоящую разведку заново?
  2. Более масштабный пример и реализуемый в стране проект — Национальная система пространственных данных. Это цифровая модель РФ, развиваемая по инициативе правительства страны, как инструмент развития регионов. С помощью представленных в системе слоёв данных можно понять, какие ресурсы имеются в распоряжении правительства и как ими можно эффективно управлять, в том числе определять экономический потенциал территории. Подробнее об этом мы рассказывали здесь.
  3. В 2023 году в России уже появился цифровой помощник, повышающий эффективность процесса государственной регистрации прав граждан в процессе купли-продажи квартир.

Регистрация прав собственности – одна из самых востребованных госуслуг в РФ, на которую приходится до 60 процентов нагрузки на МФЦ. ИИ-система сокращает срок оказания госуслуги, повышает качество обработки данных. ИИ проверяет пакет документов за 15 секунд, предзаполняет электронные формы заявлений и дает моментальную обратную связь, если в документах что-то не так. Система помогла на 26% сократить сроки приема документов, при этом проведение экспертизы сократились в среднем до 10 минут.

Какие ещё примеры принятия решений на основе данных можно привести?

В феврале 2024 года Владимир Путин поручил сформировать долгосрочную программу сохранения объектов культурного наследия. Он отметил, что «надо устранить избыточные, противоречивые требования, из-за которых памятник порой разрушается на глазах, … а оперативно принять меры по его спасению невозможно». В этот раз президент не говорил об оцифровке. Однако именно электронные данные помогут сократить некоторые бюрократические процедуры. Объектами культурного наследия можно будет эффективнее управлять, в том числе реализуя их инвестиционный потенциал и привлекая таким образом дополнительные деньги в экономику регионов.

Работа по переводу в электронный формат документов на такие объекты в стране уже началась. Так, в начале 2024 года «Государственная инспекция историко-культурного наследия» Воронежской области перевела в цифровой формат архив исторических документов. Объём оцифровки составил 305 000 страниц в формате A4. В результате только на процессе поиска необходимых исторических справок и исторических паспортов можно сэкономить как 30 минут, так и 4-5 часов.

Как решить вопрос оцифровки сложных документов, которые сложно распознать?

Значительное количество данных, которые потребуются для эффективной работы экономики, всё ещё находятся в архивах. Их надо перевести в электронный, машиночитаемый вид. И здесь возникает проблема распознавания информации.

ИИ достаточно эффективно распознает типовые формы: паспорта, водительские удостоверения, другие регламентированные формы. В реальности нейросети неуверенно обрабатывают рукописный текст, нестандартные шрифты, некачественные сканы/фото документов и т.д. А ведь на повестке стоит именно качественное распознавание сложных, слабоструктурированных данных: рукописных, технических, информации, которая содержится в том числе в ветхих, архивных документах.

Когда ошибки в распознавании таких форм документов нужно исключить, информацию обрабатывают в два-три этапа. Сначала распознавание проводит автоматическая программа, затем люди перепроверяют результат работы системы распознавания. Для таких задач вместе с системой ИИ-распознавания используют краудсорсинг. О том, как это работает, рассказывали здесь. Смысл в том, что комбинация технологий уже сегодня позволяет решить вопрос сложной массовой оцифровки данных, несмотря на несовершенство систем автоматического распознавания.

К кому обращаться, чтобы оцифровать архив?

Если у вас есть задача оцифровать архив, перевести данные в электронный формат, обращайтесь в «Биорг», компанию с многолетним опытом серьезных государственных и корпоративных проектов.

«Биорг» — крупнейший в России профессиональный оператор оцифровки и переноса данных в госрегистры. Компания оказывает полный спектр услуг: от сканирования до формирования базы данных с легким полнотекстовым поиском или поиском по ключевым атрибутам.

«Биорг» также предоставляет услугу выездного сканирования, разворачивая рабочие участки, оснащенные высококачественным оборудованием, прямо на территории заказчика, либо, если не позволяет место, где-то поблизости.

Получить консультацию

Что будет если не оцифровать документы?

Помимо того, что не получится достичь целей по переходу к экономике данных, есть и более очевидные, даже банальные риски: утрата документов в результате пожара, затопления или форс-мажора, когда с информацией можно попрощаться навсегда. И всё же эти риски периодически недооценивают. А ведь многие помнят пожар в ИНИОН РАН в 2015 году, который одномоментно уничтожил более 5 млн изданий. Тогда свыше 2 млн 300 тыс. утрачены навсегда или восстановить их можно лишь с очень большим трудом.

Оцифровка – это способ создать резервную копию научно-технологической и технической идентичности страны.

Именно такой цифровой профиль становится результатом проектов по распознаванию архивных документов, которые выполняет «Биорг».

Например, недавно компания всего за три месяца оцифровала 160 тысяч архивных листов форматом от А0 до А5. . Это был технический фонд отечественного производителя сырьевых компонентов для промышленности, научно-исследовательских организаций и потребительского рынка. В электронный формат перевели уникальные чертежи производственных цехов, оборудования, экспертную документацию, в том числе рукописные формы и т.д Данные были проиндексированы с учетом всех необходимых для поиска атрибутов. Сформированный архив защищен и зарезервирован. Такая информация никогда не будет утрачена и всегда находится в доступе. За ней не надо обращаться в бумажный архив, что увеличивает скорость принятия решений.

Современная экономика начинается с цифровых данных.

* http://kremlin.ru/events/president/news/74425

Работаем только с юридическими лицами

Работаем только с юридическими лицами.

    На указанный вами email мы автоматически пришлем презентацию.

    Работаем только с юридическими лицами.

    Вся информация по трудоустройству на странице "Вакансии"

    Ошибка: Контактная форма не найдена.

    Ошибка: Контактная форма не найдена.