Правительство РФ, по поручению Президента, предпринимает масштабные шаги по модернизации научно-технических библиотек РФ (НТБ). Единая система научно-технической информации обеспечит конкурентные преимущества российской науки и образования, поможет укрепить суверенитет страны. С чего начать и как представить целевой результат оцифровки архивов, чтобы проведенные работы соответствовали поставленной высокой задаче?
Научно-технические библиотеки являются ключевым элементом государственной системы научно-технической информации (ГСНТИ), которая представляет собой совокупность организаций, специализирующихся на сборе и обработке научно-технической информации. Современная ГСНТИ включает федеральные, отраслевые и региональные центры, обеспечивающие формирование и использование государственных ресурсов научно-технической информации, РАН, Федеральные университеты, Роспатент и пр.
Задача
Согласно Федеральному проекту, НТБ должны быть объединены в единый информационный контур, базу знаний. К этой базе необходимо предоставить средства доступа, поиска и анализа данных. Доработка задаст буст развитию всех участников процесса научно-исследовательской коммуникации.
Целевую модель можно описать так: сотрудник или научная комиссия вводит интересующий запрос простым языком, а система, заранее проиндексировав всю информацию, что хранится в базе знаний, подбирает все релевантные материалы по теме и краткое резюме по ним.
Из целевой модели понятно, что НТБ, как владельцы данных, должны будут наполнить создаваемую систему контентом.
Оцифровка таких объемов данных — задача как минимум нескольких лет. Необходимо:
С чего начать? С первого взгляда — с подсчёта книг. Но на самом деле — с глубокого аудита всего массива данных, где часто содержатся сведения, результаты исследований, обеспечивающие технологическое развитие и технологический суверенитет России. И это, конечно, дело, которое требует усилий от специалистов самой библиотеки.
Предстоит оценить физическое состояние документов, состав библиографического описания и формат машиночитаемых записей.
Правовая экспертиза
Главным критерием отбора является «правовая чистота» документа. Необходимо обеспечить соблюдение авторских прав и получить необходимые разрешения на оцифровку. Документы, не попадающие под действие нормативных актов по авторскому праву (70 лет после смерти автора), получают приоритет для включения в программы оцифровки.
Результат этапа:
✅ Реестр библиотечных фондов с метаданными (автор, год, тематика, состояние, редкость, юридический статус)
✅ Приоритизация фондов для оцифровки (по значимости, уязвимости, востребованности)
✅ Карта рисков: какие материалы требуют срочного спасения
Подготовка к сканированию
Выбор оборудования и технологий
Может потребоваться сканирование микрофишей, фотоматериалов, каротажных лент и других нестандартных носителей. Оборудование всегда подбирается под задачу.
Технологический процесс сканирования
Оцифровка документов осуществляется с соблюдением строгих требований к сохранности оригиналов. Основные принципы:
Контроль качества
Массив готовых графических образов проходит многоступенчатую проверку:
Что означает «оцифровать» в контексте научно-технических библиотек?
Это не просто фото/скан страниц. Это преобразование неструктурированных, часто устаревших, сложных документов в структурированные, машинно-читаемые, семантически обогащённые цифровые объекты.
Верификация и коррекция данных
Распознанные данные подвергаются автоматической верификации с последующей ручной коррекцией операторами. Этот этап обеспечивает высокую точность распознавания — до 99,9% для качественных документов.
Результат этапов:
✅ Цифровые копии с высокой точностью (300–600 dpi, цветные, с сохранением оригинального формата)
✅ Распознанный текст (OCR с поддержкой формул)
✅ Семантическая разметка: авторы, термины, объекты, связи между документами
✅ Каталогизация по классификаторам ВАК, УДК, ГОСТ, OECD
✅ Создание электронных архивов:
Компания Биорг — признанный лидер российского рынка оцифровки персональных данных, обладает уникальными компетенциями в области обработки сложных документов модернизации научно-технических библиотек.
Компания уже реализовала ряд масштабных проектов оцифровки сложных данных для госведомств, включая оцифровку 43 актовых записей данных для органов ЗАГС. На основе полученных электронных данных сформирован Единый реестр органов ЗАГС, на базе которого Правительство РФ развивает автоматизированные госсервисы для граждан.
Объединяет технологии искусственного интеллекта (ИИ) и краудсорсингового сервиса, обеспечивая:
Чтобы превратить бумажные фонды в цифровой центр знаний, нужно не просто «отсканировать», а переосмыслить научную информацию. Только системный, этапный, технологически продвинутый подход — с участием экспертов позволит реализовать амбициозные цели федерального проекта.
Beorg, обладая уникальными технологиями и обширным опытом работы с государственными проектами, может стать ключевым партнером в реализации федерального проекта развития научно-технических библиотек.
Биорг соответствует требованиям:
Контакт для экспертов и руководителей библиотек:
Beorg — партнёр федерального проекта по цифровизации научных библиотек. Запросите оценку вашего проекта бесплатно.
www.beorg.ru | ✉️ info@beorg.ru | ☎️ +7 (495) 739-92-37
Работаем только с юридическими лицами
Работаем только с юридическими лицами.
Работаем только с юридическими лицами.
Ошибка: Контактная форма не найдена.
Ошибка: Контактная форма не найдена.