Оцифровка инвентарных книг музея: наладить диалог между прошлым и будущим

02.04.2025

Построить фундамент цифровизации музейного дела

К началу 2026 года все государственные музеи обязаны создать цифровые копии своих собраний и вместе с сопроводительной информацией загрузить их в информационную базу Государственного каталога музейного фонда РФ.

Госкаталог —  федеральная информационная система государственного учета, которая, по данным на конец 2024 года, объединяет информацию о 47 млн экспонатов. Это основной источник информации о фондах и отдельных предметах большинства музеев РФ.

Оцифровка музейного архива

Инвентарные книги: что это и зачем они нужны

Инвентарная книга музея (книга поступлений основного фонда музея) — официальный документ, систематизированный реестр, который содержит подробную информацию обо всех предметах, которые находятся в музейной коллекции.

Это, как минимум, 11 основных параметров:

  1. №№ п/п
  2. Дата регистрации
  3. Наименование, краткое описание визуальных характеристик музейного предмета. Сведения в том числе об авторе, школе, времени и месте создания, производства, находки
  4. Количество музейных предметов
  5. Материал, техника изготовления
  6. Размер
  7. Состояние сохранности
  8. Источник и форма поступления в том числе закупка, дарение, пожертвование, завещание
  9. № и дата акта ПХ
  10. Название и шифр фондовой коллекции, в которую включается музейный предмет. №№ по инвентарной книге, специальной инвентарной книге
  11. Примечание

В России первые упоминания о таких документах относятся к XVIII веку, когда начали формироваться первые музейные учреждения и возникла потребность фиксировать поступления, создавать описания предметов, классифицировать их.

Предназначение инвентарных книг:

  • Юридическое: они служат основным документом первичной регистрации музейных предметов, подлежащим обязательному оформлению (нумерация, прошивка, опечатывание печатью
  • Научное: инвентаризация позволяет изучать, описывать и определять музейные предметы, формируя базу данных для исследований
  • Организация хранения: книги структурируются по фондовым коллекциям, что помогает управлять размещением предметов, включая децентрализованное хранение.
  • Историко-культурное, архивное: их ведение обеспечивает контроль за сохранностью фондов и предотвращает утрату информации о предметах
  • База данных: информацию из инвентарных книг используют для создания виртуальных музеев и предметных картотек

Получить консультацию

Почему оцифровка книг поступлений основного фонда – это база?

Один из доводов: подробное описание предметов музейных коллекций в электронном формате – это, на самом деле, каркас дальнейшей цифровизации музейного дела.

А доступная цифровая культура может стимулировать креативных работников к использованию мотивов российского исторического наследия. Это шаг к экспорту культурного суверенитета РФ по всему миру.

Оцифровка инвентарных книг поможет: 

  1. Сохранить данные: цифровые копии защищены от физической порчи; 
  2. Унифицировать данные: перевод в машиночитаемый вид (XML, JSON) позволяет интегрировать данные в Госкаталог
  3. Анализировать информацию: структурированные данные становятся основой для исследований, выставочных проектов и образовательных программ. 

Преимущества для всех: 

  • для посетителей: возможность виртуальных туров с детальными описаниями экспонатов
  • для ученых: доступ к метаданным через API для кросс-культурных исследований
  •  для сотрудников музеев: автоматизация учета, снижение риска ошибок при инвентаризации. 

Таким образом, цифровая база данных на основе инвентаризационных книг позволяет решать основные музейные задачи:

  • Учет и хранение
  • Каталогизация
  • Подготовка выставок и публикаций
  • Реставрация
  • Создание систем для посетителей
  • Публикация коллекции в Интернет

Если говорить ещё шире, оцифровка архивных документов, в целом, — обязательный этап создания общероссийской цифровой платформы для поиска и работы с электронными архивными данными. Этому вопросу, который связан с вопросами защиты исторической правды, посвящен майский указ президента РФ № 314 «Об утверждении Основ государственной политики Российской Федерации в области исторического просвещения».

Картинка оцифровка исторического наследия

Стандарты и требования

Данные, переданные в Госкаталог, должны соответствовать формату LIDO (Lightweight Information Describing Objects), который поддерживает мультиязычный формат и связь с внешними базами (например, Wikidata).

Схема LIDO предназначена для выгрузки метаданных с целью их дальнейшего использования в электронных каталогах, публикации данных и обмена данными в веб-среде. LIDO поддерживает разнообразную дескриптивную информацию о музейных объектах, объектах материальной культуры и т. д.

Таким образом, текст инвентаризационных книг нужно не просто сканировать, но и семантически его структурировать. 

Сложности оцифровки: рукописный текст, сокращения, уникальные описания

Перевод инвентарных книг в цифровой формат сопряжен с техническими вызовами: 

  • Распознавание рукописных записей: различные почерки, архаичные шрифты, пометки разных эпох, на разных языках
  • Специфика описаний: тексты длиной до 2000 символов, термины на устаревших языках (например, церковнославянском), сокращения («дер.» вместо «дерево», «XIX в.»); 
  • Сложная структура данных: таблицы, схемы, вклеенные листы.

Что это значит для процесса оцифровки? Это означает, что на первый плаз выходит

Получить консультацию

Этапы оцифровки музейных книг

  1.     Экспертиза архивного фонда. Как правило, очный выезд на место. Хотя иногда возможно оценить объём работ и дистанционно, для чего потребуется весьма щепетильно заполнить опросный лист.
  2.     Предпроектная подготовка: выбор нужного оборудования, подготовка участка работы.
  3.     Сканирование: использование планшетных сканеров с разрешением 400-600 DPI для сохранения мельчайших деталей.

Чтобы безопасно отсканировать учетные документы, которые в большинстве представляют их себя сшитые книги, нужно применять профессиональное бесконтактное оборудование.

Компания «Биорг» может организовать участок сканирования непосредственно на территории музея. По согласованию (в том числе, если это легитимно, не противоречит законодательству) документы можно отсканировать в Центре обработки данных «Биорг».

  1.     Предобработка: устранение искажений, шумоподавление, выравнивание изображений.
  2.     Распознавание текста: применение OCR с ИИ, обученного на исторических документах.
  3.     Верификация: проверка данных экспертами-историками, архивистами.
  4.     Загрузка нормализованного массива данных в информационную систему музея и в Госкаталог.

Пример сложного случая:

В инвентарной книге Третьяковской галереи описание картины занимает 1,5 страницы. Текст включает устаревшие термины («живопись масляная на холсте, натянутом на подрамник»), сокращения («в.ч.» — «верхний четверт»), а также ссылки на реставрационные работы 1945 года.

Для корректного перевода в цифровой вид потребовалась не только технология ИИ, но и консультации реставраторов. А также технология двойного ввода.

Оцифровка на базе ИИ. Картинка

Роль ИИ в оцифровке: опыт компании «Биорг»

Компания «Биорг» разработала платформу для автоматизации оцифровки инвентарных книг музеев. Это фундаментальная разработка и объект инноваций на базе технологии Beorg Smart Vision, созданной при поддержке фонда «Сколково». Платформа модульная, что позволяет гибко подходить к разным проектам оцифровки. И облачная – что позволяет компании «Биорг» полностью покрывать все потребности в вычислительных ресурсах. Некоторые преимущства:

  1.     OCR с ИИ: распознавание в том числе рукописного текста с точностью 99,9% даже в старых документах.
  2.     Модуль верификации – для сложных случаев, когда рапознавание силами ИИ невозможно.
  3.     Контекстный анализ: система учитывает исторические сокращения и варианты написания (например, «икона» и «образ» как синонимы).
  4.     Постоянное дообучение: система адаптируется к особенностям конкретного массива данных, улучшая точность с каждым обработанным документом.

Кейс: Оцифровка фондов музея

В 2024 году «Биорг» завершил проект по переводу 120 томов инвентарных книг: 

  • Обработано 850 000 строк; 
  • Точность распознавания — 99,7%; 
  • Срок выполнения — 4 месяца (вместо 2-3 лет при ручном вводе). 

Технологические особенности проекта: 

  • Мультимодальность: одновременная обработка текста, графики и таблиц; 
  • Семантический парсинг: автоматическое выделение ключевых атрибутов (например, аавтор, материал, дата создания); 
  • Интеграция с ГИС

Глобальный контекст и будущее цифровых архивов

Оцифровка музейных коллекций — тренд, который набирает обороты во всем мире. Например, проект Google Arts & Culture оцифровал более 2000 музеев, а Британский музей предоставляет доступ к 4,5 млн цифровых объектов.

Перспективы развития

  • Виртуальная и дополненная реальность: создание 3D-моделей экспонатов на основе данных из инвентарных книг; 
  • Блокчейн: обеспечение прозрачности цепочки поступлений и защиты от краж; 
  • Гражданская наука: вовлечение волонтеров в верификацию данных через краудсорсинговые платформы. 

Сформируем вместе цифровое пространство культурного наследия РФ

Оцифровка инвентарных книг — не просто рутинная техническая задача, а основа цифровой трансформации музеев. Обеспечивает сохранность и доступность культурного наследия. 

Применение автоматического распознавания на базе ИИ позволяет преодолеть сложности ручной обработки архивов. Однако применять технологию можно только в синтезе с другими методами оцифровки, а также экспертными знаниями в области музейного дела и сложных проектов оцифровки.

Если вам нужно выполнить оцифровку быстро, качественно и в сжатые сроки, задачу надо решать вместе с опытным подрядчиком, который имеет портфолио крупных проектов. Биорг – надежный подрядчик в масштабных проектах оцифровки:

  • есть собственный парк оборудования
  • есть услуга выездного сканирования
  • есть собственный центр обработки данных

Все технологии уже готовы — осталось сделать решительный шаг в цифровое будущее.

Получить консультацию

Работаем только с юридическими лицами

Работаем только с юридическими лицами.

    На указанный вами email мы автоматически пришлем презентацию.

      На указанный вами email мы автоматически пришлем типовое ТЗ.

      Работаем только с юридическими лицами.

      Вся информация по трудоустройству на странице "Вакансии"

      Ошибка: Контактная форма не найдена.

      Ошибка: Контактная форма не найдена.