Содержание
Сохранить историческое наследие — важная задача государства и крупных компаний, которую они реализуют через институт архивов и библиотек. Особую ценность в фондах представляют старые документы, рукописи, книги, а также выполненные на кальке технические чертежи, схемы, геокарты.
Проблема в том, что бумажные носители со временем ветшают, рвутся и выцветают — теряется читаемость текста. Оцифровка архивных старых документов, их систематизация и перевод в электронный архив позволяют надёжно сохранить информацию и сделать её доступной для пользователей и исследователей.
Например, с 2023 года в России стали усиленно проводить оцифровку географических карт-плашетов для наполнения Национальной системы пространственных данных. Сырьевые компании переводят в электронный вид чертежи скважин, месторождений и пр. Предприятия оцифровывают чертежи оборудования и цехов.
Сохранить историческое наследие — важная задача государства и крупных компаний, которую они реализуют через институт архивов и библиотек. Особую ценность в фондах представляют старые документы, рукописи, книги, а также выполненные на кальке технические чертежи, схемы, геокарты.
Проблема в том, что бумажные носители со временем ветшают, рвутся и выцветают — теряется читаемость текста. Оцифровка архивных старых документов, их систематизация и перевод в электронный архив позволяют надёжно сохранить информацию и сделать её доступной для пользователей и исследователей.
Например, с 2023 года в России стали усиленно проводить оцифровку географических карт-плашетов для наполнения Национальной системы пространственных данных. Сырьевые компании переводят в электронный вид чертежи скважин, месторождений и пр. Предприятия оцифровывают чертежи оборудования и цехов.
Процесс перевода бумажных документов в электронный формат называется оцифровкой. Она состоит из технических этапов сканирования и распознавания. Для старых и ветхих материалов требуется особо бережный подход.
Основные этапы оцифровки архивных документов:
Для рукописных текстов и старинных шрифтов применяется смешанное, но преимущественно ручное распознавание, так как нейросети плохо справляются с нестандартными шрифтами и рукописными буквами.
В компании Биорг для верификации данных силами людей есть собственный краудсорсинговый ресурс — облачная платформа. Благодаря этому инструменту возможно удалённое трудоустройство различных экспертов, например, картографов или рядовых операторов.
Сканирование и распознавание документов открывают следующие возможности:
Государственный архив РФ — крупнейшее собрание уникальных дореволюционных документов. Хранит более 500 тыс. ветхих единиц начала XVIII — начала XX века.
Российский государственный архив древних актов — свыше 300 тыс. ветхих рукописей XI–XVII веков. Документы имеют угасающий текст, разрушения пергамена, выпадение листов.
Областные госархивы — хранят региональные материалы по истории, экономике, культуре. Доля ветхих может достигать трети фондов.
Муниципальные архивы городов, фонды БТИ — хранят дела местных органов власти, предприятий, организаций. Содержат значительное количество ветхой документации.
Кроме государственных хранилищ, ветхие материалы сосредоточены в музеях, библиотеках, частных собраниях. К примеру, Отдел рукописей Российской национальной библиотеки хранит около 100 тыс. ветхих единиц.
Для сохранности ветхие документы переводят на микроносители — микрофильмы и цифровые копии. Оригиналы хранятся в специальных условиях. Доступ к ним строго регламентирован, выдача происходит по запросу и под контролем сотрудников.
Частота обращений к ветхим документам невысока — порядка 5–8% от общего объёма запросов. Это обусловлено сложностью работы с физически нестабильным носителем. Однако интерес исследователей к таким материалам постоянно растёт.
В этой связи востребована оцифровка архивных документов, в том числе ветхих. Оцифровку и распознавание документов можно заказать в компании Биорг, которая обладает собственным парком современного оборудования для сканирования широкоформатных документов. Компания также предоставляет услугу выездного сканирования.
Бумажные носители со временем ветшают, рвутся и выцветают — теряется читаемость текста. Оцифровка позволяет надёжно сохранить информацию, сделать её доступной для исследователей, снизить нагрузку на физические оригиналы и обеспечить компактное долговременное хранение. При правильном хранении электронные копии могут пережить физический носитель на века.
Процесс включает шесть этапов: подготовка материалов (удаление скрепок, при необходимости — реставрация); сканирование на профессиональных планетарных или поточечных сканерах с разрешением до 600 dpi; обработка изображений (цветокоррекция, удаление дефектов); OCR-распознавание; создание электронных копий в форматах PDF, DjVu, TIFF; размещение в защищённых хранилищах с резервным копированием.
Для рукописных текстов и старинных шрифтов применяется преимущественно ручное распознавание, так как нейросети плохо справляются с нестандартными шрифтами и рукописными буквами. В компании Биорг для этого используется собственная краудсорсинговая облачная платформа, где работают удалённые эксперты — в том числе картографы и специализированные операторы.
Для сканирования ветхих документов применяются профессиональные планетарные или поточечные сканеры в режиме, исключающем повреждение оригиналов. Разрешение до 600 dpi обеспечивает высокое качество изображения. Биорг располагает собственным парком современного оборудования, в том числе для широкоформатных документов, и предоставляет услугу выездного сканирования.
Крупнейшие хранилища: Государственный архив РФ (более 500 тыс. ветхих единиц XVIII–XX вв.), Российский государственный архив древних актов (свыше 300 тыс. рукописей XI–XVII вв.), Отдел рукописей Российской национальной библиотеки (около 100 тыс. ветхих единиц). Значительный объём ветхих документов хранится также в областных и муниципальных архивах, фондах БТИ, музеях и библиотеках.
Оцифрованные документы сохраняются в форматах PDF, DjVu, TIFF и других. При необходимости создаётся несколько копий разного качества и объёма. Электронные архивы размещаются на надёжных серверах с резервным копированием на отдельные носители для долговременного хранения.
Работаем только с юридическими лицами
Работаем только с юридическими лицами.
Работаем только с юридическими лицами.
Ошибка: Контактная форма не найдена.
Ошибка: Контактная форма не найдена.
Ошибка: Контактная форма не найдена.