Библиотека специальной литературы содержит большое количество научно-технических и справочных материалов для профессионалов из различных отраслей знания. Часто эти данные уникальны, существуют на единственном бумажном носителе, поэтому сохранить доступ к этой информации – крайне важно.
Что может случиться, если своевременно не перевести уникальные документы, книги и книжные памятники в электронный вид? Многие, наверное, помнят пожар в ИНИОН РАН в 2015 году, когда одномоментно было уничтожено более 5 млн изданий, свыше 2 млн 300 тыс. из которых — утрачены навсегда или с трудом могут быть восстановлены.
Оцифровать специальные библиотеки важно в связи с активным развитием информационного общества и нарастающей ценностью машиночитаемых данных: когда с информацией можно работать в автоматическом режиме, осуществляя её поиск и анализ. Сейчас появилось специализированное программное обеспечение, предназначенное именно для оцифровки документов. Об этом процессе лучше рассказать детально.
Оцифровка книг, методических пособий и технической документации/чертежей — весьма продолжительный и сложный процесс, требующий высокого профессионализма и многоступенчатой проверки распознанных данных.
Вот общий пошаговый план, который в своей работе используют эксперты рынка оцифровки данных:
Определить содержание библиотеки, создав их каталог или дополнив уже существующий. Каталог содержит информацию обо всех документах в библиотеке. Каталог должен содержать информацию о названии, авторе, годе публикации, издателе и актуальности. По сути, это стандартная библиотечная карточка, только в электронном виде. Не стоит умалять значения каталога: без него найти нужный материал будет очень сложно.
Выбрать оптимальный формат. Оцифровка библиотеки специальной литературы может быть выполнена в PDF, DjVu и TIFF форматах. Каждый имеет свои особенности и преимущества. Например, формат PDF обеспечивает отличную читаемость и сохраняет оригинальное качество материала. DjVu — самый компактный формат, что делает его идеальным для хранения и передачи больших объемов информации. Формат TIFF обеспечивает наивысшее качество изображения и может быть рекомендован для сохранения ценных и уникальных документов, однако такие файлы «весят» весьма существенно и занимают много место в системе хранения данных.
Подготовить документы. Это включает очистку их от пыли, выявление отсутствующих, деформированных страниц и других повреждений. Если вы работаете с раритетными книгами, старинными документами (планом здания XVII столетия, к примеру), то рекомендуется обратиться к профессионалам, которые могут оказать помощь в подготовке, возможно, предварительно отреставрируют документ, во избежание порчи оригинала и утраты ценных исторических данных навсегда.
Отсканировать документы. Скан образ – первый шаг к созданию цифровой копии документа. Для сканирования документов и книг разных форматов и разной ценности существуют разные виды оборудования – потоковые, планшетные, планетарные сканеры, камеры с очень высоким разрешением, специальные столы и др. Важно отметить, что состояние документа может повлиять на качество сканирования. Улучшить качество отсканированного изображения можно с помощью специального ПО, хотя и не всегда.
Оцифровать документы. Дальнейшая работа осуществляется с цифровыми копиями документов. Отсканированную информацию переводят в электронный машиночитаемый вид – распознают данные – с помощью специализированного программного обеспечения и оборудования. В качестве примера ПО и сервиса для распознавания можно привести платформу Beorg Smart Vision. Система извлекает и классифицирует данные отчетов, чертежей и других документов с использованием искусственного интеллекта, нераспознанные данные верифицируют люди, операторы, подключенные к облачной части платформы.
Архивация электронных документов. Для технических данных можно использовать программное обеспечение вроде «Смарт Архив», которое имеет в себе все необходимые функции для хранения, удобного поиска и работы с электронными версиями документов, а также позволяет настроить защищенный доступ или уровни доступа, в том числе установить специальные электронные метки, ограничения на печать (при попытке распечатать такие документы последние будут испорчены) и т. д. Главное — сделать всё так, чтобы в электронный архив можно было получить доступ максимально быстро и только тем людям, которые имеют на это право.
Проверить результаты. После оцифровки библиотеки специальной литературы необходимо проверить результаты, чтобы убедиться в их качестве и читаемости. Наличие ошибок и неточностей выявляют в несколько этапов – и программным и ручным способом. Верификация, проверка итоговых данных — это контроль качества, то есть важнейший этап оцифровки. Ведб неверные, искаженные данные, получившиеся в результате непрофессиональной оцифровки, перечеркивают весь титанический труд по перевод документов в электронный вид. В чем смысл оцифровки, если на выходе данные искажены? Если речь идет, например, о неточностях в специальных чертежах, то цена ошибки чрезвычайно высока.
В современных реалиях применять для оцифровки данных лучше отечественный софт, импортонезависимое программное обеспечение. Особенно это касается узкоспециализированной информации или данных высокой важности.
В то же время должна быть возможность быстрого контроля и доработки распознанной информации. Просто изображение сложного чертежа, по сути, ничего не даст. Его надо распознать, а результат распознанного программными средствами изображения надо проконтролировать, желательно с привлечением эксперта-человека. Почему так сложно? Причина в том, что нейросети и алгоритмы хорошо справляются только с типовыми данными – распознавание печатного паспорта, структурированных документов с неизменяемой формой и пр. А с рукописными и нестандартными данными эффективность нейросетей до сих пор под вопросом. Выбранное решение должно быть технологичным и достаточно гибким: автоматическое распознавание и верификация должны происходить в едином контуре.
Последовательное и ответственное выполнение всех шагов обеспечивает сохранность, быстрый и удобный доступ к информации.
Да, оцифровка специальных библиотек, как и любых нестандартных документов — процесс довольно сложный и требуюет существенных затрат времени и денег. Лучший вариант — доверить оцифровку профессионалам, имеющим обширный опыт такой работы и экспертизу.
Работаем только с юридическими лицами
Работаем только с юридическими лицами.
Работаем только с юридическими лицами.
Ошибка: Контактная форма не найдена.
Ошибка: Контактная форма не найдена.