Автоматизированные архивные технологии
Главная страница Автоматизация архивной деятельности
Новости
Статьи
Программы
   АвтоАФ 10
   АвтоФонд 6
   АвтоОпись
   ФоКа
   ОРФ
   Свежий взгляд
   Скриншоты
Скачать
Купить
FAQ (ЧаВО)
Отзывы
Автор
Обзор софта
Разное
Книги
Ссылки
Карта сайта
 

Отзыв на Рекомендации по созданию оцифрованных копий фонда пользования фото и фонодокументов

Создание фонда пользования

В декабре 2006 года назад ознакомился с «Рекомендациями по созданию оцифрованных копий фонда пользования фото и фонодокументов» от РГАНТД. Цитирую начало абзаца из главы «Принципы создания цифровых копий фотодокументов», вызвавшее наиболее бурный коллективный смех:

 

Любое изображение, запечатлённое на фотодокументе, может быть представлено в виде двумерной функции, описывающей распределение оптической плотности (почернения) или цвета по поверхности документа. Аргументами такой функции являются ширина и высота изображения. Преобразование изображения в цифровую форму заключается в приближении этой двумерной функции двумерным массивом чисел посредством сканирующего устройства – сканера.

Для кого памятка предназначена, непонятно – для математиков или для архивистов – написано сложным для понимания языком. Для хранения предлагается использовать строго CD, хотя устаревают уже и DVD, а в обиход входяд диски ещё большего объёма HD-DVD и Blue-Ray. В целом, памятка имеет качество незаконченного черновика.

2. Выбор носителя.

Из-за того, что данные о надёжности и долговечности DVD-R носителей отсутствуют, рекомендуется использовать DVD-R-диски только в тех случаях, когда необходимо записать на один носитель объём информации больше, чем ёмкость CD-R диска.

Отказываться от более ёмких носителей только из-за отсутствия сведений в литературе не имеет смысла. Уже используются BlueRay и HD DVD диски и дисководы. Всё равно нужно использовать CD?

Как сказано ниже, средний объём страницы формата A4 ~ 20 Mb. Учитывая среднее количество листов в деле 90, получается 20×57=1,11 Gb. Если учитывать и оборотные листы, то придётся каждое дело записывать на несколько CD. Это невыгодно и неудобно. Получается, что почти всегда необходимо записать на один носитель объём информации больше, чем ёмкость CD-R диска

Кроме оптических носителей ничего не говорится про другие более ёмкие накопители: ленточные накопители, DVD-библиотеки, системы хранения данных на жёстких дисках.

В разделе 4 Фонодокументы нет ни слова о форматах для хранения звуковых файлов – CD-DA, WAV, MP3, форматы без потерь.

Местами в Рекомендациях использованы нерасшифрованные термины (глубина резкости и т.д.), местами много лишних подробностей.

К широко используемым способам сжатия без потерь относятся стандартные дисковые (напр. Microsoft DoubleSpace) и файловые (напр. PKZIP) утилиты сжатия. К сожалению, эти утилиты несовместимы с различными платформами (Macintosh/PC), получаемый с их помощью выигрыш в размере файла ограничен, а на открытие, запись и закрытие сжатых файлов требуется больше времени.

Абзац абсолютно ненужный и непонятный. Ни DoubleSpace, ни PKZIP теперь не используются.

Платформа в архивах используется только одна – PC. Форматы теперь уже мало зависят от платформы – на любой платформе есть утилиты для просмотра/конвертации файлов любых графических форматов.

Процесс сканирования состоит из этапа предварительного сканирования (режим PREVIEW) и этапа окончательного сканирования, при котором документ в виде оцифрованного файла (видеофайла) записывается в компьютер.

Отдельным, очень важным вопросом является выбор формата записи цифровых копий оригиналов (видеофайлов) на диск CD-R.

…и в других местах графические файлы почему-то названы видеофайлами.

5.1. Принципы создания цифровых копий фотодокументов.

Любое изображение, запечатленное на фотодокументе, может быть представлено в виде двумерной функции, описывающей распределение оптической плотности (почернения) или цвета по поверхности документа. Аргументами такой функции являются ширина и высота изображения. Преобразование изображения в цифровую форму заключается в приближении этой двумерной функции двумерным массивом чисел посредством сканирующего устройства – сканера. При этом изображение автоматически раскладывается на мельчайшие участки – точки или пиксели (элементы изображения). Для качественного преобразования изображения сканеру задаётся разрешение – значение шага дискретизации при оцифровании, определяющее количество пикселей по горизонтали и вертикали. Оптическая плотность и/или цвет каждого из этих пикселей измеряется, преобразуются в цифровую форму и записываются в виде числа или группы чисел (в случае цветного изображения) в память персонального компьютера. Запись ведется в строго определённом порядке (строка за строкой), так, чтобы потом из этих чисел можно было сформировать исходное изображение. Число строк в изображении равно числу пикселей по вертикали в данном изображении.

Цветовая характеристика фотодокумента предопределяет разрядность цифрового массива, представляющего изображение, и, следовательно, его объём. Пиксель чёрно-белого изображения (серого полутонового изображения) – это, как правило, один байт информации (8 бит или 256 градаций серого, в современных сканерах до 16 бит – 65536 градаций). Пиксель цветного изображения в формате RGB – это, по крайней мере, три байта информации (24 бита или 16777216 цветов, в современных сканерах до 48 бит – свыше 280 триллионов цветов). Цветное изображение в формате RGB образуется смешением в каждом пикселе в соответствующих пропорциях трёх цветов – красного (red), зелёного (green), и синего (blue).

Абсолютно ненужный и непонятный раздел.

5.2. Сканирующее устройство. Основные характеристики

5.2.1. Общие представления о конструкции сканера.

Сканер — это устройство ввода текстовой или графической (фотографии, рисунки) информации в компьютер путём преобразования её в цифровой вид (цифровой образ) для последующего использования, обработки, хранения или вывода.

Сканеры позволяют ввести только графическую информацию. Текст распознаётся уже в компьютере.

Так как диски DVD-R продаются в контейнерах «dvd-box», то после записи их для удобства хранения необходимо переложить в контейнеры «jewel case».

Диски также продаются в банкам десятками, сотнями штук. Куда девать dvd-box и что это такое?

В разделе 5.4. Выбор оптимального разрешения и формата записи на диск ничего не сказано про формат JPEG2000, который может сжимать как с потерями, так и без. В отличие от JPEG при сильном сжатии на картинке появляются не шумные пиксели, а размытые.

Не сказано про отдельное сканирование очень маленьких фотографий, если они расположены на листе формата A4. Их нужно сканировать отдельно с большим разрешением.

Ручные сканеры.

Для того чтобы ввести в компьютер какой-либо документ при помощи ручного сканера, надо без резких движений провести сканирующей головкой по изображению. Таким образом, проблема перемещения считывающей головки относительно оригинала целиком лежится на пользователя. Равномерность перемещения сканера существенно сказывается на качестве вводимого в компьютер изображения. В ряде моделей для подтверждения нормального ввода имеется специальный индикатор. Ширина вводимого изображения для ручных сканеров не превышает обычно 10 см. К основным достоинствам ручных сканеров относятся небольшие габаритные размеры и компактность.

Ненужная глава – ручные сканеры сейчас не используются, а возможно и не продаются.

В Таблице 5.4.1 нет самого распространённого разрешения 300.

Нет информации о вариантах сканирования небольших фотографий с группой людей или больших портретных фотографий.

Поэтому, на основании всего вышеизложенного, мы рекомендуем при создании фонда пользования фотодокументов архива записывать цифровые копии оригиналов на диски CD-R в виде цифровых файлов в формате TIFF (несжатом) с разрешением, основанном на эмпирических данных таблицы 5.4.1.

Непонятна причина использовать TIFF формат без сжатия, в то время как LZW сжатие даёт существенный выигрыш в объёме.

Тогда абзац Соответственно для цветного изображения того же размера вполне достаточно 3–6 Мб на одну цифровую копию (или в 3 раза больше, чем для ч/б оригинала). абсолютно противоречит процитированному выше, т.к. средний объём страницы A4 в формате TIFF даже с LZW сжатием ~ 20 Mb.

5.5 Технология копирования

цифровые копии оригиналов:

  • могут непосредственно использоваться потребителями;
  • формировать страховой фонд.

Цифровые копии не являются страховым фондом, это фонд пользования.

Для выполнения работ создается директория с именем, например, «Phono» объёмом 20 Гб.

Несоответствие терминологии: местами каталоги названы директориями, местами папками.

Как можно создать папку с каким-то объёмом?

  • не используйте ручку, карандаш или маркер для отметок на диске;

Получается, сами диски не должны никак помечаться? Как тогда отличать диски вне коробок?

5.6. Учёт цифровых копий архивных фотодокументов.

В отличие от фонодокументов, для фотодокументов описана какая-то конкретная программа, в которой нужно дублировать информацию Архивного Фонда. Текстовая информация должна храниться в Архивном Фонде, а графическая (фоно и любая другая) должна быть привязана к программе своей структурой папок (Ф.1\Оп.2\Д.123).

Нет информации о заполнении в Архивном Фонде, единственной общеархивной программе, поля «Имеет фонд пользования».

Нет информации о сохранении оригинального и отретушированного изображения – предлагается сразу изображение приводить к лучшему виду.

Нет информации о дополнительных способах увеличения надёжности сохранности данных на CD/DVD – сохранение контрольных сумм (CRC32, MD5), файлов с избыточными данными (IceECC)

Нет информации об ускорении работы – кроме ADF можно использовать функции многих программ для автоматического пакетного сканирования изображений с заданными или средними параметрами. Пользователю остаётся только перелистывать страницы.

В качестве графического редактора предлагается только Adobe PhotoShop. Кроме этой дорогой программы есть ещё множество более дешёвых или бесплатных. Также не названы бесплатные звуковые редакторы.

Есть также программы для автоматического пакетного выравнивания изображений, очистки от мусора.

Нет информации о способах восстановления повреждённых данных с CD/DVD.

В целом, памятка создаёт впечатление незаконченного черновика.

Плотников Сергей Александрович
Зам.начальника отдела НСА, ААТ и ИПС
Государственное областное учреждение «Государственный
общественно-политический архив Пермской области» (ГОУ ГОПАПО)
Адрес: ул. Большевистская, 162, г. Пермь, 614068, Россия

Понравилась статья? Расскажите о ней друзьям!

 

© 2004–2022 Сергей Плотников, сайт Автоматизированные архивные технологии
Rambler's Top100