Страница 1 из 1

Сведения о DjVu формате

СообщениеДобавлено: 23 май 2009, 04:23
Валентин Эрикович

Сведения о DjVu формате


DjVu - графический формат, оптимизированный для хранения отсканированных документов. В частности он идеально подходит для создания электронных книг. Существует два традиционных способа хранения отсканированной книги: для энтузиастов это распознавание (OCR) с последующей подготовкой полноценного текстового электронного документа, менее терпеливые люди выкладывают непосредственно "сканы" - отсканированные картинки, часто собранные в pdf документ. В первом случае требуется чертова прорва работы, во втором получаются файлы размером в десятки и даже сотни мегабайт.
Отныне существует компромиссный вариант - перевод отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные рисунки сохраняются с разрешением 300dpi, все остальное считается фоном и сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный документ без потери его читаемости. В DjVu размер файла отсканированной книги оказывается в пределах нескольких мегабайт, что вполне приемлемо.
Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время формат DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Файлы с расширением DjVu, я надеюсь, скоро перестанут быть экзотикой на просторах сети.