Есть ещё и что-то наподобие: DjVu Solo v3.1 Коммерческая версия + SoloEx Beta 2 by Gencho. Это самодельный комплекс из 2 программ, благодаря которому стало возможным пакетное кодирование в DjVu. Правда, он ещё довольно несовершенен: для пакетного кодирования в DjVu нужно создать файл-задание, представляющий из себя список всех кодируемых файлов и опций (для каждого файла). И делать такой файл-задание нужно вручную! Я уже написал Генчо письмо, в котором попросил автоматизировать процесс создания файла-задания. Тут ведь работы ему на 5 минут, не пойму я, в чём проблема.

Кроме DjVu Solo v3.1 есть, правда, разные консольные утилиты для кодирования в DjVu, в том числе и в пакетном режиме, но они, к сожалению, дают на выходе DjVu-файлы гораздо большего размера (и, по моему субъективному ощущению, визуально хуже), чем у DjVu Solo v3.1 в режиме "scanned" (это, из моего опыта, самый "маленький" режим для создания DjVu-книг).

Я сравнивал разные DjVu-кодировщики, чтобы определить, какой самый эффективный, т. е. какой создаёт DjVu-файл самого маленького размера. Я кодировал в DjVu один и тот же контрольный pbm-файл, благо, что ВСЕ DjVu-кодировщики принимают его на входе.

Pbm-файл можно сделать из tif-файла так: открываем tif-файл в Adobe Acrobat v5.0 и сохраняем его как ps-файл. Далее программой GSview 4.6 for Win32 конвертируем (не сохраняем, а именно конвертируем) ps-файл в pbm-файл, выбирая устройство "pbmraw" (устройство "pbm" не подойдёт, такой файл не откроется в DjVu Solo v3.1) с разрешением 300 или 600 dpi, как Вам больше нравится.

НЕ нашли? Не то? Что вы ищете?

По результатам контрольного кодирования в DjVu выяснилось, что самым эффективным DjVu-кодировщиком является DjVu Solo v3.1 (он создаёт DjVu-файлы v21). Он превзошёл даже DjVuEditor Pro v4.1 build 333 Rus (который создаёт DjVu-файлы v25) (на 1 %)!

На втором месте оказался кодировщик cjb2.exe из 3 разных источников: этот cjb2.exe (создаёт DjVu-файлы v23); cjb2.exe из пакета Cygwin DjVuLibre v3.5.11.3 (создаёт DjVu-файлы v24); cjb2.exe из пакета DjVuLibre v3.5.13 for Win (создаёт DjVu-файлы v24). Такой DjVu-файл получился больше на 42 %, чем у DjVu Solo v3.1.

Хуже всех показал себя DjVu-кодировщик DjvuEncode. exe (создаёт DjVu-файлы v18), который есть в пакете DjVu GUI. С опциями "-b -dl - q100" (как рекомендовано в пакете DjVu GUI) он создал DjVu-файл на 50 % больше, чем у DjVu Solo v3.1!

Вариант онлайнового преобразования в DjVu (на Any2djvu. DjVuzone. org) (создаёт DjVu-файлы v21) оказался лучше даже чем DjVu Solo v3.1! Этот же контрольный файл получился на 3% меньше, чем у DjVu Solo v3.1. Впрочем, я вообще-то считаю этот вариант экзотическим и согласен с не помню чьим мнением, что он пригоден лишь для ускорения скачивания Pdf-файлов, выложенных в Интернете (через преобразование их в DjVu).

Формат DjVu действительно очень важен, ведь он даёт возможность создать в Интернете БЕСПЛАТНЫЕ электронные библиотеки с ЛЮБЫМИ книгами. Даже с теми, которые не поддаются распознаванию из-за обилия формул, рисунков, графиков и т. п. В Интернете с 2003 года уже есть такие библиотеки, например, Библиотека научной литературы и прочие. Сейчас они переживают период бурного роста. В основном они содержат DjVu-книги, но также ещё и Pdf и Ps-файлы. Там дело идёт уже к десяти тысячам книг. Ещё недавно всё это показалось бы фантастикой. Такие библиотеки открывают огромные информационные возможности и к тому же доступные по деньгам! Они являются бесценной находкой для студентов, аспирантов, учёных и просто интересующихся людей. Это будет покруче пресловутых рефератов. Заметьте, ведь всё это - уже политический вопрос, потому что, во-первых, теперь почти каждый человек (при желании) получает доступ к ОГРОМНОМУ количеству образовательной научной учебно-справочной документации, количество которой в данный момент стремительно растёт, а во-вторых, также почти каждый человек при желании может внести свою посильную лепту в рост бесплатных DjVu-библиотек, так сказать, поучаствовать в политике. DjVu теперь - это политическая технология.

Я для того и сделал эту страницу, чтобы способствовать развитию таких бесплатных электронных DjVu-библиотек. Я хочу показать людям, что можно и нужно создавать DjVu-книги и выкладывать их в Интернет. Я буду и дальше прорабатывать всю эту технологию - от сканирования книги до выкладывания её в Интернет - и постараюсь изложить здесь все подробности этого процесса.

Я хочу ещё раз обратиться к читающему эти строки: если у Вас есть компьютер со сканером плюс выход в Интернет, сделайте хотя бы одну DjVu-книгу (только нужно проверить, не сделана ли она уже) и выложите её бесплатно в Интернет. Это делается легко, просто и быстро. Всю информацию об этом Вы найдёте на этой странице. Даже если у Вас нет Интернета - всё равно сделайте DjVu-книгу и отложите её до лучших времён, когда у Вас появится возможность выложить её в Интернет.

Ведь самое сложное в этом деле - отсканировать книгу, но и это, в общем-то, не так трудно сделать. Любую, даже самую толстую бумажную книгу, можно отсканировать за 3-5 вечеров. Если Вы - студент, то возьмите бумажную книгу в институтской библиотеке и переведите её в DjVu. Вам же самому потом понадобится эта DjVu-книга - ведь институт-то Вы закончите и бумажную книгу вынужденно сдадите в библиотеку. А какой будет смысл в дипломе, если нет нигде никакой литературы по специальности, кроме как в библиотеке учебного заведения?

На мой взгляд, главный секрет в деле создания сканированной DjVu-книги - это ПОЭТАПНАЯ работа. Отсканировали книгу - отдыхаем пару дней, отредактировали - опять отдыхаем, и т. д. При поэтапной работе нет большого перенапряжения, книга создаётся постепенно, нагрузка на себя получается малозаметной. Тут можно привести аналогию с покупкой дорогой вещи - можно её сразу купить, а можно и в кредит. Что меньше напрягает?

Я уже сделал более десяти таких книг, и по опыту их создания могу сказать, что основная трудность в этом деле - чисто психологическая. Поначалу, глядя на бумажную книгу, подлежащую сканированию, думаешь, что всё это огромная работа, что сделать её нереально, и т. п. Но теперь я могу сказать, что здесь на самом деле работает принцип "Глаза боятся - руки делают". К тому же, выложив сделанную собою DjVu-книгу в Интернет, испытываешь ни с чем не сравнимое чувство удовлетворения.

14  2. PDF - программы и статьи

Этот раздел ещё полуготов, потому что основное внимание - к DjVu.

Программа

Размер

Зеркала

Кряк

Откуда

Комментарий

LEADTOOLS ePrint v4.0

16 МБ

Вроде бы есть на www. *****, но непонятно, куда вводить серийник?

Leadtools,
СКР

Виртуальный принтер для любого Windows-приложения. "Печатает" в 140 граф. форматов.

<a href="http://dl. /send/dir/14386

Скачивание DjVu-софта через почтовый ящик

Назад к разделу "DjVu-программы"

Я создал бесплатный большой (1 ГБ) почтовый ящик на Yahoo! и поместил туда DjVu-софт с этого сайта - его можно либо скачать из этого ящика, либо (в случае проблем со скачиванием из ящика) переслать в свой почтовый ящик и скачать его оттуда вручную (см. подробности ниже).

Если у Вас возникнут какие-то проблемы со скачиванием, или же с заходом в ящик или т. п. - просьба сообщить мне по электронной почте сюда:

Мой E-Mail ( monday2000 [at] *****)

1Доступ к ящику

Примечание: Не забудьте скачать WinRAR версии не ниже 3.40 - иначе Вы, возможно, не сможете распаковать архивы. Многие файлы в ящике просто упакованы в rar-архив.

1. Скачиваете программу Peer2Mail v1.60 (или выше) тут: http://www. /download. html   (1 МБ).

2. Инсталлируете её и запускаете.

3. Нажимаете на панели инструментов на кнопку со стрелкой вниз - эта кнопка находится справа от кнопки с изображением домика:

01.jpg (25256 bytes)

Выбираете "1 Gigabytes -> Yahoo Mail":

02.jpg (26759 bytes)

4. На загрузившейся Web-странице вводите логин-пароль доступа к ящику под  надписью "Enter your ID and password":

03.jpg (24558 bytes)

Yahoo! ID:  djvu_soft0001

Password:  (|i9K6vEaq9dx2l7n44nX5+JIdubJvv/n2zDjIFRIimKU=|)

Нажимаете кнопку "Sign In".

5. Если всё пройдёт нормально, то Вы зайдёте в ящик. Нажимаете на панели инструментов Peer2Mail кнопку button.jpg (5524 bytes):

04.jpg (24564 bytes)

Откроется окно "Segment Manager" и начнётся сканирование ящика с целью составления списка доступных файлов-"сегментов" (это обычные файловые вложения в письма, которые находятся в ящике, эти файловые вложения и есть нужный Вам файл, порезанный на куски Peer2Mail):

05.jpg (19037 bytes)

6. После окончания формирования списка доступных файлов-"сегментов" (т. е. когда произойдёт следующее:

а. Линейка "Progress" заполнится синими квадратиками до отказа:

bluebar.jpg (10259 bytes)

б. Исчезнет линейка "Listing segments":

greenbar.jpg (8663 bytes)

и появится список файлов-"сегментов") ставите флажки напротив тех файлов, которые хотите скачать и нажимаете активизировавшуюся при этом кнопку "Download":

06.jpg (21035 bytes)

Затем выбираете папку на своём жёстком диске, куда будут скачены файлы, нажимаете "Ok":

07.jpg (21869 bytes)

Начинается процесс скачивания файлов:

08.jpg (19121 bytes)

7. Загруженные файлы-"сегменты" склеиваются воедино в нужный Вам файл посредством программы Peer2Mail - либо сразу автоматически, либо потом вручную - смотря, какие были выставлены опции.

8. По окончании скачивания файлов-"сегментов" окно загрузки файлов закроется самостоятельно и тогда Вам следует выйти из ящика нажатием ссылки "Выйти":

09.jpg (24627 bytes)

а затем закройте все сервисы Yahoo нажатием ссылки "Выйти полностью":

10.jpg (22173 bytes)

Теперь закройте Peer2Mail.

1Как переслать файлы в свой почтовый ящик

Вы можете не скачивать файлы-"сегменты" из этого ящика, а переслать их в свой почтовый ящик (только в такой, который поддерживает 10 МБ вложения и rar-расширения аттачей - ***** и НЕ подходят, рекомендую *****) и скачать их оттуда - пересылка осуществляется полностью вручную, как обычно.

При возможной пересылке выбирайте опцию "Как встроенный текст" (по умолчанию применяется опция "Как приложение") - это нужно для того, чтобы файловые вложения (т. е. файлы-"сегменты") сохраняли свои имена при пересылке:

forward.jpg (12809 bytes)

Только не забудьте,  что склейка файлов-"сегментов" воедино в 1 желаемый файл осуществляется посредством Peer2Mail. И ещё в этом случае Вам потребуется вручную удалить расширения "doc" у скаченных сегментов перед склейкой их в Peer2Mail.

Список софта в ящике

Примечание: Список софта в ящике будет ещё расти в самое ближайшее время - в ящик будет выложен весь "бездомный" софт и софт с доступом только с русских IP-адресов.

Весь софт в ящике выложен без кряков. Кряки и серийники выложены в разделе "DjVu-программы". Поиск нужной программы в ящике осуществляется по имени файла - смотрите графу таблицы "Файл в ящике".

Название программы

Файл в ящике

Размер

1.

Document Express Enterprise with DjVu 5.1.0 build 946 (Light Edition)

DEE_5_1_0_LE. rar

18,7 МБ

2.

JRA Publish v2.000 (НЕ взломанный!!!)

JRAPublish_v2_0.rar

65,5 МБ

3.

Document Express Enterprise v.5.1.0 Help

dee51le_help. rar

5,89 МБ

4.

LizardTech PDFToDjVu GUI (no installer) (для Win NT / 2000 / XP)

pdftodjvugui. rar

183 КБ

5.

PDFToDjVu Help

pdftodjvudocs. rar

360 КБ

6.

DjvuOCR v2.0 pre

DjvuOCR_2.0_pre. rar

1,16 МБ

7.

LizardTech Virtual Printer Pro v4.1 (для Win 98 / ME)

vpd_4_1_9x. rar

5,83 МБ

8.

LizardTech Virtual Printer Pro v4.1 (для Win NT / 2000 / XP)

vpd_4_1_nt. rar

5,89 МБ

9.

SoloEX by Gencho

SoloEX_by_gencho. rar

8,02 МБ

10.

SoloEX beta2 by Gencho with DjvuSoloPro
Serial:  02040-*****-DB6A

SoloEX_beta2_by_gencho_
with_DjvuSoloPro. rar

9,86 МБ

11.

SoloEX beta2 exe only

SoloEX_beta2_exe_only. rar

54 КБ

12.

DjVuReader v2.0.0.26

djvureader_2_0_0_26.rar

1,75 МБ

13.

PDF-to-DjVu Command Line Encoder v3.6.100 (НЕ взломанный!!!)

pdftodjvu_3_6_100_setup. rar

6,77 МБ

14.

DjvuSDK v3.6.1 (НЕ взломанный!!!)

DjVuSDK_3_6.rar

5,87 МБ

15.

DjVu Editor 3.6.1 (Desktop Edition)

DjVuEditor36.rar

14,7 МБ

16.

Djvu Express Enterprise 3.6 (НЕ взломанный!!!)

DjVu_Enterprise_3_6.rar

26,3 МБ

17.

DocumentExpress Pro v4.0

DocExpressPro4_0.rar

29,6 МБ

18.

DocumentExpress Pro v4.1

DocExpressPro4_1.rar

29,6 МБ

19.

Document Express Editor v5.0.0 Build 16 (contains Asian OCR support)

DocExpress_Editor_v5_0_0_
Build_16_Asian_OCR. rar

53, 9 МБ

20.

Document Express Editor v5.0.0 Build 16 (без OCR и справки)

DocExpress_Editor_v5_0_Build
_16_Rus_no_OCR. rar

1,72 МБ

21.

Document Express Enterprise v5.1.0 Build 946 (contains Asian OCR support)

DocExpress_Enterprise_5_1_0
_Build_946_Asian_OCR. rar

195 МБ

22.

Document Express Enterprise v5.1.0 Build 973

DocExpress_Enterprise_5_1_0
_Build_973.rar

168 МБ

23.

Document Express Enterprise Workgroup Edition 3.6.1 (НЕ взломанный!!!)

DocExpress_Enterprise_Workgroup
_Edition_3_6_1.rar

13,9 МБ

24.

JRAPublish v.1.500 (НЕ взломанный!!!)

JRAPublish_v1_5.rar

77,3 МБ

25.

LizardTech Virtual Printer Pro v4.1.5 build 973

LVP415.rar

12,1 МБ

Назад к разделу "DjVu-программы"

Яндекс

Реклама на Яндексе

Помощь

Спрятать

Яндекс.Афиша

Яндекс

Реклама на Яндексе

Помощь

Показать

Закрыть

Яндекс. Афиша

Создание электронных книг в формате DjVu

В этой небольшой статье я опишу технологию, по которой я создал все книги в формате DjVu на своём дочернем сайте.

Эта моя собственная технология, она совершенно проста и даёт хорошие результаты. Её единственный недостаток - опора преимущественно на ручную работу, но, с другой стороны, это даёт возможность постоянно контролировать качество получаемого результата в процессе создания книги.

Для создания электронных книг в формате DjVu я использую следующие программы: ABBYY FineReader v7.0 (достаточно использовать бесплатную пробную версию, скаченную из Интернета), Adobe PhotoShop v5.0, DjVu Solo v3.1. Просматривать готовые DjVu-книги лучше всего броузерным DjVu-плагином v5.0, потому что он поддерживает мышиное колёсико (правда, пока лишь в пределах текущей страницы многостраничного DjVu-файла), чем не могут похвастаться все предыдущие версии плагина. Мне, правда, не нравится его иконка для DjVu-файлов, так что можно поставить иконку от плагина версии 4.1 из пакета DjVu-иконок.

Опишем процесс создания DjVu-книги по порядку.

11. Сканирование:

Для сканирования бумажных книг лучше всего использовать программу ABBYY FineReader v7.0, потому что там есть функция "Сканировать несколько страниц", т. е. при запуске этого режима загружается сканерный интерфейс, и при этом потом остаётся лишь совершать простую циклическую деятельность: переворачиваем в книге страницу, кладём её на сканер, нажимаем в сканерном интерфейсе на кнопку "Сканировать" и т. д. до конца книги, тогда как обычная программа, тот же Adobe PhotoShop v5.0 требует загружаеть сканерный интерфейс уже для сканирования каждой страницы книги.

Программа ABBYY FineReader v7.0 работает с понятием "пакет". Пакет - это в данном случае просто папка с отсканированными изображениями в графическом формате *.tif. Обычно страницы сканируются в пакет по умолчанию, который потом нужно сохранить. А можно сразу, при открытии программы создать пакет, и потом уже в него сканировать страницы, т. е каждая сканируемая страница будет автоматически записываться в этот пакет. Каждый пакет в ABBYY FineReader v7.0 имеет настройки, но об этом - чуть позже.

Сканировать бумажную книгу следует с оптическим разрешением не ниже 300 dpi. Я всегда сканирую при 400 dpi. Это нужно для того, чтобы полученные сканы можно было потом распознать - во-первых, в процессе создания внедрённого в DjVu-файл текстового слоя, а во-вторых, в далёком будущем, с целью создания полностью текстовой электронной версии книги.

12. Редактирование:

После того, как бумажная книга отсканирована, получившиеся сканы в графическом формате *.tif нужно отредактировать, перед тем, как закодировать их в формат DjVu. Это нужно сделать как для улучшения внешего вида будующей книги, так и для уменьшения её размера.

На первом этапе редактирование получившихся сканов нужно провести в самом ABBYY FineReader v7.0. Кстати, размер получающегося пакета довольно большой - примерно 1,5-1,8 гигабайта, и при редактировании потребуется ещё где-то 300-400 мегабайт. Так что не забудьте до начала сканирования обеспечить на жёстком диске 2-2,5 гигабайт места.

При предварительном редактировании получившихся сканов в ABBYY FineReader v7.0 можно сделать следующее: если вы сканировали сразу 2 страницы книги за один проход сканера, то Вам нужно, во-первых, повернуть на 90 градусов все страницы пакета (это немного увеличивает размер пакета), а во-вторых, разрезать сдвоенные страницы. Разрезать сдвоенные страницы лучше всего при помощи ABBYY FineReader v7.0, потому что это единственная программа, которая делает это автоматически на интеллектуальной основе, а не механически, как скажем, СканКромсатор (которым я так и не воспользовался ни разу: уж больно он навороченный, и хелп к нему есть лишь к первой версии, а последняя версия - 5-я). Повернуть на 90 градусов все страницы пакета можно через меню в ABBYY FineReader v7.0.

Далее в любом случае (сдвоенные страницы или нормальные) нужно создать пустой проект. Затем в этом новом проекте задаём опции: Сервис -> Опции -> "Очистить от мусора" (крайне полезная опция, всегда используйте её) и, если у Вас сдвоенные страницы, там же ставим галочку "Делить разворот книги". Далее, при новом открытом пакете в меню "Файл" выбираем пункт "Открыть изображение" и выбираем все файлы-сканы из старого проекта. Нажимаем "Открыть". Начнёт заполняться новый проект и при этом к каждому добавлемому файлу будут применяться выбранные опции проекта (очистка от мусора, разрезание сдвоенных страниц). Вы спросите, а почему бы сразу не поставить эти 2 галочки в опциях проекта, ещё до сканирования? Дело в том, что "Очистить от мусора" ещё можно выставить и действительно обойтись 1 проектом, а вот "Делить разворот книги" сразу поставить нельзя, потому что некоторые страницы разрезаются неправильно, и нужно их потом в Adobe PhotoShop v5.0 вручную разрезать. Необходимо упомянуть, что программа ABBYY FineReader, начиная с версии как минимум 4, автоматически исправляет неправильный наклон страниц (по-английски "Deskew"). Это же вроде бы делает СканКромсатор, я не пробовал, ничего не могу сказать.

Окончательное редактирование сканов осуществляется в Adobe PhotoShop v5.0. Я делаю вот что: Сначала создаю в Adobe PhotoShop v5.0 пустой файл-шаблон с такими размерами (которые подбираю опытным путём), чтобы он был чуть-чуть больше "зоны значимости" на каждом скане, т. е. той части площади скана, которая содержит интересующую нас информацию (остальное - поля) и с желаемым разрешением. Потом я просто вручную копирую каждый скан и, вставляя его в шаблон (который, понятно, меньше скана), центрирую скан мышкой относительно шаблона на глаз так, чтобы получились ровные поля. Затем сохраняю теперь уже будующую страницу книги в пункте меню Файл - Сохранить Копию, а изменения в шаблоне - не сохраняю. И так далее, до конца сканов. Попутно "доворачиваю" вручную те сканы, которые ABBYY FineReader v7.0 плохо повернул в нормальное положение, в Adobe PhotoShop v5.0 так: Изображение -> Перевернуть холст -> Произвольный. Вводим произвольный угол поворота, разделяя дробную часть угла запятой. Пункт "Произвольный" будет поначалу неактивным, чтобы активизировать его, нужно изображение преобразовать так: Изображение -> Режим из Bitmap в Ч-Б, а потом, после поворота, обратно в Ч-Б.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5