Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| ScanKromsator – настройка и работа
« было написано: 18 апреля 2005 17:28:18 »
| |
Если сканы имеют такие недостатки, как черные поля, двойной разворот и тому подобное, то для их исправления можно воспользоваться программой ScanKromsator
Сайт разработчика: http://bolega. *****/
Сейчас временно закрыт, поэтому выложил версию v. 5.07 по адресу: http://bkrs. *****/ScanKromsator. rar (2 Мб.)
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите.
Внимание: для корректной работы программы необходимо поместить прилагаемые файлы с расширением DLL в папку: C:\WINDOWS\system32
| | | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #1 было написано: 18 апреля 2005 17:28:57 »
| |
Последовательность работы и настройки:
Нажимаем кнопку Load Image Files и загружаем сканы, которые хотим обработать.
| 
001.jpg (1.52 KB, 56x118 - просмотрено 173 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #2 было написано: 18 апреля 2005 17:42:48 »
| |
На вкладке Pages отмечаем:
Split (отмечаем только в том случае, если сканы содержат разворот книги. Если книга отсканирована постранично, то не отмечаем)
Deskew (очень полезная функция выравнивания страницы, если она отсканирована криво)
Остальные функции на этой вкладке не отмечаем. Если они отмечены, снимаем галки.
| 
002.jpg (10.2 KB, 176x272 - просмотрено 166 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #3 было написано: 18 апреля 2005 17:46:47 »
| |
На вкладе Book выставляем Page width и Page height – в обоих случаях None
| 
003.jpg (10.57 KB, 175x273 - просмотрено 165 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #4 было написано: 18 апреля 2005 17:54:24 »
| |
На вкладке Files в Output dir задаем путь в папку, где будут размещаться сканы после их обработки. Не задавайте ту же самую папку, в которой размещены исходные сканы.
В графе DPI выставляем Original
| 
004.jpg (13.27 KB, 177x267 - просмотрено 161 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #5 было написано: 18 апреля 2005 18:10:37 »
| |
Остальные вкладки нам не нужны, там ничего не изменяем.
Теперь задаем параметры для обрезания лишних полей. Тут надо ориентироваться на сами сканы. Разберем наиболее тяжелый случай. Отсканирован разворот и у него нужно обрезать все четыре стороны и черную полосу по середине.
Выставляем галки:
Cut left margin – отсекает левое вертикальное поле у скана. Cut right margin – отсекает правое вертикальное поле. Cut top margin – отсекает верхнее горизонтальное поле. Cut bottom margin – отсекает нижнее горизонтальное поле.
Cut internal margin – делит разворот пополам, активировать ее нельзя, она активируется автоматически, если в настройках выставлено Split (см. сообщение № 2 в этой теме) Cut internal2 margin – позволяет вырезать черное поле на развороте.
В том случае, если вам не нужно обрезать поля с какой-либо стороны или в центре разворота нет черной полосы, галки не выставляются.
| 
005.jpg (4.24 KB, 209x53 - просмотрено 161 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #6 было написано: 18 апреля 2005 18:23:39 »
| |
После того как заданы параметры обрезания полей, мы можем, ориентируясь на изображение скана, обозначить с помощью ползунков то лишнее, что необходимо вырезать. Не выставляете линии обреза в самый край текста, оставляйте белые поля разумной величины, читать книгу с полями легче, а если она преобразована в формат PDF, то на полях удобно делать разного рода заметки.
| 
006.jpg (43.59 KB, 622x500 - просмотрено 163 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #7 было написано: 18 апреля 2005 18:28:38 »
| |
Теперь необходимо зафиксировать положение ползунков. Для этого выставляем галочку напротив названия скана.
Внимание: если вы хотите изменить положение ползунков, сначала необходимо снять зеленую галочку напротив названия скана. В противном случае изменения не будут запомнены, а сохраняться старые значения.
| 
007.jpg (4.35 KB, 183x159 - просмотрено 159 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #8 было написано: 18 апреля 2005 18:36:36 »
| |
Далее переходим к следующей странице. Регулируем положение ползунков, если в этом есть необходимость. Обратите внимание, что напротив номера страницы не должна стоять галочка. Она ставится только тогда, когда положение ползунков вас устраивает. Еще раз хочу повторить, что, выставив галочку, вы фиксируете параметры положения ползунков и обрезку страницы.
| |
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: ScanKromsator – настройка и работа
« Ответное сообщение #9 было написано: 18 апреля 2005 18:40:18 »
| |
Обрабатываем таким образом все сканы. И нажимаем кнопку Process! Программа начнет обработку страниц.
После этого в отдельном окне Result view вам будет предложено просмотреть переработанные сканы.
На этом работа завершена.
| | |
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Рекомендации по сканированию книг для ПБ
« было написано: 22 июня 2004 21:23:29 »
| |
Рекомендации по сканированию книг для электронной библиотеки
| | « Последняя правка: 30 июня 2005 11:58:24 от Олег »
| Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #1 было написано: 30 июня 2005 11:59:21 »
| |
Рабочим форматом библиотеки, в котором хранятся отсканированные книги, является графический PDF с распознанным вторым слоем. Это не значит, что другие книги в других форматах будут игнорироваться, но желательно при сканировании книги придерживаться тех рекомендаций, которые будут изложены ниже.
Несколько слов о том, почему выбран PDF. На данный момент это наиболее удобная оболочка для чтения электронных книг. В противовес ей обычно противопоставляют формат DJVU, но у него, на мой взгляд, единственное преимущество – меньший размер файла, что при современном развитии интернета уже не является критическим значением.
Полная версия Adobe Acrobat Professional имеет прекрасные возможности для работы с электронным текстом, позволяет оставлять разного рода заметки и комментарии, делать привязку к другим документам и так далее. Некоторые возможности (далеко не все) представлены на картинках. Также возможен (при наличии второго распознанного слоя) полноценный поиск в тексте, в том числе сразу в нескольких файлах.
Почему книга сохраняется в графических файлах, а не распознанной. Графический файл позволяет стопроцентно передать текст бумажного издания, особенности построения внутренней структуры книги. При распознавании весьма велика вероятность появления дополнительных опечаток, структуру книги сохранить также проблематично. Для создания качественной, полностью электронной версии книги, необходимо очень тщательно вычитывать текст и правильно его отформатировать, что во много увеличивает трудозатраты на перевод бумажной версии книги в электронную. А делать в том виде, в котором, например, выкладываются книги у Машкова, мне представляется весьма варварским занятием.
| |
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #2 было написано: 30 июня 2005 12:00:29 »
| |
Теперь непосредственно о сканировании.
Для сканирования используется программа ABBYY Fine Reader.
Запускаем программу.
Создаем новый пакет (Файл – Новый пакет).
Сохраняем новый пакет на жестком диске (Файл – Сохранить пакет как…)
Задаем параметры (Сервис – Опции…)
Вкладка «Сканирование\Открытие»: выбираем «Использовать интерфейс Fine Reader». Если книга, которую вы собираетесь сканировать, помещается в сканер целиком – то ставим галочку «Делить разворот книги». Также отмечаем «Определять ориентацию страницы при распознавании» (иногда, довольно редко, попадаются страницы, например, с изображением географических карт, когда ориентация страницы определяется неправильно. В этом случае им следует придать нужную ориентацию вручную (Изображение – повернуть изображение…)
| 
b003.jpg (23.4 KB, 358x464 - просмотрено 185 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #3 было написано: 30 июня 2005 12:01:04 »
| |
Вкладка «Распознавание». Выставляем языки распознавания. Для книг на русском языке лучше выставлять пару Русский-Английский. Остальные опции – как на рисунке. Остальные вкладки оставляем по умолчанию.
| 
b004.jpg (23.29 KB, 360x470 - просмотрено 185 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #4 было написано: 30 июня 2005 12:01:44 »
| |
Далее настраиваем сканер (Сервис – Настройки сканера…). Размер бумаги выставляем пользовательский. Измеряем размер книги. Если вы будете сканировать разворот, то ширина – это будет высота, а высота – ширина. Размер для сканирования выставляйте на несколько миллиметров меньше, чем у реальной книги, чтобы на сканах не было черных полос. Режим сканирования – черно-белое изображение. Разрешение – 300 dpi. Большая просьба придерживаться не снижать разрешение сканирования меньше этой цифры. Читать такие файлы будет очень не комфортно.
При таких настройках программа должна сохранять сканы в формате TIFF Group 4. Вес скана одной страницы книги обычного формата не превышает 50 кб. Режим черно-белого санирования предполагает, что в сканируемой книге нет полутоновых изображений.
| 
b005.jpg (21.02 KB, 520x386 - просмотрено 184 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #5 было написано: 30 июня 2005 12:02:40 »
| |
Яркость подбираем вручную. Необходимо чтобы на сканах текст читался нормально. Не был слишком бледным или заплывал. Первое изображение – яркость слишком большая (сдвигаем ползунок влево), на втором – не достаточная (сдвигаем ползунок вправо), на третьем – норма.
| |
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #6 было написано: 30 июня 2005 12:03:25 »
| |
Сканировать необходимо все страницы, включая пустые. Номер скана должен совпадать с номером сканируемой страницы. Это важно впоследствии, когда книга будет преобразована в формат PDF, для того, чтобы удобней было находить нужную страницу. Обложку можно не сканировать и в pdf не вставлять. Обычно, изображения обложек книг нужны только для использования в специальных программах-каталогов для учета электронных книг. Изображения обложки можно найти на сайтах интернет-магазинов, торгующих книгами. Обложку стоит отсканировать только в том случае, если издание редкое. В этом случае обложка сканируется в цвете с небольшим разрешением, чтобы его изображение было не больше размера открытки или стандартной фотографии.
После того как вся книга будет отсканирована, ее необходимо распознать (Процесс – распознать всё). Если книга, помимо, например, русского текста содержит иероглифы, разумеется, они распознаваться не будут. Но поиск по русскому тексту будет возможен. Если книга издана на языках, которые не распознаются файн ридером, например, китайском, то такую книгу распознавать не надо.
После того, как книга распознана, пропускаем функцию проверить, а сразу приступаем к сохранению (Файл – Сохранить текст как…). Выбираем тип файла – документ PDF. Сохранить – все страницы. Все страницы в один файл. Пока кнопку «Сохранить» не нажимаем.
| 
b007.jpg (17.76 KB, 424x392 - просмотрено 175 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #7 было написано: 30 июня 2005 12:04:25 »
| |
Сначала нажимаем на кнопку «Форматы», чтобы задать дополнительные условия сохранения файла.
Выбираем – текст под изображением страницы. Выставляем максимальные значения в окнах – уменьшить изображение картинки до; качество JPEG.
После этого сохраняем файл.
| 
b008.jpg (16.26 KB, 370x478 - просмотрено 176 раз.)
| | Записан
|
|
|
|
Олег
Moderator Заслуженный
    
Онлайн
Пол:  Сообщения: 5925


| 
| Re: Рекомендации по сканированию книг для ПБ
« Ответное сообщение #8 было написано: 30 июня 2005 12:04:49 »
| |
Если сканируется книга на восточных языках, без распознавания, то pdf делается с помощью программы Adobe Acrobat Professional. (File – Create PDF – From Multiple files)
| |
|
|
|