На этом получасовом видео показан процесс текстовой обработки скана с 0 и до конечного вывода.
!Никого не агитирую под такого рода обработку, каждый решает сам, как ему делать и какими средствами; всех апологетов своих "общепризнанных" стандартов прошу просто проходить мимо, это видео для тех, кто интересуется!
Обращаю внимание, что иногда придется останавливать видеоряд для того, чтобы успеть прочесть заметки.
Не являюсь специалистом, просто делюсь своим опытом, всегда что-то где-то можно сделать лучше, нужно лишь знать где и как.
Очепятки, орфографические и пунктуационные ошибки в видео простительны хотя бы тем, что если их редактировать, то половина видео ушла на это действие.
Все тоже самое можно делать и в Linux, при наличии текстового слоя. (запуск того же FineReader через виртуальную машину или запуск 10 версии - малопродуктивно, т. к. на больших объемах обработки потребует значительно бОльших ресурсов компьютера, или выход распознанного текста будет с бОльшим кол-вом ошибок).
Горячие клавиши:
2 основные в XnView: shift+s - размер выделения; ctrl+alt+s - экспорт из исходника в какой-либо формат
в OpenOffice: f11 - стили
Для удобства, в openoffice выводится дополнительная панель, на которую "вешаются" нужные клавиши-действия, такие как "разрыв колонки", сноска, спец символы и т. п.
Действия в видео:
1. Формирование разворота книги в мм в openoffice как в оригинале
2. Выставление отступов и межстрочный интервал
3. Форматирование текста
4. Колонтитул
5. Обработка иллюстраций и вставка в страницу
6. Обработка иллюстраций с коррекцией тени у разворота (также иногда помогает улучшить "выходной" файл автоконтрастность [делается в tiff файле])
7. компоновка иллюстраций и текста как в исходнике
8. примеры сканов, где проще (по моему мнению) сделать текстовой набор