101 СПОСОБ  ЗАРАБОТАТЬ   НА ПЕЧАТИ

ABBYY PDF Transformer 2.0

  • Михаил Иванюшин
  • 1 октября 2007 г.
  • 6378

Проблема и решение

Формат PDF стал стандартом в допечатной подготовке. Документ, сохранённый в нём, утверждается заказчиком, передаётся на вывод, сохраняется в архиве. И часто бывает так, что от проделанной ранее работы остаётся только PDF-файл: данные для вёрстки не годятся, извлечь текст, сохранив в исходном оформлении, практически не удаётся. Для решения проблемы российская компания ABBYY разработала PDF Transformer 2.0. С её помощью можно распознать текст на 37-ми языках, поддерживается стандарт Unicode, PDF-файл можно конвертировать в DOC, RTF, TXT, XLS, HTML и др.

Как это работает

Интерфейс чрезвычайно прост, обучение не требуется — можно сразу приступать к делу. Перед запуском процесса преобразования можно воспользоваться функцией автоматической разметки изображения на блоки либо разметить документ вручную — объясняя программе, где в нём текст, картинка или таблица. Для каждого блока текста или таблицы выбирается язык, задаётся очерёдность обработки блоков при распознавании текста. С другими настройками, помогающими при работе с текстом, можно ознакомиться в «Справке к программе» или «Руководстве пользователя» (см. на сайте разработчика). После разметки содержимого файла программа преобразует его в выбранный вами формат.

Но одно дело инструкция, совсем другое — практический опыт. Для знакомства с программой попробуем преобразовать в редактируемый формат с. 10 «Руководства», на которой есть текст и картинки. Закладка Fonts в меню Document Properties сообщает, что в этот файл внедрены шрифты FreeSetC, FreeSetBlackC и GaramondNarrowC.

На рисунке видны в чёрных рамках блоки текста, а в красных — области страницы, которые программа должна сохранить как иллюстрации (предположим, что мы не хотим распознавать подписи к картинкам). После запуска процесса получаем файл в формате Word, в котором внедрённых шрифтов нет. Вместо них используются Arial и New Roman, сохранены только размер букв и начертание. Рисунки размещены по тексту, как в исходном файле.

На странице, открытой в PDF Transformer, текстовые блоки помечены чёрными рамками, а графические — красными

Далее проверяем программу на PDF-файлах, созданных в QuarkX-Press и Adobe InDesign. Эти работы содержали текстовый многоколонник, таблицу и CMYK-картинку, использовались разные шрифты, текст окрашен разными цветами. После разметки многоколонника и таблицы имеем RTF-файл: разметка текста в плане размера, начертания и цвета букв сохранена, но используемые шрифты те же — Arial и New Roman. Структура и содержимое таблицы сохранены без потерь, но виды линеек и их толщина не сохранились. Текстовые данные извлекаются корректно, и не важно, какие шрифты использовались при создании PDF-файла, — верстальщику придётся задать нужные стили и шрифты.

Что касается CMYK-иллюстрации, то налицо потеря: сохранив файл как веб-страницу, убеждаемся, что картинка преобразована в цветовую модель RGB. Причина понятна: HTML (да и другие офисные форматы) не поддерживает CMYK. Если предполагаете использовать информацию PDF-файла для вёрстки, придётся извлечь картинку непосредственно из файла с помощью Adobe Photoshop, Illustrator или редактора PDF (Enfocus Pitstop).

Программа равнодушна к кодировке текста в PDF-формате, главное — начертание букв. Справилась она и с отсканированными распечатками, сохранёнными в многостраничный PDF-файл. Как и следовало ожидать, в окне Document Properties закладка Fonts была пустой, но программа хорошо распознала текст.

На пробу

На сайте ABBYY указана рекомендованная цена, есть полнофункциональная демо-версия. Программа подходит не только пользователям QuakXPress. Файл, сохранённый в формате DOC, TXT или RTF, можно импортировать в любой программе вёрстки. Конечно, интересно увидеть развитие функций, ориентированных на допечатную подготовку. Например, программа могла бы извлекать из PDF-файла растровые изображения или сохранять в выходном файле хотя бы названия использованных шрифтов.


PDF Transformer 2.0

Производитель: ABBYY
Рейтинг: ****1/2*
Заключение: полезная и лёгкая в использовании, конвертирует PDF-файлы в популярные редактируемые форматы; хотя форматирование частично теряется и требуется ручная доводка, услуги машинистки для перепечатывания текстов из PDF-файлов вам больше не понадобятся.
Цена в Москве: 1490 руб.
ПОХОЖИЕ СТАТЬИ
Автоматический биговщик SABTEC CR-370

Устройство, необходимое для изготовления многих видов изделий: открыток, буклетов, лифлетов, обложек для книг, календарей и т. д.

HATECO SMART PRO

Устройство предназначено для изготовления переплётных крышек средними и большими тиражами.

Комплект Depo.ONE для изготовления бумаги со шлицем

Комплект для оснащения рулонного ламинатора, позволяющий изготавливать листы бумаги со шлицем для выпуска фотокниг и альбомов с раскрытием на 180 градусов продукции

Новый уровень эффективности

Цифровые технологии давно вошли в нашу жизнь и прочно там обосновались. Они окружают нас везде, и мы порой их даже не замечаем. Когда деревянные счёты на стойке универмага заменили электронным калькулятором, произошла цифровая революция. С тех пор она только набирала обороты, и то, что ещё вчера считалось инновациями, сегодня уже сменяется чем-то более современным.

Генеральный тренд

Являясь апологетом автоматизации в полиграфии, не смог пройти мимо опроса «Внедрение какого цифрового решения оказало наибольшее влияние на эффективность вашего предприятия?» от Publish.


Новый номер

Тема номера — Небольшие устройства послепечати. Выставка «Реклама-2022». Печатающих головки. «Например» — Krekerdecor и «Карт Регион». ЦПМ для коробок. Publish Eurasia: Казахстан и Иран. «Текстильная печать»: конференция про деньги в текстильной печати. Каландровые прессы. Ч. 1.


Какой широкоформатный принтер вы планируете купить в течение ближайших шести месяцев?
С УФ-чернилами
25%
25 %
Латексный
12%
12 %
Сольвентный
2%
2 %
Экосольвентный
2%
2 %
На водных чернилах
2%
2 %
Не планирую покупать — мало заказов
22%
22 %
Сокращаю направление широкоформатной печати — нет перспектив
8%
8 %
Вообще не занимаюсь широкоформатной печатью
26%
26 %
Проголосовало: 95