101 СПОСОБ  ЗАРАБОТАТЬ   НА ПЕЧАТИ

ABBYY PDF Transformer 2.0

  • Михаил Иванюшин
  • 1 октября 2007 г.
  • 8161

Проблема и решение

Формат PDF стал стандартом в допечатной подготовке. Документ, сохранённый в нём, утверждается заказчиком, передаётся на вывод, сохраняется в архиве. И часто бывает так, что от проделанной ранее работы остаётся только PDF-файл: данные для вёрстки не годятся, извлечь текст, сохранив в исходном оформлении, практически не удаётся. Для решения проблемы российская компания ABBYY разработала PDF Transformer 2.0. С её помощью можно распознать текст на 37-ми языках, поддерживается стандарт Unicode, PDF-файл можно конвертировать в DOC, RTF, TXT, XLS, HTML и др.

Как это работает

Интерфейс чрезвычайно прост, обучение не требуется — можно сразу приступать к делу. Перед запуском процесса преобразования можно воспользоваться функцией автоматической разметки изображения на блоки либо разметить документ вручную — объясняя программе, где в нём текст, картинка или таблица. Для каждого блока текста или таблицы выбирается язык, задаётся очерёдность обработки блоков при распознавании текста. С другими настройками, помогающими при работе с текстом, можно ознакомиться в «Справке к программе» или «Руководстве пользователя» (см. на сайте разработчика). После разметки содержимого файла программа преобразует его в выбранный вами формат.

Но одно дело инструкция, совсем другое — практический опыт. Для знакомства с программой попробуем преобразовать в редактируемый формат с. 10 «Руководства», на которой есть текст и картинки. Закладка Fonts в меню Document Properties сообщает, что в этот файл внедрены шрифты FreeSetC, FreeSetBlackC и GaramondNarrowC.

На рисунке видны в чёрных рамках блоки текста, а в красных — области страницы, которые программа должна сохранить как иллюстрации (предположим, что мы не хотим распознавать подписи к картинкам). После запуска процесса получаем файл в формате Word, в котором внедрённых шрифтов нет. Вместо них используются Arial и New Roman, сохранены только размер букв и начертание. Рисунки размещены по тексту, как в исходном файле.

На странице, открытой в PDF Transformer, текстовые блоки помечены чёрными рамками, а графические — красными

Далее проверяем программу на PDF-файлах, созданных в QuarkX-Press и Adobe InDesign. Эти работы содержали текстовый многоколонник, таблицу и CMYK-картинку, использовались разные шрифты, текст окрашен разными цветами. После разметки многоколонника и таблицы имеем RTF-файл: разметка текста в плане размера, начертания и цвета букв сохранена, но используемые шрифты те же — Arial и New Roman. Структура и содержимое таблицы сохранены без потерь, но виды линеек и их толщина не сохранились. Текстовые данные извлекаются корректно, и не важно, какие шрифты использовались при создании PDF-файла, — верстальщику придётся задать нужные стили и шрифты.

Что касается CMYK-иллюстрации, то налицо потеря: сохранив файл как веб-страницу, убеждаемся, что картинка преобразована в цветовую модель RGB. Причина понятна: HTML (да и другие офисные форматы) не поддерживает CMYK. Если предполагаете использовать информацию PDF-файла для вёрстки, придётся извлечь картинку непосредственно из файла с помощью Adobe Photoshop, Illustrator или редактора PDF (Enfocus Pitstop).

Программа равнодушна к кодировке текста в PDF-формате, главное — начертание букв. Справилась она и с отсканированными распечатками, сохранёнными в многостраничный PDF-файл. Как и следовало ожидать, в окне Document Properties закладка Fonts была пустой, но программа хорошо распознала текст.

На пробу

На сайте ABBYY указана рекомендованная цена, есть полнофункциональная демо-версия. Программа подходит не только пользователям QuakXPress. Файл, сохранённый в формате DOC, TXT или RTF, можно импортировать в любой программе вёрстки. Конечно, интересно увидеть развитие функций, ориентированных на допечатную подготовку. Например, программа могла бы извлекать из PDF-файла растровые изображения или сохранять в выходном файле хотя бы названия использованных шрифтов.


PDF Transformer 2.0

Производитель: ABBYY
Рейтинг: ****1/2*
Заключение: полезная и лёгкая в использовании, конвертирует PDF-файлы в популярные редактируемые форматы; хотя форматирование частично теряется и требуется ручная доводка, услуги машинистки для перепечатывания текстов из PDF-файлов вам больше не понадобятся.
Цена в Москве: 1490 руб.
ПОХОЖИЕ СТАТЬИ
Цифровая печать этикеток чернилами на водной основе

По мере ужесточения экологических требований производители цифровых машин всё больше внимания уделяют разработкам струйных этикеточных ЦПМ, использующих чернила на водной основе. В прошлом году сразу четыре японских компании — Screen, Epson, Canon и Miyakoshi — представили свои прототипы подобных устройств.

Ricoh Pro C5400S

С начала 2026 года в России стали доступны Ricoh Pro C5400S/5410S/5400SL.

Этикеточная ЦПМ Arojet iHEM-330

Осенью этикеточная ЦПМ Arojet iHEM-330 была установлена в демозале поставщика, что дало возможность познакомиться с ней поближе.

Всё, что можно автоматизировать, будет автоматизировано

В современных условиях развития полиграфической отрасли послепечатное производство всё чаще становится узким местом в производственном процессе, ограничивающим общую эффективность предприятий.

G!Digital FB-2513S vs Mimaki JFX200–2513

Сравнивая два принтера, мы пришли к выводу, что современная китайская техника по качеству печати не отстаёт от японской, а по производительности и уровню автоматизации даже опережает.


Реклама. Рекламодатель ООО "ТКС"
erid 2SDnjbygPPW


Новый номер

Цифра vs флексо для этикетки. Цифровая печать этикеток водными чернилами. «Этикетка и упаковка. Взгляд 360°». Ricoh Pro C5400S. Боксмейкеры. Vorey расширяет присутствие на рынке. Фабрика фантастических декораций. UPAKEXPO после смены дислокации.



Какой следующий принтер вы купите себе на производство?
Широкий УФ
25%
25 %
Сувенирный УФ
27%
27 %
ДТФ (текстиль)
20%
20 %
УФ ДТФ
20%
20 %
Латекс
7%
7 %
Экосольвент
12%
12 %
На водных чернилах
7%
7 %
Сублимацию
8%
8 %
Для прямой печати по ткани
10%
10 %
ДТГ («футболочный»)
3%
3 %
Проголосовало: 59