101 СПОСОБ  ЗАРАБОТАТЬ   НА ПЕЧАТИ

Не бойтесь баз данных! *

  • Хэл Хиндерлитер
  • 5 октября 2005 г.
  • 4312
Войти в мир печати переменных данных не так сложно, как кажется. Для начала разберёмся с базами.

Подобно мультяшному слону, трясущемуся при виде мыши, типографии часто паникуют при одной мысли о работе с клиентскими файлами баз данных. Многослойные документы Adobe Photoshop или сложные иллюстрации Macromedia Freehand — это запросто, но вид нескольких тысяч почтовых адресов в FoxPro приводит в трепет. К сожалению, коты здесь не помогут, поэтому придётся во всём разбираться самостоятельно — от простой обработки адресов до прибыльных персонализированных маркетинговых кампаний.

Столбцы, строки, записи, поля

Базой данных (БД) именуют любой способ организации и хранения информации — от списка в записной книжке до АСУ со сложной инфраструктурой. Структурированная информация (например, список сотрудников с адресами) называется файлом данных. Доступ к ним осуществляется через таблицу или программу БД.

Программы типа Microsoft Excel выводят информацию в виде таблицы из столбцов и строк. В каждом столбце хранится один тип данных (имя, город), а в строках — всё по определённой теме. Все тематические данные строки образуют запись, столбцы с однотипными данными — поля. Практически все файлы данных базируются на табличной концепции и сохраняются в формате, предусмотренном производителем ПО. Работающие под MS Windows, UNIX и Mac OS X компьютеры распознают формат по расширению — .xls у Excel или .dbf у IBM DBASE. Помимо сохранения данных в собственном формате, значительная часть БД предусматривает экспорт информации в нескольких форматах по выбору.

Ещё одна распространённая функция — экспорт данных в текстовом формате с разделением записей символами, чаще всего запятыми (.csv) или табуляцией (.tab или .txt). Некоторые устаревшие «большие» ЭВМ экспортируют информацию только в виде текстового файла с заданным числом символов на запись: каждое поле данных содержит соответствующее количество пробелов.

Фактор XML

Постепенно базы данных уходят от табличного формата к расширяемому языку разметки (eXtensible Markup Language, XML). Замена традиционных полей и записей дескрипторами XML, описывающими природу каждого элемента, повышает эффективность автоматизированных процессов, включая языковые переводы и операции с валютой. Более того, открытость стандарта XML означает, что пользователям БД и систем управления проще сменить поставщика решений для гибкого управления данными.

Двухмерная или реляционная?

Независимо от формата хранения файлов (XML или традиционного), придётся выбирать из двух самых популярных категорий БД — двухмерной («плоской») или реляционной. Первые обеспечивают доступ только к одной таблице. Их несколько десятков, простейшие — программы управления списками для маркирования почтовых отправлений или генерации индекса компакт-дисков с возможностью поиска.

Двухмерные БД обеспечивают доступ к одной таблице, реляционные — сразу к нескольким

Реляционные БД — это параллельный доступ сразу к нескольким таблицам. Само собой, можно использовать такую систему (relational database management system, RDBMS) для работы с одной. Относительно дешёвые реляционные базы (FileMaker Pro или Microsoft Access), несмотря на подключение к нескольким таблицам, как правило, работают только с одним файлом данных.

Одна большая или сразу несколько?

Если выбор сделан в пользу полноценной программы БД, а не таблицы, возникает следующая дилемма: создать несколько таблиц или собрать все данные в одну? Ответ зависит от сложности задачи.

Для распечатывания адресов на конвертах или объединения вложений в письма достаточно двухмерного файла: принимаете таблицу клиента или текстовый файл с разделителями символами табуляции, проверяете на полноту и корректность данных, сортируете по почтовому индексу (для получения оптовой скидки на почте) и распечатываете. Это можно сделать в любой программе, принимающей в качестве входных двухмерные файлы, — от Microsoft Word до сложных пакетов для печати переменных данных (см. «Инструменты для печати переменных данных: последние поступления», Publish ? 4, 2004).

Группа связанных через RDBMS таблиц оптимальна в ситуациях «один ко многим» (one-to-many). Рассмотрим классический пример печати переменных данных — рекламную кампанию автомобилей от местного дилера. Обычный двухмерный файл даст информацию о местожительстве потенциальных клиентов и даже о последних покупках через дилера; а если вам интересны все приобретения? Использование двух таблиц (с контактной информацией и для отслеживания деловой активности) выведет персонализацию на новый уровень. С тем, кто приобрёл через этого дилера три последних автомобиля, можно пообщаться более непринуждённо. Если же кому-то пришлось недавно выложить за ремонт купленной здесь машины 4000 долл., послание будет сдержаннее.

Всё о запросах

Предположим, корпоративный заказчик не горит желанием поделиться данными для персонализированной рекламной кампании. Или ему интересна непрерывная кампания, когда новые запросы генерируются на основании последних обновлений БД. А вам нужно «выуживать» данные из действующей базы, т. е. формулировать запрос. Разработчики привели его формат к стандартному виду — универсальному языку структурированных запросов (Structured Query Language, SQL). Формат SQL позволяет получать информацию, отвечающую определённым критериям, описанным достаточно простым языком. Разработчики БД высшего класса дополняют SQL собственными терминами и функциями, расширяя возможности поиска.

SQL-запрос упрощает извлечение информации, но со старыми «большими» ЭВМ надо быть начеку! Эти пыльные реликты, созданные ещё до появления ОС DOS, отягощены множеством ограничений: данные могут заноситься в них прописными буквами, без пунктуации, а поля — обрезаться после 10-ти символов. Маркетинг — это битва за сердца и умы; не позволяйте техническим неурядицам отразиться на вашей аудитории. Письмо с адресатом «Х ХИНДЕРЛИТ», скорее всего, отправится в мусорную корзину.

Точность — вежливость почтальонов

Получив информацию для массовой рассылки или проекта с переменными данными, проверьте её на корректность. Типичные признаки «грязных данных» — дублирующиеся записи, неправильная информация, неверно скомпонованные поля и несоответствие почтовым требованиям. Тщательность с вашей стороны отнюдь не гарантирует от проблем: иногда заказчики объединяют несколько файлов с данными, не подозревая, что создают сотни дублирующихся записей, а продавцы вносят имена и фамилии в графу «Фамилия».

Очистка данных перед печатью тиража — не просто удачная идея, а требование почтовой службы США. Чтобы отправить рассылку по максимально благоприятным ценам, в США необходимо приложить к письмам заключение почтовой службы о правильности данных (USPS Proof of Accuracy), которое автоматически генерирует специальное ПО — Coding Accuracy Support System (CASS). Все средства очистки данных, отвечающие его требованиям, выполняют базовые функции:

  • проверка по БД мастер-адресов почтовой службы США (номера домов должны быть в пределах допустимого диапазона);
  • проверка названий улиц;
  • проверка стандартных сокращений штатов;
  • поиск неверных почтовых кодов.

Заметьте, что система CASS просто проверяет адрес на соответствие имеющемуся диапазону номеров для данной улицы. Это не гарантирует, что Джон Доу живёт именно там или что по этому адресу вообще есть здание. В США это немаловажно, поскольку почтовая служба требует дополнительно оплачивать каждое отправление, которое вернули или отказались получать.

В большинстве «плохих» адресов ошибки незначительные, и качественный инструмент очистки данных попытается «спасти» максимальное число записей. Каждый год переезжает 20% американцев, и каждый пятый не сообщает в почтовую службу новый адрес. Записи можно сверить с Национальной базой данных США по смене адресов и автоматически обновить изменения.

Другие возможности проверки — БД для перевода адресов сельской местности в стандартный формат (Locatable Address Conversion System, LACS) и новая Delivery Point Validation (DPV), включающая все реальные почтовые адреса США (CASS только оценивает адрес на соответствие диапазону).

Лучшая защита — нападение

Ошибки лучше предотвращать. Практически все БД предусматривают правила верификации (запрещающие вместо «CA» набирать «Calif») и фильтры, предотвращающие ввод неверных данных (например, с требованием 5- или 9-значного индекса). Иногда имеет смысл создать раскрывающийся список с вариантами выбора (допустим, деятельности компаний) — вряд ли каждый будет сам вводить стандартный ответ.

Для индустрии, где в почёте спектрофотометры, плейтсеттеры и автоматизированные печатные машины, бояться цифр просто непозволительно. Преодолейте свои фобии, и к крупным тиражам добавятся небольшие, но прибыльные заказы с переменными данными. Ключом к успеху и при чистке полученного от клиента списка, и при печати миллионов брошюр с переменными данными станет умение работать с базой.

Хэл Хиндерлитер (hal@halhinderliter.com), директор Института графических коммуникаций (Graphic Communica-tion Institute) при Государственном политехническом университете Калифорнии.


Всё лучшее — бесплатно

Реляционными БД активно пользуются компании, специализирующиеся на персонализированном маркетинге. Кстати, они часто дополняют информацию клиента из собственной базы. Поскольку основная часть персонализированных полиграфических заказов носит ярко выраженный региональный характер, стоит задаться целью и собрать данные о нужном городе или регионе. Сколько интересного можно абсолютно бесплатно найти в Интернете: соотношение студентов и преподавателей в разных странах мира (www.uis.unesco.org), количество тяжких преступлений в округах штатов США (www.ojp.usdoj.gov), детальную информацию по занятости в США с разбивкой по штатам и округам (www.bls.gov/data) и т. д.


Чем БД отличается от таблицы?

Microsoft Excel часто неверно принимают за двухмерную БД. Созданные в табличной программе файлы действительно импортируются в БД, но есть и отличия.

Табличные программы выводят информацию в виде таблицы. В каждом столбце хранится один тип данных, в строках — вся информация по определённой теме

Сортировка. БД поддерживает связь между всеми полями, относящимися к конкретной записи, позволяя быстро сортировать и отменять сортировку без опасения запутаться в информации. В Excel перед сортировкой придётся специально выделить необходимые ячейки таблицы, иначе последствия будут непредсказуемыми.

Взаимосвязи ячеек. Для таблицы ячейка — отдельная самостоятельная координата, поэтому можно без проблем удалить несколько ячеек, переместив на освободившееся место остаток строки или столбца. Если из поля «Город» в базе данных удалить «Чикаго», поле останется пустым: программа не сместит вперёд следующие города, чтобы заполнить пробел.

Индексация. Во всех БД для упрощения поиска применяется индекс — специальная колонка в таблице, где каждой записи соответствует уникальное значение. Пользовательские БД проводят индексацию автоматически; в сложных программах индексация автоматическая или выборочная.

В таблицах нет облегчающего поиск индекса, потому что значения ячеек для быстроты доступа загружаются в оперативную память, ограничивая объём хранящейся информации (в MS Excel 65 000 строками). При скачках напряжения или системном сбое несохранённые данные могут быть утеряны. БД записывают информацию на жёсткий диск после каждой операции.


Больше, чем просто рассылки

Progressive Solutions (21 сотрудник, площадь 1400 м2) специализируется на цифровой печати, рассылках и экспедиции. Основана 14 лет назад, начинала с посреднических услуг по печати, сейчас выполняет до 300 заказов в месяц на собственном оборудовании — HP Indigo 3050, Xerox DocuColor 2045 и два Canon ImageRunner.

Готовая продукция

Президент Progressive Solutions Марк Сарпа уверен, что самое сложное — работа с готовой продукцией: «Допустим, клиент заказывает 400 экз. буклета или издания и просит отправить 200 копий себе, а 95 вложить в готовящиеся комплекты. Остальные нужно хранить на складе для дальнейшего распространения. За всеми операциями необходимо тщательно следить». В подобных вопросах — от склада до выставления счетов и управления техпроцессом — компания полагается на тщательно разработанную БД FileMaker Pro из 50-ти файлов с тысячами записей. «Многие считают, что FileMaker не конкурент Oracle, но во многих отношениях она ничуть не хуже, — считает Сарпа. — Её гибкость FileMaker Pro — то, что нужно Progressive Solutions. Достоинство в настройке: файлы клиентов очень разные, ведь мы не просим их подлаживаться под нашу систему».

Что нового

С FileMaker в Progressive Solutions работают с 1991 г. и недавно установили FileMaker Pro 7. Сарпе особенно импонирует объединение файлов в один и хранение документов в электронном виде: «Количество таблиц в файле не ограничено, что очень удобно. Плюс хранение и экспорт документов в электронном виде через гибкие составные поля нового типа». Раньше электронные документы клиентов хранили на пяти серверах. Поиск информации отнимал массу времени, не говоря о проблемах с доступом к файлам. Теперь для открытия документа достаточно двух щелчков мыши. «Когда клиент звонит с вопросом, мы уже не предлагаем перезвонить попозже, а даём ответ в течение 10 секунд!»


Хорошие адреса с плохими перспективами?

Некоторые адреса не стоит вносить в рассылку, даже если они абсолютно верны, достаточно исключить их из списка, не удаляя из базы. Mail Manager 2010 от BCC Software предлагает расширенные опции скрытия адресов, позволяя блокировать доставку тем, кто исключил себя из списка рассылок Ассоциации прямого маркетинга, а также отправку в тюрьмы, дома престарелых, колледжи, автофургоны, по адресам недавно умерших и т. д.


* Журнал «Американский печатник», май 2005 г. © 2005, American Printer Magazine, a PRIMEDIA publication. All Rights Reserved.

ПОХОЖИЕ СТАТЬИ
#неТакойКакВсе

С 10 по 14 апреля 2024 года в Сочи пройдёт ежегодное мероприятие для производителей рекламы «#неФОРУМ для РПК».

Женский взгляд на цвет

В преддверии международного женского дня прилично вспомнить о вкладе прекрасной половины человечества в историю цвета. И мы поговорим о женщинах, которые написали прекрасные книги, посвящённые цвету, которые по каким-то причинам до сих пор не переведены на русский язык. Взглянем на цвет и его историю с позиции историка-прозаика, практика работы с цветом, исследователя цвета в моде и химика.

«Притяжение» будет

19 апреля 2024 года в Сочи состоится очередной слёт полиграфистов «Притяжение». О том, какие темы будут самыми актуальными на весенней встрече профессионального сообщества, мы поговорили с руководителем проекта AXIOM и организатором слёта Яной Ивановой и директором екатеринбургской типографии «Профиль» Алексеем Гончаровым.



Новый номер

Тема номера: Больше порядка. R-SUPERLAM AF-540. Пятикнижие конструкторов-полиграфистов. ARK-JET SOL 1804. Офсет – при своих. Когда ты – вне конкуренции. Бум в этикетке и не только. Глобальный плакат. Скрепка 2024. Интерлакокраска-2024. Инлегмаш 2024.



Организовав печать по текстильным материалам, стоит ли заводить своё швейное производство или лучше печатать на сторону?
    Проголосовало: 19