2005.10.05, Автор: Хэл Хиндерлитер2311 прочтений

Не бойтесь баз данных! *

Теги: Допечатные процессы Допечатные процессы Publish

Войти в мир печати переменных данных не так сложно, как кажется. Для начала разберёмся с базами.

Войти в мир печати переменных данных не так сложно, как кажется. Для начала разберёмся с базами.

Подобно мультяшному слону, трясущемуся при виде мыши, типографии часто паникуют при одной мысли о работе с клиентскими файлами баз данных. Многослойные документы Adobe Photoshop или сложные иллюстрации Macromedia Freehand — это запросто, но вид нескольких тысяч почтовых адресов в FoxPro приводит в трепет. К сожалению, коты здесь не помогут, поэтому придётся во всём разбираться самостоятельно — от простой обработки адресов до прибыльных персонализированных маркетинговых кампаний.

Столбцы, строки, записи, поля

Базой данных (БД) именуют любой способ организации и хранения информации — от списка в записной книжке до АСУ со сложной инфраструктурой. Структурированная информация (например, список сотрудников с адресами) называется файлом данных. Доступ к ним осуществляется через таблицу или программу БД.

Программы типа Microsoft Excel выводят информацию в виде таблицы из столбцов и строк. В каждом столбце хранится один тип данных (имя, город), а в строках — всё по определённой теме. Все тематические данные строки образуют запись, столбцы с однотипными данными — поля. Практически все файлы данных базируются на табличной концепции и сохраняются в формате, предусмотренном производителем ПО. Работающие под MS Windows, UNIX и Mac OS X компьютеры распознают формат по расширению — .xls у Excel или .dbf у IBM DBASE. Помимо сохранения данных в собственном формате, значительная часть БД предусматривает экспорт информации в нескольких форматах по выбору.

Ещё одна распространённая функция — экспорт данных в текстовом формате с разделением записей символами, чаще всего запятыми (.csv) или табуляцией (.tab или .txt). Некоторые устаревшие «большие» ЭВМ экспортируют информацию только в виде текстового файла с заданным числом символов на запись: каждое поле данных содержит соответствующее количество пробелов.

Фактор XML

Постепенно базы данных уходят от табличного формата к расширяемому языку разметки (eXtensible Markup Language, XML). Замена традиционных полей и записей дескрипторами XML, описывающими природу каждого элемента, повышает эффективность автоматизированных процессов, включая языковые переводы и операции с валютой. Более того, открытость стандарта XML означает, что пользователям БД и систем управления проще сменить поставщика решений для гибкого управления данными.

Двухмерная или реляционная?

Независимо от формата хранения файлов (XML или традиционного), придётся выбирать из двух самых популярных категорий БД — двухмерной («плоской») или реляционной. Первые обеспечивают доступ только к одной таблице. Их несколько десятков, простейшие — программы управления списками для маркирования почтовых отправлений или генерации индекса компакт-дисков с возможностью поиска.

Двухмерные БД обеспечивают доступ к одной таблице, реляционные — сразу к нескольким

Реляционные БД — это параллельный доступ сразу к нескольким таблицам. Само собой, можно использовать такую систему (relational database management system, RDBMS) для работы с одной. Относительно дешёвые реляционные базы (FileMaker Pro или Microsoft Access), несмотря на подключение к нескольким таблицам, как правило, работают только с одним файлом данных.

Одна большая или сразу несколько?

Если выбор сделан в пользу полноценной программы БД, а не таблицы, возникает следующая дилемма: создать несколько таблиц или собрать все данные в одну? Ответ зависит от сложности задачи.

Для распечатывания адресов на конвертах или объединения вложений в письма достаточно двухмерного файла: принимаете таблицу клиента или текстовый файл с разделителями символами табуляции, проверяете на полноту и корректность данных, сортируете по почтовому индексу (для получения оптовой скидки на почте) и распечатываете. Это можно сделать в любой программе, принимающей в качестве входных двухмерные файлы, — от Microsoft Word до сложных пакетов для печати переменных данных (см. «Инструменты для печати переменных данных: последние поступления», Publish ? 4, 2004).

Группа связанных через RDBMS таблиц оптимальна в ситуациях «один ко многим» (one-to-many). Рассмотрим классический пример печати переменных данных — рекламную кампанию автомобилей от местного дилера. Обычный двухмерный файл даст информацию о местожительстве потенциальных клиентов и даже о последних покупках через дилера; а если вам интересны все приобретения? Использование двух таблиц (с контактной информацией и для отслеживания деловой активности) выведет персонализацию на новый уровень. С тем, кто приобрёл через этого дилера три последних автомобиля, можно пообщаться более непринуждённо. Если же кому-то пришлось недавно выложить за ремонт купленной здесь машины 4000 долл., послание будет сдержаннее.

Всё о запросах

Предположим, корпоративный заказчик не горит желанием поделиться данными для персонализированной рекламной кампании. Или ему интересна непрерывная кампания, когда новые запросы генерируются на основании последних обновлений БД. А вам нужно «выуживать» данные из действующей базы, т. е. формулировать запрос. Разработчики привели его формат к стандартному виду — универсальному языку структурированных запросов (Structured Query Language, SQL). Формат SQL позволяет получать информацию, отвечающую определённым критериям, описанным достаточно простым языком. Разработчики БД высшего класса дополняют SQL собственными терминами и функциями, расширяя возможности поиска.

SQL-запрос упрощает извлечение информации, но со старыми «большими» ЭВМ надо быть начеку! Эти пыльные реликты, созданные ещё до появления ОС DOS, отягощены множеством ограничений: данные могут заноситься в них прописными буквами, без пунктуации, а поля — обрезаться после 10-ти символов. Маркетинг — это битва за сердца и умы; не позволяйте техническим неурядицам отразиться на вашей аудитории. Письмо с адресатом «Х ХИНДЕРЛИТ», скорее всего, отправится в мусорную корзину.

Точность — вежливость почтальонов

Получив информацию для массовой рассылки или проекта с переменными данными, проверьте её на корректность. Типичные признаки «грязных данных» — дублирующиеся записи, неправильная информация, неверно скомпонованные поля и несоответствие почтовым требованиям. Тщательность с вашей стороны отнюдь не гарантирует от проблем: иногда заказчики объединяют несколько файлов с данными, не подозревая, что создают сотни дублирующихся записей, а продавцы вносят имена и фамилии в графу «Фамилия».

Очистка данных перед печатью тиража — не просто удачная идея, а требование почтовой службы США. Чтобы отправить рассылку по максимально благоприятным ценам, в США необходимо приложить к письмам заключение почтовой службы о правильности данных (USPS Proof of Accuracy), которое автоматически генерирует специальное ПО — Coding Accuracy Support System (CASS). Все средства очистки данных, отвечающие его требованиям, выполняют базовые функции:

  • проверка по БД мастер-адресов почтовой службы США (номера домов должны быть в пределах допустимого диапазона);
  • проверка названий улиц;
  • проверка стандартных сокращений штатов;
  • поиск неверных почтовых кодов.

Заметьте, что система CASS просто проверяет адрес на соответствие имеющемуся диапазону номеров для данной улицы. Это не гарантирует, что Джон Доу живёт именно там или что по этому адресу вообще есть здание. В США это немаловажно, поскольку почтовая служба требует дополнительно оплачивать каждое отправление, которое вернули или отказались получать.

В большинстве «плохих» адресов ошибки незначительные, и качественный инструмент очистки данных попытается «спасти» максимальное число записей. Каждый год переезжает 20% американцев, и каждый пятый не сообщает в почтовую службу новый адрес. Записи можно сверить с Национальной базой данных США по смене адресов и автоматически обновить изменения.

Другие возможности проверки — БД для перевода адресов сельской местности в стандартный формат (Locatable Address Conversion System, LACS) и новая Delivery Point Validation (DPV), включающая все реальные почтовые адреса США (CASS только оценивает адрес на соответствие диапазону).

Лучшая защита — нападение

Ошибки лучше предотвращать. Практически все БД предусматривают правила верификации (запрещающие вместо «CA» набирать «Calif») и фильтры, предотвращающие ввод неверных данных (например, с требованием 5- или 9-значного индекса). Иногда имеет смысл создать раскрывающийся список с вариантами выбора (допустим, деятельности компаний) — вряд ли каждый будет сам вводить стандартный ответ.

Для индустрии, где в почёте спектрофотометры, плейтсеттеры и автоматизированные печатные машины, бояться цифр просто непозволительно. Преодолейте свои фобии, и к крупным тиражам добавятся небольшие, но прибыльные заказы с переменными данными. Ключом к успеху и при чистке полученного от клиента списка, и при печати миллионов брошюр с переменными данными станет умение работать с базой.

Хэл Хиндерлитер (hal@halhinderliter.com), директор Института графических коммуникаций (Graphic Communica-tion Institute) при Государственном политехническом университете Калифорнии.


Всё лучшее — бесплатно

Реляционными БД активно пользуются компании, специализирующиеся на персонализированном маркетинге. Кстати, они часто дополняют информацию клиента из собственной базы. Поскольку основная часть персонализированных полиграфических заказов носит ярко выраженный региональный характер, стоит задаться целью и собрать данные о нужном городе или регионе. Сколько интересного можно абсолютно бесплатно найти в Интернете: соотношение студентов и преподавателей в разных странах мира (www.uis.unesco.org), количество тяжких преступлений в округах штатов США (www.ojp.usdoj.gov), детальную информацию по занятости в США с разбивкой по штатам и округам (www.bls.gov/data) и т. д.


Чем БД отличается от таблицы?

Microsoft Excel часто неверно принимают за двухмерную БД. Созданные в табличной программе файлы действительно импортируются в БД, но есть и отличия.

Табличные программы выводят информацию в виде таблицы. В каждом столбце хранится один тип данных, в строках — вся информация по определённой теме

Сортировка. БД поддерживает связь между всеми полями, относящимися к конкретной записи, позволяя быстро сортировать и отменять сортировку без опасения запутаться в информации. В Excel перед сортировкой придётся специально выделить необходимые ячейки таблицы, иначе последствия будут непредсказуемыми.

Взаимосвязи ячеек. Для таблицы ячейка — отдельная самостоятельная координата, поэтому можно без проблем удалить несколько ячеек, переместив на освободившееся место остаток строки или столбца. Если из поля «Город» в базе данных удалить «Чикаго», поле останется пустым: программа не сместит вперёд следующие города, чтобы заполнить пробел.

Индексация. Во всех БД для упрощения поиска применяется индекс — специальная колонка в таблице, где каждой записи соответствует уникальное значение. Пользовательские БД проводят индексацию автоматически; в сложных программах индексация автоматическая или выборочная.

В таблицах нет облегчающего поиск индекса, потому что значения ячеек для быстроты доступа загружаются в оперативную память, ограничивая объём хранящейся информации (в MS Excel 65 000 строками). При скачках напряжения или системном сбое несохранённые данные могут быть утеряны. БД записывают информацию на жёсткий диск после каждой операции.


Больше, чем просто рассылки

Progressive Solutions (21 сотрудник, площадь 1400 м2) специализируется на цифровой печати, рассылках и экспедиции. Основана 14 лет назад, начинала с посреднических услуг по печати, сейчас выполняет до 300 заказов в месяц на собственном оборудовании — HP Indigo 3050, Xerox DocuColor 2045 и два Canon ImageRunner.

Готовая продукция

Президент Progressive Solutions Марк Сарпа уверен, что самое сложное — работа с готовой продукцией: «Допустим, клиент заказывает 400 экз. буклета или издания и просит отправить 200 копий себе, а 95 вложить в готовящиеся комплекты. Остальные нужно хранить на складе для дальнейшего распространения. За всеми операциями необходимо тщательно следить». В подобных вопросах — от склада до выставления счетов и управления техпроцессом — компания полагается на тщательно разработанную БД FileMaker Pro из 50-ти файлов с тысячами записей. «Многие считают, что FileMaker не конкурент Oracle, но во многих отношениях она ничуть не хуже, — считает Сарпа. — Её гибкость FileMaker Pro — то, что нужно Progressive Solutions. Достоинство в настройке: файлы клиентов очень разные, ведь мы не просим их подлаживаться под нашу систему».

Что нового

С FileMaker в Progressive Solutions работают с 1991 г. и недавно установили FileMaker Pro 7. Сарпе особенно импонирует объединение файлов в один и хранение документов в электронном виде: «Количество таблиц в файле не ограничено, что очень удобно. Плюс хранение и экспорт документов в электронном виде через гибкие составные поля нового типа». Раньше электронные документы клиентов хранили на пяти серверах. Поиск информации отнимал массу времени, не говоря о проблемах с доступом к файлам. Теперь для открытия документа достаточно двух щелчков мыши. «Когда клиент звонит с вопросом, мы уже не предлагаем перезвонить попозже, а даём ответ в течение 10 секунд!»


Хорошие адреса с плохими перспективами?

Некоторые адреса не стоит вносить в рассылку, даже если они абсолютно верны, достаточно исключить их из списка, не удаляя из базы. Mail Manager 2010 от BCC Software предлагает расширенные опции скрытия адресов, позволяя блокировать доставку тем, кто исключил себя из списка рассылок Ассоциации прямого маркетинга, а также отправку в тюрьмы, дома престарелых, колледжи, автофургоны, по адресам недавно умерших и т. д.


* Журнал «Американский печатник», май 2005 г. © 2005, American Printer Magazine, a PRIMEDIA publication. All Rights Reserved.

Архив журналов в свободном доступе.

На ту же тему:
  • 20 наивных, но важных вопросов про CTP и их выбор

    Сейчас все офсетные типографии сталкиваются с похожими проблемами: тиражи падают, расходы растут. В этой ситуации встаёт вопрос: каким образом строить стратегические планы по развитию производства? Одним из простых и эффективных решений можно считать смену технологии вывода печатных форм с аналогового способа на CTP. Даже аппараты начального уровня — сравнительно недорогой способ заметно увеличить оборот и прибыль типографии, получить импульс для рывка в конкурентной борьбе. За кажущейся простотой решения скрывается множество подводных камней и вопросов, которые лучше всего прояснить на самом раннем этапе. И не на все вопросы есть очевидные ответы. Вместе с компанией «МакЦентр» мы разбираемся, всем ли нужны CTP, какая технология предпочтительнее, и надо ли переживать о стране происхождения вашего аппарата.

     

  • Стремление к лидерству в «тяжёлом» сегменте

    Ricoh Rus провела 31 мая 2018 г. в Санкт-Петербурге второе заседание Клуба полиграфистов под названием «Смена лидера в мире цифровой полиграфии». Выступавшие на нём сотрудники компании и владельцы оборудования доказали: это не просто слова.

     

  • CorelDRAW Graphics Suite 2018

    Заключение: вы можете не согласиться с утверждением разработчиков о «самом радикальном обновлении в истории пакета», зато спорить с тем, что он стал ещё более полезен и незаменим, не приходится. А ещё вы можете купить его любым удобным способом — по подписной модели или обычным образом навсегда, заплатив только один раз.

     

  • Мир графических открытий–2018

    Самый подробный обзор новых возможностей популярнейшего графического пакета CorelDRAW Graphics Suite 2018 и множество полезным советов по его освоению.

     

     

  • Apple iPad Pro 2017

    iPad Pro 2017, Pencil

    Заключение: хотя по производительности новый планшет iPad Pro может конкурировать с ноутбуками, полностью заменить рабочие станции планшетами в издательском деле пока не получится. Однако появление полнофункциональных приложений для создания и обработки изображений позволяет дизайнерам, иллюстраторам и фотографам уже сейчас сделать своим основным рабочим инструментом iPad Pro с Apple Pencil. Главные недостатки планшета — традиционно высокая цена и всё ещё недостаточное внимание к нему со стороны разработчиков приложений.

     

  • Вывод офсетных форм как услуга 3.0

    Ситуация в секторе коммерческого вывода форм за последние годы стала сложнее: офсетный полиграфический рынок находится явно не на подъёме, типографии стараются экономить каждый рубль, а собственные мощности для вывода форм у некоторых компаний даже выросли. Закономерно повысилась конкуренция.

     


comments powered by Disqus