Kataloge preiswert produzieren:
Datenbankgestütztes Crossmedia-Publishing

Stephan Dresen, novalis media, VVA-Wesel Kommunikation

Seine kleine Preisbibel, so nennt Dieter Schmidt seinen 300 Seiten starken Katalog für 2001. So stolz der Händler auf seinen Wälzer ist, so ärgert es ihn doch, dass er jedes Jahr aufs neue tief in die Tasche greifen muss, um das Zahlenwerk auf den neuesten Stand zu bringen. Der Katalog wird von Hand gesetzt und das ist nicht nur teuer, sondern kostet auch Zeit – viel Zeit. Dieter Schmidt ist es ein Dorn im Auge, kaum ist der Katalog endlich fertig, sind bereits gut zehn Prozent der Angebote nicht mehr korrekt kalkuliert. Grund dafür sind unter anderem schwankende Rohstoffpreise, die nicht immer ein halbes Jahr vorher abzuschätzen sind.
Seit einigen Monaten drängt sein Sohn, dass das Unternehmen mit seinem vollen Angebot auch ins Internet soll. Er wünscht sich nicht nur die kleine Firmenpräsentation auf 10 Webseiten, sondern ein umfassendes Online-Geschäft mit Produktbildern, Beschreibung, Schaufenster für Sonderaktionen und natürlich einer Bestellfunktion. Auch über eine CD-ROM mit den mehr als 3.000 Produkten haben die beiden bereits diskutiert. Sie sollte den Katalog ergänzen, damit der Kunde schneller in der Informationsfülle suchen kann. Außerdem muss dann nicht mehr alles in den gedruckten Katalog aufgenommen werden, das spart Geld.
Grundsätzlich lassen sich natürlich alle drei Projekte völlig getrennt voneinander durchführen. Doch für die Aktualisieren des gedruckten Katalogs, Internet-Geschäft und CD-ROM liegen die Kosten zusammen bei knapp einer halben Millionen Mark und werden auch in den Folgejahren nicht deutlich weniger. Das kann sich Dieter Schmidt beim besten Willen nicht leisten, auch ist der Pflegeaufwand für die drei Medien nebeneinander von dem mittelständischen Unternehmen nicht machbar. Bleibt nur eine Lösung zu finden, die alle drei Medien miteinander verbindet. So dass die Daten nur noch an einer Stelle gepflegt werden müssen und voll- bzw. teilautomatisch aus dieser einen Quelle alle drei Medien gespeist werden. Zwei moderne Schlagworte beschreiben diesen Weg:
Crossmedia-Publishing und Database-Publishing.
(siehe Kasten: Was ist Crossmedia-Publishing und Database-Publishing?)
Werden diese beiden Publikationswege miteinander verbunden, entsteht eine leistungsstarke und flexible Softwarelösung, die das moderne Erstellen und vor allem Aktualisieren von großen Dokumenten (wie etwa Katalogen) sehr vereinfacht.
Im konkreten Fall des Herrn Dieter Schmidt bedeutet das eine große Kostenersparnis. Vor allem bei den folgenden Auflagen des Katalogs sinkt der Herstellungspreis in allen drei Medien auf weniger als ein Drittel der ersten Herstellungskosten (Aktualisierung des Druckkatalogs: nur noch etwa 30 % der ersten Satzkosten, bei CD-ROM: etwa 25 %, beim Internet: sogar nur etwa 20 %). Außerdem lassen sich so die jeweiligen Medien schneller und damit zeitnaher aktualisieren.


Um den Katalog von Dieter Schmidt auf den modernen Weg zu übertragen, sind eine Reihe von Schritten nötig:
Zunächst müssen die gesamten Produktdaten des Katalogs strukturiert werden. Dazu wird ermittelt, welche Eigenschaften (Größe, Form, Material, Preis ...) die jeweiligen Produkte beschreiben. Da häufig die angebotenen Produkte sehr unterschiedlich sind, reicht es meist nicht aus, nur die Eigenschaften aufzulisten. Die Folge wäre, dass am Schluss auf der Liste mehr Eigenschaftsfelder als Produkte stehen würden. Eine Schmuckschatulle etwa hat völlig andere Eigenschaften, wie eine edle Armbanduhr und nur wenige sind bei beiden gleich (die Schnittmenge der Eigenschaftsmengen ist manchmal nur noch der Preis). Daher werden in diesem Schritt häufig sehr allgemeine Kategorien gewählt, die dann wiederum auf Eigenschaftsfelder verweisen (Relationen herstellen), in denen dann die genauen Eigenschaftsdetails abgelegt werden. Am Beispiel der Schmuckschatulle und Armbanduhr könnte eine solche Kategorie „Form“ heißen, die dann bei der Schatulle auf das Eigenschaftsfeld „Box“ mit den Eigenschaften „Höhe“, „Breite“, „Tiefe“ und „Buchtung“, dagegen bei der Uhr auf das Eigenschaftsfeld „Ringform“ unter anderem mit der Eigenschaft „Durchmesser“ verweisen.

Abbildung 2
Zentraldatenbank aus Printkatalog


Sind alle Eigenschaften und deren Felder erschlossen, lässt sich daraus eine relationale (auf Relationen aufbauende) und medienneutrale Datenbank erstellen. Diese dient als „Zentraldatenbank“ und muss im zweiten Schritt gefüllt werden. Das kann teilautomatisiert aus bestehenden Publikationen, etwa aus den Satzdaten eines gedruckten Katalogs oder aus anderen Datenquellen wie etwa einem Warenwirtschaftssystem oder einer Lagerdatenbank geschehen (siehe Abb. 1). Sind die Daten aus diesen Quellen eingespielt worden, wird in der Zentraldatenbank auf diese Quellen zurückverwiesen, so dass in Zukunft Änderungen in diesen Quellen automatisch in die Zentraldatenbank übernommen werden können. Das vereinfacht die Aktualisierung enorm, so braucht Dieter Schmidt in Zukunft nur noch die Preise oder andere Produkteigenschaften in seinem Warenwirtschaftssystem zu verändern. Von dort gelangen diese dann in die Zentraldatenbank, wo sie wiederum für den gedruckten Katalog, für Internet oder CD-ROM bereitstehen (siehe Abb.2). Nur Daten, die in keinem anderen System vorhanden sind, werden über Pflegemasken direkt in die „Zentraldatenbank“ eingegeben und aktualisiert. Diese Daten werden beim ersten Erfassen durch Mitarbeiter von Hand eingepflegt.
Insgesamt gibt es also drei Datenbanken:
· das bestehende Warenwirtschaftssystem oder ähnliche Datenbanken im Betrieb, die in Zukunft als Quelle der Inhalte dienen,
· die medienneutrale und relationale Zentraldatenbank, die mit allen anderen Medien und Datenbanken verbunden ist und aus der sowohl der gedruckte Katalog, als auch CD-ROM und über die
· Internetdatenbank, das Online-Geschäft im Internet gespeist werden.

Diese drei Datenbanken kommunizieren in einem Datenbankverbund miteinander und tauschen automatisch Daten über definierte Schnittstellen aus, so dass sich Änderungen in allen Datenbanken automatisch wiederfinden (siehe Abb. 3). Durch den Einsatz dieses zentralen Systems wird eine überflüssige mehrfache Datenhaltung vermieden. Die Leitdatenbank ist dabei immer das Warenwirtschaftssystem des Kunden, da es alle Preise und Daten für die Rechnungsstellung und Lagerhaltung enthält. Fehler im Warenwirtschaftssystem würden sich direkt auf die Lagerhaltung und Abrechnung auswirken und für große Probleme sorgen. So ist davon auszugehen, dass dort die „reinsten“ Daten vorliegen.


Wenn die Texte strukturiert archiviert sind fehlen noch die Photos. Denn der Katalog von Dieter Schmidt ist keine Bleiwüste, neben den Produktbeschreibungen enthält er noch über 5.000 Bilder. Diese erfordern gesonderte Aufmerksamkeit, denn für die unterschiedlichen Medien müssen die Bilder in verschiedener Auflösung vorhanden sein. Das Photo einer Armbanduhr für den gedruckten Katalog wird also in einer ganz anderen Größe und Dateiform benötigt, wie für die CD-ROM oder das Internet. Allgemein gilt, für den Druck muss das Photo in 300 bis 600 dpi (Bildpunkte pro Inch – amerikanisches Längenmass) vorliegen, meist werden die Photos bereits als farbgetrennte TIF-Dateien verlangt. Die Datei kann dann zwischen 10 bis zu 100 Megabyte groß sein. Das wäre für die CD-ROM und erst recht für das Internet viel zu groß (Übertragungszeiten von mehreren Stunden wäre die Folge). Für das Netz sollten die Bilder nur etwa ein tausendstel dieser Größe besitzen – 10 bis 100 Kilobyte. Dazu werden die Bilder komprimiert und optimiert im JPG-Format abgespeichert und außerdem stark verkleinert auf nur noch 72 dpi (Bildschirmauflösung). Für die CD-ROM können die Bilder grundsätzlich etwas größer und weniger optimiert sein als für das Web. So reicht es dort meist aus, das Bild nur zu verkleinern, eine spezielle Optimierung durch starke Kompression ist meist nicht nötig. Um diese verschiedenen Formate zu erreichen gibt es Systeme in denen die Bilder systematisiert und dokumentiert in einer Bilddatenbank als Rohdaten verlustfrei abgelegt werden. Von dort können die Photos dann in der gewünschten Größe, Format und Kompression abgerufen werden, um dann auf das jeweilige Medium übertragen zu werden. In der Praxis heißt das, in der Zentraldatenbank werden zu den jeweiligen Produkten Verweise auf die Bilder abgelegt. In den Vorlagen (Templates, siehe Kasten: Was ist Crossmedia-Publishing und Database-Publishing?) für die jeweiligen Medien sind dann die genauen Vorgaben enthalten, in welcher Form das Bild auf das Medium projiziert werden soll. Für die Produktwebseite im Internet steht dann unter anderem im Template „<Name des Produktbilds, Höhe, Breite, Datei-Format, Speicherform, Kompressionsgrad, Farbdefinition>“, damit wird das Bild aus der Datenbank abgerufen und ausgegeben.
Die eigentliche Publikation des Katalogs geschieht für das jeweilige Medium getrennt. Im Internet lässt sich dazu eine Mischform aus online-Shop für das Bestellsystem und Content-Management-System (CMS) einsetzten. Über das CMS wird das Layout der Produktseiten bestimmt, allgemeine Informationsseiten wie etwa über das Unternehmen oder Lieferbedingungen erstellt. Auch kann der Besitzer des online Geschäfts mit dem System einzelne Produkte in einem Schaufenster auf einer Webseite etwa als Sonderangebote herausstellen und so den Kunden gezielt darauf aufmerksam machen. Die gesamte Produktpalette ist dabei im Internet sowohl über Suchfunktionen (über die Eigenschaften, Typen oder ganz freie Volltextsuche) als auch linear über die Katalogrubriken und Listen erreichbar. Auf der eigentlichen Produktseite wird dem Kunden dann die Ware in Text und Bild vorgestellt, auch hier kann der Besitzer noch spezielle Informationen zu einem Produkt hinterlegen, die etwa nur für das online Geschäft gelten. Wie das Bestellsystem aussieht hängt von der Ware und von dem bestehenden Ablauf in der jeweiligen Firma ab.
Auch für den gedruckten Katalog gibt es nicht eine einzige Standardlösung. Welcher der optimale Weg vom Stehsatz hin zum voll- oder zumindest teilautomatisierten Satz ist, hängt neben dem Aufbau des Kataloges auch von den Ansprüchen ab.
Es lassen sich zwei grobe Richtungen unterscheiden:
· automatisierter Inhaltsaustausch
· automatisierter Vollsatz
Der automatisierte Austausch von Inhalten innerhalb eines Satzrahmens bietet sich vor allem an, wenn sich regelmäßig Texte innerhalb von bestehenden Seiten ändern. Dies ist der Fall, wenn etwa Preise häufig geändert oder in andere Währungen überführt werden müssen. Generell sollte der Inhaltsaustausch gewählt werden, wenn einzelne Produkteigenschaften häufig wechseln oder der Katalog regelmäßig in eine andere Sprache überführt werden muss. Beim Inhaltsaustausch werden die Textrahmen innerhalb des Katalogs mit der Datenbank verknüpft und können so im Satzlayout immer wieder mit den geänderten Informationen aus der Datenbank neu gefüllt werden. Werden also die Texte in der Datenbank übersetzt kann der Katalog in der neuen Sprache zurückgeschrieben werden. Auch ist der Inhaltsaustausch immer dann das Mittel der Wahl, wenn die einzelnen Katalogseiten so unterschiedlich sind, dass ein automatisierter Vollsatz nicht gelingen kann.
Denn beim automatisierten Vollsatz werden die Seiten völlig neu aus der Datenbank mittels Vorlagen generiert. Eine Software wie etwa „InBetween2“ hilft dabei als Mittler zwischen der Datenquelle und dem Produkt.
Diese Form des Database-Publishing bietet automatischen Umbruch und kann so die einzelnen Produkte immer neu über die Seiten verteilen. Das gelingt aber nur, wenn wenigstens eine geringe Systematik vorliegt und nicht für jedes Produkt eine eigene Vorlage (siehe Kasten: Was ist Crossmedia-Publishing und Database-Publishing?) erstellt werden muss. Um die Vorlagen (Templates) korrekt anzuwählen, muß die relationale Zentraldatenbank um produkt- und produktgruppenspezifische Satzinformationen erweitert werden. Auch nach dem vollautomatisierten Satz ist ein menschlicher Kontroll- und Korrekturlauf unabdingbar. Nachkorrigieren von Hand und das nachträgliche Einfügen von Anzeigen und Indizes ist auch hier nötig.
Egal welche Lösung gewählt wird, grundsätzlich muss die Software nicht im Betrieb bereitgestellt und gewartet werden. Es müssen keine teuren Experten und Systemadministratoren eingestellt werden. Das Konzept der ASP greift hier.
ASP heißt „Application Service Providing” und bedeutet, dass ein Dienstleister die gesamte Software für einen betreibt, betreut, wartet und aktualisiert. Die Softwarelösung ist (natürlich mit modernen Sicherheitsmaßnahmen abgesichert) jederzeit über das Internet zugänglich. So ist eine vollständige Pflege und ein Sicherung der Daten möglich. „Hosting“ wird dieser Service in der Fachsprache der IT-Branche genannt und er umfasst:
· eine garantierte Absicherung gegen Ausfälle (meist bei über 98 %)
· technische Software- und Datenbankpflege
· regelmäßiges Backup und Datensicherung
· Technische Serverwartung und -pflege
· Support und Korrektur bei Softwareproblemen
Achtung noch ein kleiner Hinweis: Bei Garantien gegen Ausfälle ist eine hoch scheinende Zahl wie 98 % nur scheinbar hoch. Sie bedeutet, dass die Software sieben Tage im Jahr ausfallen darf, trifft das genau in die Produktionszeit, kann es sehr ärgerlich werden.

Noch einmal in Kürze:

Zielsetzung
· Erstellen einer Katalogdatenbank (u.a. für Neue Medien, Internet, CD-ROM)
· Automatisierter Satz aus einer Katalogdatenbank (Database-Publishing),
· Minimieren der händischen Pflege, Einsparpotential
· Satzdaten im Standard-Format (QuarkXPress)
· Verknüpfen der Katalogdatenbank mit Warenwirtschaft
· Daten- und Softwarebetreuung durch Dienstleister (ASP)

Vorteile des Systems
- geringer Pflegeaufwand
- schnelleres und kostengünstigeres Aktualisieren
- weitgehend automatisches Erstellen des Print-Kataloges, CD-ROM und Internet
- geringere Kosten in der Datenhaltung, Pflege, Administration und Medienproduktion
- Flexibilität durch aktuelle, medienneutrale Datenbestände
- Qualitätssteigerung durch bessere Kommunikation
- gleichbleibend hohe Qualität durch weniger manuelle Eingriffe