Taxonomien, Metadaten, Tags und kontrollierte Vokabulare

Lassen Sie uns einige vereinfachte Definitionen betrachten:

Book cover for Metadata for Content Management by David Diamond

Metadata for Content Management von David Diamond

  • Taxonomie – Eine Sammlung von Begriffen, die in einer Struktur organisiert sind, die ein semantisches Verständnis dieser Begriffe vermittelt (wenn zum Beispiel „Becken“ in einer Hierarchie unter „Musik“ fällt, wird davon ausgegangen, dass es sich um das Musikinstrument handelt, nicht um ein Gefäß für Wasser oder das Becken des Skelets).
  • Metadaten – Begriffe, numerische Werte oder andere Informationen, die den Status, den Standort oder physische Attribute eines Inhalts und mehr beschreiben.
  • Tags – Begriffe, die einem Inhalte zugeordnet werden, um den betreffenden Inhalt zu identifizieren. Tags werden oft auch ohne semantische oder hierarchische Erwägungen angewendet.
  • Kontrollierte Vokabulare – Eine Sammlung standardisierter oder vereinbarter Begriffe, die verwendet werden, um Inhalte zu identifizieren.

Betrachten Sie diese Definitionen nun aus einem anderen Blickwinkel. Sie liegen richtig, wenn Sie feststellen, dass sie alle ziemlich ähnlich klingen. Ein Tag ist nur ein Begriff (Wort oder Phrase). Ein Vokabular besteht aus vielen Begriffen. Eine Taxonomie ist eine baumartige Struktur, die ein semantisches Verständnis der darin enthaltenen Begriffe vermittelt. Und „Metadaten“ ist das Wort, das wir nutzen, um all dies zu beschreiben.

Alle Software-spezifischen Unterschiede zwischen diesen verschiedenen Metadaten-Konzepten basieren darauf, wie jedes Konzept im Rahmen der Konfiguration und Nutzung des  jeweiligen Systems verwendet wird.

Sie lesen gerade einen Auszug aus dem Buch Metadata for Content Management von David Diamond von Picturepark. Weitere Auszüge werden von Zeit zu Zeit hier publiziert werden. Das ganze Buch können Sie über Amazon erwerben.

Die Perspektive eines Software-Systems

Wenn wir all diese Metadaten-Konzepte sozusagen aus der Sicht einer Content Management-Oberfläche betrachten, sehen wir klarer, wie jedes in das größere Bild passt.

Der Taxonomie-Baum

Viele Content-Systeme beinhalten eine baumartige Struktur, die es ermöglicht, Begriffe in Hierarchien zu organisieren. Die Nutzer können Inhalte per Drag-and-Drop diesen Begriffen zuordnen (oder umgekehrt). Die meisten Systeme präsentieren ihren Nutzern Taxonomien auf diese Weise. Es ist ein recht intuitiver Weg für die Arbeit mit einer Taxonomie – eine solche hierarchische Darstellung von Begriffen hat aber auch Nachteile, die später diskutiert werden.

taxonomy

Diese einfache Taxonomie umfasst Äste (Knoten) für „Expertise“, „Industries“ und „Languages“. Einige Content-Systeme ermöglichen die Verwendung solcher Taxonomie-Knoten als Eingabefilter für Metadatenfelder (siehe unten).

Feldfilter als kontrollierte Vokabulare

Wenn Äste (oder Knoten) einer Taxonomie bestimmten Metadatenfeldern als Eingabefilter zugeordnet werden, funktionieren sie als kontrollierte Vokabulare. Wenn ein Feld auf diese Weise konfiguriert ist, können nur solche Begriffe in das Metadatenfeld eingegeben werden, die im zugeordneten Ast enthalten sind – andere Begriffe werden abgelehnt.

type-ahead

Der Knoten „Languages” der oben gezeigten Taxonomie wurde als Eingabefilter für dieses Feld zugewiesen. Nur Begriffe, die in diesem Ast der Taxonomie genannt sind, werden in diesem Feld akzeptiert – andere werden abgelehnt. Da der Nutzer „Ger…“ eingegeben hat, erscheint der Begriff „German“ als Vorschlag.

Einige Systeme ermöglichen den Nutzern die Erstellung von Listen, die in der gleichen Weise verwendet werden: Eine Liste von Begriffen wird erstellt (oder von einer externen Quelle abonniert), und die Begriffe in dieser Liste werden die zulässigen Werte für alle Metadatenfelder, denen diese Liste zugewiesen wurde. In diesen Fällen können die Listen vollständig von jeder Taxonomie getrennt werden.

Tags

In einigen Systemen können die Nutzer einfach Begriffe eingeben, die dann zu systemweiten Tags werden. Das System merkt sich, welche Tags vorher verwendet wurden, und bietet sie zukünftig als Vorschläge an. Dies kann als „unkontrolliertes“ Vokabular angesehen werden, da nicht eingeschränkt wird, was eingegeben wird und ob die Werte richtig sind oder nicht.

Einige Systeme erfordern, dass Tags von einem Knoten im Taxonomie-Baum oder einer vordefinierten Liste von Begriffen bereitgestellt werden. Damit werden das Konzept der Eingabe über kontrollierte Vokabulare und das der Eingabe über Tags identisch.

Metadatenschemas

Die gesamte Palette der verfügbaren Metadatenfelder wird als das Metadatenschema des Systems angesehen. In den meisten DAMs sind Metadatenschemas statisch – das heißt, dass das gleiche Set von Feldern über alle Inhaltsarten hinweg verfügbar ist.

Adaptive Metadatenschemas machen es möglich, dass jedem Inhalt in einem System bei Bedarf eigene Metadatenschemas zugeordnet werden können. Bei Redaktionsschluss dieses Artikels war Picturepark das einzige mir bekannte Content-System, das diese Funktion anbot. Es ist aber zu erwarten, dass andere Hersteller folgen werden, da diese Metadatenstrategie sehr großes Potenzial bietet.

Wenn Sie sich mit Content-Software befassen, fragen Sie die Hersteller, ob sie mehrere oder mehrschichtige Metadatenschemas unterstützen oder dies für die Zukunft planen. Unter Umständen bieten Sie die Funktion unter einer anderen Bezeichnung als adaptive Metadaten. Stellen Sie nur sicher, dass die angebotene Funktion Ihnen tatsächlich ermöglicht, verschiedene Klassen von Inhalten zu definieren und nicht einfach nur die Änderung verfügbarer Metadatenfelder basierend auf dem Dateiformat des betreffenden Inhalts. So können ein Logo, ein Produktfoto oder ein Portrait des CEOs alle im JPG-Format vorliegen, aber die Anforderungen an ihre Metadaten sind sehr unterschiedlich.

Orte vs. Attribute

Das Verständnis dafür, dass Vokabulare, Tags und Taxonomien alle „nur“ Metadaten sind, macht es gleichermaßen einfach und schwierig, den Nutzern die Unterschiede zu erläutern. Um die Diskussion zu vereinfachen lassen Sie es mich so erklären:

Taxonomie-Begriffe sind, ähnlich wie Ordner in einem Aktenschrank, Orte, an denen digitale Inhalte klassifiziert werden können. Begriffe aus Vokabularen und Tags hingegen sind Attribute, die diesem Inhalt zugewiesen werden können.

Zugegeben, diese Perspektive basiert ausschließlich auf der von Content-Systemen gebotenen Nutzererfahrung – beispielsweise darauf, dass ich Inhalte per Drag-and-Drop auf Begriffe in einer Taxonomie ziehen kann. Das vermittelt mir den Eindruck, dass ich sie dort ablege. Im Gegensatz dazu empfinde ich die Zuweisung von Tags in einem Fenster zur Eingabe von Metadaten als das Hinzufügen von Attributen.

Tatsächlich sind beide Operationen exakt die gleichen, insbesondere dann, wenn kontrollierte Vokabulare aus der Taxonomie stammen.

Da aber diese Begriffe aus der physischen Welt abgeleitet sind, müssen wir diese Perspektive berücksichtigen, wenn wir die Konzepte mit anderen diskutieren. So sind die Ordner in einem Aktenschrank Orte, an denen wir Dokumente ablegen (Taxonomie), während Stempel wie „Bezahlt“ Attribute (Tags) sind, die wir diesen Dokumenten zuweisen.

Für viele ist es einfach zu verlockend, bei der Konfiguration eines CMS oder eines DAMs Konzepte aus der realen Welt zu entlehnen – und in vielen Fällen ist das auch gut. Denken Sie aber daran, dass alle Definitionen, die Sie für Ihr System übernehmen, rein akademisch sind – am Ende geht es ausschließlich um Metadaten.

Dieser Auszug aus dem Buch Metadata for Content Management wird mit Genehmigung seines Autors David Diamond veröffentlicht, dessen Urheberrecht davon nicht berührt wird. Weitere Auszüge werden von Zeit zu Zeit im DAM Innovation-Blog von Picturepark veröffentlicht werden. Das Buch ist über Amazon erhältlich.