Ob im B2C oder B2B, die Qualität Ihrer Produktdaten entscheidet über das Einkaufserlebnis und damit über den Umsatz in Ihrem Online-Shop, denn: Von Artikelfotos über Suchergebnisse und Filter bis hin zu Kategorien – so gut wie alles, was in Ihrem Shop zu sehen ist, wird anhand der Produktdaten ausgespielt. Nur wenn Ihr Datenfeed möglichst vollständig, korrekt und frei von doppelten Datensätzen ist, können Ihre Kunden Produkte zuverlässig finden und kaufen. Was aber ist zu tun, wenn die eigenen Produktdaten alles andere als gut sind?

In unserem Geschäftsbereich Data Quality unterstützen wir mehr als 2000 Unternehmen dabei, ihre Daten in Bestform zu bringen. Deshalb können wir Ihnen in diesem Beitrag genau verraten, wie ein verkaufsförderndes Datenfeed aussieht und wie es zu erreichen ist.

Umfragen zeigen: Viele Online-Händler sind unzufrieden mit ihren Produktdaten

Mangelhafte Produktdaten sind ein überaus häufiges Problem im eCommerce: Im Oktober 2018 führte eggheads, einer der führenden PIM-Anbieter, eine Webinar-Umfrage unter 134 Unternehmen durch. Sie ergab, dass mehr als 30%  entweder unzufrieden oder sehr unzufrieden mit der Vollständigkeit ihrer Produktdaten war. Dieses Resultat bestätigt die Erkenntnisse einer von FACT-Finder durchgeführten Händlerumfrage aus 2016, in der knapp 40% der Online-Händler angaben, dass ihre Produktdaten grundsätzlich verbessert werden sollten.

Umfrageergebnis eggheads 

Wie zufrieden sind Sie mit der Vollständigkeit Ihrer Produktdaten (Qualität, Aktualität, Vergleichbarkeit usw.)?

Mehr als ein Drittel der Unternehmen ist unzufrieden mit seinen Produktdaten.

Auswirkungen mangelhafter Produktdaten

Hier in aller Kürze einige Beispiele, was schief läuft, wenn das Datenfeed eine Generalüberholung nötig hat – sei es, weil Felder leer sind, falsch befüllt sind oder uneinheitliche Bezeichnungen vorliegen.

Die vier Dimensionen des eCommerce-optimierten Datenfeeds

Fest steht also, Datenmängel sind häufig und sie erschweren die Auffindbarkeit Ihrer Produkte, was zu Umsatzeinbußen führt. Wie sollten Ihre Datensätze nun beschaffen sein, damit Ihre Shop-Funktionen optimal arbeiten und Ihre Sichtbarkeit auf externen Plattformen möglichst hoch ist? Ein eCommerce-optimierter Datenfeed hat vier Dimensionen – er ist:

  1. Attributisiert

Ob Suche, Filternavigation, oder Recommendation-Engine: Jede Shop-Funktion arbeitet nur so gut wie die Daten, aus denen sie ihre Informationen bezieht. Je vollständiger die Attributsfelder Ihrer Produktdaten, desto einfacher finden Kunden bei Ihnen das Richtige.

  1. Normalisiert

Erst wenn Attribute in einheitlichen Bezeichnungen, Formaten und Maßeinheiten vorliegen, lassen sie sich zum Filtern von Suchergebnissen und zur Personalisierung nutzen. Im Fashion-Shop sollten zum Beispiel für „Volcano“ und „Rot“ keine separaten Filter erscheinen, sondern alles unter „Rot“ zusammengefasst sein.

  1. Getagged

Die reinen Produktinformationen sind für viele Shopartikel nicht ausreichend, um sie zuverlässig zu finden. Mit zusätzlichen Schlagworten – sogenannten Tags – machen Sie Ihre Produkte auch unter alternativen und umgangssprachlichen Begriffen auffindbar („Grafikkarte“ gleichbedeutend mit „Graka“).

  1. Kategorisiert

Eigentlich eine selbstverständliche Voraussetzung, trotzdem aber oftmals nicht konsequent umgesetzt: Das Clustering von Produkten muss logisch nachvollziehbar, konsistent und kundengerecht sein.

Ein verkaufsförderndes Datenfeed hat vier Dimensionen. Und bringt maximale Sichtbarkeit für Ihre Produkte – auch auf Handelsplattformen und bei Händlerverbünden.

Projekt-Einblick: So kann die Datenbereinigung ablaufen

Für Online-Händler, die einen Datenbestand von mehr als nur ein paar tausend Produkten haben, wäre es eine Sisyphos-Arbeit, das Feed ausschließlich manuell zu bereinigen. Besonders dann, wenn sich ihr Sortiment regelmäßig in kurzen Zeitabständen ändert oder keine Maßnahmen getroffen werden, um eine einmal erreichte Datenqualität sicherzustellen.

Um die Bereinigung der Produktdaten dort zu automatisieren, wo sie sich automatisieren lässt, kommt in unseren Projekten daher der Omikron Data Quality Server zum Einsatz – doch der Reihe nach: Hier ein Überblick, wie ein Bereinigungsprojekt in unserem Geschäftsbereich Data Quality typischerweise strukturiert ist:

Phase 1: Spezifizierung – wie genau steht es um die Daten?

Bevor man sich auf die Optimierung stürzt, muss natürlich klar sein, wie der Status quo aussieht. Daher nehmen unsere Experten den Datenbestand zunächst genau unter die Lupe – zum Beispiel anhand der Fragestellungen: Wie gut sind die relevanten Felder befüllt? Wie hoch ist der Dublettenanteil? Welche Attribute gibt es bereits? Und wie gut ist der Content in Longtail- und Textfeldern? Die Erkenntnisse aus diesen Analysen liefern ein exaktes Bild über die Qualität der Daten und wo genau angesetzt werden muss, um sie zu verbessern.

Ganz wichtig ist außerdem die Frage, was Sie mit Ihren Produktdaten später machen möchten: Denn ob Onsite-Ranking, Guided Selling, Personalisierung oder Recommendation – all diese Konzepte bringen nur dann den erhofften Gewinn, wenn sie durch die Produktdaten unterstützt werden. Daher beziehen wir auch diese Aspekte mit in die Analyse ein.

Phase 2: Klassifizierung – Produkte eindeutig zuordnen

Die Produktdaten von Online-Händlern stammen meist von verschiedenen Herstellern, die oft unterschiedliche Standards zur Bezeichnung und Gruppierung der Produkte haben. Das erschwert es Shop-Besuchern enorm, ihre gesuchten Produkte zu finden und untereinander zu vergleichen.

Genau deshalb ist die Klassifizierung der Produktdaten für viele Händler so wichtig – insbesondere im B2B. Sie stellt sicher, dass sich Produkte eindeutig identifizieren und den entsprechenden Warengruppen zuordnen lassen. Einige bekannte Klassifikationen sind eCl@ss, ETIM, GPC und ATC. Zusätzlich haben sich Identifikationsnummern etabliert, wie EAN und ISBN.

Falls sich in der Analyse herausstellt, dass eine Klassifizierung notwendig ist, lauten die nächsten Schritte wie folgt:

  1. Festlegen, wie granular die Gruppierung der Produkte später aussehen soll.
  2. Prüfen, ob es Dienstleister für eine branchenspezifische Klassifizierung gibt.
  3. Clustering der Produkte anhand von Artikeleigenschaften mit Hilfe eines patentierten Vergleichsalgorithmus.
  4. Aufbau eines „Wörterbuchs“, um einheitliche Bezeichnungen für Warengruppen, Merkmale, Synonyme etc. sicherzustellen.

Phase 3: Normalisierung und Attributisierung – alles für bessere Shop-Usability

Mit dem in Phase 2 erstellten Wörterbuch lassen sich als nächstes Ihre Material- und Produktkurztexte vereinheitlichen. Darin – und in Ihren Langtexten – verstecken sich häufig kaufentscheidende Merkmale, die unter anderem für die Filternavigation wichtig sind. Diese Attribute lassen sich mit Hilfe von Software regelbasiert extrahieren und nutzbar machen:

Kaufrelevante Attribute lassen sich regelbasiert aus Kurz- und Langtexten extrahieren, um sie als Filter zur Verfügung zu stellen.

Als nächstes geht es darum, die inkonsistenten Schreibweisen in Merkmalsfeldern – zum Beispiel 230V vs. 230 V oder Alu vs. Aluminium – zu vereinheitlichen. Das Gleiche gilt für fremdsprachige oder uneinheitliche Bezeichnungen: Zum Beispiel sollten sehr detaillierte und fantasievolle Farbbezeichnungen auf die jeweilige Grundfarbe heruntergebrochen werden, damit Kunden im Shop nicht von einer Flut unterschiedlicher Filter überschwemmt werden, wie im folgenden Beispiel zu sehen:

Zu viele Farbfilter. Wenn es um Conversion geht, ist Übersichtlichkeit wichtiger als Granularität. Im Fashion-Shop genügt daher ein einziger Filter pro Farbe.

Ihre Daten sind nun also möglichst vollständig und einheitlich. Bevor es aber in die vierte und letzte Projektphase geht, erfolgt noch der Feinschliff: das Tagging. Hiermit ist eine Verschlagwortung Ihres Datenfeeds aus der Sicht des Kunden gemeint, um die Sichtbarkeit Ihrer Produkte zu erhöhen.

Zentrale Fragestellungen sind hier also: Welche Begriffe verwenden Ihre Kunden bei der Suche nach Produkten? Wenn sich diese Begriffe nicht im Datenfeed wiederfinden, sollten sie angereichert werden, um 0-Trefferseiten und damit Kaufabbrüche zu verringern.

Tags helfen Ihnen dabei, bestimmte Produkte unter alternativen Begriffen auffindbar zu machen und sie in Themenkategorien einzuordnen.

Phase 4: Dublettenprüfung – weniger Daten, mehr Erfolg

In der letzten Projektphase erfolgt die Qualitätssicherung der vorangegangenen Schritte sowie die Konfiguration der Dublettenfindung:

Ungewollte mehrfache Datenbank-Einträge eines Produktdatensatzes führen dazu, dass sowohl Kunden als auch der Produktmanager falsche Verfügbarkeits-Informationen erhalten. Typisches Szenario: Ein Produkt wird als nicht vorrätig angezeigt, obwohl es auf Lager ist. Die Folge ist, dass der Kunde den Kaufvorgang abbricht und der Produktmanager eine unnötige Nachbestellung einleitet.

Um Dubletten zu finden, führen wir ein automatisiertes Daten-Matching mit Hilfe unseres Abgleich-Algorithmus durch. Eindeutige Dubletten werden dadurch sofort bereinigt. Weniger eindeutige erscheinen in einer Ergebnisliste, die Sie bequem überprüfen können.

Fazit: Produktdaten entscheiden über den eCommerce-Erfolg

In Zeiten von wachsendem Wettbewerb und hohem Preisdruck sind gut gepflegte Produktdaten ein wichtiges Differenzierungsmerkmal. Denn sie verbessern nicht nur die Auffindbarkeit und Conversion Rate der Produkte im eigenen Shop, sondern auch Ihre Sichtbarkeit in Suchmaschinen, auf Marktplätzen und auf Vergleichsportalen. Ein weiterer Vorteil: Ihre internen Kosten sinken – zum Beispiel aufgrund von:

Sie möchten noch tiefer ins Thema eintauchen? In unserem Webinar finden Sie weitere Insights, wie Sie das volle Potenzial Ihrer Produktdaten nutzen: