Willkommen zu dieser Ausgabe von Thought Leadership – unserem Blog-Format, in dem du das neueste eCommerce-Wissen direkt von unseren Experten erfährst. Diesen Monat erklärt Adam Hjort, VP of Customer Success bei Loop54, welche unterschiedlichen Methoden Recommendation Engines nutzen können – und wo jeweils der Haken ist.

Personalisierung ist seit geraumer Zeit ein Buzzword im eCommerce – ähnlich wie KI oder früher Big Data. Je nachdem, wen man fragt, bekommt man unterschiedliche Definitionen von Personalisierung. Und genau dasselbe gilt für Recommendations. Empfehlungsdienste (engl. „Recommendation Engines“) sind im eCommerce längst als Standard etabliert und haben einen enormen Einfluss auf den Umsatz eines jeden Online-Händlers.

Dass die Definitionen von Recommendations variieren, ist nicht weiter überraschend, denn es gibt sie in ganz unterschiedlichen Formen. Nachfolgend eine Liste, was wir alles unter dem Begriff verstehen:

Ähnliche Produkte. Das sind Empfehlungen, die sich anderen Produkten in bestimmten Merkmalen ähneln. Sie werden in der Regel auf Produktdetailseiten angezeigt – mit dem Ziel, den Kunden bei der Stange zu halten, wenn das angeklickte Produkt nicht seinen Vorstellungen entspricht. Die Logik dahinter ist folgende: Wenn das angeklickte Produkt Interesse geweckt hat, können ähnliche Produkte den Besucher auf der Website halten.

Beliebte Produkte. Damit sind Produkte gemeint, die auf einer aggregierten Ebene beliebter sind als andere Produkte. Die Beliebtheit kann auf verschiedene Weise gemessen werden – die gängigsten Messzahlen sind Klicks, Views oder Käufe. Ziel dieses Empfehlungstyps ist es, die Conversion-Rate eines Shops zu erhöhen.

Ergänzende Produkte. Hierbei handelt es sich um Empfehlungen, die das angezeigte Produkt sinnvoll ergänzen oder komplettieren. Beispiele dafür sind Zubehörteile wie Schnürsenkel zu einem Schuh oder auch ein Paddel zu einem Kajak. Das Ziel von ergänzenden Produkten besteht darin, den durchschnittlichen Bestellwert (AOV) zu erhöhen, indem der Besucher veranlasst wird, mehr Produkte in den Warenkorb zu legen. Es gibt verschiedene Möglichkeiten, ergänzende Produkte zu generieren – von der KI-basierten Kontextermittlung und Bilderkennung bis hin zu manueller Steuerung und historischen Kaufmustern.

Warenkorb-Empfehlungen. Das sind Empfehlungen, die auf dem aktuellen Warenkorb des Besuchers basieren. Ähnlich wie bei ergänzenden Produkten besteht der Hauptzweck von Warenkorb-Empfehlungen darin, den AOV zu erhöhen. Außerdem ist dies die einzige Art von Empfehlung, die von vornherein personalisiert ist (die anderen sind optional personalisierbar).

Woher weiß eine Recommendation Engine, welche Produkte passen?

Zunächst müssen wir uns klar machen, was eine gute Empfehlung eigentlich ist. Denn auch hier können sich die Definitionen stark unterscheiden. Für uns ist eine Empfehlung dann gut, wenn sie deine Hypothese belegt – in den meisten Fällen ist das diejenige Empfehlung mit der höchsten Conversion-Rate. Bitte beachte jedoch, dass du bei einer reinen Ausrichtung auf die Conversion-Rate möglicherweise Empfehlungen anzeigst, die zwar sehr gut konvertieren, die sich aber nur mäßig auf den PSV (Bestellwert pro Session) oder den AOV auswirken. Der Grund dafür ist, dass es eine sehr hohe Korrelation zwischen dem Preis der Empfehlung und der tatsächlichen Conversion-Rate gibt: Je günstiger das Produkt, desto höher die Conversion-Rate. Daher empfehlen wir dir, dich auf den Bestellwert pro Session zu konzentrieren (PSV = Umsatz/Sessions).

Nachdem wir nun eine gemeinsame Definition für eine gute Empfehlung haben, stellt sich die Frage, wie wir entscheiden, welches Produkt empfohlen werden soll. Die meisten Recommendation Engines arbeiten auf verschiedenen Ebenen, aber fast alle analysieren historische Kaufdaten, um zu ermitteln, welche Produkte häufig zusammen gekauft werden. Auf rudimentärer Ebene erfordert dieser Ansatz keine Künstliche Intelligenz und kein Verständnis der tatsächlichen Beziehung zwischen den Produkten. Dieser Ansatz funktioniert auch sehr gut für 10% deines Produktsortiments. Bei den restlichen 90% gibt es aber nur sehr wenige Verbindungen zwischen den Produkten. Das liegt einerseits daran, dass sich das Kaufverhalten von Session zu Session ändert, und andererseits auch daran, dass sich dein Produktsortiment ständig ändert. Alte Produkte werden aus dem Sortiment genommen und neue kommen hinzu. Dabei haben die neuen entweder gar keine Verbindungen zu anderen Produkten oder ihre Kaufhistorie ist noch nicht bekannt.

Um dieses – nennen wir es mal Datenproblem – zu lösen, gibt es verschiedene Ansätze. Einige Suchmaschinen verwenden Technologien zur Bilderkennung, um ähnliche Produkte zu finden, und bauen auf dieser Grundlage ein Kontextbewusstsein auf. Andere Suchmaschinen nutzen NLP (Natural Language Processing), um ein besseres Verständnis der Produkte und ihrer Beziehungen zueinander zu schaffen. Und wieder andere verzichten auf das Verständnis des Kontexts und verlassen sich beim Generieren guter Empfehlungen ausschließlich auf menschliche Intelligenz.

Bilderkennung

Diese Technologie hat in den letzten Jahren enorme Fortschritte gemacht und ist heute in Plattformen wie Google Fotos nutzbar, um Fotos zu gruppieren oder zu markieren. In vielen Fällen funktioniert die Bilderkennung sehr gut und bringt großen Nutzen bei der Klassifizierung und Organisation von Foto-Attributen. Doch wenn diese Technologie zur Produktklassifizierung eingesetzt wird, kommen einige Nachteile zum Vorschein. Zunächst einmal ist die Bilderkennung sehr wohl in der Lage, unterschiedliche Bilder mit unterschiedlichen Eigenschaften zu klassifizieren (so wie die Nicht-Hotdog-App).

Sie ist aber weniger gut, wenn es darum geht, granulare Unterschiede zwischen Produkten zu finden. So lassen sich z.B. Kleider oder Röcke, die ähnlich aussehen, gut erkennen. Aber auch ein Garderobenständer und ein Haushaltspapierhalter sehen sich möglicherweise sehr ähnlich – und das kann für Vollsortimenter ungünstige Auswirkungen auf die angezeigten Empfehlungen haben.

Kleiderständer oder Küchenrollen-Halter? Hier kommt Software-gestützte Bilderkennung an ihre Grenzen.

Natural Language Processing

Auch die Produkt-Beschreibung kann genutzt werden, um den Kontext und die Beziehung von Produkten zu verstehen. Dieser Ansatz hat aber ähnliche Nachteile wie die Bilderkennung, da die Beschreibung nur einen Teil des eigentlichen Produkts widerspiegelt. Ein Beispiel dafür ist ein Produktattribut wie die Farbe: Manche Produkte sind bunt, und in vielen Datenfeeds ist dies der tatsächlich angegebene Wert des Attributs. Ein Mensch würde verstehen, dass das Produkt viele Farben hat, aber das Attribut „bunt“ nichts darüber aussagt, wie es tatsächlich aussieht. Der offensichtliche Nachteil dieser Methode ist, dass einige Produkte keinen wirklichen Kontext haben und die Empfehlungen sehr irrelevant werden können.

Manuelle Auswahl von Empfehlungen

Wenn es um Relevanz geht, ist diese Methode wahrscheinlich die beste. Denn Menschen sind sehr gut darin zu verstehen, welche Produkte zueinander passen. Am deutlichsten wird das vielleicht von Visual Merchandisern veranschaulicht. Empfehlungen manuell zu steuern ist recht einfach, wenn dein Sortiment aus 500 Produkten besteht. Aber was ist, wenn es 10.000 oder sogar 100.000 sind?

Allein die regelmäßige Aktualisierung dieser Empfehlungen wird schnell zu einer Vollzeitbeschäftigung. Zudem hängt diese Methode allein vom Ermessen des jeweiligen Merchandisers ab – das Erlebnis kann also nicht für jeden einzelnen Besucher personalisiert werden, sei es auf der Grundlage historischer Kaufdaten oder dem Session-Intent.

Hier ein Venn-Diagramm, das die Überschneidungen und Beziehungen zwischen den verschiedenen Empfehlungs-Methoden veranschaulicht.

Kontextunabhängige Empfehlungen

Eine vierte Möglichkeit besteht darin, das Konzept des Kontexts zu ignorieren und die Empfehlungen stattdessen auf andere Variablen zu stützen – z.B. auf historische Kaufdaten. Diese Methode ist eigentlich gar nicht so ungewöhnlich und kann in Kombination mit manuellem Merchandising durchaus mit anderen automatisierten Methoden wie der Bilderkennung mithalten. Der Vorteil der Betrachtung historischer Kaufdaten ist, dass die Produkte, die mit dieser Methode empfohlen werden, eine nachgewiesene Kaufwahrscheinlichkeit haben. Das Risiko besteht jedoch darin, dass völlig irrelevante Empfehlungen erscheinen können, zum Beispiel könnte ein Grill auf der Produktseite eines Bleistifts empfohlen werden.

Den Kontext verstehen auf Basis des Besucherverhaltens

Es gibt jedoch noch eine weitere Methode: Aus unserer 10-jährigen Arbeit in den Bereichen Kontext und Relevanz wissen wir, dass GOLEM (unser Kontext-sensitiver Relevanz-Algorithmus) die oben genannten Nachteile auf sehr effektive Weise lösen kann. Ohne zu tief in die technischen Merkmale von GOLEM und unserer KI einzutauchen, nur so viel: GOLEM versteht den Kontext, indem er die Produktattribute mit Neuronen verbindet. Diese Neuronen werden dann den Interaktionen ausgesetzt, die deine Besucher auf deiner Website durchführen. Dadurch lernt die KI, welche Produkte einander ähnlich sind und welche weit voneinander entfernt sind.

Dadurch können die relevantesten Empfehlungen zuverlässig ausgewählt werden – ohne dass die bekannten Nachteile von Bilderkennung, NLP oder manuellem Merchandising auftreten. Darüber hinaus kann diese Methode mit allen oben genannten Varianten kombiniert werden, um eine noch höhere Relevanz und Conversion-Rate zu erreichen.

Diese Methode ist auch mit Personalisierung kompatibel – unabhängig davon, ob die Personalisierung auf Basis von Session-Intent oder historischen Präferenzen wie Markenaffinität, Preissensibilität oder jeder anderen Art von Präferenz realisiert wird. GOLEM unterstützt auch Streaming-Daten. Im Grunde bedeutet das, dass jedes neue Produkt, das du auf den Markt bringst, sofort mit in Betracht gezogen wird – ohne dass historische Daten darüber vorliegen.

Welche Methode hast du bereits verwendet und was sind deine wichtigsten Erkenntnisse? Hinterlasse uns gerne einen Kommentar!