Content Based Filtering (CBF)

Das Content-Based Filtering bilded zusammen mit dem Collaborative Filtering die technologische Basis für fast alle Recommender Systeme. Beim Content-Based Filtering (CBF) werden bestimmte, erkennbare Parameter eines Elements gemessen und mit denen anderer Elemente verglichen.

So können dem Nutzer, der sich einen Artikel im Shop ansieht, weitere Artikel mit ähnlichen Eigenschaften empfohlen werden. Die Messung der Ähnlichkeit kann beispielsweise über die Bestimmung von "Schlüsseleigenschaften" bzw. "Schlüsselbegriffen" erfolgen. Über das Zählen der Übereinstimmungen zwischen zwei Elementen bzw. der Häufigkeiten von Schlüsselbegriffen wird dann die Empfehlungsberechnung operationalisiert. Zusätzlich können die einzelnen Parameter auch entsprechend ihrer Relevanz gewichtet werden.

Der Unterschied von Content-Based Filterung zu Guided Selling ist, dass bei Content Based Filtering Produkte mit Produkten abgeglichen werden, um Ähnlichkeiten zu finden. Bei Guided Selling werden Nutzerprofile mit Produkten abgeglichen:

  • Content-Based Filtering findet durch den Abgleich von Content (z.B. Beschreibungstext) eines Ausgangsprodukts mit anderen Produkten Vorschläge als Alternativen zu dem Ausgangsprodukt.
  • Guided Selling berät Nutzer über ihre Anforderungen und bildet durch die Kaufwünsche ein Nutzerprofil. Dieses wird mit Produkten abgeglichen ( Matching Engine), um bestmögliche Produktempfehlungen zu berechnen.

Nachteile des Content-Based Filterings:

  • keine Beratung über Anforderungen, sondern lediglich Suche über alternative Produkte
  • Sie zeigen dem Verwender wenig Neues, da sie in ihrer Empfehlung nur die Ähnlichkeiten von Elementen berücksichtigen können, die zuvor vom Entscheider ausgewählt wurden. Dabei haben CBF- Systeme Probleme, Elemente zu empfehlen, die aus einer Menge wenig "verwandter" Elemente stammen.
  • Darüber hinaus kann das System keinerlei Aussage darüber machen, ob die Qualität einzelner Elemente auch den Anspruch des Verwenders (im Sinne von Funktionalität und Gefallen) erfüllt.
  • Problematisch können auch Differenzen zwischen den vom Website-Betreiber festeglegten Parametern und deren inhaltliche Bedeutung für den Verwender sein.

Content-Based Filtering wird häufig zusammen mit Collaborative Filtering eingesetzt, um das auf Nutzungsdaten-Analyse basierende Collaborative Filtering um inhaltliche Ähnlichkeiten zwischen den Produkten anzureichern. In den nach Nutzungsdaten korrelierenden Produktvorschlägen können dann z.B. durch Content Based Filtering besonders gut passende Alternativen hervorgehoben werden. Man redet dann von hybriden Systemen aus Content-Based Filtering und Collaborative Filtering.

Siehe auch: