Song Recommender
Für unsere Empfehlungen wurden auf dem Dorfplatz einer kleinen Gemeinde zufällig acht Personen ausgewählt, die ihren Namen, ihr Geschlecht, Alter und Lieblingslied angeben mussten. Die Ergebnisse wurden anschliessend in einer Tabelle festgehalten. Danach wurde ein Algorithmus geschrieben, der die Eingabe des Users mit diesen Daten vergleicht und eine passende Song-Empfehlung abgibt.
Wie zufrieden warst du mit deiner Empfehlung?
Was denkst du, wie gut passte die Empfehlung für die andere Gruppe?
A1 – Wieso unterscheidet sich die Qualität der Empfehlungen der bieden Gruppen (m/w) so stark?
Der Algorithmus ist so eingestellt, dass er die Vorschläge aufgrund des Geschlechts zusammenstellt. Das heisst, er vergleicht die Eingabe des Users (m/w) mit der Spalte "Geschlecht" aus dem Datensatz und gibt als Empfehlung alle Songs aus, die von Personen mit dem gleichen Geschlecht als "Lieblingslied" angegeben wurden. Die Einteilung der Daten anhand bestimmter übereinstimmender Merkmale nennt man auch Klassifizierung. Wieso passt diese Einteilung bei unserem Beispiel so schlecht?
A2 – In Abb. 1 siehst du eine grafische Darstellung der Daten aus unserem Datensatz. Wie liesse sich die Qualität der Empfehlung ohne Veränderung des Datensatzes verbessern?
Wie wir inzwischen festgestellt haben, waren die männlichen Teilnehmer aus der Umfrage alle deutlich älter als die Teilnehmerinnen. Das Geschlecht ist vielleicht auch nicht so ein passendes Kriterium für den Musikgeschmack. 🤓
Wir könnten die Klassifizierung der Empfehlung jedoch leicht auch durch das Kriterium Alter vornehmen. Wie wir im Streudiagramm (Abb. 1) deutlich sehen, lässt sich eine vertikale Trennlinie bei 50 setzen, um statt der Geschlechtergruppen zwei Altersgruppen zu erhalten.
Dafür müssen wir jedoch die Eingangsfrage des "Song Recommenders" anpassen. Wie könnte diese lauten? (Lösung)
Moderne Recommendersysteme wie du sie von YouTube, TikTok, Spotify, usw. kennst, sind natürlich viel komplexer aufgebaut. Im Grunde genommen gehen sie aber ganz ähnlich vor. Die Zuschauer von Netflix werden zum Beispiel aufgrund der Merkmale ihrer konsumierten Inhalte in unterschiedliche Geschmacksgruppen eingeteilt. In unserem ersten Beispiel haben wir eine Klassifikation anhand eines einzigen Merkmals vorgenommen (zuerst Geschlecht, anschliessend Alter). Das hat aber noch nicht so viel mit künstlicher Intelligenz zu tun. In der nächsten Übung bringen wir einer Maschine mit Hilfe von überwachtem Lernen bei, Filmempfehlungen für verschiedene Geschmacksgruppen vorzunehmen.