Movie Recommender
Unser Movie Recommender kennt nur zwei Filmgenres: Action und Comedy. Damit können wir Filme jedoch schon in vier unterschiedliche Kategorien klassifizieren. Ordne die Filme dem passenden Feld durch Drag-and-Drop zu.
A3 – Wie gut lassen sich Personen, die einen Film in einer Kategorie mögen andere Filme aus der gleichen Kategorie vorschlagen?
Bei der Zuordnung ist dir vermutlich aufgefallen, dass unsere Klassifikation nicht ausreichen würde, um ein Recommendersystem zu erstellen. Beispielsweise möchten wir ja einem Fan des Romantik-Dramas "Drei Meter über dem Himmel" nicht den Horrorfilm "Es - Kapitel 2" vorschlagen. Vielleicht ist dir auch aufgefallen, dass sich manche Filme nicht so klar einem Feld zuordnen lassen. Ist beispielsweise "Encanto" als Familienfilm eine reine Komödie oder doch zu actionhaltig für diese Kategorie?
In Wirklichkeit werden dir bei einem Movie Recommender wie er beispielsweise von Netflix eingesetzt wird nicht Filme aufgrund von Genre-Klassen gezeigt. Stattdessen wirst du aufgrund deines Klickverhaltens einer Benutzerklasse zugeteilt, die ähnliche Filme konsumieren. Noch etwas ausgeklügelter funktioniert zum Beispiel der Algorithmus hinter der Social-Media-Plattform TikTok. Aber was passiert eigentlich mathematisch, wenn sich ein Recommendersystem durch maschinelles Lernen deinem Geschmack anpasst, um dir die passenden Videos oder Produkte anzuzeigen?
Um dies zu untersuchen, schauen wir uns ein einfaches Perzeptron an, das drei Eingänge verarbeitet, um anzugeben, ob eine Person einen Film mag oder nicht. Durch einen Klick auf die Eingänge (Action, Comedy und Horror) kannst du ändern, welche Filmeigenschaften das Perzeptron verarbeiten soll. Das an- und ausschalten der Eingänge hat zur Folge, dass sich der Füllstand des mittleren Knotenpunkts verändert. Wenn dieser ganz gefüllt ist, wird ein Schwellenwert erreicht, der das Ausgabeneuron aktiviert.
Weitere Informationen zum Perzeptron findest du hier.
A4 – Welche Art von Filmen mag die Person auf die das Perzeptron trainiert wurde?
Sie mag Action-Komödien, aber nur wenn sie keine Horror-Elemente enthalten.
Wie aber passt sich das Perzeptron an verschiedene Filmgeschmäcker an? Dies untersuchen wir mit Hilfe des überwachten Lernens. Dazu schlüpfen wir selbst in die Überwacher*innenrolle, da wir die Lösung bereits kennen und mit diesem Wissen die Maschine trainieren. Die Lösung besteht jeweils aus Ein-/Ausgabepaaren, in unserem Fall also ob eine Person einen Film mit den Ausprägungen Comedy und Action mag oder nicht.
Auf Abbildung 3 sehen wir ein Perzeptron mit zwei Eingängen und einem Bias (auch Always-On-Neuron genannt). Den Bias brauchen wir bei den folgenden Übungen, da sich je nach Geschmacksausprägung der Schwellenwert verändert. Seine Funktion wird weiter unten erklärt. Für den Moment müssen wir nur wissen, dass wir das Gewicht des Bias für die Berechnung der Summe bei jeder Filmausprägung dazurechnen müssen.
Die Verbindungen vom Bias, IN1 und IN2 zur Summe sind in unterschiedlichen Breiten und Farben dargestellt. Diese Darstellung steht für unterschiedliche Gewichtungen. Eine dünne blaue Verbindung steht für eine schwach positive Gewichtung und eine dicke orange Verbindung für eine stark negative Gewichtung des Inputs. Dieses Perzeptron wurde so trainiert, dass es lustige Filme negativ bewertet und alle anderen Filme positiv. Wenn wir dem Perzeptron einen beliebigen Film zeigen, übergeben wir eigentlich zwei Informationen:
Comedy: Ja (1) oder nein (0)?
Action: Ja (1) oder nein (0)?
Mit Hilfe der Genres als Inputs berechnet das Perzeptron die gewichtete Summe und kontrolliert, ob diese grösser als der Schwellenwert 0 (Null) ist. Hier zwei Beispiele:
Bias * 2 + Comedy * (- 3) + Action * 1 | Zahlen einsetzen
1 * 2 + 0 * (- 3) + 1 * 1 | vereinfachen
2 + 0 + 1 = 3 --> like
Beim Actionfilm "The Dark Knight Rises" ist dieser Wert 3, also grösser als 0 und somit sagt das Perzeptron ein like voraus.
Bias * 2 + Comedy * (- 3) + Action * 1 | Zahlen einsetzen
1 * 2 + 1 * (- 3) + 0 * 1 | vereinfachen
2 - 3 + 0 = - 1 --> dislike
Bei der Komödie "Ted 2" ergibt die Berechnung die Voraussage dislike.
A5 – In unserem Beispiel besteht die Aufgabe des Perzeptrons darin, alle lustigen Filme negativ zu bewerten. Wie müsste es demnach Action-Komödien oder Horrorfilme bewerten? Kontrolliere, ob die Zuordnung für die beiden Genres korrekt funktioniert:
Free Guy (Action-Komödie): Comedy (1), Action (1)
Scream (Horrorfilm): Comedy (0), Action (0)
Free-Guy (Action-Komödie)
Bias * 2 + Comedy * (- 3) + Action * 1 | Zahlen einsetzen
1 * 2 + 1 * (- 3) + 1 * 1 | vereinfachen
2 - 3 + 1 = 0 --> dislike
Diese Zuordnung ist korrekt, da auch Action-Komödien lustig sind.
Scream (Horrorfilm)
Bias * 2 + Comedy * (- 3) + Action * 1 | Zahlen einsetzen
1 * 2 + 0 * (- 3) + 0 * 1 | vereinfachen
2 - 0 + 0 = 2 --> like
Diese Zuordnung ist ebenfalls korrekt, da Horrorfilme in der Regel nicht lustig sind.
Bisher haben wir nur kurz über den Bias gesprochen. Wie du vielleicht bemerkt hast, ist dieser immer aktiv (Wert = 1). Der Bias wird benötigt, wenn wir die Gewichte beim Training verändern, damit wir den Schwellenwert bei 0 belassen können. Mit Training wird der Prozess bezeichnet, in welchem wir beim überwachten Lernen mit Hilfe von uns bekannten Beispielen die Gewichte so lange anpassen, bis die Ausgaben dem gewünschten Ergebnis entsprechen. Damit wir die Übersicht beim Training behalten, verändern wir die Darstellung des Perzeptrons leicht.
Die Gewichte werden als ganze Zahlen auf einem verschiebbaren Streifen dargestellt anstatt als farbige Verbindung zwischen Input und Summe.
Anstelle des Wortes Summe wird die Operation mit Plus-Zeichen ausgeschrieben.
Durch die horizontale Darstellung der drei Summanden soll die Übersichtlichkeit verbessert werden.
Die Ausgabe mit den beiden Ausprägungen "like" und "dislike" wird durch das Plus- und Minus-Zeichen ergänzt. Die beiden Symbole sollen dabei helfen, dass die Gewichte beim Training des Perzeptrons richtig angepasst werden.
Wie aber lernt denn nun unser Perzeptron? Das Ziel war doch ein universaler Movie Recommender. So wie unser Perzeptron im Moment eingestellt ist, gibt es lediglich aus, ob jemandem ein Film gefällt, der keine lustigen Filme mag. Wie wir in der alternativen Darstellung eben gesehen haben, lassen sich die Gewichte aber ganz leicht anpassen. Diese Anpassung der Gewichte ist es, die wir schlussendlich meinen, wenn wir von maschinellem Lernen sprechen. Wie dieses funktioniert und wo unser Perzeptron an seine Grenzen stösst lernen wir auf der nächsten Seite.