Didaktischer Kommentar

Die folgenden Bemerkungen sollen beim Einsatz der Materialien im Unterricht helfen und zu vertiefenden Fragen anregen.

Die mehrheitlich offenen Fragen zu den Übungen sind jeweils farbig hervorgehoben, mit einem Symbol gekennzeichnet und durchnummeriert. Alle Fragen können mündlich oder schriftlich in Einzelarbeit oder kollaborativ beantwortet werden. Durch einen Klick öffnet sich eine verborgene Musterlösung.

Der Lernpfad mit den "weiter"-Buttons ist folgendermassen aufgebaut:

Symbol für Aufgabe mit Musterlösung

Zeit: mind. 1 Lektion (je nach Vertiefung)

Lernziel:

  • Die Lernenden können anhand eines Beispiels erklären, wie die Qualität eines Empfehlungssystems verbessert werden kann.

Zentrale Erkenntnis: Ein Recommendersystem lernt aus Daten. Damit hat es zwei Schwachstellen: Es braucht sowohl "gute" Daten, wie auch einen Algorithmus, der aus den Daten möglichst "gute" Empfehlungen generiert.

Die Einstiegsfrage soll Lernende provozieren, sich mit Recommendersystemen zu beschäftigen. Falls eine Diskussion zu Genderfragen entstehen sollte, soll dieser ruhig Raum gelassen werden (wieso gibt es keinen Knopf für "keine Angabe" oder ähnlich). Nach einem Klick auf eine der beiden Auswahlmöglichkeiten werden zwei völlig unterschiedliche Playlisten gezeigt. Die nächste Seite soll aufzeigen, weshalb die beiden Playlisten derart unterschiedliche Empfehlungen aufzeigen.

Die beiden ersten Fragen können in geschlechtergemischten Gruppen oder in der Klasse besprochen werden. Die Musterlösung zu A1 enthält eine erste Erklärung zu einem wichtigen Konzept, das im weiteren Verlauf immer wieder auftauchen wird: Klassifizierung. Die Aufgabe von ML-Algorithmen besteht häufig darin, Klassifizierungen zu erlernen, dabei gibt es Verfahren, welche die Klassen bereits vorgeben und solche, die Klassen aufgrund der Daten autonom generieren.

A2 soll die Lernenden animieren, eine alternative Klassifizierung vorzunehmen. Das Streudiagramm zeigt, dass die Separation zwischen den beiden Gruppen auch durch eine vertikale Trennlinie vorgenommen werden kann. Dies würde zu einer anderen Einstiegsfrage führen. Am Ende der Musterlösung findet sich ein Link zu einer alternativen Einstiegsfrage.

Mögliche Vertiefung:

  • Eine eigene Umfrage zum Lieblingslied und ausgewählten Merkmalen (Geschlecht, Alter, ...) mit der einen Schulhaushälfte (Lernende und Lehrpersonen) durchführen

  • Mögliche Klassen aus den Merkmalen der Befragten bilden und Lieblingslieder zuordnen

  • Merkmale der zweiten Schulhaushälfte (restliche Lernende und Lehrpersonen) erfragen und entsprechend der ersten Befragung eine Empfehlung generieren

  • Empfehlungen bewerten (wie viele Befragte waren zufrieden mit der Bewertung? Wie könnte die Empfehlung verbessert werden?)

  • kann sowohl analog als auch digital mit entsprechenden Tools (Excel) durchgeführt werden

Zeit: mind. 2 Lektionen (je nach Vertiefung)

Lernziel:

  • Die Lernenden können erklären, was in einem künstlichen neuronalen Netz passiert, wenn von maschinellem Lernen gesprochen wird.

Zentrale Erkenntnis: Ein künstliches neuronales Netz (KNN) wird auf ein Muster trainiert (zum Beispiel für die Klassifikation), indem es die Verbindungen und Schwellenwerte mit Hilfe eines Datensatzes anpasst. Die Anpassung folgt einer strengen Regel: Bei einer beliebigen Eingabe wird die vom KNN berechnete Ausgabe mit der erwarteten Ausgabe verglichen und im Falle einer Abweichung eine Anpassung vorgenommen.

A3 verfolgt mehrere Ziele: Die Lernenden wiederholen das Konzept der Klassifizierung und sie stellen fest, dass eine Klassifizierung immer eine Reduktion mit sich bringt. Das Ziel der Klassifizierung sollte sein, möglichst ähnliche Objekte zu gruppieren, jedoch zeigt das Beipiel, dass je nach Klassifikationsmerkmalen auch völlig unterschiedliche Objekte in der gleichen Klasse landen können. Weiter kann auch die Diskussion angeregt werden, ob alle Lernenden die Filme in die gleichen Boxen ziehen.

Die nachfolgende Erklärung führt den Begriff Perzeptron ein. Die Aufgaben sind so aufgebaut, dass die Funktionen des Perzeptrons nach und nach erklärt werden. Jedoch wird auf eine Begriffsklärung innerhalb der Übung verzichtet. Falls Fragen zum Begriff Perzeptron aufkommen sollten, kann die Seite mit der Begriffsklärung jederzeit zwischengeschoben werden. Darin wird erklärt, dass künstliche Neuronen durch die Funktionsweise von Nervenzellen inspiriert wurden. Falls die Begriffsklärung schon zu diesem Zeitpunkt besucht wird, kann der letzte Abschnitt noch ignoriert werden, da sich dieser auf die abschliessenden Aufgaben A10/A11 der Übung Movie Recommender bezieht.

Für die Lösung von A4 lohnt es sich, die Zeit zu nehmen, die interaktive Darstellung Abb. 2 zu verstehen. Eine Erklärung findet sich ebenfalls in der Erklärung des Begriffs Perzeptron.

Bei A5 wird eine Berechnung analog Abb. 4 und Abb. 5 vorgenommen. Es empfiehlt sich, die Berechnung Schritt für Schritt und schriftlich vorzunehmen. Die Schwierigkeit das Konzept des überwachten Lernens zu begreifen ist nicht zu unterschätzen. Die Lernenden rechnen einerseits nach, wozu das Perzeptron programmiert ist und schlüpfen andererseits in die Rolle des allwissenden Überwachers, der überprüft, ob die Berechnung korrekt ist.

Die weiteren Erklärungen zum Bias und der alternativen Darstellung sind wichtig als Hintergrund für die Lehrperson und interessierte Lernende, jedoch müssen diese nicht zwingend von allen verstanden werden, um das Perzeptron in den folgenden Übung zu trainieren.

A6 soll aufzeigen, wie ein Perzeptron im untrainierten Zustand Filme aus den vier Klassen bewertet.

Für die folgenden Aufgaben wird mit den Trainingsdaten aus Tabelle 2 gearbeitet. Eine Zeile entspricht einem zu lernenden Datensatz. Das Ziel ist es, die Gewichte des Perzeptrons nur mit Hilfe des Lernalgorithmus so anzupassen, dass die Ausprägungen ("like"/"dislike") der sechs Personen repräsentiert werden können. Der Trainingsprozess ist abgeschlossen, wenn alle Kategorien korrekt zugeordnet werden.

Das Beispiel des Trainings für Kim kann auch durch die Lehrperson mit den analogen Materialien vorgezeigt werden. Die Aufgaben 7 und 8 können angeleitet im KU mi Hilfe der analogen Materialien in Partnerarbeit gelöst werden. Der Pseudocode von A9 kann auch in einer anderen Form festgehalten werden. Wichtig ist, dass alle Lernenden dem Lernalgorithmus folgen können:

  • Der Algorithmus terminiert, wenn alle Filme richtig zugeordnet werden

  • Wenn die Summe der aktiven Gewichte grösser als 0 ist, ist die Voraussage "like"

  • sonst ist die Voraussage "dislike"

  • Wenn die Voraussage dislike ist, aber like sein müsste, müssen die aktiven Gewichte erhöht werden

  • Wenn die Voraussage like ist, aber dislike sein müsste, müssen die aktiven Gewichte verkleinert werden.

A10 ist die Kernaufgabe des Movie Recommenders und sollte mit den analogen Materialien durchgeführt werden. Alternativ kann die interaktive Google-Tabelle genutzt werden, welche die Trainingsdaten in einem Graphen visualisiert. Die Klasse kann beispielsweise in Zweiergruppen aufgeteilt werden, um sich mit 2-3 Ausprägungen aus der Tabelle zu beschäftigen. Die Resultate können anschliessend der Klasse oder einen anderen Gruppe vorgetragen werden. Eine Musterlösung zu A10 findet sich auf der folgenden Seite Visualisierung.

Achtung bei Sara: Die Ausprägung Ihres Geschmacksprofils ist für das Perzeptron nicht lernbar. Dies kann für Lernende frustrierend sein, falls sie nach 20 Anpassungen noch nicht merken, dass die Gewichte immer wieder die gleichen Zustände einnehmen, aber die Zuordnung immer noch nicht korrekt ist. Eine ausführliche Erklärung findet sich in der Antwort zu A11 und in der Begriffsklärung des Perzeptrons.

Der Abschnitt zum Weiterdenken soll aufzeigen, dass das Training bei weiteren Inputs schnell zu komplex wird, um es von Hand durchzuführen. Ausserdem spricht es ein zentrales Problem der Übung mit dem einfachen Datensatz an. Beim maschinellen Lernen wird normalerweise ein System mit einem Trainingsdatensatz trainiert, damit es das Gelernte auf neue Beispiele anwenden kann. Hier gibt es jedoch keine Testdaten, die sich vom Trainingsdatensatz unterscheiden. Es findet also eine Überanpassung auf die Trainingsdaten statt.

A12 soll die Lernenden dazu anregen, sich zu überlegen, wie sie einen eigenen Movie Recommender bauen würden. Die Aufgabe soll zu einem kleinen Projekt anregen. Die Musterlösung zeigt verschiedene Lösungsvarianten und erklärt noch einmal vereinfacht, wie heutige Recommendersysteme funktionieren.

Zeit: mind. 2 Lektionen (je nach Vertiefung)

  • Die Lernenden erkennen, dass die Qualität der Voraussagen eines künstlichen neuronalen Netzes von den Daten abhängt, mit denen es trainiert wurde.

Die erste Übung können Lernende mit Hilfe des Erklärvideos oder nach Anleitung der Lehrperson selbständig lösen. Wichtig ist, dass sie einen Code erstellen, der funktioniert. Es sollen also 2-3 Bilder korrekt erkannt und klassifiziert werden. Weiter sollen sie aber auch dazu angeregt werden, die Bilderkennung an die Grenze zu bringen und sich zu überlegen, weshalb das Modell nicht alle Bilder erkennt. Eine Erklärung findet sich im letzten Abschnitt.

Nach einem Einstieg mit einem trainierten Modell geht es bei der zweiten Übung darum, ein Bilderkennungsmodell selbst zu trainieren. Als Motivation kann beispielsweise der Clip "Hund oder Schwein" aus dem Netflix-Film "The Mitchells vs the Machines" gezeigt werden. Der Clip bringt das Problem der Bilderkennung sehr schön auf den Punkt, indem es zeigt, dass Grenzfälle für einen Computer sehr schwierig zu erkennen sind. Die Bilderkennung der Roboter aus dem Film wurde vermutlich so trainiert, dass sie die Klassifizierung nur aufgrund äusserer Merkmale vornehmen. Für uns Menschen ist jedoch klar, dass es ein Hund sein muss, da er sich (meistens) wie ein Hund verhält und als Begleiter der Familie ein Schwein vermutlich nicht in Frage kommt.

Das eigene Modell lässt sich am besten trainieren, indem möglichst viele unterschiedliche Figuren aus der gleichen Kategorie aus unterschiedlichen Perspektiven ins Modell eingelesen werden. Als Vorbereitung kann den Lernenden daher der Auftrag gegeben werden, Plüsch- oder Gummitiere mitzunehmen.

Die beiden Erklärvideos führen Schritt für Schritt durch die Aufgaben zum Training und zur Einbindung in ein eigenes Scratch-Projekt.

Filmclip: Hund oder Schwein