Inhaltsbasiertes Empfehlungssystem mit KNN-Klassifikation
Aufgabe 1 - Punktdiagramm anfertigen: Trainingsphase
Fertige für den Datensatz ein Punktdiagramm an. Überlege dir dafür zunächst, was die erklärenden Attribute und was die Klassen sind.
Die Werte Witz und Spannung geben auf einer Skala von 1 bis 10 an, wie viel Witz und Spannung ein Film objektiv
beinhaltet.
Film | Witz | Spannung | Bewertung |
---|---|---|---|
A | 1 | 10 | nicht gefallen |
B | 2 | 6 | nicht gefallen |
C | 3 | 7 | nicht gefallen |
D | 3 | 2 | nicht gefallen |
E | 4 | 4 | gefallen |
F | 5 | 5 | gefallen |
G | 5 | 9 | nicht gefallen |
H | 6 | 1 | gefallen |
I | 7 | 3 | gefallen |
J | 7 | 8 | nicht gefallen |
K | 8 | 5 | gefallen |
L | 8 | 1 | gefallen |
M | 9 | 7 | nicht gefallen |
N | 10 | 3 | gefallen |
O | 1 | 2 | nicht gefallen |
Aufgabe 2 - Punktdiagramm nutzen: Anwendungsphase
Bestimme mit der Nächste-Nachbar-Klassifikation die Klassen der Filme.
Film | Witz | Spannung | Bewertung |
---|---|---|---|
P | 1 | 4 | |
Q | 6 | 4 | |
R | 6 | 6 | |
S | 9 | 8 | |
T | 9 | 2 |
Aufgabe 3 - Erweiterung der Klassen
Die Klassen wurden genauer spezifiziert. Übertrage die genaueren Klassen in dein Punktdiagramm aus Aufgabe 1 und bestimmte die Klassen
für den Anwendungsdatensatz aus Aufgabe 2 erneut.
Film | Witz | Spannung | Bewertung |
---|---|---|---|
A | 1 | 10 | 1 |
B | 2 | 6 | 2 |
C | 3 | 7 | 2 |
D | 3 | 2 | 3 |
E | 4 | 4 | 4 |
F | 5 | 5 | 4 |
G | 5 | 9 | 1 |
H | 6 | 1 | 5 |
I | 7 | 3 | 5 |
J | 7 | 8 | 1 |
K | 8 | 5 | 5 |
L | 8 | 1 | 5 |
M | 9 | 7 | 1 |
N | 10 | 3 | 5 |
O | 1 | 2 | 2 |
Aufgabe 4 - Erweiterung der erklärenden Attribute
Die erklärenden Attribute wurden ebenso erweitert. Betrachte das Punktdiagramm in Geogebra 3D und die untenstehenden Datensätze.
- Finde heraus, welche erklärenden Attribute an welcher Achse abgetragen sind. Kannst du das Punktdiagramm so drehen, dass es aussieht wie das aus Aufgabe 2?
- Bestimme mit der Nächste-Nachbar-Klassifikation die Klassen der Filme P, Q, R, S und T.
- Vergleiche deine Klassifikation zu deinen Ergebnissen aus Aufgabe 2.
Film | Witz | Spannung | Romantik | Bewertung |
---|---|---|---|---|
A | 1 | 10 | 6 | 1 |
B | 2 | 6 | 3 | 2 |
C | 3 | 7 | 2 | 2 |
D | 3 | 2 | 9 | 3 |
E | 4 | 4 | 7 | 4 |
F | 5 | 5 | 5 | 4 |
G | 5 | 9 | 9 | 1 |
H | 6 | 1 | 2 | 5 |
I | 7 | 3 | 2 | 5 |
J | 7 | 8 | 7 | 1 |
K | 8 | 5 | 3 | 5 |
L | 8 | 1 | 1 | 5 |
M | 9 | 7 | 9 | 1 |
N | 10 | 3 | 2 | 5 |
O | 1 | 2 | 3 | 2 |
Film | Witz | Spannung | Romantik | Bewertung |
---|---|---|---|---|
P | 1 | 4 | 7 | |
Q | 6 | 4 | 5 | |
R | 6 | 6 | 8 | |
S | 9 | 8 | 1 | |
T | 9 | 2 | 3 |
Aufgabe 5 - Inhaltsbasierte K-Nächste-Nachbar-Klassifikation
Unser ursprüngliche Filmdatensatz hat nach der Datenvorbereitung die folgende Form:
movieID | Comedy | Crime | Drama | Thriller | Romance | War | rating Nutzer 1 |
---|---|---|---|---|---|---|---|
1 | 1 | 0 | 1 | 0 | 1 | 1 | 4 |
2 | 1 | 1 | 0 | 0 | 0 | 0 | 5 |
3 | 1 | 0 | 1 | 0 | 0 | 0 | 3 |
4 | 0 | 1 | 1 | 1 | 0 | 0 | 5 |
5 | 0 | 0 | 1 | 0 | 1 | 0 | 2 |
6 | 1 | 1 | 1 | 0 | 0 | 0 | 5 |
- Bestimme, welche Spalte der Klasse und welche Spalten den Attributen entsprechen.
- Argumentiere, warum wir mehr als zwei erklärende Attribute betrachten sollten, um sinnvolle Vorhersagen zu machen.