Bewertung der Verlinkung von Webseiten
Bewertung mit einem Simulationsverfahren
Ziel ist es, eine Webseite danach zu bewerten, wie viele andere auf sie verlinken und wie stark verlinkt diese anderen Seiten wiederum sind. Links von Webseiten, auf die selbst viele Links verweisen, werden dabei stärker berücksichtigt als Links, die ihren Ursprung auf Webseiten haben, auf die nur wenige oder gar keine Links verweisen.
Um diese Verlinkungsstruktur zahlenmäßig zu erfassen, spielen wir das Surfverhalten von Webseitenbesuchern durch, die sich (eher ziellos) anhand der Links durch das Netz von Webseiten bewegen. Webseiten, auf die viele bedeutende Links verweisen, werden bei der Simulation daran zu erkennen sein, dass dort viele Besucher durch das ziellose Surfen landen.
Um die Funktionsweise dieses Ansatzes zu verstehen, muss man (zum Glück) nicht die Gesamtheit aller verlinkten Webseiten betrachten. Es reicht, wenn man eine "kleine Welt" vernetzter Webseiten betrachtet.
Ein erstes Surfmodell
Wir gehen von folgenden vereinfachenden Annahmen aus:
(A1) Zu Beginn verteilen sich alle Besucher gleichmäßig auf die Webseiten.
(A2) Alle Besucher ("Surfer") folgen jeweils im gleichen Takt einem Link auf eine weitere Webseite. Wenn auf einer Webseite mehrere Links vorkommen, dann verteilen sich die Besucher gleichmäßig auf die verschiedenen Links.
Aufgabe 1
(a) Wie viele Nutzer besuchen in der gezeigten Situation nach einem Takt die verschiedenen Webseiten?
(b) Welche Schwierigkeit ergibt sich bei der Webseite F?
Ein verbessertes Surfmodell
Wenn ein Nutzer die Webseite F besucht, dann kommt er/sie nicht mehr weiter. In der Realität kann ein Nutzer jetzt auf verschiedene Weisen reagieren, z.B.: zurück auf die zuletzt besuchte Seite gehen; die Adresse einer neuen Seite eingeben; ganz mit dem Surfen aufhören. Wir gehen in unserem Modell von folgendem Verhalten aus:
(A3) Besucher, die in eine Sackgasse geraten (d.h. Webseiten besuchen, die keine Links auf weitere Seiten enthalten), besuchen im nächsten Schritt irgend eine der gegebenen Webseiten. Wir nennen sie ab jetzt "Sackgassenjumper". Sie teilen sich dabei gleichmäßig auf alle zur Verfügung stehenden Webseiten auf.
Aufgabe 2
Wie viele Nutzer besuchen unter den veränderten Annahmen nach einem Takt die verschiedenen Webseiten?
Ein weiter verfeinertes Surfmodell
In der Regel folgen nicht alle Nutzer immer nur den auf Webseiten vorgegebenen Links. Manche Nutzer springen auch von Zeit zu Zeit auf eine andere Webseite, indem sie die Adresse dieser Webseite eingeben. Wir nennen sie hier "Gelegenheitsjumper" und modellieren ihr wie folgt.
(A4) Ein bestimmter Prozentsatz der Nutzer (z.B. 20%) springt in jedem Takt zu einer beliebigen Webseite. Sie teilen sich dabei gleichmäßig auf alle zur Verfügung stehenden Webseiten auf.
Aufgabe 3
(a) Erkläre, wie die in der Abbildung gezeigten Zahlen gemäß Annahmen zustande kommen.
(b) Führe die Berechnungen für mehrere Takte durch. Benutze (gerundete) Dezimalzahlen, wenn die Divisionen nicht aufgehen - auch, wenn das der Wirklichkeit nicht mehr entspricht.
A | B | C | D | E | F |
---|---|---|---|---|---|
300 | 300 | 300 | 300 | 300 | 300 |
180 | 460 | 100 | |||
246.5 | 254.5 | 619.8 | 340.9 | 91.8 | 246.5 |
Grenzen von Modellen
Wir haben oben Modelle entwickelt, um das Surfverhalten von Nutzern im Internet zu beschreiben. Modelle vereinfachen dabei sehr häufig die zu beschreibende Realität.
Aufgabe 4
(a) Mache dir klar, welche Vereinfachungen bei der Beschreibung des realen Surfverhaltens von Nutzern getroffen wurden.
(b) Sind diese Vereinfachungen akzeptabel?