Philosophie Lexikon der Argumente

Home Screenshot Tabelle Begriffe

 
PageRank-Algorithmus: Der PageRank-Algorithmus ist ein Link-Analyse-Algorithmus, der jedem Element einer mit Hyperlinks versehenen Menge von Dokumenten, z. B. im World Wide Web, eine numerische Gewichtung zuweist, um seine relative Bedeutung innerhalb der Menge zu messen. Siehe auch Websites, Suchmaschinen, Internet, Google.

_____________
Anmerkung: Die obigen Begriffscharakterisierungen verstehen sich weder als Definitionen noch als erschöpfende Problemdarstellungen. Sie sollen lediglich den Zugang zu den unten angefügten Quellen erleichtern. - Lexikon der Argumente.

 
Autor Begriff Zusammenfassung/Zitate Quellen

Peter Norvig über PageRank-Algorithmus – Lexikon der Argumente

Norvig I 870
PageRank-Algorithmus/Norvig/Russell: PageRank wurde erfunden, um das Problem der TF-scores zu lösen: Wie stellen wir sicher, wenn die Abfrage [IBM] lautet, dass die Homepage von IBM (ibm.com) das erste Ergebnis ist, auch wenn eine andere Website den Begriff "IBM" häufiger erwähnt? Die Idee dahinter ist, dass ibm.com viele In-Links (Links zu der Seite) aufweist und daher höher eingestuft werden sollte: Jeder In-Link ist eine Stimme für die Qualität der verlinkten Seite. Wenn wir aber nur die In-Links zählen würden, dann wäre es für einen Web-Spammer möglich, ein Netzwerk von Seiten zu erstellen und sie alle auf eine Seite seiner Wahl verweisen zu lassen, wodurch sich die Punktzahl dieser Seite erhöht. Daher ist der PageRank-Algorithmus so ausgelegt, dass Links von qualitativ hochwertigen Websites stärker gewichtet werden. Was ist jedoch eine qualitativ hochwertige Website? Eine Website, auf die von anderen qualitativ hochwertigen Websites verwiesen wird. Diese Definition ist rekursiv, erreicht (...) aber einen Tiefpunkt. Der PageRank für eine Seite p ist definiert als:

PR(p) = 1 – d/N + d ∑i PR(ini)/ C ini)

PR(p): der PageRank der Seite p
N: die absolute Anzahl an Seiten in dem Korpus,
Ini: sind die Seiten, die auf p verlinken und
C(ini): ist die Zählung der Gesamtzahl der Out-Links auf der Seite in i.
D: Die Konstante d ist ein Dämpfungsfaktor.
Zufälliger Internetnutzer: Dies kann durch das Modell des zufälligen Internetnutzers (engl. random surfer model) verstanden werden. Stellen Sie sich einen Internetnutzer vor, der auf irgendeiner zufälligen Seite mit der Erkundung beginnt. Mit der Wahrscheinlichkeit d (wir nehmen an d=0,85) klickt der Internetnutzer auf einen der Links auf der Seite (wobei er einheitlich unter den Links auswählt). Mit der Wahrscheinlichkeit 1 - d langweilt die Webseite den Internetnutzer und dieser beginnt erneut auf einer zufälligen Seite irgendwo im Web. Der PageRank von Seite p ist dann die Wahrscheinlichkeit, dass sich der zufällige Internetnutzer zu irgendeinem Zeitpunkt auf Seite p befindet. Der PageRank kann durch ein iteratives Verfahren berechnet werden: Beginnen Sie mit allen Seiten, die PR(p)=1 aufweisen, iterieren Sie den Algorithmus und aktualisieren Sie die Ränge, bis sie konvergieren.
Norvig I 972
HITS-Algorithmus: Der Algorithmus der Hyperlink-induzierten Themensuche, auch bekannt als "Hubs and Authorities" oder HITS, ist ein weiterer einflussreicher Algorithmus zur Link-Analyse (...). HITS unterscheidet sich in mehrfacher Hinsicht vom PageRank. Erstens ist er ein anfrageabhängiges Maß: es bewertet Seiten in Bezug auf eine Anfrage. Das bedeutet, dass er für jede Anfrage neu berechnet werden muss - eine Rechenlast, die die meisten Suchmaschinen nicht übernehmen wollen. Bei einer Suchanfrage findet HITS zunächst eine Reihe von Seiten, die für die Anfrage relevant sind. Dies geschieht, indem es Trefferlisten mit Suchbegriffen vergleicht und dann Seiten in der Link-Nachbarschaft dieser Seiten hinzufügt - Seiten, die auf eine der Seiten in der ursprünglichen relevanten Menge verweisen oder von einer dieser Seiten aus verlinkt werden.
Jede Seite in diesem Set wird als AUTHORITY betrachtet, eine Instanz oder Autorität der Suchanfrage in dem Maße, dass andere HUB-Seiten im relevanten Set darauf verweisen. Eine Seite gilt in dem Maße als Hub, wie sie auf andere maßgebliche (engl. authoritative) Seiten im relevanten Set verweist. Genau wie beim PageRank wollen wir nicht einfach nur die Anzahl der Links zählen; wir wollen den qualitativ hochwertigen Hubs und Instanzen mehr Wert verleihen. Wie beim PageRank iterieren wir also einen Prozess, bei dem die Autoritätsbewertung einer Seite so aktualisiert wird, dass sie die Summe der Hub-Bewertungen der Seiten ist, die auf sie verweisen und die Hub-Bewertung die Summe der Autoritätsbewertungen der Seiten ist, auf die sie verweist. Wenn wir dann die Punktzahlen normalisieren und k-mal wiederholen, wird der Prozess konvergieren.
Sowohl PageRank als auch HITS spielten eine wichtige Rolle bei der Entwicklung unseres Verständnisses des Webs. >Information Retrieval
, >Question Answering.
Norvig I 884
Literatur: Brin und Page (1998)(1) beschreiben den PageRank-Algorithmus und die Implementierung einer
Web-Suchmaschine. Kleinberg (1999)(2) beschreibt den HITS-Algorithmus. Silverstein et al. (1998)(3) untersuchen ein Protokoll von einer Milliarde Web-Suchanfragen. Die Zeitschrift Information Retrieval und der Tagungsband der jährlichen SIGIR-Konferenz behandeln die jüngsten Entwicklungen auf diesem Gebiet.


1. Brin, S. and Page, L. (1998). The anatomy of a large-scale hypertextual web search engine. In Proc.
Seventh World Wide Web Conference.
2. Kleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. JACM, 46(5), 604–632.
3. Silverstein, C., Henzinger, M., Marais, H., and Moricz,M. (1998). Analysis of a very large altavista query log. Tech. rep. 1998-014, Digital Systems Research Center

_____________
Zeichenerklärung: Römische Ziffern geben die Quelle an, arabische Ziffern die Seitenzahl. Die entsprechenden Titel sind rechts unter Metadaten angegeben. ((s)…): Kommentar des Einsenders. Übersetzungen: Lexikon der Argumente
Der Hinweis [Begriff/Autor], [Autor1]Vs[Autor2] bzw. [Autor]Vs[Begriff] bzw. "Problem:"/"Lösung", "alt:"/"neu:" und "These:" ist eine Hinzufügung des Lexikons der Argumente.

Norvig I
Peter Norvig
Stuart J. Russell
Artificial Intelligence: A Modern Approach Upper Saddle River, NJ 2010

Send Link

Autoren A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Y   Z  


Begriffe A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Z