Kategorie: Suchmaschinen, Suchmaschinen


Am letzten Donnerstag wurde nach einem Vortrag von mir gleich mehrmals nach der Bedeutung des Google PageRanks gefragt, z. B. für die Position einer Webseite in den Google-Suchergebnissen oder für den monetären Wert einer Webseite (beispielsweise beim Verkauf eines Internetprojektes). Die Fragen zeigen: Beim Thema PageRank scheint es nach wie vor Aufklärungsbedarf zu geben. Gesagt, getan! Dieser Blogartikel erklärt die Idee hinter dem Google PageRank, ordnet die heutige Bedeutung dieser Kennzahl ein, und diskutiert drei typische PageRank-Mythen.

Der Ursprung: Die Linkpopularität

Der Google PageRank ist die Kennzahl, mit der die Erfolgsgeschichte von Google einst begonnen hat. Als Doktoranden an der Stanford University entwickelten Sergey Brin und Lawrence (oder Larry) Page einen Algorithmus, um die „Linkpopularität“ einer Webseite zu bestimmen. Das einfache Grundprinzip (~ Annahme 1): Je mehr Links auf eine Webseite verweisen, desto höher ist die Bedeutung (also der PageRank) dieser Webseite. Und ergänzend dazu (~ Annahme 2): Je höher die Bedeutung (also der PageRank) der verweisenden Seiten ist, desto größer ist der Effekt. Das Ziel des Algorithmus: Webseiten sollen anhand ihrer Linkpopularität sortiert werden und populäre Webseiten sollen dann in Suchergebnissen weiter vorne angezeigt werden. Anders gesagt: Die Linkpopularität wurde somit mit der grundsätzlichen Bedeutung einer Webseite gleichgesetzt.

Übrigens: Der 1999 erschienene wissenschaftliche Artikel mit dem Titel „The PageRank Citation Ranking: Bringing Order to the Web“, in dem die wesentlichen Prinzipien des ursprünglichen Google-Algorithmus von Brin und Page beschrieben werden, kann hier heruntergeladen werden. Internetgeschichte zum Nachlesen, wenn man mathematische Grundkenntnisse mitbringt.

Seit 1999 hat sich der PageRank-Algorithmus nun allerdings sehr stark weiterentwickelt. Zwar ist die Zielsetzung nach vor die gleiche, d.h. Webseiten sollen gemäß ihrer Bedeutung sortiert werden, allerdings spielen heute mehrere hundert verschiedene Faktoren bzw. Stellschrauben eine Rolle, wenn es darum geht Webseiten in den Google-Suchergebnissen in eine Reihenfolge zu bringen. Die Linkpopularität im ursprünglichen Verständnis spielt – da vergleichsweise leicht manipulierbar, z. B. durch den Kauf von Links – eine wenn überhaupt nur noch untergeordnete Rolle.

PageRank vs. PageRank

Zu beachten ist insbesondere: Man muss heute zwischen zwei PageRank-Kennzahlen unterscheiden. PageRank ist nicht gleich PageRank. Dem Google-internen, öffentlich nicht einsehbaren PageRank steht der externe, für jedermann über die Google Toolbar einsehbare PageRank gegenüber. Der interne PageRank ist eine Zahl mit mehreren Nachkommastellen zwischen 0,00000001 und 1.953.126. Der externe PageRank ist dagegen eine vom Google-internen PageRank abgeleitete Zahl zwischen 0 und 10.

Die Berechnung des internen PageRank ist das Geheimnis von Google. Zu Berechnung des internen PageRanks kann also nicht viel gesagt werden – die genauen Algorithmen sind nicht bekannt. Allerdings kann man davon ausgehen, dass heute sicher mehrere hundert verschiedene Faktoren bzw. Stellschrauben für die Bestimmung des internen PageRanks von Bedeutung sind. Die Optimierung des internen PageRanks ist übrigens das schwierige und herausfordernde Spielfeld der Suchmaschinenoptimierer und SEO-Dienstleister, das hier jetzt aber bewusst ausgeklammert werden soll.

Im Nachfolgenden soll es jetzt stattdessen um die Bedeutung des extern sichtbaren PageRank gehen, weil eben im Kontext dieses externen PageRanks immer wieder gravierende Missverständnisse entstehen. Aber warum? Drei Gründe:

Zur Aussagekraft des externen PageRank

Erstens: Dem internen PageRank liegt eine exponentielle Berechnung zugrunde. Der externe PageRank wird dann von diesem internen PageRank abgeleitet und auf eine lineare Skala von 0 bis 10 abgebildet. Dies hat zwei unmittelbare Konsequenzen. Eine Webseite, als Beispiel, mit einem externen PageRank 5 ist grundsätzlich als sehr viel stärker einzuschätzen als eine Webseite mit externem PageRank 4 – um den externen PageRank 5 zu erreichen braucht man einen exponentiell besseren internen PageRank als für den externen PageRank 4. Und: Die exponentielle Berechnung des internen PageRanks führt auch dazu, dass großer Spielraum innerhalb von einem einzelnen externen PageRank entsteht. So können zwei Webseiten, die beide den externen PageRank 4 besitzen (die also vermeintlich gleich stark sind), trotzdem eine stark variierende Bedeutung haben.

Zweitens: Der von jedem einsehbare externe PageRank wird von Google nur in größeren Zeitabständen (meist alle paar Monate) von Google aktualisiert. Der externe PageRank repräsentiert somit nur selten die tatsächlich aktuelle Situation einer Webseite.

Drittens (und dies ist der wichtigste Grund für die geringe Aussagekraft des externen PageRanks): Google nimmt sich das Recht heraus, die öffentlich einsehbaren PageRanks nach Belieben zu manipulieren. Schon im Jahr 2008 äußerte sich Matt Cutts, eines der bekanntesten Superhirne hinter dem Google-Algorithmus: "We return random PageRank data if we feel like to." Auf Deutsch: "Wir zeigen Zufallswerte für den PageRank an, wenn uns danach ist."

Somit wird klar: Der externe PageRank ist keine wirklich vertrauenswürdige Kennzahl. Trotzdem sind mit dieser Kennzahl immer noch Mythen und Legenden verknüpft, die im Nachfolgenden kurz diskutiert werden sollen.

PageRank-Mythen

Mythos 1: Der extern sichtbare PageRank ist die alleinige Kennzahl zur Quantifizierung der Bedeutung einer Webseite. Viele glauben bis heute, dass der extern sichtbare PageRank ultimativ die Bedeutung oder Wertigkeit einer Webseite beschreibt, u. A. schon allein deswegen, weil er eben PageRank heißt, also eine "Page" (vermeintlich abgeleitet von Homepage) bewertet. Dazu ist zu sagen, dass der ursprüngliche Algorithmus zur Bestimmung der Linkpopularität im Wesentlichen von Lawrence Page erfunden wurde – und deswegen spricht man auch vom PageRank-Algorithmus. Der PageRank heisst also PageRank, weil er von Lawrence Page erfunden wurde.

Mythos 2: Der PageRank beeinflusst den finanziellen Wert einer Webseite. Viele Webseitenbetreiber glauben Aussagen, dass der PageRank den finanziellen Wert einer Webseite bestimmt bzw. zumindest signifikant beeinflusst. Auch dies ist nicht der Fall. Warum sollte auch eine so ungenaue und für das Ranking einer Webseite so unwichtige Kennzahl (vgl. Mythos 3) einen entscheidenden Einfluss auf den Wert einer Webseite haben?!? [Exkurs: Der monetäre Wert eines Internetprojektes wird heute oft auf Basis einer Multiplikator-Methode errechnet. Dazu wird z. B. der monatlich erwirtschaftete Gewinn des Internetprojektes mit einem zusätzlichen Preisfaktor multipliziert. Dieser Preisfaktor liegt oft zwischen 6-8 (bei sehr risikobehafteten Projekten) und 24-30 (bei risikoarmen Projekten).]

Mythos 3: Der PageRank beeinflusst die Position einer Webseite (also das Ranking einer Webseite) in den Google-Suchergebnissen. Auch das stimmt nicht. Oben wurde ja schon erwähnt, dass für die Position einer Webseite in den Google-Suchergebnissen heute mehrere hundert Faktoren relevant sind. Am Wichtigsten sind Stand heute – um es ganz einfach zu sagen – sicher gute und spannende Inhalte sowie eine natürlich gewachsene, themenrelevante Linkstruktur (die aber, Vorsicht, mit der ursprünglichen Linkpopularität nicht mehr viel gemeinsam hat).

Fazit

Der Google PageRank war zu Beginn tatsächlich eine Kennzahl, mit der die Bedeutung einer Webseite quantifiziert werden sollte. Allerdings hat sich in den letzten knapp 15 Jahren sehr viel getan – Annahmen, die früher galten, spielen heute keine Rolle mehr. Somit mein Fazit: Die praktische Bedeutung des extern sichtbaren PageRank als vertrauenswürdige Kennzahl ist heute als sehr gering einzustufen.


Ereignishorizont Digitalisierung, Logo

Unser Themen-Blog rund um das Thema "Digitalisierung und Digitale Transformation“

Die Digitalisierung überrennt Gesellschaft, Unternehmen und jeden Einzelnen von uns mit unvorstellbarer Dynamik und Wucht. Während manche Auswirkungen in unserem Alltag sichtbar und spürbar sind, bleibt vieles andere vage und im Verborgenen. Das Bild eines Eisbergs beschreibt diese Situation treffend. Wir sehen v. a. das, was über der Wasseroberfläche zu erkennen ist. Das jedoch, was unterhalb des Wasserspiegels verbleibt, ist weitestgehend unbekanntes Land. Dieses unbekannte Land greift das Blog „Ereignishorizont Digitalisierung“ auf. Es geht um Neuland-Missverständnisse, Gar-Nicht-So-Weit-Weg-Zukunftsfantasien und What-the-Fuck-Momente. Sicher selektiv. Immer auch subjektiv! Besondere Zielgruppe sind Entscheider und Gestalter der Digitalisierung und Digitalen Transformation.


Zum Blog