Neue Studie: Ist Google im Hinblick auf bestimmte Medienseiten voreingenommen

Patrick Stox
Patrick Stox ist Produktberater, technischer SEO und Markenbotschafter bei Ahrefs. Er ist Organisator des SEO-Meetups in Raleigh, der SEO-Konferenz in Raleigh, des Beer & SEO-Meetups, der Findability-Konferenz und Moderator bei /r/TechSEO.
    Vor kurzem musste Googles CEO Sundar Pichai über mögliche Voreingenommenheit in Bezug auf Googles Algorithmus vor dem Kongress als Zeuge aussagen. Es ist nicht das erste Mal, dass Google Voreingenommenheit vorgeworfen wurde und es wird vermutlich auch nicht das letzte Mal sein. Während Google versichert, dass keine Voreingenommenheit existiert, behaupten viele Konservative, dass Google voreingenommen gegenüber ihnen sei.

    Auf Grund unseres Expertenwissens im Hinblick auf Search Engine Optimization (SEO) und Ahrefs Vorhandensein von großen Datenmengen, wollten wir sehen, ob wir irgendeine Voreingenommenheit feststellen können, indem wir Daten von populären konservativen und liberalen Medienseiten untersuchen. Falls du nicht mit Ahrefs vertraut bist, wir sind eines der führenden SEO Tools mit signifikanten Datenmengen über das Web.

    Google nimmt jährlich hunderte von Änderungen an seinem Ranking-Algorithmus vor. Die meisten davon bleiben unbemerkt, weil sie marginal sind, aber ab und an wird ein großes Core-Update vorgenommen, welches einen Großteil der Suchergebnisse betrifft. Da Google uns das Datum, an dem diese Updates vorgenommen werden, mitteilt, dachten wir uns, dass wir Voreingenommenheit feststellen können, indem wir organischen Traffic zu bekannten liberalen und konservativen Medienseiten vor und nach diesen Updates untersuchen.

    Hier ist zum Beispiel der geschätzte organische Suchtraffic zu Fox News seit 2015. Jede gestrichelte Linie repräsentiert ein Google Core-Update:

    Allerdings können wir kaum Rückschlüsse ziehen, wenn wir diese Daten lediglich für eine Website betrachten, weshalb wir auch die Daten für die bekanntesten konservativen und liberalen Medienseiten herangezogen haben. Wir haben diese mit Hilfe von AllSides Media Bias Ratings (Einordnung zur Lage auf dem politischen Spektrum) zusammengetragen. Hier ist eine Liste der Websites: 

    Konservative Medienseiten:

    • New York Post
    • The Last Refuge
    • Drudge Report
    • The Federalist
    • Orange County Register
    • The Epoch Times
    • Washington Times
    • Christian Broadcasting Network
    • National Review
    • Townhall
    • The Mark Levin Show
    • The Rush Limbaugh Show
    • Breitbart
    • Newsmax
    • The National Interest
    • The Gateway Pundit
    • RedState
    • PJ Media
    • Washington Examiner
    • Fox News
    • Christian Today
    • Zero Hedge
    • The Daily Caller
    • TheBlaze
    • The Daily Wire

    Liberale Medienseiten:

    • Vox
    • U.S. News & World Report
    • The Washington Post
    • CNN
    • Bustle
    • NBC News
    • Hollywood Reporter
    • Los Angeles Times
    • Yahoo News
    • Al Jazeera
    • Rolling Stone
    • HuffPost
    • The Verge
    • The New York Times
    • ABC News
    • TIME
    • CBS Local
    • The Guardian
    • Bloomberg
    • NPR
    • CBS News
    • The Atlantic
    • Politico
    • Univision

    Bevor wir zu den Ergebnissen kommen, sollte ich etwas mehr Kontext zu Ahrefs Daten geben. Wir haben Hunderte Millionen Suchbegriffe und eine große Anzahl an Clickstream-Daten. Wir nutzen diese Daten zur Schätzung von organischem Traffic, indem wir uns all die unterschiedlichen Suchanfragen von Leuten ansehen, die Positionen, die Webseiten dafür in den Suchergebnissen einnehmen und wohin Nutzer klicken. Für die Core-Updates haben wir uns dazu entschieden, den Traffic zu Beginn des Google Core-Updates und den Traffic 14 Tage danach zu betrachten. Damit haben wir Zeit für Google zur Durchführung aller Änderungen in ihren unterschiedlichen Datenzentren berücksichtigt. Es gibt auch uns Zeit und erlaubt unseren Daten die Änderungen abzubilden.

    Unsere Daten sind normalisiert im Hinblick darauf, dass der Durchschnitt für Volumen über 12 Monate herangezogen wird, was Saisonalität größtenteils ausgleichen sollte. Wobei Wahlen eine Ausnahme darstellen, da sie nicht jedes Jahr stattfinden. Wir werden anfangs auch keine aktuellere Berichterstattung oder Suchthemen sehen, aber sollten alle populären Suchen und damit verbundenen Clickstream-Daten später mit einbeziehen können. 

    Wir sehen während des Zeitraums eines Google Core-Updates vom Jahr 2015 bis zur Gegenwart eine Abnahmen an durchschnittlichem Traffic zu den Top-Medienseiten in jeder Kategorie.

    Totale Traffic-Abnahme konservative Medien: ‑2.65%
    Totale Traffic-Abnahme liberale Medien: ‑1.78%

    Diese Zahlen liegen sehr nah beieinander und sind statistisch nicht signifikant, wenn man bedenkt, dass wir Traffic von 50 Websites über einen Zeitraum von 6 Jahren betrachten. Bis zur vorletzten Wahl 2016 waren die Auswirkungen für beide Kategorien mehr oder weniger gleich. Bis zur letzten Wahl in 2020 waren die Auswirkungen auch mehr oder weniger gleich, wenn man die Ergebnisse aus dem Vorjahr betrachtet, während konservative Medien vom letzten Update mehr profitierten.

    Wenn wir die einzelnen Datenpunkte genauer betrachten, sehen wir, dass sowohl konservative als auch liberale Medienseiten positive und negative Auswirkungen während allen Google Core-Updates zu verzeichnen hatten. Jeder Boxplot im Diagramm unten repräsentiert die Top Websites in jeder Kategorie und ich wiederhole nochmal, dass jedes einzelne Update Gewinner und Verlierer in beiden Kategorien hatte. Normalerweise hängt es in erster Linie von der Qualität der Seite ab, ob eine Seite in einem Core-Update gewinnt oder verliert.

     

    Während wir aufgrund dieser Daten nicht darauf schliessen können, dass Voreingenommenheit in Googles Suchergebnissen ausgeschlossen werden kann, können wir sagen, dass innerhalb der letzten 6 Jahre keine neue Voreingenommenheit während Google Core-Updates eingeführt wurde. 

    Gibt es Traffic-Voreingenommenheit?

    Eine Sache, die aus unserer Sicht auffällig war, ist die Tatsache, dass liberale Websites definitiv mehr Traffic erhalten, als konservative Seiten.

    Die Frage, die sich hier stellt, ist: Warum ist das so? Zeigt dies eine potenzielle Voreingenommenheit, die zurückzuführen ist auf eine Zeit vor unseren Keyword Daten? Lass uns sehen, ob wir diese Differenz im Hinblick auf Traffic-Zahlen erklären können. 

    Inhaltsumfang

    Wenn wir die Anzahl an indexierten Seiten betrachten, stellen wir fest, dass liberale Medienseiten mehr als achtmal so viele Seiten indexiert haben, als konservative Medienseiten. Tatsächliche ist die Grafik fast identisch mit der Grafik für den Anteil an organischem Traffic. Aus diesem Grund haben liberale Medienseiten generell mehr Chancen für verschiedene Dinge gerankt zu werden, als konservative Medienseiten. 

    Traffic für Markennennung vs. keine Markennennung

    Der Traffic mit Markennennung ist für CNN und Fox News mehr oder weniger gleich hoch, was bedeutet, dass eine ähnliche Anzahl an Leuten speziell nach diesen Medienseiten in der organischen Suche suchen. Allerdings macht der Traffic mit Markennennung für CNN einen kleineren Prozentsatz des Gesamttraffics aus, vermutlich weil sie einfach mehr Inhalte haben. CNN hat circa 2,5 Mal mehr Seiten indexiert als Fox News, somit haben sie eine höhere Chance für unterschiedliche Dinge zu ranken.

    Circa 40% des Traffics zu CNN ist Traffic mit Markennennung, was monatlich ungefähr 32,5 Mio. organischen Visits entspricht.

    Circa 67% des Traffics zu Fox News ist Traffic mit Markennennung, was monatlich ungefähr 33 Mio. organischen Visits entspricht.

    Andere Erklärungen für unterschiedliche Trafficvolumen

    Nur mit Hilfe von Google Suchdaten ist es schwierig mit Sicherheit zu bestimmen, warum liberale Seiten mehr Traffic erhalten, als konservative Seiten. Es könnte sein, dass Konservative Goolge weniger nutzen. Es ist auch möglich, dass Konservative Nachrichten eher über TV, Apps oder Soziale Medien beziehen, statt über Google. All dies kann zutreffend sein, aber ohne zusätzliche Daten können diese Aussagen nicht bestätigt werden und sind somit nur Vermutungen.

    Weitere Möglichkeiten die wir im Hinblick auf Voreingenommenheit hätten überprüfen können

    Wenn wir bestimmte Beispiele an Suchanfragen betrachtet hätten, bin ich mir sicher, dass wir etwas gefunden hätten, was nach Beispielen für Voreingenommenheit aussehen würde. Das Problem mit konkreten Beispielen ist, dass von Grund auf eine Voreingenommenheit der Person, die die Analyse durchführt, vorhanden ist. Die Daten sind komplex und du würdest eine gute Vorgehensweise benötigen, um zu bestimmen, ob die Seiten und Inhalte relevant für bestimmte Suchanfragen sind. Dies wäre leider schwierig und extrem subjektiv, weshalb wir uns gegen dieses Vorgehen entschieden haben.

    Wir hätten auch Link-Daten und Links von anderen Websites zu den jeweiligen Medienseiten mit einbeziehen können. Auch hier bin ich mir sicher, dass diese Daten auf Voreingenommenheit hingedeutet hätten, da bekanntere und höher rankende Websites mit mehr Seiten auch dazu neigen auf natürlichem Wege mehr Links zu generieren. Wir haben dies bereits in unserer Backlink Wachstums-Studie nachgewiesen.

    Wir hätten spezifische Beispiele für Suchbegriffe betrachten können, die von Google über ihr Autocomplete-System angezeigt werden, aber wir wissen bereits, dass viele negative Anfragen aus diesen Ergebnissen entfernt werden. Auch hier liegt von Grund auf eine Voreingenommenheit vor und es wäre schwierig, eine mutwillige Voreingenommenheit nachzuweisen.

    Abschließende Gedanken

    Eine grundsätzliche Voreingenommenheit existiert immer. Während unsere Daten aufzeigen, dass Googles Core-Updates in den letzten Jahren im Hinblick auf keine bestimmte Seite voreingenommen war, können wir eine Voreingenommenheit in anderen Bereichen von Googles Systemen nicht mit Sicherheit ausschliessen.

    Hast du Fragen im Hinblick auf diese Daten? Stelle sie mir auf Twitter.

    Übersetzt von Heike Radlanski. Heike beschäftigt sich mit allen Aspekten des Online Marketing und Product Managements.