Wie funktionieren Suchmaschinen? Ein Leitfaden für Anfänger

Avatar
Head of Content @ Ahrefs (oder, in einfachen Worten, ich bin der Typ, der dafür sorgt, dass jeder Blog-Post EPISCH wird).
Suchmaschinen nutzen Bots, sogenannte Spider, um das Internet zu durchsuchen. Diese Webcrawler folgen effektiv Links von Seite zu Seite, um neue Inhalte zu finden, die in den Suchindex aufgenommen werden.Wenn du eine Suchmaschine benutzt, werden relevante Ergebnisse aus dem Index extrahiert und mithilfe eines Algorithmus gerankt.

Wenn das kompliziert klingt, liegt es daran, dass es das auch ist. Doch wenn du in den Suchmaschinen höher ranken willst, um mehr Traffic auf deine Website zu bekommen, brauchst du ein grundlegendes Verständnis dafür, wie Suchmaschinen Inhalte finden, indexieren und ranken.

Genau das wirst du in diesem Leitfaden lernen.

Chapters


    Bevor wir uns mit dem technischen Kram beschäftigen, wollen wir erst einmal sicherstellen, dass wir verstehen, was Suchmaschinen eigentlich sind, warum sie existieren und warum das alles überhaupt wichtig ist.

    Was sind Suchmaschinen?

    Suchmaschinen sind Tools, die Webinhalte finden und ranken, die der Suchanfrage eines Nutzers entsprechen.

    Jede Suchmaschine besteht aus zwei Hauptbestandteilen:

    1. Dem Suchindex. Eine digitale Bibliothek mit Informationen über Webseiten.
    2. Suchalgorithmen. Computerprogramm(e), die passende Ergebnisse aus dem Suchindex indexieren.

    Beispiele für beliebte Suchmaschinen sind Google, Bing und DuckDuckGo.

    Was ist das Ziel einer Suchmaschine?

    Jede Suchmaschine hat das Ziel, die besten und relevantesten Ergebnisse für die Nutzer zu liefern. So erlangen oder halten sie Marktanteile — zumindest in der Theorie.

    Wie verdienen Suchmaschinen Geld?

    Suchmaschinen liefern zwei Arten von Suchergebnissen:

    • Organische Ergebnisse aus dem Suchindex. Hier kann man nicht dafür bezahlen, aufgeführt zu werden.
    • Bezahlte Ergebnisse von Werbetreibenden. Hier kann man dafür bezahlen, aufgeführt zu werden.

    Jedes Mal, wenn jemand auf ein bezahltes Suchergebnis klickt, bezahlt der Werbetreibende die Suchmaschine. Dies wird als Pay-per-Click (PPC) Werbung bezeichnet.

    Aus diesem Grund ist der Marktanteil wichtig. Mehr Nutzer bedeuten mehr Anzeigenklicks und mehr Umsatz.

    Warum sollte es dich interessieren, wie Suchmaschinen funktionieren?

    Wenn du verstehst, wie Suchmaschinen Inhalte finden, indexieren und ranken, hilft dir das dabei, deine Website in den organischen Suchergebnissen für relevante und beliebte Keywords zu platzieren.

    Wenn du für diese Suchanfragen weit oben ranken kannst, dann erhältst du mehr Klicks und organischen Traffic auf deine Inhalte.

    Welche ist die beliebteste Suchmaschine?

    Google. Sie hat einen Marktanteil von 92%.

    Google ist die Suchmaschine, um die sich die meisten SEO-Profis und Website-Betreiber bemühen, weil sie das Potenzial hat, mehr Traffic zu generieren als jede andere Suchmaschine.


    Die meisten bekannten Suchmaschinen wie Google und Bing haben Billionen von Seiten in ihren Suchindexen. Bevor wir also über die Ranking-Algorithmen sprechen, lass uns tiefer in die Mechanismen eindringen, die verwendet werden, um einen Web-Index aufzubauen und zu pflegen.

    Hier ist der grundlegende Prozess, mit freundlicher Genehmigung von Google:

    Lass uns das Schritt für Schritt aufschlüsseln:

    1. URLs
    2. Crawlen
    3. Verarbeiten & Rendern
    4. Indexierung
    Nebenbei bemerkt.
    Der folgende Prozess bezieht sich speziell auf Google, aber er ist wahrscheinlich auch bei anderen Web-Suchmaschinen wie Bing sehr ähnlich. Es gibt auch andere Arten von Suchmaschinen wie Amazon, YouTube und Wikipedia, die nur die Ergebnisse von ihrer Website anzeigen. 

    Schritt 1. URLs

    Alles beginnt mit einer bekannten Liste von URLs. Google findet diese durch verschiedene Prozesse heraus. Die drei häufigsten sind:

    Über Backlinks

    Google hat bereits einen Index, der Billionen von Webseiten enthält. Wenn jemand einen Link von einer dieser Webseiten zu einer deiner Seiten hinzufügt, kann Google sie von dort aus finden.

    Du kannst die Backlinks deiner Website kostenlos mit dem Site Explorer aus den Ahrefs Webmaster Tools einsehen.

    1. Melde dich für einen kostenlosen Account in den Ahrefs Webmaster Tools an
    2. Gib deine Domain in den Site Explorer ein
    3. Gehe zum Backlinks-Bericht

    Unser Crawler ist der zweitaktivste nach Google, also müsstest du hier einen ziemlich vollständigen Überblick über deine Backlinks erhalten. 

    Über Sitemaps

    Sitemaps listen alle wichtigen Seiten deiner Website auf. Wenn du deine Sitemap bei Google einreichst, kann es ihnen helfen, deine Website schneller zu finden.

    Über URL-Einreichungen

    Google erlaubt auch die Einreichung von einzelnen URLs über die Google Search Console.

    Schritt 2. Crawling

    Beim Crawling besucht ein Computerbot, der Spider genannt wird (z.B. der Googlebot), die entdeckten Seiten und lädt sie herunter.

    Es ist wichtig zu wissen, dass Google die Seiten nicht immer in der Reihenfolge crawlt, in der sie entdeckt werden.

    Google stellt URLs für das Crawling in eine Warteschlange, die auf einigen Faktoren basiert, darunter:

    • dem PageRank der URL
    • wie oft sich die URL ändert
    • ob sie neu ist oder nicht

    Das ist wichtig, weil es bedeutet, dass Suchmaschinen einige deiner Seiten vor anderen crawlen und indexieren können. Wenn du eine große Website hast, kann es eine Weile dauern, bis die Suchmaschinen sie vollständig gecrawlt haben.

    Schritt 3. Verarbeiten

    Bei der Verarbeitung arbeitet Google daran, wichtige Informationen aus den gecrawlten Seiten zu verstehen und zu extrahieren. Niemand außerhalb von Google kennt jedes Detail dieses Prozesses, aber die wichtigen Teile für unser Verständnis sind das Extrahieren von Links und das Speichern von Inhalten für die Indexierung.

    Google muss Seiten rendern, um sie vollständig zu verarbeiten. Das ist der Punkt, an dem Google den Code der Seite ausführt, um zu verstehen, wie sie für Nutzer aussieht.

    Das bedeutet, dass einige Prozesse vor und nach dem Rendern stattfinden — wie du im Diagramm sehen kannst.

    Schritt 4. Indexierung

    Bei der Indexierung werden die verarbeiteten Informationen der gecrawlten Seiten in eine große Datenbank, den Suchindex, eingefügt. Dies ist im Wesentlichen eine digitale Bibliothek mit Billionen von Webseiten, aus der die Suchergebnisse von Google stammen.

    Das ist ein wichtiger Punkt. Wenn du eine Suchanfrage in eine Suchmaschine eingibst, durchsuchst du nicht direkt das Internet nach passenden Ergebnissen. Du durchsuchst den Index einer Suchmaschine mit Webseiten. Wenn eine Webseite nicht im Suchindex ist, wird sie von den Suchmaschinen-Nutzern nicht gefunden. Deshalb ist es so wichtig, dass deine Website in den großen Suchmaschinen wie Google und Bing indexiert wird.


    Das Entdecken, Crawlen und Indexieren von Inhalten ist nur der erste Teil des Puzzles. Suchmaschinen müssen auch einen Weg finden, um passende Ergebnisse zu ranken, wenn ein Nutzer eine Suche durchführt. Das ist die Aufgabe der Algorithmen der Suchmaschinen.

    Jede Suchmaschine hat einzigartige Algorithmen für das Ranking von Webseiten. Da Google aber die am weitesten verbreitete Suchmaschine ist (zumindest in der westlichen Welt), werden wir uns im weiteren Verlauf dieses Leitfadens auf diese konzentrieren.

    Google hat bekanntlich 200+ Rankingfaktoren.

    Niemand weiß, was alle diese Rankingfaktoren sind, aber wir kennen die wichtigsten.

    Lass uns ein paar von ihnen besprechen.

    • Backlinks
    • Relevanz
    • Aktualität
    • Thematische Autorität
    • Seitengeschwindigkeit
    • Mobilfreundlichkeit

    Backlinks

    Backlinks sind einer der wichtigsten Rankingfaktoren von Google.

    Andrey Lipattsev, Search Quality Senior Strategist bei Google, bestätigte dies während eines Live-Webinars im Jahr 2016. Auf die Frage nach den zwei wichtigsten Rankingfaktoren war seine Antwort einfach: Content und Links.

    Absolut. Ich kann dir sagen, was sie [die beiden wichtigsten Rankingfaktoren] sind. Es ist Content. Und es sind Links, die auf deine Seite verweisen.

    Links sind seit 1997 ein wichtiger Rankingfaktor bei Google, als sie den PageRank einführten — eine Formel, um den Wert einer Webseite basierend auf der Quantität und Qualität der Backlinks, die auf sie verweisen, zu beurteilen.

    Als wir über eine Milliarde Seiten analysierten, stellten wir eine klare Korrelation zwischen der Anzahl der Websites, die auf eine Seite verlinken, und der Menge des organischen Traffics, den sie von Google erhalten, fest. 

    Es geht jedoch nicht nur um die Quantität, denn nicht alle Backlinks sind gleich. Es ist durchaus möglich, dass eine Seite mit ein paar hochwertigen Backlinks eine Seite mit vielen minderwertigen Backlinks übertrumpft.

    Es gibt sechs wesentliche Attribute für einen guten Backlink.

    Schauen wir uns die zwei wohl wichtigsten davon genauer an: Autorität und Relevanz.

    Link-Autorität

    Backlinks von autoritären Seiten und Websites haben in der Regel den größten Einfluss auf die Rankings.

    Wie definierst du Autorität? Im Kontext von SEO sind autoritäre Seiten und Websites diejenigen, die viele Backlinks oder “Stimmen” haben.

    In Ahrefs haben wir zwei Metriken, um die relative Autorität von Websites und Seiten zu schätzen:

    • Domain Rating (DR): Die relative Autorität einer Website auf einer Skala von 0–100.
    • URL Rating (UR): Die relative Autorität einer Seite auf einer Skala von 0–100.

    Du kannst die Autorität jeder Website oder Webseite im Ahrefs Site Explorer überprüfen. 

    Link-Relevanz

    Links von relevanten Websites und Webseiten sind in der Regel die wertvollsten.

    Auf ihrer Seite über die Funktionsweise der Suche spricht Google von Relevanz im Zusammenhang mit dem Ranking von nützlichen Seiten. 

    Wenn andere prominente Websites zum Thema auf die Seite verlinken, ist das ein gutes Zeichen dafür, dass die Informationen von hoher Qualität sind.

    Wenn du dich fragst, warum Relevanz wichtig ist, denke darüber nach, wie die Dinge in der realen Welt funktionieren. Wenn du das beste italienische Restaurant suchst, würdest du wahrscheinlich dem Rat deines Freundes, der Koch ist, mehr vertrauen als dem deines Freundes, der Tierarzt ist. Doch wenn du nach Empfehlungen für Katzenfutter suchst, wäre es genau andersherum.

    Relevanz

    Google hat viele Möglichkeiten, die Relevanz einer Seite zu bestimmen.

    Auf der grundlegendsten Ebene sucht es nach Seiten, die die gleichen Keywords wie die Suchanfrage enthalten.

    Doch Relevanz geht weit über das Keyword-Matching hinaus.

    Google nutzt auch Interaktionsdaten, um zu beurteilen, ob die Suchergebnisse für die Suchanfragen relevant sind. Mit anderen Worten: Finden die Suchenden die Seite nützlich?

    Das ist zum Teil der Grund, warum alle Top-Ergebnisse für “Apple” sich um das Technologieunternehmen drehen, nicht um die Frucht. Google weiß aus den Interaktionsdaten, dass die meisten Suchenden nach Informationen über Ersteres suchen, nicht über Letzteres.

    Interaktionsdaten sind jedoch bei weitem nicht die einzige Möglichkeit, wie Google das macht.

    Google hat in viele Technologien investiert, die dabei helfen, die Beziehungen zwischen Entitäten wie Menschen, Orten und Dingen zu verstehen. Der Knowledge Graph ist eine dieser Technologien, die im Wesentlichen eine riesige Wissensdatenbank von Entitäten und den Beziehungen zwischen ihnen ist.

    Sowohl Apple (Frucht) als auch Apple (Technologieunternehmen) sind Entitäten im Knowledge Graph.

    Google nutzt die Beziehungen zwischen den Entitäten, um die Relevanz einer Seite besser zu verstehen. Ein übereinstimmendes Ergebnis für “Apple”, welches sich mit Orangen und Bananen befasst, handelt eindeutig von der Frucht. Ein Ergebnis, das über iPhone, iPad und iOS handelt, bezieht sich jedoch eindeutig auf das Technologieunternehmen.

    Es ist zum Teil dem Knowledge Graph zu verdanken, dass Google über das Keyword-Matching hinausgehen kann.

    Manchmal gibt es sogar Suchergebnisse, die scheinbar wichtige Keywords aus der Suchanfrage nicht erwähnen. Zum Beispiel das zweite Ergebnis für “apple paper app”, das nirgendwo auf der Seite das Wort “apple” erwähnt.

    Google kann erkennen, dass es sich um ein relevantes Ergebnis handelt, unter anderem weil es Entitäten wie iPhone und iPad erwähnt, die zweifelsohne eng mit Apple im Knowledge Graph verbunden sind.

    Nebenbei bemerkt.
    Interaktionsdaten und der Knowledge Graph sind nicht die einzigen Technologien, die Google verwendet, um die Relevanz einer Seite für eine Suchanfrage zu verstehen. Ein Großteil der Arbeit wird mit Technologien erledigt, die die Bedeutung und Absicht hinter der Suchanfrage selbst verstehen, wie BERT und RankBrain. Google schreibt sogar manchmal Suchanfragen hinter den Kulissen um, um relevantere Ergebnisse zu liefern. 

    Aktualität

    Die Aktualität ist ein von der Suchanfrage abhängiger Rankingfaktor, was bedeutet, dass sie für einige Ergebnisse wichtiger ist als für andere.

    Für eine Suchanfrage wie “Was gibt es Neues auf Amazon Prime?” ist die Aktualität wichtig, da die Suchenden über kürzlich hinzugefügte Filme und Fernsehsendungen informiert werden wollen. Das ist wahrscheinlich der Grund, warum Google neu veröffentlichte oder aktualisierte Suchergebnisse höher rankt.

    Bei Suchanfragen wie “beste Kopfhörer” spielt die Aktualität eine Rolle, aber nicht ganz so sehr. Die Kopfhörertechnologie entwickelt sich schnell, so dass ein Ergebnis aus dem Jahr 2015 nicht mehr viel nützt, aber ein Beitrag, der vor 2–3 Monaten veröffentlicht wurde, ist immer noch nützlich.

    Google weiß das und zeigt Ergebnisse an, die in den letzten paar Monaten aktualisiert oder veröffentlicht wurden. 

    Es gibt auch Suchanfragen, bei denen die Aktualität der Ergebnisse größtenteils irrelevant ist, wie z.B. “wie man eine Krawatte bindet.” An diesem Prozess hat sich seit Jahrzehnten nichts geändert, so dass es keine Rolle spielt, ob die Suchergebnisse von gestern oder 1998 sind. Google weiß das und hat keine Skrupel, Beiträge zu ranken, die vor Jahren veröffentlicht wurden.

    Thematische Autorität

    Google möchte Inhalte von Websites ranken, die über Autorität zu einem bestimmten Thema verfügen. Das bedeutet, dass Google eine bestimmte Website als gute Ergebnisquelle für Suchanfragen zu einem gewissen Thema ansieht, eine andere jedoch nicht.

    Google spricht darüber in einem seiner Patente:

    Ob das Suchsystem eine Seite als autoritär einstuft, ist typischerweise abhängig von der Suchanfrage. […] das Suchsystem kann die Seite des Centers for Disease Control, “cdc.gov”, als autoritäre Seite für die Suchanfrage “CDC mosquito stop bites” ansehen, aber möglicherweise nicht für die Suchanfrage “restaurant recommendations”.

    Obwohl dies nur eines von vielen Patenten ist, die von Google eingereicht wurden, sehen wir Beweise dafür, dass “thematische Autorität” in den Suchergebnissen für viele Suchanfragen eine Rolle spielt.

    Schau dir nur die Ergebnisse für “sous vide vacuum sealer” an.

    Hier sehen wir zwei kleine Nischenseiten über Sous Vide Kochen, die der New York Times im Ranking überlegen sind.

    Obwohl hier zweifelsohne auch andere Faktoren eine Rolle spielen, scheint es wahrscheinlich, dass die “thematische Autorität” einer der Gründe ist, warum diese Seiten dort ranken, wo sie es tun.

    Das ist wahrscheinlich auch der Grund, warum Google’s SEO Starter Guide Webseitenbesitzern rät:

    Einen Ruf für Expertise und Vertrauenswürdigkeit in einem bestimmten Bereich kultivieren.

    Seitengeschwindigkeit

    Niemand wartet gerne auf das Laden von Seiten, und Google weiß das. Deshalb wurde die Seitengeschwindigkeit 2010 zu einem Rankingfaktor für die Desktop-Suche und 2018 für die mobile Suche.

    Viele Leute stören sich an der Seitengeschwindigkeit, dennoch ist es wichtig zu wissen, dass deine Seiten nicht blitzschnell laden müssen, um zu ranken. Google sagt, dass die Seitengeschwindigkeit nur ein Problem für Seiten ist, die “die langsamste Erfahrung für Nutzer liefern”.

    Mit anderen Worten: Es ist unwahrscheinlich, dass die Verbesserung der Geschwindigkeit einer ohnehin schon schnellen Seite das Ranking erhöht, wenn man ein paar Millisekunden einspart. Sie muss nur schnell genug sein, um die Benutzer nicht negativ zu beeinflussen.

    Du kannst die Geschwindigkeit jeder Webseite in PageSpeed Insights überprüfen, das auch Vorschläge generiert, um die Seite schneller zu machen.

    PageSpeed Insights zeigt auch, wie deine Seite bei den Core Web Vitals abschneidet.

    Die Core Web Vitals setzen sich aus drei Metriken zusammen, die die Ladeleistung, Interaktivität und visuelle Stabilität deiner Webseiten bewerten. Google hat bestätigt, dass die Core Web Vitals ab Juni 2021 ein Ranking-Signal sein werden.

    Du kannst die Leistung aller Seiten auf deiner Website mit dem Core-Web-Vitals-Bericht in der Google Search Console sehen.

    Wenn viele URLs schlecht abschneiden oder verbessert werden müssen, solltest du mit einem Entwickler sprechen.

    Mobilfreundlichkeit

    65% der Google-Suchen finden auf mobilen Geräten statt. Aus diesem Grund ist die Mobilfreundlichkeit seit 2015 ein Faktor für die mobile Suche.

    Seit 2019 ist die Mobilfreundlichkeit auch ein Rankingfaktor für die Desktop-Suche, dank Googles Umstellung auf die mobile-first Indexierung. Das bedeutet, dass Google “überwiegend die mobile Version des Inhalts für die Indexierung und das Ranking” über alle Geräte hinweg nutzt.

    Mit anderen Worten, ein Mangel an Mobilfreundlichkeit kann sich auf die Rankings auswirken — überall.

    Du kannst die Mobilfreundlichkeit jeder Webseite mit Googles Mobile-Friendly Test Tool oder im Mobile-Usability-Bericht in der Google Search Console überprüfen.


    Suchmaschinen verstehen, dass unterschiedliche Ergebnisse unterschiedliche Menschen ansprechen. Deshalb passen sie ihre Ergebnisse für jeden Nutzer an.

    Wenn du schon einmal auf mehreren Geräten oder Browsern nach derselben Sache gesucht hast, hast du wahrscheinlich die Auswirkungen dieser Personalisierung gesehen. Die Ergebnisse werden oft an unterschiedlichen Positionen angezeigt, abhängig von verschiedenen Faktoren.

    Wegen dieser Personalisierung solltest du, wenn du SEO betreibst, besser ein spezielles Tool wie den Rank Tracker von Ahrefs verwenden, um die Rankingpositionen zu verfolgen. Die berichteten Positionen in diesen Tools sind wahrscheinlich näher an der Wahrheit, da sie das Web auf eine Art und Weise durchsuchen, die den Suchmaschinen nicht viele nützliche Informationen für die Personalisierung gibt.

    Wie personalisieren Suchmaschinen die Ergebnisse?

    Google erklärt, dass “Informationen wie dein Standort, dein früherer Suchverlauf und deine Sucheinstellungen [uns] dabei helfen, deine Ergebnisse auf das zuzuschneiden, was für dich in diesem Moment am nützlichsten und relevantesten ist.”

    Schauen wir uns diese drei Dinge einmal genauer an.

    1. Standort

    Wenn du nach etwas wie “italienisches Restaurant” suchst, sind alle Ergebnisse im Kartenpaket lokale Restaurants.

    Google macht das, weil es unwahrscheinlich ist, dass du zum Mittagessen um die halbe Welt fliegst.

    Google nutzt deinen Standort aber auch, um Suchergebnisse außerhalb des Kartenpakets zu personalisieren. Wenn wir bei unserer Suche nach “italienisches Restaurant” nach unten scrollen, sind sogar die Ergebnisse von TripAdvisor personalisiert und wir sehen, dass viele der Top-Ranking-Ergebnisse Webseiten von lokalen Restaurants sind.

    Ähnlich verhält es sich bei einer Suchanfrage wie “Haus kaufen”. Google zeigt dir Seiten mit lokalen statt internationalen Angeboten an, weil du wahrscheinlich nicht in ein anderes Land umziehen willst.

    Dein Standort beeinflusst die Ergebnisse für lokale Suchanfragen so stark, dass es praktisch keine Überschneidungen gibt, wenn du von zwei verschiedenen Standorten aus nach derselben Sache suchst.

    2. Sprache

    Google weiß, dass es keinen Sinn macht, spanischen Nutzern englische Ergebnisse zu zeigen. Deshalb rankt Google die englische Version unseres YouTube SEO-Tutorials für englische Suchen und die spanische Version für spanische Suchen. 

    Allerdings ist Google in dieser Hinsicht auf die Websitebetreiber angewiesen. Wenn du Seiten in mehreren Sprachen hast, kann es sein, dass Google das nicht erkennt, es sei denn, du sagst es ihnen.

    Du kannst dies mit einem HTML-Attribut namens hreflang tun.

    Hreflang ist ein bisschen kompliziert und würde den Rahmen dieses Leitfadens sprengen, aber im Grunde ist es ein kurzer Code, der die Beziehung zwischen mehreren Versionen der gleichen Seite in verschiedenen Sprachen angibt.

    3. Suchverlauf

    Das vielleicht offensichtlichste Beispiel dafür, dass Google den Suchverlauf nutzt, um Ergebnisse zu personalisieren, ist, wenn es ein zuvor angeklicktes Ergebnis beim nächsten Mal, wenn du die gleiche Suche ausführst, höher “rankt”.

    Das passiert nicht immer, aber es scheint ziemlich häufig zu sein — vor allem, wenn du die Seite innerhalb eines kurzen Zeitraums mehrfach anklickst oder besuchst.

    Fassen wir zusammen

    Zu verstehen, wie Suchmaschinen funktionieren, ist der erste Schritt, um bei Google besser zu ranken und mehr Traffic zu generieren. Wenn Suchmaschinen deine Seiten nicht finden, crawlen und indexieren können, hast du bereits verloren, bevor du überhaupt angefangen hast.

    Wenn du wissen willst, wie das geht, und wie du deine Website für SEO optimieren kannst, lies unseren Leitfaden zu den SEO-Grundlagen.

    Hast du noch Fragen? Hinterlass ein Kommentar oder schreib mir auf Twitter.