Indexierung
Indexierung bezeichnet den Vorgang, bei dem Google eine Webseite nach dem Crawling analysiert und in seinen Suchindex aufnimmt – erst dann kann die Seite in Suchergebnissen erscheinen.
Was ist Indexierung?
Indexierung ist der zweite Schritt im Prozess, durch den eine Webseite in Google-Suchergebnissen sichtbar wird. Nachdem Googles Crawler eine Seite besucht hat (Crawling), analysiert Google den Inhalt, bewertet ihn und entscheidet, ob und wie die Seite in den Suchindex aufgenommen wird.
Einordnung
Der Google-Suchindex ist eine riesige Datenbank – vergleichbar mit einem Bibliothekskatalog. Nur Seiten, die sich in diesem Index befinden, können bei einer Suchanfrage als Ergebnis erscheinen. Indexierung ist damit eine Grundvoraussetzung für jegliche organische Sichtbarkeit. Sie ist kein automatischer Vorgang: Google entscheidet eigenständig, welche Seiten es für wert hält zu indexieren.
Wie funktioniert Indexierung?
Nach dem Crawling durchläuft eine Seite mehrere Verarbeitungsschritte:
- Rendering: Google führt JavaScript aus und erstellt ein vollständiges Abbild der Seite.
- Analyse: Inhalte, Links, Metadaten und strukturierte Daten werden ausgewertet.
- Bewertung: Google prüft, ob der Inhalt einzigartig, wertvoll und crawlbar ist.
- Aufnahme: Bei positiver Bewertung wird die Seite im Index gespeichert und bei passenden Suchanfragen ausgespielt.
Eine Seite kann aus verschiedenen Gründen nicht indexiert werden: ein „noindex"-Tag im HTML, eine Sperrung in der robots.txt, Duplicate Content, dünner Inhalt oder technische Fehler.
Indexierungsstatus prüfen
In der Google Search Console zeigt der Bericht „Seiten" an, welche URLs indexiert sind und welche aus welchem Grund nicht aufgenommen wurden. Der URL-Prüftool ermöglicht außerdem eine Echtzeit-Prüfung einzelner URLs. Typische Ausschlussgründe sind: „Seite mit noindex-Tag", „Gecrawlt – aktuell nicht indexiert" oder „Doppelter Inhalt".
Praxisbeispiel
Ein lokales Dienstleistungsunternehmen erstellt zehn neue Leistungsseiten. Nach zwei Wochen erscheinen in der Search Console sieben Seiten als indexiert, drei als „Gecrawlt – aktuell nicht indexiert". Bei näherer Prüfung zeigt sich: Die drei Seiten haben nahezu identische Texte, die nur im Ortsnamen variieren. Google wertet dies als Duplicate Content und verweigert die Indexierung. Erst nach inhaltlicher Differenzierung nimmt Google alle Seiten auf.
Verwandte Begriffe
Indexierung ist eng verknüpft mit Crawling, Sitemap, robots.txt und Canonical Tag. Auch Duplicate Content und Orphan Pages können die Indexierung negativ beeinflussen.
Das klingt komplex? Klickweise übernimmt alle Aufgaben rund um Indexierung für Unternehmen am Niederrhein und im Westmünsterland. → Mehr erfahren