Duplicate Content
Duplicate Content bezeichnet identische oder sehr ähnliche Inhalte, die unter mehreren URLs erreichbar sind – innerhalb einer oder zwischen verschiedenen Websites – und die Google vor Auswahl- und Bewertungsprobleme stellt.
Was ist Duplicate Content?
Duplicate Content (deutsch: doppelter Inhalt) entsteht, wenn derselbe oder sehr ähnlicher Text unter mehr als einer URL abrufbar ist. Google muss dann entscheiden, welche Version das Original ist, welche Version indexiert werden soll und wie Linkstärke auf die Varianten aufgeteilt wird. In den meisten Fällen ist Duplicate Content kein böswilliges Problem, sondern ein technisches – es entsteht durch CMS-Einstellungen, URL-Parameter oder Syndizierung.
Einordnung
Duplicate Content ist eines der häufigsten technischen SEO-Probleme. Google betont regelmäßig, dass es bei eigenem (nicht gestohlenen) Duplicate Content keine manuelle Bestrafung ausspricht. Dennoch schadet es der SEO-Performance, weil sich Rankingsignale auf mehrere URLs aufteilen und Google die „falsche" Variante bevorzugen kann.
Ursachen für Duplicate Content
- URL-Varianten: HTTP und HTTPS, www und non-www, mit und ohne abschließenden Schrägstrich – dieselbe Seite unter vier URLs ist klassischer technischer Duplicate Content.
- URL-Parameter: Tracking-Parameter (utm_source=newsletter), Session-IDs oder Sortierungsparameter erzeugen inhaltlich identische URLs.
- Druckerfreundliche Versionen: Ältere CMS erzeugen oft /print/-Versionen von Artikeln.
- Pagination: Mehrseitige Artikel oder Kategorieseiten mit /page/2/-Struktur können als Duplicate Content gewertet werden.
- Syndizierung: Inhalte, die auf mehreren Websites veröffentlicht werden (z. B. Pressemitteilungen), erzeugen domainübergreifenden Duplicate Content.
- Dünner Content mit Variationen: Standortseiten, die nur im Ortsnamen variieren, fallen ebenfalls unter Duplicate Content.
Lösungsansätze
Je nach Ursache kommen verschiedene Werkzeuge zum Einsatz:
- Canonical Tag: Verweist Google auf die bevorzugte URL-Version.
- 301-Weiterleitungen: Führen alle URL-Varianten auf eine kanonische URL zusammen.
- Noindex: Verhindert die Indexierung von Duplikaten, die crawlbar bleiben sollen.
- URL-Parameter in Search Console: Teilt Google mit, wie Parameter-URLs behandelt werden sollen.
Praxisbeispiel
Ein Online-Magazin veröffentlicht seine Artikel sowohl unter /artikel/titel als auch unter /autor/name/titel. In der Search Console zeigt der Bericht „Seiten" 800 URLs als „Duplikat – Google hat eine andere kanonische URL ausgewählt". Google hat eigenständig eine Version bevorzugt – aber nicht immer die gewünschte. Nach Implementierung eines Canonical Tags auf allen Artikel-Seiten konsolidiert Google innerhalb von acht Wochen die Rankings auf die bevorzugte URL.
Verwandte Begriffe
Duplicate Content wird primär durch Canonical Tags adressiert. robots.txt und Noindex-Tags sind ergänzende Maßnahmen. Auch Indexierung, Crawling und Orphan Pages hängen mit Duplicate Content zusammen.
Das klingt komplex? Klickweise übernimmt alle Aufgaben rund um Duplicate Content für Unternehmen am Niederrhein und im Westmünsterland. → Mehr erfahren