Suchmaschinenoptimierung

Duplicate Content

Duplicate Content bezeichnet identische oder sehr ähnliche Inhalte, die unter mehreren URLs erreichbar sind – innerhalb einer oder zwischen verschiedenen Websites – und die Google vor Auswahl- und Bewertungsprobleme stellt.

Was ist Duplicate Content?

Duplicate Content (deutsch: doppelter Inhalt) entsteht, wenn derselbe oder sehr ähnlicher Text unter mehr als einer URL abrufbar ist. Google muss dann entscheiden, welche Version das Original ist, welche Version indexiert werden soll und wie Linkstärke auf die Varianten aufgeteilt wird. In den meisten Fällen ist Duplicate Content kein böswilliges Problem, sondern ein technisches – es entsteht durch CMS-Einstellungen, URL-Parameter oder Syndizierung.

Einordnung

Duplicate Content ist eines der häufigsten technischen SEO-Probleme. Google betont regelmäßig, dass es bei eigenem (nicht gestohlenen) Duplicate Content keine manuelle Bestrafung ausspricht. Dennoch schadet es der SEO-Performance, weil sich Rankingsignale auf mehrere URLs aufteilen und Google die „falsche" Variante bevorzugen kann.

Ursachen für Duplicate Content

URL-Varianten: HTTP und HTTPS, www und non-www, mit und ohne abschließenden Schrägstrich – dieselbe Seite unter vier URLs ist klassischer technischer Duplicate Content.
URL-Parameter: Tracking-Parameter (utm_source=newsletter), Session-IDs oder Sortierungsparameter erzeugen inhaltlich identische URLs.
Druckerfreundliche Versionen: Ältere CMS erzeugen oft /print/-Versionen von Artikeln.
Pagination: Mehrseitige Artikel oder Kategorieseiten mit /page/2/-Struktur können als Duplicate Content gewertet werden.
Syndizierung: Inhalte, die auf mehreren Websites veröffentlicht werden (z. B. Pressemitteilungen), erzeugen domainübergreifenden Duplicate Content.
Dünner Content mit Variationen: Standortseiten, die nur im Ortsnamen variieren, fallen ebenfalls unter Duplicate Content.

Lösungsansätze

Je nach Ursache kommen verschiedene Werkzeuge zum Einsatz:

Canonical Tag: Verweist Google auf die bevorzugte URL-Version.
301-Weiterleitungen: Führen alle URL-Varianten auf eine kanonische URL zusammen.
Noindex: Verhindert die Indexierung von Duplikaten, die crawlbar bleiben sollen.
URL-Parameter in Search Console: Teilt Google mit, wie Parameter-URLs behandelt werden sollen.

Praxisbeispiel

Ein Online-Magazin veröffentlicht seine Artikel sowohl unter /artikel/titel als auch unter /autor/name/titel. In der Search Console zeigt der Bericht „Seiten" 800 URLs als „Duplikat – Google hat eine andere kanonische URL ausgewählt". Google hat eigenständig eine Version bevorzugt – aber nicht immer die gewünschte. Nach Implementierung eines Canonical Tags auf allen Artikel-Seiten konsolidiert Google innerhalb von acht Wochen die Rankings auf die bevorzugte URL.

Häufig gestellte Fragen zu Duplicate Content

Bestraft Google Duplicate Content?

Bei unbeabsichtigtem eigenem Duplicate Content gibt es keine manuelle Strafe. Google wählt aber eine Version aus und ignoriert die anderen – was die SEO-Performance der duplizierten Seiten schwächt.

Ist Duplicate Content auf verschiedenen Domains ein Problem?

Ja. Wenn Inhalte auf mehreren Domains erscheinen (z. B. durch Syndizierung), riskiert das Original, dass Google eine andere Domain als Quelle bevorzugt. Ein Canonical Tag mit Verweis auf die Originaldomain hilft.

Wie finde ich Duplicate Content auf meiner Website?

Crawling-Tools wie Screaming Frog, Sitebulb oder der kostenpflichtige Siteliner zeigen doppelte Seiten und stark ähnliche Inhalte an. Die Google Search Console meldet außerdem URLs, bei denen Google eine abweichende kanonische URL gewählt hat.