Duplicate content in WordPress

Een van de vervelendste dingen waar je mee te maken hebt na het bouwen van een website is duplicate content. Als je een Content Management System zoals wordpress gebruikt en zelf niets aanpast aan het thema dan ga je gegarandeerd last hebben van duplicate content

Wat is duplicate content?

De naam zegt het zelf eigenlijk al, dubbele content. Dit wil zeggen dat je op je website pagina’s hebt die dezelfde inhoud hebben. Het probleem is dat de zoekmachines maar 1 pagina weergeven in de zoekresultaten. Als je pech hebt dan toont de zoekmachine een pagina die eigenlijk voor jou niet van belang is, en wordt bijvoorbeeld het artikel over “houtbewerking” dat perfect geoptimaliseerd is om er geld mee te verdienen niet weergegeven. In plaats daarvan wordt een /page/nummer pagina of een feed weergegeven.

Duplicate content voorbeelden wordpress

  • Artikels die volledig worden weergegeven op de index pagina
  • Artikels die volledig worden weergegeven op de maand/jaar archief pagina
  • Artikels die volledig worden weergegeven op de categorie pagina
  • Volledige artikels op de pagina’s van je blog /page1, /page2, …
  • Meta description die exact hetzelfde is op elke pagina
  • Feeds die volledige artikels tonen
  • Gebruik en indexering van Tag pagina’s
  • Trackback URL

Duplicate content op de homepagina

We kunnen duplicate content op de index niet volledig vermijden aangezien onze website nog bruikbaar moet blijven en de bezoekers graag artikels willen lezen vanaf dat ze op de hoofdpagina komen. We kunnen wel 2 dingen doen waardoor de duplicate content drastisch vermindert en hoogst waarschijnlijk zelfs niet aanzien wordt als duplicate content door de zoekmachines.

1. Homepage unieker maken door een korte inleiding te geven.

Let wel op, de inleiding mag geen nieuw artikel zijn dat je op de homepage zet als sticky. We gaan de index.php file aanpassen zodat we net na de header een inleidend stukje tekst hebben. Waar je exact kan beginnen typen hangt af van je thema maar meestal is het ergens vlak na <?php get_header(); ?>.

2. Gebruik maken van de more functie van wordpress.

De more functie in wordpress laat je toe om een deel van je artikel te verbergen zodat bezoekers op read more moeten klikken om het volledige artikel te lezen. Op deze manier verminderen we de duplicate content. Als je liever een andere tekst wil dan read more dan moet je je index.php aanpassen en zoeken naar <?php the_content(‘Read more &raquo;’); ?>. Vervang de tekst read more met je eigen tekst en sla het bestand op.

Duplicate content op de archief pagina

Persoonlijk ben ik niet zo’n voorstander van archieven in wordpress. Wat voor nu heeft het dat bezoekers artikels kunnen bekijken die tijdens een bepaalde maand gepubliceerd zijn. Als je toch zo nodig wilt gebruik maken van archief pagina’s dan kan je deze blokkeren van de zoekmachines door middel van een robots.txt bestand, meer hierover op het einde van het artikel.

Duplicate content op de category pagina

De category pagina is voor veel websites essentieel om hun artikels aan de man te brengen. Als ik immers op een website kom die gaat over electronica dan wil ik toch kunnen selecteren welke artikels ik graag wil lezen. Wat ben ik met artikels over zonnepanelen als ik eerder interesse heb in artikels over de nieuwste laptops. Een nadeel van de category pagina is dat het nogal veel duplicate content met zich meebrengt.

De oplossing is heel simpel, maak je categoriepagina net zoals de homepagina unieker. Een probleem is dat er geen appart categorie.php bestand is om een tekst te maken voor de categorieën. Dit probleem kwam ik ook tegen maar had ik al snel opgelost. Als je een categorie aanmaakt kan je voor elke categorie een beschrijving maken. Die beschrijving wordt in de wordpress database opgeslagen. Alles wat in een database zit kan je ook terug uit die database halen.

Via de volgende code kan je de description van de categorie laten weergeven

<div><h1><?php single_cat_title(); ?>
</h1><?php echo category_description(); ?></div>

Dit stukje code geeft eerst de categorie titel in een H1 koptekst weer en geeft dan de description weer. In het descriptionvak in wordpress kan je ook html verwerken. Het plaatsen van afbeeldingen, URL’s en dergelijke in je inleiding is dus volledig mogelijk.

Duplicate Meta description

Een andere vorm van duplicate content is de Duplicate Meta description. De Meta description is de beschrijving van je site die je in de zoekmachines kan zien. Als deze allemaal hetzelfde zijn dan gaat google er een groot aantal verwijderen uit de zoekresultaten. Ze zijn nog wel geïndexeerd maar worden niet meer weergegeven.

Via de All in one seo plugin voor wordpress kan je een  Meta description per artikel maken.

Overige duplicate content

De volgende oorzaken van duplicate content pakken we aan met een robots.txt file.

  • Feeds die volledige artikels tonen
  • Gebruik en indexering van Tags pagina’s
  • Trackback URL

Een robots.txt is een bestand dat een spider van een zoekmachine (zoekmachinerobot) laat zien wat hij wel en niet mag indexeren in de zoekmachine. Ik ga hier geen complete uitleg geven over robots.txt omdat dit eigenlijk overbodig is. Het volgende bestand lost de bovenstaande problemen van duplicate content op. Let wel op, als je artikels hebt die beginnen met /search of /feed en je gebruikt de wordpress no category base plugin (blog.be/artikel en niet blog.be/category/artikel) laat deze dan uit de robots.txt, anders worden ze niet geïndexeerd

User-agent: *
Disallow: /wp-
Disallow: /search
Disallow: /feed
Disallow: /comments/feed
Disallow: /feed/$
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$

Dit bestand sla je op als robots.txt in je public_html map.

*Wil je zelf eens nagaan of je mogelijke duplicate content hebt?

doen een zoekopdracht via google met de volgende parameters site:jouwsite.be

ga naar de laatste pagina en bekijk bovenaan het aantal weergegeven zoekresultaten (Pagina x van x resultaten).

Klik nu op de link die daaronder staat.

Om de meest relevante resultaten te tonen, hebben we er een aantal weggelaten die heel sterk lijken op de reeds weergegeven x. Indien gewenst kunt u de zoekbewerking herhalen met de weggelaten resultaten.

Vergelijk de 2 getallen en je kan nu zelf zien hoeveel pagina’s wel geïndexeerd zijn maar niet worden weergegeven in de zoekresultaten.

Speak Your Mind

*