Référencement, parlons SEO, Acte III : duplicate content ou contenu dupliqué
Le contenu dupliqué est pénalisé par Google. Pour éviter cela, prenez connaissance de ce billet.
Selon Google, le contenu dupliqué se résume ainsi : « Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ».
Le contenu dupliqué
En clair, plusieurs liens existent pour accéder à un contenu qui lui est unique.
C’est une grande négligence qui peut avoir des conséquences désastreuses.
On peut citer le retrait du site des résultats de recherches car considéré comme :
- site « polluant » ou « non pertinent »,
- perte de valeur du contenu,
- perte de PageRank.
www. ou pas ?
Avant de lire ce qui suit, assurez-vous d’avoir consulté les deux premiers volets (PageRank et Contenu) de cette série « Parlons SEO », sinon vous allez vite être perdu.
L’erreur souvent rencontrée sur la toile est l’accès à un site avec le www et sans le www, erreur souvent liée à l’absence de redirection permanente.
Nous allons voir les différentes variantes du Duplicate Content et les conséquences que cela aura sur un site.
Explication par l’exemple
Nous allons appeler notre site « SiteA ».
SiteA est mal conçu et est accessible avec ou sans www.
Il n’y a également aucune optimisation SEO et SiteA est également accessible avec ou sans slash.
Il y a une tentative d’optimisation du site mais elle a été mal faite donc chaque page à deux liens d’accès :
- le lien par défaut de la page,
- et le lien réécrit (dans une tentative d’avoir des liens « »).
Maintenant imaginons que l’on ai envie de consulter la page « À propos » du site en question, voici les liens que Google aura référencé :
- https://sitea.com/a-propos
- https://sitea.com/a-propos/
- https://sitea.com/page-98.html
- https://sitea.com/page-98.html/
- https://www.sitea.com/a-propos
- https://www.sitea.com/a-propos/
- https://www.sitea.com/page-98.html
- https://www.sitea.com/page-98.html/
Tous ces liens mènent à une seule et unique page web.
Maintenant imaginons que Google ne fait pas son travail et que toutes ces pages (rappelons qu’il s’agit d’une unique page du site) soient référencées.
Voici le résultat obtenu après une recherche avec les mots-clés « siteA à propos » :
Résultat de cet exemple
Ce n’est vraiment pas terrible.
Sans compter la perte de valeur de la page en question, qui par exemple au lieu d’avoir un PageRank de 5 (ce qui est vraiment pas mal pour une page interne), aura un PageRank de… 0 !
Et oui, car on divise le PageRank 5 par les 8 liens et non pas par 1 seul lien. 5 / 1 = 5 alors que 5 / 8 c’est déjà beaucoup moins bien.
Bon on a vraiment pris le pire exemple possible, mais même dans le cas d’une duplication www, ça divise une valeur PageRank par 2.
Théoriquement, au lieu d’avoir une page d’accueil avec un PR 6 par exemple, on se retrouve avec :
- la page d’accueil avec le www d’un PR 3,
- et la même page d’accueil sans le www d’un PR 3.
Le site sera donc moins bien référencé qu’un concurrent qui lui aura un moins bon PR (car moins de backlinks), 4 par exemple, mais aura optimisé son SEO.
Que pense Google du contenu dupliqué ?
Google pénalise les sites possédant du contenu dupliqué car cela impacte négativement la pertinence des résultats de recherche.
Car Google n’aime pas perdre son temps à trier les liens de votre site et décider d’inclure ou pas telle ou telle page. C’est d’ailleurs pour cela qu’une balise nommée « canonical » a été mise en place.
Cela minimise l’importance des duplications involontaires. Encore faut-il que cette balise soit correctement utilisée !
L’optimisation du SEO est donc très important et à ne surtout pas négliger pour son référencement.
Qu'est-ce que le Duplicate Content ou Contenu Dupliqué ?
Le « Duplicate content » (ou contenu dupliqué en français) fait référence à des cas où du contenu similaire ou identique apparaît sur plusieurs pages web à travers l’internet.
Quelles sont les conséquences d'un contenu dupliqué ?
Un contenu peut être dupliqué sur votre propre site ou sur le site web d’un concurrent et dans le deux cas, des pages web dupliquées peuvent être déclassées dans les résultats de recherches.
Est-ce que le contenu dupliqué est toujours pénalisé en 2024 ?
Oui ! Le contenu dupliqué est toujours pénalisé en 2024 et les conséquences continuent d’être importantes.
Nous pouvons citer pour exemple :
- la diminution du classement dans les moteurs de recherche,
- la perte de trafic organique,
- la dilution de l’autorité de la page,
- les problèmes de conformité et de copyright,
- l’impact négatif sur l’expérience utilisateur,
- la dégradation de la réputation de la marque,
- les ressources de crawl des moteurs de recherche gaspillées…