septembre 30, 2021

Le Duplicate Content : qu’est-ce que c’est et comment l’éviter ? 

Reading time about 10 min
Duplicate Content

Le duplicate content… épouvantail des marketeurs ? Découvrez de quoi il s’agit et quels risques vous encourez vraiment. 

Dans le monde du marketing, “duplicate content” est un mot qui fait peur.  On entend souvent qu’il peut mener à des pénalités de Google – voir même à la disparition de votre site des résultats de recherche. 😱

Est-ce vraiment si dangereux et comment ne pas tomber dans le piège ? 

👉 Dans cet article, nous vous expliquons tout ce qu’il faut savoir sur le duplicate content. 

🧐 Le duplicate content : une définition

Pour ceux qui ne le savent pas, le SEO, c’est l’optimisation pour les moteurs de recherche (Search Engine Optimization en anglais) – autrement dit le référencement naturel. Il s’agit donc d’un ensemble de techniques visant à faire remonter votre site web dans les résultats de recherche (SERP), dans Google Search par exemple. 

Pour courtiser les algorithmes de Google (et autres), vous devrez produire du contenu de qualité, original et unique.

En effet, Google déteste le duplicate content, c’est-à-dire le fait de copier du contenu d’une page à l’autre.  

Il existe de nombreuses formes de duplicate content, allant du contenu plagié volontairement au contenu dupliqué à cause d’une erreur technique (due, par exemple, au paramétrage d’un CMS) en passant par un site indexé avec et sans www. 

Dans tous les cas, pour une stratégie de content marketing efficace, vous devrez éviter les doublons de contenu et même ne pas abuser sur les contenus similaires.

🤔 Quels sont les risques du duplicate content ?

Le duplicate content risque d’affecter négativement l’indexation de vos contenus et de votre site. 

Au plus tard depuis la mise à jour Panda, on entend souvent dire que Google applique des pénalités en cas de contenu dupliqué – allant jusqu’à la désindexation. En réalité, c’est un peu plus compliqué. 

Selon les dires de Andrey Lipattsev de Google, le moteur de recherche n’applique pas directement de pénalités (ou très rarement). Voilà ce qu’en dit Google

“Le contenu en double n’entraîne pas de conséquences négatives particulières pour votre site sauf si l’objectif semble être de tromper et de manipuler les résultats des moteurs de recherche. Cependant, si nous estimons qu’il s’agit de pratiques trompeuses et retirons en conséquence votre site de nos résultats de recherche, revoyez votre site.” 

Mais même si le duplicate content n’entraîne pas de pénalité directe, votre contenu risque tout de même d’être moins bien indexé. Pourquoi ? 

Explication. Les “robots” de Google indexent des milliards de pages web et les font remonter dans les résultats de recherche en fonction des mots-clés saisis. Si ces robots trouvent deux pages similaires, ils vont essayer de déterminer quelle est l’original. Il se peut donc que : 

  • Google ne sélectionne pas la “bonne” page à afficher.
  • Vous faites analyser (“crawler”) à Google plus de pages que nécessaires. Vous avez un quota de pages crawlées quotidiennement – il vaut donc mieux faire analyser à Google les pages les plus importantes. 

Les duplicate content va donc diminuer la qualité de l’expérience utilisateur sur votre site et empêcher que vos contenus soient bien référencés !

🩺 Comment résoudre un problème lié au duplicate content ?

Découvrons maintenant quelques bonnes pratiques qui vous aideront à résoudre vos problèmes de duplicate content. 

1 – Rédigez du contenu unique, basé sur l’analyse de mots-clés

Produisez du contenu original et évitez de plagier d’autres sites.

Cela peut paraître évident, mais la première règle à respecter si vous voulez éviter le duplicate content est de créer du contenu unique. 

Bien sûr, cela implique de rédiger vos contenus vous-même et de ne pas copier grossièrement ce que vous allez trouver sur d’autres sites. Mais cela implique aussi d’orienter votre production de contenu à l’aide d’une recherche de mots-clés. 

L’une des règles d’or du SEO, c’est de créer une page unique pour chaque mot-clé sur lequel vous voulez vous positionner. Si, par exemple, vous voulez apparaître dans les résultats Google pour quelqu’un qui saisit les mots “créer un blog”, vous allez créer une seule page dédiée à ces mots-clés. Si vous créez plusieurs pages avec la même intention, celles-ci risquent de se « cannibaliser ».

En somme, vous devez créer une page unique pour chaque terme ciblé – une bonne façon d’éviter les contenus trop similaires. 

Afin de travailler votre SEO et d’analyser vos mots-clés, il existe de nombreux outils comme SEMrush ou Ahrefs. Souvent, une simple recherche Google vous aidera aussi à cerner les mots-clés les plus intéressants pour votre site.

Pour aller plus loin – Découvrez une liste d’outils SEO qui vous permettront d’optimiser votre contenu pour les moteurs de recherche :

2 – Travaillez l’architecture de votre site 

Le duplicate content ce n’est pas qu’une histoire de plagiat : c’est aussi et avant tout une affaire technique. 

Parfois une page ou des éléments de contenu peuvent être dupliqués sans même que vous ne vous en rendiez compte. Cela est souvent le cas si vous utilisez des systèmes CMS comme WordPress. 

Voici quelques erreurs communes auxquelles vous devriez prêter attention :

  • Les duplicate http/https – saisissez l’URL de votre site avec http. Vous devriez être redirigé vers la page https. Si ce n’est pas le cas, cela veut dire que la page est dupliquée – qu’elle existe en double. 
  • Les pages générées automatiquement – certains systèmes comme WordPress génèrent automatiquement des pages qui seront parfois considérées comme du duplicate content. Par exemple, les pages de Catégories, de Tags, de Portfolio, etc.
  • Les pages dupliquées avec et sans www – saisissez l’URL de votre site avec et sans www (en tapant http://exemple.com et http://www.exemple.com). Si votre site est accessible dans les deux cas sans redirection, vous avez peut-être un problème de duplicate content. 

Comment résoudre ces problèmes ? En réalité, ce n’est pas si difficile. Il suffit de pouvoir spécifier clairement à Google quelle est la “vraie” version d’une page.

Pour cela, la meilleure solution reste d’utiliser des redirections 301. Grâce à cette technique, vous pouvez indiquer à Google quelle est la page originale. Ainsi, les différents contenus ne se “battent” plus pour le meilleur ranking (classement). 

Une redirection 301 est donc un bon moyen de résoudre vos problèmes de contenu duppliqué.

Pour aller plus loin – Découvrez les principales erreurs qui mènent à du duplicate content et comment les éviter :

3 – Analyser vos nouveaux contenus pour vous assurer qu’ils sont uniques.  

Pensez à régulièrement vérifier si votre contenu n’est pas dupliqué.

Si votre site web ou blog existe depuis longtemps, il peut parfois être difficile de se souvenir de ce que vous avez déjà publié ou non. 

De plus, si vous travaillez souvent avec des collaborateurs externes (dans le cadre, par exemple, d’articles guest), vous ne pourrez pas toujours vous assurer à 100% de l’originalité du contenu que vous allez publier.

Heureusement, il existe aujourd’hui de nombreux outils en ligne qui vous aideront à vérifier si un contenu est unique ou non. La plupart de ces solutions proposent une version gratuite et sont très simples d’utilisation. 

Nous vous proposons quelques outils à essayer ci-dessous !

🛠️ 5 outils pour détecter le duplicate content

Découvrons maintenant 5 outils qui vous aideront à identifier et résoudre le duplicate content. 

1 – Google Search Console

Pourquoi ne pas demander directemment à Google ?

Duplicate Content - Search Console

Google Search Console est un outil gratuit qui vous aidera dans votre travail de SEO.

Entre autre, vous pourrez détecter des erreurs sur votre site : double versions Http / Https, problèmes dans l’URL, etc.

L’avantage de cette solution est bien sûr qu’elle utilise directement les données de Google… autant travailler à la source !

Découvrez Google Search Console

2 – Duplichecker

Un outil en ligne gratuit pour déterminer si un contenu a été plagié.

Duplicate Content - Duplichecker

Duplichecker est une solution gratuite qui vous permet de copier-coller un contenu et de déterminer s’il existe déjà ailleurs sur le web. 

C’est un outil très simple d’utilisation et sans trop de fonctionnalités avancées, mais il a l’avantage d’être gratuit et très intuitif.  

Si vous voulez simplement savoir si un contenu existe déjà ailleurs sur le web, Duplichecker est un très bon choix.

Découvrez Duplichecker

3 – Copyleaks 

Une solution basée sur l’intelligence artificielle qui vous aidera à détecter le contenu paraphrasé. 

Duplicate Content - Copyleaks

Copyleaks se sert d’algorithmes alimentés par l’IA pour identifier du contenu dupliqué. 

Il vous suffit de créer un compte en indiquant votre adresse email et vous pourrez commencer à utiliser cet outil gratuitement. 

Au delà de 20 pages (ou 5 000 mots) vous devrez passer sur un abonnement payant à partir de 8$ par mois pour vérifier 1 200 pages sur un an. 

Copyleaks est pensé à la fois pour les marketeurs et pour les chercheurs / universitaires. 

Découvrez Copyleaks

4 – Copyscape

Une solution gratuite et super simple d’utilisation.

Duplicate Content - Copyscapes

Copyscape est similaire à Copyleaks. Il s’agit donc d’un outil qui vous permet de checker si votre contenu existe en double ailleurs sur le web. 

Il vous suffit d’indiquer l’URL de la page et Copyscape vous livrera de nombreuses pages avec un contenu similaire. 

C’est un bon moyen pour vous assurer que personne n’a copier votre contenu, mais pour une analyse plus en profondeur, on passera à la solution suivante.

Découvrez Copyscape

5 – Screaming Frog 

La référence en matière de crawler !

Duplicate Content - Screaming Frog

Screaming Frog est une puissante solution qui vous permet d’auditer votre site, que ce soit un blog ou un site e-commerce. 

Il vous permet non seulement d’identifier les contenus dupliqués, mais aussi de révéler de nombreuses autres erreurs déterminantes pour votre SEO – comme des liens cassés. 

Screaming Frog est gratuit jusqu’à l’analyse de 500 URLs.

Découvrez Screaming Frog

Ready to grow with Brevo?

Get the tools you need to reach your customers and grow your business.

Sign up free