comment corriger ses problèmes d'indexation ?

C'est lorsque j'ai travaillé sur la façon dont Google crawle mon site Internet que je me suis rendu compte que j'avais un sérieux problème avec un certain nombre de pages publiées sur mon site : + de 40% de mon site n'est pas indexé par Google, ou ne répond à aucune intension et donc bien qu'indexée, est inutile aux yeux du géant américain.

50 pages sur 130 de faible qualité ? Pour quelqu'un qui se vante d'avoir un super outil d'optimisation sémantique, c'est quand même assez moyen. Je vous montre comment je me suis sorti de ce guêpier.

1 - Amélioration de mon outil de PR Sculpting

Il m'a donc fallu améliorer mon outil de PR sculpting avec la possibilité de trier les pages en fonction du nombre de crawls de Google. J'en ai profité pour revoir le système de calcul par rapport à mon étude initiale. L'idée, c'est d'identifier un profil de pages type qui coince, mais aussi de pouvoir agir directement dessus.

Ensuite j'ai ajouté - toujours accessible depuis l'outil de PR sculpting - un accès à des statistiques pour chaque page. L'idée est de voir le trafic (nombre de visiteurs uniques) de la page (tracé en bleu), le nombre d'entrées provenant de Google (tracé en vert), mais aussi de voir le nombre de crawls de Googlebot par semaine, et d'avoir un suivi des dernières modifications réalisées sur la page.

2 - Identification des pages problématiques

Reprenons le crawl du mois d'août. L'outil m'indique désormais les bonnes et les mauvaises pages :

Suivi du crawl d'aout 2021
« Suivi du crawl d'aout 2021 : 43% de mauvaises pages, 57% de pages correctes. »

Nous voilà donc avec 43 pages ignorées par Google, et donc potentiellement exclues de l'index, et 13 pages peu crawlées. Regardons les pages Ignored By Google.

Exemple de pages Ignored by Google
« Tableau des pages ignorées par Google »

Si on regarde cet extrait de pages problématiques :

  • 3 d'entre elles avaient été identifiées comme cible SEO. Dommage pour moi...
  • J'ai encadré la colonne média en rouge : toutes les pages ont ce point commun, 0 ou 1 média seulement !
  • Ensuite j'ai encadré en orange d'autres problèmes : peu de contenu texte (- de 150 mots), peu de lien entrant ou peu de liens sortants.
  • Les autres pages sont des pages filles dont la page mère n'a pas été indexée.

Note : la colonne du dernier passage de GoogleBot est erronée : elle affiche la situation d'aujourd'hui, mais elle importe peu ici.

Résumons : toutes ces pages (qui sont censées être des pages informationnelles) n'ont quasiment aucun média, et pour la moitié d'entre elles sont vides ou dénués de sens ! Regardons la dernière ligne catégorie : 1 lien reçu, 45 mots, et un seul lien. Bravo joli travail... On voit que je me suis dépassé sur ce coup. D'autres pages font à peine 100 mots, sans média et font jusqu'à 5 à 6 liens.

La vérité, c'est que la plupart de ces pages ne sont là que pour transmettre du Pagerank à d'autres pages. Je pensais avoir fait de la bouillie sémantique, mais pas du tout. J'ai voulu grossir artificiellement mon site sans donner du sens, faire des petits cocons pour pouvoir dire que je faisais du cocon. Bref : je n'avais RIEN compris. 

3 - Correction des pages problématiques

Lors de mon précédent article "nettoyer sa masse noire", j'avais défini les différentes actions nécessaires pour indexer à nouveau mon contenu :

  1. Voir si la page répond à un vrai sujet
  2. Vérifier si la page reçoit des vues / visites
  3. Essayer d'améliorer le contenu : amélioration du texte, ajout d'illustrations
  4. Revoir les liens internes : le nombre de liens, le choix des pages, des ancres...
  5. Demander une réindexation si besoin sur Search Console
  6. En dernier lieu, supprimer les pages vraiment inutiles, avec redirection 301.

Concrètement, voici ce que donne mes correctifs :

Mes pages cibles SEO

Ce sont les 3 pages que j'ai corrigé en priorité. Pour être honnête, l'une d'elle s'est indexée toute seule au mois d'octobre, c'est la dernière qui avait déjà 5 médias. Les deux autres pages cible SEO : rajout de médias, relecture et légère modification de texte. Puis demande de réindexation depuis Google Search Console.

Résultat : dès le lendemain, les pages rankent en position 9 à 20 sur leur sujet. Ces 3 pages débloquent également des pages filles.

Les autres pages sans média

De la même façon, j'ai corrigé certaines de ces pages en ajoutant des photos / vidéos.

Les pages sans contenu

Petit à petit, je nettoie ces pages et je fais simple : soit je les supprime car sans intérêt, soit j'améliore un peu le contenu, j'arrête de bourriner en ajoutant des liens tous les 3 mots. Bref, j'essaie d'être un peu plus propre. Pour cela, je m'appuie sur la vue statistique :

Statistiques d'une page perdue avec #mystranding
« Statistiques d'une page isolée et perdue... Pas de vues, pas de crawl, pas d'action de ma part : on supprime ! »

Le cas ci-dessus est simple : pas ou très peu de visite. Aucun crawl depuis des mois. => On supprime.
Quant à l'exemple ci-dessous : il est + complexe. On voit que la page a été crawlée régulièrement cet été, et qu'elle a même fait un peu de trafic provenant de Google. Le trafic interne est plutôt bon et augmente : les visiteurs réussissent à trouver cette page avec la navigation interne. Pour ce cas précis, il y a deux pistes :

  1. Le contenu doit être amélioré.
  2. Aller sur Search Console pour voir les requêtes

Après avoir vérifié la search console, Google m'avait bien positionné sur le bon sujet : ma page ne méritait tout simplement pas d'être bien classée. Il va donc falloir retravailler le contenu. (Il s'agit une page catégorie qui est à ce jour incomplète sur son sujet)

Statistiques d'une page web
« Statistiques d'une page web qui mérite une seconde chance ! »

4 - résultats du nettoyage

Après seulement quelques efforts, je suis passé de 33% de pages ignorées à 23%. Repasser sur son propre travail n'est pas la partie la plus excitante, surtout quand on a l'impression que c'est le stagiaire qui a fait tout ça... Ce qui me manque vraiment : c'est la motivation, mais honnêtement j'arrive à indexer à nouveau du contenu sans réelle difficulté. On aurait dit que Google n'attendait que ça.

En tout cas, garder la main sur son contenu, suivre et corriger les pages problématiques est important et peut débloquer des situations.

 

Commentaires

Aucun commentaire publié actuellement.

Ajouter un commentaire :


Top
Sommaire
Comment
Share