Heures de bureau SEO, 1er avril 2022

Publié: 2022-04-08

Ceci est un résumé des questions et réponses les plus intéressantes des heures de bureau Google SEO avec John Mueller le 1er avril 2022.

Masquer le contenu
1 Ajuster les redirections pour récupérer le trafic perdu
2 Nombre de mots optimal
3 Problèmes d'indexation avec du contenu nouvellement publié
4 Utiliser des outils d'IA pour créer du contenu
5 Crawlabilité d'un bouton Afficher plus sur une page
6 La longueur et l'utilisation du texte alternatif

Ajuster les redirections pour récupérer le trafic perdu

14:53 "Nous avons [had] un site Web de publication de contenu depuis 2009 et nous avons connu une mauvaise migration en 2020 où nous avons rencontré une énorme baisse du trafic organique. […] Nous avions beaucoup de liens cassés donc nous avons utilisé la redirection 301 pour rediriger ces liens cassés vers les articles originaux mais […] dans le robots.txt nous avons interdit ces liens afin que le budget de crawl ne soit pas […] [utilisé] en explorant ces 404 pages. […] Si nous corrigeons toutes ces redirections […] [donc elles redirigent] vers le même article avec le nom propre, […] pouvons-nous supprimer ces liens du robots.txt et combien de temps cela prend-il pour être réellement considéré par Google ?"

John a déclaré : "[…] Si la page est bloquée dans le fichier robots.txt , nous ne pourrions pas voir la redirection. Donc, si vous configurez une redirection, vous devrez supprimer ce bloc dans le fichier robots.txt. […] Il n'y a pas d'heure précise car nous ne crawlons pas toutes les pages [à] la même vitesse. Certaines pages peuvent être récupérées en quelques heures et d'autres peuvent prendre plusieurs mois pour être réexplorées.

[…] S'il s'agit d'une migration qui remonte à deux ans maintenant, alors […] Je ne pense pas que vous obtiendriez beaucoup de valeur en faisant simplement que ces 404 liens […] affichent le contenu. […] Je ne peux pas imaginer que ce serait la raison pour laquelle un site Web obtiendrait beaucoup moins de trafic , […] à moins que ces pages ne soient les pages les plus importantes de votre site Web, mais vous l'auriez remarqué. Mais s'il ne s'agit que de pages génériques sur un site Web plus grand, je ne peux pas imaginer que le trafic global vers un site Web chuterait parce qu'elles ne sont plus disponibles. »

Nombre de mots optimal

17:27 "[…] Question sur la longueur optimale du contenu sur la page - [...] nous avons rencontré de nombreux articles de blog [...] [disant] nous devons avoir environ 100 ou 1000 mots par page, alors quelle est la longueur optimale du contenu ?"

Comme l'a dit John, « Je ne pense pas qu'il y en ait un – […] certaines pages sont très courtes, certaines pages sont très longues. […] Cela […] dépend de la quantité d'informations que vous souhaitez donner aux utilisateurs.

La personne a ensuite continué à poser des questions sur le contenu, en particulier que "Il y a ce terme qui se propage maintenant : […] contenu léger. Est-il […] [utilisé] par Google […] ?

John a précisé : "[…] Habituellement, cela s'applique davantage à l'ensemble du site Web. Ce n'est donc pas tant qu'une page n'a pas assez de contenu, c'est plutôt que le site Web dans son ensemble est très léger sur les informations réelles. […] Je n'utiliserais pas le mot compter pour le reconnaître. Je pense que parfois le nombre de mots est utile pour consulter un site Web plus vaste et essayer de trouver des domaines dans lesquels vous pourriez peut-être faire mieux. Mais je ne l'utiliserais pas comme mesure pour guider […] les choses spécifiques que vous faites sur le site Web.

Problèmes d'indexation avec le contenu nouvellement publié

19:00 “[…] Depuis 2013, nous gérons une place de marché à deux faces qui est assez bien établie. Nous avons environ 70 000 pages et environ 70 % de celles-ci se trouvent généralement dans l'index. Et puis il y a une sorte de budget qui explore les nouvelles pages qui sont créées et celles que nous voyons bouger là-dessus afin que les anciennes pages sortent, de nouvelles pages apparaissent. En même temps, nous écrivons également des entrées de blog […], et pour […] les placer en haut de la file d'attente, nous utilisons toujours […] Demander l'indexation sur celles-ci. Ils iront donc plus vite. Nous les ajoutons également au plan du site, mais nous constatons que nous les écrivons et ensuite nous voulons qu'ils soient sur […] Google aussi [rapidement] que possible […]. Comme nous avons en quelque sorte grandi au cours de l'année dernière et que nous avons plus de contenu sur notre site, nous avons constaté que cela ne fonctionnait parfois pas aussi bien pour les nouvelles entrées de blog. Et ils sont également assis dans cette file d'attente [ découvert - actuellement non indexé ] pendant plus longtemps. Y a-t-il quelque chose que nous puissions faire […] – comme des liens internes – ou […] est-ce basé sur le contenu ou devons-nous simplement vivre avec le fait que certains de nos blogs pourraient ne pas figurer dans l'index ? »

John a expliqué qu'il n'est pas inhabituel d'avoir du contenu non indexé : « […] Je pense que dans l'ensemble, il est assez normal que nous n'indexions pas tout sur un site Web. […] Ce n'est pas lié à un type de contenu spécifique. […] Utiliser [l'outil d'inspection d'URL] pour les soumettre à l'indexation est très bien. Cela ne pose certainement aucun problème. Mais j'essaierais aussi de trouver des moyens de rendre [il] […] aussi clair que possible que vous vous souciez de [ces pages] donc […] les liens internes sont un bon moyen de le faire. […] Assurez-vous que depuis votre page d'accueil, vous dites qu'il y a les cinq nouveaux articles de blog et que vous les reliez directement afin que ce soit facile pour […] Googlebot lorsque nous explorons et indexons votre page d'accueil pour voir qu'il y a quelque chose de nouveau et il est lié depuis la page d'accueil. Alors peut-être que c'est important […].

John a également fourni une autre suggestion : « Si vous avez une section de blog sur votre site, vous avez également des flux RSS […]. Je les soumettrais également à Google dans la Search Console. Tout simplement parce que les flux RSS ont tendance à se concentrer davantage sur le contenu le plus récent, et cela nous aide à les récupérer un peu plus rapidement. Nous les utilisons de la même manière que les fichiers de plan de site, mais parfois les flux RSS sont un peu plus faciles à comprendre pour nous. »

Utiliser des outils d'IA pour créer du contenu

22:19 "[…] Depuis que les outils d'écriture d'IA basés sur GPT-3 ont commencé à être annoncés, notre communauté [sur Reddit] a un débat sur l'opportunité de les utiliser ou non. […] Notre position est majoritairement contre mais […] nous avons du mal à voir quelle est la position officielle de Google. […] Comment Google réagit-il aux sites Web hébergeant du contenu écrit par l'IA […] ? »

John a répondu : "[…] Pour nous, ceux-ci tomberaient essentiellement dans la catégorie des contenus générés automatiquement. C'est quelque chose que nous avons dans les Consignes aux webmasters depuis presque le début, je pense. Et les gens génèrent automatiquement du contenu de différentes manières. Et […], si vous utilisez des outils d'apprentissage automatique pour générer votre contenu, c'est essentiellement la même chose que si vous étiez juste […], en mélangeant des mots, ou en recherchant des synonymes, ou en faisant les astuces de traduction que les gens avaient l'habitude de faire. […] Je soupçonne que la qualité du contenu est peut-être un peu meilleure que […] les outils de la très vieille école, mais […] nous considérerions cela comme du spam.

En guise de suivi, on a demandé à John : "Êtes-vous en train de dire que Google est capable de comprendre la différence entre le contenu humain et l'IA ?"

En réponse, John a dit : « Je ne peux pas prétendre cela. Mais […] si nous constatons que quelque chose est généré automatiquement, l'équipe de spam Web peut certainement prendre des mesures à ce sujet. […] Je ne sais pas comment l'avenir va évoluer là-bas, mais j'imagine que, comme avec toutes ces autres technologies, il y aura un peu un jeu du chat et de la souris, où parfois les gens feront quelque chose et s'en tireront ce. Et puis l'équipe de spam Web rattrape son retard et résout ce problème à plus grande échelle.

Mais d'après notre recommandation, nous le considérons toujours comme un contenu généré automatiquement […]. C'est peut-être quelque chose qui va évoluer. En cela, il deviendra davantage un outil pour les gens. […] Comme si vous utilisiez la traduction automatique comme base pour créer une version traduite d'un site Web, mais vous continuez à la parcourir manuellement. Et peut-être qu'avec le temps, ces outils d'IA évolueront dans le sens où vous les utiliserez pour être plus efficace dans votre écriture, ou pour vous assurer que vous écrivez correctement, comme les outils de vérification de l'orthographe et de la grammaire […] .”

Crawlabilité d'un bouton Afficher plus sur une page

39:50 "[…] J'ai récemment repensé mon site Web et changé la façon dont je répertorie mes articles de blog et d'autres pages des pages un, deux, trois, quatre à un bouton Afficher plus . Google peut-il toujours explorer ceux qui ne sont pas affichés sur la page principale du blog ? Quelle est la meilleure pratique? Si ce n'est pas le cas, disons que ces pages ne sont pas importantes en termes de recherche et de trafic, l'ensemble du site […] serait-il affecté en termes de pertinence par rapport au sujet pour Google ? »

La réponse de John a été : « […] Cela dépend un peu de la façon dont vous avez mis cela en œuvre. Un bouton D'autre part, vous pouvez également implémenter un bouton Afficher plus , essentiellement comme un lien vers la page deux de ces résultats, ou de la page deux à la page trois. Et s'il est implémenté sous forme de lien, nous le suivrons en tant que lien, même s'il n'a pas d'étiquette indiquant la page deux.

[…] La première chose à vérifier - est-ce réellement quelque chose qui peut être crawlé ou non ? Et […] s'il ne peut pas être exploré, alors généralement, ce qui se passerait ici, c'est que nous nous concentrerions principalement sur le billet de blog qui serait directement lié à ces pages.

[…] Nous conserverions probablement les anciens articles de blog dans notre index parce que nous les avons vus et indexés à un moment donné. Mais nous allons probablement nous concentrer sur ceux qui sont actuellement là. Une façon d'aider à atténuer ce problème est de créer également des liens croisés entre vos articles de blog. Parfois, cela se fait avec des pages de catégories ou […] des pages de balises que les gens ajoutent. Parfois, les blogs ont un mécanisme pour créer des liens vers des articles de blog connexes […]. Même si nous ne voyons initialement que la première page des résultats de votre blog, nous serions toujours en mesure d'explorer le reste de votre site Web.

[…] Une façon de vérifier cela consiste à utiliser un robot d'exploration local. Il existe divers outils d'exploration tiers disponibles. Et si vous explorez votre site Web et que vous voyez qu'il ne récupère que cinq articles de blog, alors ce sont probablement les cinq articles de blog qui peuvent être trouvés. D'un autre côté, si cela passe par ces cinq articles de blog. Et puis trouve un tas de plus […] alors vous pouvez être à peu près sûr que Googlebot sera également capable d'explorer le reste du site.

La longueur et l'utilisation du texte alternatif

46:51 "[…] Google a dit qu'il y a un maximum de 16 mots que vous pouvez utiliser dans votre texte alternatif. […] Est-ce que Google lit le reste de mon texte alternatif et […] qu'est-ce que cela signifie pour la convivialité ? »

Comme John a répondu: «[…] Nous n'avons aucune directive concernant la longueur de votre texte alternatif. […] Du point de vue de la recherche Google, vous pouvez mettre beaucoup de choses dans le texte alternatif d'une image si cela est pertinent pour cette image particulière. En ce qui concerne le texte alternatif, nous l'utilisons principalement pour mieux comprendre l'image. Donc, si quelqu'un recherche […] dans Google Images quelque chose qui correspond au texte alternatif, nous pouvons l'utiliser pour comprendre que votre image est pertinente pour ce texte alternatif sur cette page spécifique […].

Nous utilisons également le texte alternatif dans le cadre de la page. Mais pour moi, c'est généralement quelque chose qui est déjà visible sur la page, de toute façon. C'est donc moins quelque chose qui est critique pour la page elle-même. Je l'utiliserais vraiment comme quelque chose qui s'applique à l'image, et […] pour des raisons de convivialité et pour que Google Images comprenne mieux cette image spécifique.

[…] Ce qui mérite également d'être mentionné, c'est que lorsqu'il s'agit de Google Images, vous n'avez pas nécessairement besoin de décrire exactement ce qu'il y a dans l'image. Mais plutôt […] ce que cette image signifie pour votre page particulière. Donc, si vous avez une photo d'une plage, vous pouvez utiliser un texte alternatif et dire, oh, c'est une plage. Mais vous pourriez aussi dire, c'est la plage en face de notre hôtel, ou c'est la plage que nous avons prise en photo lors d'un nettoyage chimique. […] Ces intentions sont très différentes, et les gens chercheraient de différentes manières dans Google Images pour y trouver plus d'informations, et donner ce contexte supplémentaire […] a toujours du sens à mon avis.