Horário de atendimento SEO, 3 de junho de 2022

Publicados: 2022-07-04

Este é um resumo das perguntas e respostas mais interessantes do Google SEO Office Hours com John Mueller em 3 de junho de 2022.

Conteúdo ocultar
1 Posso usar dois códigos de resultado HTTP em uma página?
2 O uso de uma CDN melhora a classificação se meu site já for rápido no meu país principal?
3 Devo proibir solicitações de API para reduzir o rastreamento?
4 Devo usar rel=”nofollow” em links internos?
5 Existe uma maneira de forçar a exibição de sitelinks?
6 Nosso site incorpora PDFs com iframes, devemos fazer o OCR do texto?
7 O Google rastreia URLs na marcação de dados estruturados?

Posso usar dois códigos de resultado HTTP em uma página?

1:22 “[…] É teoricamente possível ter dois códigos de resultado HTTP diferentes em uma página, mas o que o Google fará com esses dois códigos? Será que o Google vai mesmo vê-los? E se sim, o que o Google fará? Por exemplo, um 503 mais um 302.”

A resposta de John foi: “[…] Com os códigos de resultado HTTP, você pode incluir muitas coisas diferentes. O Google analisará o primeiro código de resultado HTTP e o processará essencialmente.

E teoricamente você ainda pode ter dois códigos de resultado HTTP ou mais se forem redirecionamentos que levam a alguma página final. Assim, por exemplo, você pode ter um redirecionamento de uma página para outra. Esse é um código de resultado. E então nessa outra página, você pode servir um código de resultado diferente. Então isso poderia ser um redirecionamento 301 para uma página 404 […]. E do nosso ponto de vista, naquelas situações de cadeia em que podemos seguir o redirecionamento para obter um resultado final, basicamente nos concentraremos apenas nesse resultado final.

E se esse resultado final tiver conteúdo, isso é algo que podemos usar para canonização. Se esse resultado final for uma página de erro, então é uma página de erro. E isso é bom para nós também.”

O uso de uma CDN melhora os rankings se meu site já for rápido no meu país principal?

2:50 “[…] Recebemos a maior parte do nosso tráfego de um país específico. Hospedamos nosso site em um servidor localizado naquele país. Você sugere colocar todo o nosso site atrás de um CDN para melhorar a velocidade da página para os usuários globalmente, ou isso não é necessário no nosso caso?”

John respondeu: “ Eu não acho que isso teria um grande efeito no Google em relação ao SEO.

O único efeito em que eu poderia imaginar que algo poderia acontecer é o que os usuários acabam vendo. […] Se a maioria de seus usuários já está vendo um site muito rápido porque seu servidor está localizado lá, então você está […] fazendo a coisa certa. Mas, é claro, se os usuários em outros locais estão vendo um resultado muito lento, porque talvez a conexão com seu país não seja tão boa, então é algo em que você pode ter algumas oportunidades de melhorar isso.

[…] Se houver algo que você possa fazer para melhorar globalmente o seu site, acho que é uma boa ideia. Eu não acho crítico [...]. Mas é algo que você pode fazer para […] expandir seu site além do seu país atual.

Talvez uma coisa que eu deva esclarecer, se o rastreamento do Google é muito, muito lento, é claro que isso pode afetar o quanto podemos rastrear e indexar do site […]. Eu realmente não vejo isso como um problema em relação a qualquer site que não tenha milhões e milhões de páginas […].

Você pode verificar com que rapidez o Google está rastreando no Search Console e as estatísticas de rastreamento. E se isso parece razoável, mesmo que não seja super rápido, então eu realmente não me preocuparia com isso.”

Devo proibir solicitações de API para reduzir o rastreamento?

5:20 “[…] Nosso site atualmente gasta cerca de 20% do orçamento de rastreamento no subdomínio da API, outros 20% em miniaturas de imagens de vídeos. Nenhum desses subdomínios possui conteúdo que faz parte da nossa estratégia de SEO. Devemos proibir o rastreamento desses subdomínios ou como os endpoints da API são descobertos ou usados?”

Como John disse, “[…] Em muitos casos, os endpoints da API acabam sendo usados ​​pelo JavaScript em um site e renderizaremos suas páginas. E se eles acessarem uma API que está em seu site, tentaremos carregar o conteúdo dessa API e usá-lo para renderizar a página.

E dependendo de como sua API está configurada e como seu JavaScript está configurado, pode ser difícil para nós armazenar em cache esses resultados de API, o que significa que talvez rastreamos muitas dessas solicitações de API para tentar obter uma versão renderizada de suas páginas para que possamos usá-las para indexação. Então geralmente é o lugar onde isso é descoberto. E isso é algo que você pode ajudar, certificando-se de que os resultados da API possam ser armazenados em cache, que você não injete nenhum carimbo de data/hora em URLs […] quando estiver usando JavaScript para a API […].

Se você não se importa com o conteúdo que é retornado com esses pontos de extremidade da API, é claro que você pode impedir que todo esse subdomínio seja rastreado com o arquivo robots.txt. E isso basicamente impedirá que todas essas solicitações de API aconteçam.

[…] Antes de mais nada, você precisa descobrir se esses resultados da API […] fazem parte do […] conteúdo crítico que eu quero indexar do Google? E se assim for, provavelmente você não deve bloquear o rastreamento. Mas se […] está […] gerando algo […] que não é crítico para suas páginas […], então pode valer a pena verificar novamente como fica quando elas são bloqueadas.

E uma maneira de verificar isso é criar uma página de teste separada que não chame a API ou que use uma URL quebrada para o endpoint da API. […] Você pode ver como esta página realmente é renderizada no meu navegador? Como ele é renderizado para o Google?”

Devo usar rel=”nofollow” em links internos?

8:05 "É apropriado usar um atributo nofollow em links internos para evitar solicitações desnecessárias do rastreador para URLs que não desejamos que sejam rastreados ou indexados?"

Aqui está como John respondeu: “[…] Eu acho que, na maioria das vezes, faz muito pouco sentido usar nofollow em links internos. Mas se isso é algo que você quer fazer, vá em frente.

Na maioria dos casos, tentarei fazer algo como usar o rel=canonical para apontar para URLs que você deseja indexar ou usar o robots.txt para coisas que você realmente não deseja rastrear.

Tente descobrir, é mais uma coisa sutil […] que você prefere indexar e depois usar rel=canonical para isso? Ou é algo que você diz – na verdade, quando o Googlebot acessa esses URLs, causa problemas para o meu servidor. Causa uma grande carga. Isso torna tudo muito lento. É caro ou o que você tem.

E para esses casos, eu apenas proibiria o rastreamento desses URLs. […] Com o rel=canonical, obviamente, primeiro teremos que rastrear essa página para ver o rel=canonical. Mas com o tempo, vamos nos concentrar no canônico que você definiu. E usaremos esse principalmente para rastreamento e indexação.”

Existe uma maneira de forçar a exibição de sitelinks?

16:02 “Existe alguma estratégia pela qual as páginas desejadas podem aparecer como um link de site nos resultados da Pesquisa Google?”

John esclareceu que “[…] Não há meta tag ou dados estruturados que você possa usar para impor a exibição de um link de site .

[…] Nossos sistemas tentam descobrir o que é […] relacionado ou relevante para os usuários quando eles estão olhando para esta página da web […]? […] Nossa recomendação é essencialmente ter uma boa estrutura de site, ter links internos claros para que seja fácil reconhecer quais páginas estão relacionadas a essas páginas, e ter títulos claros que possamos usar e […] mostrar como um link de site.

[…] Não é que haja garantia de que tudo isso será mostrado assim. Mas isso meio que nos ajuda a descobrir o que está relacionado. E se acharmos que faz sentido mostrar um link de site, será muito mais fácil para nós escolher um com base nessas informações.”

Nosso site incorpora PDFs com iframes, devemos fazer o OCR do texto?

17:14 “Nosso site usa iframes e um script para incorporar arquivos PDF em nossas páginas e nosso site. Existe alguma vantagem em pegar o texto OCR do PDF e colá-lo em algum lugar no HTML do documento para fins de SEO, ou o Google simplesmente analisará o conteúdo do PDF com o mesmo peso e relevância para indexar o conteúdo?”

John respondeu: “[…] Parece que você quer pegar o texto do PDF e […] escondê-lo no HTML para fins de SEO. E isso é algo que eu definitivamente não recomendaria fazer. Se você deseja que o conteúdo seja indexável, torne-o visível na página.

[…] Nós tentamos tirar o texto dos PDFs e indexá-lo para os próprios PDFs. Do ponto de vista prático, o que acontece com um PDF é como um dos primeiros passos, nós o convertemos em uma página HTML e tentamos indexá-la como uma página HTML. […] O que você está fazendo é […] iframe uma página HTML indireta. E quando se trata de iframes, podemos levar esse conteúdo em consideração para indexação na página principal. Mas também pode acontecer que indexemos o PDF separadamente de qualquer maneira. […] Eu inverteria a questão e a enquadraria como o que você quer que aconteça?

E se você quiser que suas páginas da Web normais sejam indexadas com o conteúdo do arquivo PDF, faça com que esse conteúdo fique imediatamente visível na página HTML. Portanto, em vez de incorporar o PDF como uma parte principal do conteúdo, torne o conteúdo HTML a parte principal e vincule ao arquivo PDF.

E então há uma questão de você deseja que esses PDFs sejam indexados separadamente ou não? Às vezes, você deseja que os PDFs sejam indexados separadamente. E se você quiser indexá-los separadamente, vinculá-los é ótimo.

Se você não quiser indexá-los separadamente, usar o robots.txt para bloquear a indexação também é bom. Você também pode usar o noindex [? x-robots ?] cabeçalho HTTP. É um pouco mais complicado porque você precisa servir isso como um cabeçalho para os arquivos PDF se quiser ter esses arquivos PDF disponíveis no iframe, mas não indexados de fato.”

O Google rastreia URLs na marcação de dados estruturados?

23:24 “O Google rastreia URLs localizados na marcação de dados estruturados ou o Google apenas armazena os dados?”

John explicou que “na maioria das vezes, quando olhamos para as páginas HTML, se virmos algo que se parece com um link, podemos tentar esse URL também. […] Se encontrarmos um URL em JavaScript, podemos tentar pegá-lo e tentar usá-lo. Se encontrarmos um link em um arquivo de texto em um site, podemos tentar rastreá-lo e usá-lo. Mas não é realmente um link normal.

[…] Se você quiser que o Google rastreie esse URL, certifique-se de que haja um link HTML natural para esse URL , com um texto âncora claro também, que você forneça algumas informações sobre a página de destino.

Se você não quiser que o Google rastreie esse URL específico, talvez o bloqueie com robots.txt ou nessa página, use um rel=canonical apontando para sua versão preferida, qualquer coisa assim. […] Eu não assumiria cegamente que só porque está em dados estruturados não será encontrado, nem assumiria cegamente que só porque está em dados estruturados será encontrado.

[…] Em vez disso, eu focaria no que você quer que aconteça lá. Se você quiser que ele seja visto como um link, faça dele um link. Se você não quiser rastreá-lo ou indexá-lo, bloqueie o rastreamento ou a indexação […].”