Horário de Atendimento SEO, 12 de novembro de 2021
Publicados: 2021-11-16Este é um resumo das perguntas e respostas mais interessantes do Google SEO Office Hours com John Mueller em 12 de novembro de 2021.
Páginas sem índice no Google Search Console
8:16 “ [Algumas páginas] foram configuradas incorretamente para noindex. Isso foi corrigido há alguns meses. […] Tentamos solicitar a indexação via Search Console [e] reenviar sitemaps, mas ainda assim, não conseguimos indexar essas páginas. Você tem alguma ideia sobre o que pode fazer com que o Googlebot não escute as solicitações de indexação ou se há algum problema conhecido no Search Console com a indexação?”
John: “Acho que não há problemas conhecidos a esse respeito, mas às vezes somos um pouco conservadores em relação ao envio de solicitações de indexação, o que provavelmente é parcialmente o que você está vendo lá. […] Por um lado, se vemos que uma página está noindex por um longo período de tempo, geralmente desaceleramos com o rastreamento disso. […] Isso também significa que, quando a página se tornar indexável, retomaremos o rastreamento, então é essencialmente esse tipo de empurrão que você precisa fazer.
Outra coisa é que, como o Search Console relata essencialmente os URLs que conhecemos para o site, pode ser que a imagem pareça pior do que realmente é. Isso pode ser algo que você pode analisar, por exemplo, examinando o Relatório de desempenho e filtrando essa seção do site ou esses padrões de URL, para ver se esse número de páginas sem índice alto no Search Console está relatando páginas que não eram realmente importantes e as páginas importantes dessas seções são realmente indexadas.”
John também afirmou que “[…] um sitemap é essencialmente um bom começo, mas outra coisa que você pode fazer é deixar claro com links internos que essas páginas são muito importantes para o site para que possamos rastreá-las um pouco mais rápido. Isso pode ser um link interno temporário em que você diz: por algumas semanas, vinculamos produtos individuais em nossa página inicial. […] Essencialmente, quando descobrimos que o link interno mudou significativamente, geralmente vamos verificar novamente essas páginas também. Então, essa poderia ser uma abordagem temporária para colocar as coisas no índice novamente. Com links internos, não é que você esteja dizendo que essas são páginas importantes na web, mas sim páginas importantes em relação ao seu site. Portanto, se você alterar significativamente o link interno, pode acontecer que outras partes do site, que talvez tenham sido apenas indexadas, saiam em algum momento. Então é por isso que eu faria isso em um nível temporário e diria, eu quero empurrá-los de volta para o sistema para que eles sejam rastreados novamente na taxa normal, e então eu mudarei o link interno de volta para que tudo fique mais normal novamente .”
Com relação à adição de links ao rodapé, John acrescentou: “Acho que isso também funcionaria. Geralmente é melhor se pudermos encontrá-lo em páginas realmente importantes do site, geralmente como em sua página inicial, […] onde você está dizendo que isso é importante para você, portanto, verificaremos novamente essa página. ”
Tags canônicas e alternativas
14:25 “Estou usando um site WordPress e estou usando dois plugins. Um [deles] adiciona automaticamente um link rel="canonical" a cada página. […] [O outro é um plugin tradutor] que adiciona [a] cada página um link rel="alternativo". É lógico que diga: para esse URL, é canônico, mas também é alternativo? Isso entra em conflito em algum lugar do rastreador?”
João afirmou: “Não. Quer dizer, eu não sei exatamente o que esses dois plugins fazem. De um ponto de vista geral, se você tem uma página que tem um rel=canonical, você está essencialmente com um ditado canônico: o link mencionado lá é o URL preferido que eu quero. Se for a mesma página, então isso é perfeito porque nos dá a confirmação de que esta página é a que você deseja indexar.
O rel=”alternativo” basicamente significa que também existem versões alternativas desta página. Assim, com idiomas diferentes, por exemplo, se você tiver uma página em inglês, uma página em francês, você teria o link rel="alterne" entre essas duas versões de idioma. E não está dizendo que a página onde esse link está é a alternativa, mas é como se fossem duas versões diferentes, uma delas em inglês, uma delas em francês. Ambos podem ser canônicos, então ter essa combinação geralmente é bom.
O único lugar para observar um pouco é que o canônico não deve estar entre os idiomas. Portanto, não deve ser que na sua página em francês você tenha um conjunto canônico para a versão em inglês porque são páginas essencialmente diferentes. Mas a página em francês pode ser canônica, e a página em inglês pode ser canônica, e você tem o link alternativo entre as duas, e esse é essencialmente um bom conjunto.”
Canonização ou tag noindex
16:49 “Temos um site com uma loja de e-commerce com muitas variações de produtos com conteúdo ralo ou duplicado. Fiz uma lista de todas as URLs que queremos indexar […], e não queremos indexar. […] Não tenho certeza do que seria melhor: canonização ou noindex?”
John disse: “Acho que a questão geral de devo usar noindex ou rel="canonical” para outra página é algo em que provavelmente não há uma resposta absoluta. […] Se você está lutando com isso, você não é a única pessoa que pensa, ah, qual devo usar? Isso também geralmente significa que ambas as opções podem ser boas. Então, geralmente, o que eu olharia para lá é qual é sua preferência realmente forte. Se a forte preferência é que você realmente não deseja que esse conteúdo seja exibido na pesquisa, eu usaria noindex. Se a sua preferência for mais, eu realmente quero tudo combinado em uma página […], então eu usaria um rel=”canonical”. Em última análise, o efeito é semelhante, pois é provável que a página que você está visualizando não seja exibida na pesquisa, mas com um noindex – definitivamente não é exibida e com um rel="canonical" – é mais provável que não seja exibida. ”
John resumiu: “ Você também pode fazer os dois. Se links externos, por exemplo, estão apontando para esta página, então ter os dois lá nos ajuda a descobrir bem, você não quer esta página indexada, mas você também especificou outra, então talvez alguns dos sinais que possamos apenas avance.”
Indexação e rastreamento para dispositivos móveis
28:26 “[…] Otimizamos nosso site de acordo [para indexação mobile-first]. Quanto à configuração, o Google recomenda duas maneiras de fazê-lo. O primeiro é um web design responsivo e o segundo é um serviço dinâmico. Como a primeira maneira é um pouco difícil de alcançar por meio de nosso ambiente de tecnologia, usamos a segunda maneira. Mas ainda vemos que hoje em dia, existem mais de duzentos mil rastreamentos diários em direção ao nosso domínio móvel. Isso é uma coisa normal de se ver? […] Tínhamos o domínio m-dot, então redirecionamos para o domínio principal.”

John respondeu: “Uma certa quantidade de engatinhar assim é normal. Leva muito tempo para que nossos sistemas parem completamente de rastrear um domínio, mesmo depois de redirecionado, então não vejo isso como um problema. Nossos sistemas têm uma memória muito longa para coisas como essa às vezes, e se você mover um site de um domínio para outro, ou se você fizer essa alteração móvel com um subdomínio, às vezes leva anos para que o rastreamento pare completamente.”
Tecnologias da Web versus classificação
36:00 “ Existe alguma relação ou impacto nos rankings dos sites que são feitos com HTML normal, CSS, JS e outro – PWA? […] Um de nossos principais concorrentes o adotou recentemente e notamos um grande salto em seus rankings SERP.”
John disse: “Essas são essencialmente maneiras diferentes de criar um site, e você pode criar um site com várias estruturas e formatos diferentes. Na maioria das vezes, as vemos como páginas HTML normais. Portanto, se for um site baseado em JavaScript, vamos renderizá-lo e processá-lo como uma página HTML normal. Se já for HTML no começo, podemos fazer isso. [Existem] diferentes frameworks e CMSs por trás disso. Normalmente, basicamente ignoramos isso e apenas dizemos, bem, aqui está uma página HTML, e podemos processá-la.
Então, apenas o fato de um de seus concorrentes ter mudado de uma estrutura para outra e ter visto uma melhoria na pesquisa, essa mudança de estrutura, do meu ponto de vista, não seria responsável por isso. Mas, em vez disso, talvez eles tenham um site mais novo agora, junto com essa mudança de estrutura. Talvez o site mais novo tenha links internos diferentes, conteúdo diferente internamente, seja significativamente mais rápido ou significativamente mais lento, os usuários realmente gostem ou fizeram uma campanha de marketing junto com o lançamento do site. Todas essas coisas funcionam lá, e essas são todas as coisas que não estão limitadas à estrutura que você está usando.”
Google PageSpeed Insights x Lighthouse
37:39 “Os resultados nos dados do laboratório no Google PageSpeed Insights são os mesmos que os resultados do Lighthouse no meu navegador Chrome? Eles usam a mesma fórmula?”
John disse: “Eu não sei cem por cento, mas eles são feitos de forma completamente diferente. […] Se você usa o PageSpeed Insights que é executado em um data center em algum lugar com dispositivos essencialmente emulados, onde tentamos agir como um computador normal, e temos restrições que o tornam um pouco mais lento. […] No Lighthouse, ele basicamente roda em seu computador com sua conexão de internet. Acho que o Lighthouse no Chrome também tem algumas restrições que se aplicam para que pareça um pouco mais lento do que o seu computador pode fazer apenas para garantir que seja comparável.
Mas, essencialmente, eles são executados em ambientes completamente diferentes, e é por isso que você costuma ver números diferentes lá. […] Se você testar com outras ferramentas de velocidade que rodam online, você pode [também] ver números diferentes. Além disso, os dados de campo, os dados que usamos para classificação de pesquisa que você vê no Search Console, também podem ser números completamente diferentes apenas porque seus usuários podem ter, em média, um tipo diferente de dispositivo ou tipo diferente de conexão com a Internet. Portanto, mesmo que as fórmulas sejam as mesmas, todo o ambiente em torno desses sistemas é muito diferente.”
Google Discover
47:09 “Percebemos um grande problema com o Google Discover em nosso site. Em dois dias, o tráfego caiu setenta por cento. […] Então, estamos nos perguntando se fizemos algo errado? […] Você pode esclarecer o que exatamente aconteceu, já que é um sorteio tão drástico? […] Poderia ser um erro técnico?”
John disse: "Não sei especificamente em relação ao seu site, mas recebo relatórios de muitas pessoas de que o tráfego do Discover está ativado ou desativado no sentido de que há muito pouco espaço entre isso se nossos algoritmos determinarem que se não mostrar muito conteúdo deste site no Discover no momento, basicamente todo esse tráfego desaparece. Por outro lado, é a mesma coisa que, se mostrarmos algo do seu site no Discover, de repente você terá aquela grande onda de tráfego novamente.
Se for um problema técnico, você também verá isso na pesquisa na Web e verá problemas de rastreamento aparecendo. Não tenho uma visão completa do que exatamente acontece no Discover, mas geralmente os problemas que vejo as pessoas falando são, por um lado, problemas de qualidade em que talvez a qualidade do site não seja tão boa e com relação ao políticas individuais que temos para o Discover. Em particular, para o Discover, temos algumas políticas que são diferentes da pesquisa na web e recomendações que são um pouco diferentes em relação a, eu acho, conteúdo adulto, conteúdo clickbaity. […] Tudo isso é mencionado na página da Central de Ajuda que temos para o Discover. Imagino que muitos sites tenham um pouco de uma mistura de todas essas coisas, e às vezes suspeito que nossos algoritmos encontram um pouco demais, e então eles dizem, ah, temos que ter cuidado agora com este site. Então, sem conhecer seu site e sem saber os detalhes do que exatamente o Discover está pegando lá, essa é a direção que eu seguiria até lá. […]
Do nosso ponto de vista, o Discover é onde tentamos mostrar um fluxo de informações para as pessoas e, por causa disso, tendemos a não ter muitas informações detalhadas sobre o que exatamente você precisa fornecer para ter um desempenho realmente bom. Então, às vezes, faz sentido olhar para o que outras pessoas descobriram.”
Tempo de resposta
50:41 “Qual seria um bom tempo de resposta para um novo site de mídia de notícias?”
De acordo com John, “ O tempo de resposta é algo que afeta nossa capacidade de descobrir quanto rastreamento um servidor pode levar. Normalmente, o tempo de resposta, de um ponto de vista prático, limita ou joga em quantas conexões paralelas seriam necessárias para rastrear. Portanto, se quisermos rastrear mil URLs de um site, o tempo de resposta para distribuir isso ao longo de um dia pode ser muito grande. Considerando que, se quisermos rastrear um milhão de URLs de um site e houver um alto tempo de resposta, isso significa que acabaremos com muitas conexões paralelas ao servidor. Acho que temos alguns limites com relação a não querermos causar problemas no servidor, então é por isso que o tempo de resposta está diretamente conectado com a taxa de rastreamento.
Para um site de notícias, não é tanto uma questão de ser notícia ou não, mas sim o número de URLs que precisamos rastrear por dia. Então esse é o ângulo que eu olharia lá. Pode ser que em um site de notícias, rastreamos dez mil páginas por dia, e esses são os artigos de notícias importantes que são cobertos. Pode ser que tenhamos que rastrear milhões de artigos por dia porque sempre temos que atualizar o arquivo […], então obviamente o tempo de resposta, a taxa de rastreamento, parece diferente.”
