Horário de Atendimento SEO, 18 de fevereiro de 2022

Publicados: 2022-02-28

Este é um resumo das perguntas e respostas mais interessantes do Google SEO Office Hours com John Mueller em 18 de fevereiro de 2022.

Conteúdo ocultar
1 Tipos de sites afetados pela atualização do Product Reviews
2 O uso da API de indexação
3 EAT e algoritmos do Google
4 Menções de marca não vinculadas e conteúdo gerado pelo usuário
5 Googlebot e rolagem infinita
6 Atualizar e descobrir dados no relatório Estatísticas de rastreamento
7 Rastreamento reduzido de um site
8 Como o Google identifica países segmentados por páginas
9 Grande número de URLs marcados como Descobertos – atualmente não indexados

Tipos de sites afetados pela atualização do Product Reviews

4:03 “[…] Minha pergunta é sobre a atualização de análises de produtos […]. Eu queria entender como o Google identifica se uma página ou site está relacionado a análises de produtos. […] Por exemplo, há um site de comércio eletrônico […] e eles também têm um blog onde avaliam seus próprios produtos. Eles escrevem sobre prós e contras de seus produtos, comparam produtos diferentes. […] O Google dirá que […] isso também é uma análise de produtos e pode ser analisado pela atualização de análises de produtos? […]”

Como John explicou, “[…] As recomendações que temos para análises de produtos […] seriam relevantes para qualquer tipo de análise de produtos. Então eu não necessariamente tentaria ver se o Google acha que meu site é um site de resenhas de produtos ou não […]. Mas, em vez disso, se você acha que essas boas práticas se aplicam ao seu conteúdo, faça essas boas práticas […]”.

O uso da API de indexação

6:53 “[…] [documentação do Google] menciona que a API de indexação deve ser usada para páginas como anúncios de emprego ou eventos de transmissão. É possível que possamos experimentar esta API para diferentes tipos de conteúdo, como alguns artigos de notícias ou conteúdo de blog?”

John respondeu: “As pessoas experimentam. Mas essencialmente, o que documentamos é para o que usamos a API. Se você não tem conteúdo que se enquadre nessas categorias, então a API não vai te ajudar lá”.

EAT e algoritmos do Google

10:54 “[…] EAT é mencionado em [ Quality Rater Guidelines ], mas eu quero saber se algoritmos reais também [incluem] fatores EAT como a experiência do autor?”

John disse: “Eu diria que há algum trabalho indireto feito para tentar fazer coisas semelhantes. […] Colocamos isso nas diretrizes para que possamos orientar os testadores de qualidade para verificar essas coisas. E se pensarmos que é algo importante, então eu diria que as pessoas do lado da qualidade da pesquisa também trabalham para tentar entender isso de uma maneira mais algorítmica.

Mas eu não veria […] [que haveria] uma pontuação EAT, e você tem que tirar cinco ou algo assim. É mais tentar entender o contexto do conteúdo na web”.

Menções de marca não vinculadas e conteúdo gerado pelo usuário

12:01 “[…] Vejo que as pessoas estão falando sobre menções de marca não vinculadas […]. Você acha que também é importante para os algoritmos [do Google] […]?”

Por menções de marca não vinculadas, a pessoa estava se referindo a situações em que outros sites mencionam sua marca, mas não incluem um link para seu site.

John disse: “[…] Eu acho que é meio complicado, porque nós realmente não sabemos qual é o contexto. Eu não acho que seja uma coisa ruim [...] para os usuários porque se eles podem encontrar seu site através dessa menção, então isso é sempre uma coisa boa. Mas eu não diria que há algum fator de SEO que está tentando descobrir onde alguém está mencionando o nome do seu site”.

12:58 “[…] E as avaliações ou comentários dos usuários? Você acha que também é um fator de classificação para um artigo ou produto?”

John respondeu que “[…] Muitas vezes, as pessoas escrevem sobre a página com suas próprias palavras e isso nos dá um pouco mais de informação sobre como podemos mostrar esta página nos resultados da pesquisa. Desse ponto de vista, acho que os comentários são uma coisa boa em uma página. Obviamente, encontrar uma maneira de mantê-los de maneira razoável às vezes é complicado porque as pessoas também enviam spam para esses comentários […]. Se você puder encontrar uma maneira de manter comentários em uma página da web, isso lhe dará um pouco mais de contexto e ajudará as pessoas que estão pesquisando de maneiras diferentes a encontrar seu conteúdo”.

Googlebot e rolagem infinita

24:00 “[…] Você sabe se o Googlebot já é avançado o suficiente para lidar com a rolagem infinita , ou pelo menos algo em que o conteúdo continua se transformando em algo?”

João disse: “ Um pouco […].

O que acontece quando renderizamos uma página é que usamos uma janela de visualização bastante alta, como se você tivesse uma tela muito longa, e renderizamos a página para ver o que a página mostraria lá. Normalmente, isso acionaria uma certa quantidade de rolagem infinita em quaisquer métodos JavaScript que você esteja usando para acionar a rolagem infinita. O que quer que acabe sendo carregado lá, seria o que poderíamos indexar.

[…] Dependendo de como você implementa a rolagem infinita, pode acontecer que tenhamos essa página mais longa no índice. Pode não ser que tenhamos tudo o que caberia nessa página. Porque dependendo de como você aciona a rolagem infinita, pode ser que você esteja apenas carregando a próxima página. Então podemos ter duas ou três dessas páginas carregadas em uma página com rolagem infinita, mas não tudo. […] Eu recomendaria testar isso com a ferramenta [URL] Inspeção e ver quanto o Google pegaria”.

Atualizar e descobrir dados no relatório de estatísticas de rastreamento

33:32 “No relatório Search Console [ Estatísticas de rastreamento ], 97% das solicitações do rastreador são de atualização e apenas 3% são de descoberta. Como otimizar isso e deixar o Google descobrir mais páginas?”

John respondeu: “[…] É normal que […] um site mais antigo e mais estabelecido tenha muito rastreamento de atualização porque veremos a quantidade de páginas que conhecemos que cresce com o tempo. E a quantidade de novas páginas que chegam tende a ser bastante estável. É bastante comum, especialmente para um site que está meio estabelecido e crescendo lentamente, ter um equilíbrio como esse, que a maior parte do rastreamento seja no rastreamento de atualização e não tanto no rastreamento de descoberta.

Eu acho que seria diferente se você tivesse um site […] onde você tem muitos artigos novos que chegam, e o conteúdo antigo se torna irrelevante muito rapidamente. Então acho que tenderíamos a nos concentrar mais na descoberta. […] Se você tem algo como um site de comércio eletrônico, onde você está apenas aumentando a quantidade de conteúdo lentamente, e a maior parte do conteúdo antigo permanece válida, […] a quantidade de rastreamento de atualização provavelmente vai aumentar ser um pouco mais alto”.

Rastreamento reduzido de um site

35:09 “Durante as últimas semanas, notei uma grande queda nas estatísticas de rastreamento, de 700 para 50 por dia. Existe uma maneira de entender no relatório do Search Console qual poderia ser a causa dessa queda? Poderia ser o carregamento da página de origem? Como posso ler corretamente o detalhamento da solicitação de rastreamento?”

John forneceu uma explicação detalhada de como o Google rastreia sites e quais fatores afetam o rastreamento: “[…] Existem algumas coisas que influenciam a quantidade de rastreamento que fazemos.

[…] Tentamos descobrir quanto precisamos rastrear de um site para manter as coisas atualizadas e úteis em nossos resultados de pesquisa. E isso depende da compreensão da qualidade do seu site, como as coisas mudam no seu site. Chamamos isso de demanda de rastreamento.

Por outro lado, existem as limitações que vemos do seu servidor, […] site, […] infraestrutura de rede em relação ao quanto podemos rastrear em um site. Tentamos equilibrar esses dois.

E as restrições tendem a estar vinculadas a duas coisas principais: […] o tempo geral de resposta às solicitações

ao site e […] o número de […] erros de servidor que vemos durante o rastreamento. Se virmos muitos erros de servidor, desaceleraremos o rastreamento […]. Se percebermos que seu servidor está ficando mais lento, também diminuiremos o rastreamento […].

A dificuldade com o aspecto da velocidade é que temos duas […] maneiras diferentes de ver a velocidade. Às vezes, isso fica confuso quando você observa a taxa de rastreamento. Especificamente para a taxa de rastreamento, apenas analisamos, com que rapidez podemos solicitar um URL do seu servidor?

E o outro aspecto da velocidade que você provavelmente encontra é tudo em torno do Core Web Vitals e a rapidez com que uma página é carregada em um navegador. A velocidade que leva em um navegador tende a não estar relacionada diretamente à velocidade que leva para buscar um URL individual em um site. Porque em um navegador, você precisa processar o JavaScript, extrair todos esses arquivos externos, renderizar o conteúdo, recalcular as posições de todos os elementos na página. E isso leva um tempo diferente do que apenas buscar esse URL.

[…] Se você estiver tentando diagnosticar uma alteração na taxa de rastreamento, não olhe quanto tempo leva para uma página ser renderizada. […] Veja apenas quanto tempo leva para buscar essa URL do servidor.

A outra coisa […] é que […] a gente tenta entender onde o site está hospedado […]. Se reconhecermos que um site está mudando de hospedagem de um servidor para um servidor diferente – pode ser para um provedor de hospedagem diferente, […] migrando para um CDN ou alterando CDNs […] – nossos sistemas retornarão automaticamente para alguns taxa segura onde sabemos que não vamos causar nenhum problema e então, passo a passo, aumentamos novamente.

Sempre que você fizer uma mudança maior na hospedagem do seu site, presumo que a taxa de rastreamento cairá. E nas próximas semanas, ele voltará ao que achamos que podemos rastrear com segurança em nosso site. Isso pode ser algo que você está vendo aqui.

A outra coisa é que, de tempos em tempos, nossos algoritmos para determinar como classificamos sites e servidores […] também podem ser atualizados. […] Mesmo que você não altere nada em sua infraestrutura de hospedagem, nossos algoritmos tentarão descobrir [que] este site está hospedado neste servidor, e esse servidor é frequentemente sobrecarregado. Devemos ser mais cautelosos ao rastrear este site para que não causemos problemas. Isso é algo que também se estabiliza automaticamente ao longo do tempo, geralmente em algumas semanas [...].

[…] No [Google] Search Console, você pode especificar uma taxa de rastreamento […] e isso nos ajuda a entender que você tem configurações específicas […] para seu site e tentaremos levar isso em consideração. A dificuldade com a configuração da taxa de rastreamento é que ela é uma configuração máxima. Não é um sinal de que devemos rastrear tanto quanto isso, mas sim que devemos rastrear no máximo o que você especificar lá. Normalmente, essa configuração é mais útil quando você precisa reduzir a quantidade de rastreamento, não quando deseja aumentar a quantidade de rastreamento.

[…] Uma coisa que você também pode fazer é, na Central de Ajuda do Search Console, temos um link para relatar problemas com o Googlebot. Se você perceber que o rastreamento do seu site está fora do alcance do que você esperava, você pode relatar problemas com o Googlebot por meio desse link […]”.

Como o Google identifica os países segmentados por páginas

56:25 “[…] Quanto à segmentação geográfica, além de usar hreflang, como o Google descobre qual [país] você está segmentando [com] este site específico ou o subdiretório específico?”

A resposta de John foi: “ Tentamos agrupar URLs por padrões claros que podemos reconhecer […], por exemplo, por subdomínio ou subdiretório. Se você tem o país no subdiretório em um lugar mais alto em um caminho, então é muito mais fácil para nós dizer, tudo sob este caminho é para este país, tudo sob este outro caminho é para outro país.

Você também pode verificar caminhos individuais no Search Console […], o que facilita um pouco para nós. Na prática, não ouço muitos comentários de pessoas dizendo que isso faz uma grande diferença.

[…] Eu tentaria deixar […] o mais claro possível qual país é relevante para as URLs individuais, com um caminho claro na URL. Acho que também houve uma pergunta que alguém enviou sobre o uso do país como um parâmetro de URL no final. Teoricamente, você pode fazer isso [...]. Para nossos sistemas, fica muito mais difícil reconhecer quais URLs pertencem a qual país […]. Se você estiver usando hreflang, então isso é um problema menor, porque você pode fazer isso por URL”.

Grande número de URLs marcados como Descobertos – atualmente não indexados

58:25 “[…] Somos um enorme site de comércio eletrônico e, conforme verificamos nosso relatório de rastreamento, descobrimos que há uma grande quantidade de URLs na seção [ Descobertos – atualmente não indexados ] […]. Isso é uma indicação de [um] problema [em nosso site] […]?”

John disse: “ Acho que depende de quais são essas páginas e como você as usa em seu site. […] Encontramos todos os tipos de URLs na web e muitos desses URLs não precisam ser rastreados e indexados, porque talvez sejam apenas variações de URLs que já conhecemos, ou […] algum fórum aleatório ou scraper script copiou URLs do seu site e os incluiu de forma quebrada. […] É muito normal ter muitos desses URLs que são rastreados e não indexados ou descobertos e não rastreados, apenas porque existem tantas fontes diferentes de URLs na web.

[…] Tente baixar […] uma amostra desses, para que você possa ver exemplos individuais e […] classificar quais desses URLs são aqueles que você se importa e quais […] são os que você pode ignorar.

[…] Aqueles com os quais você se importa, é algo em que eu tentaria descobrir o que você poderia fazer para melhor vinculá-los ao seu site em relação a coisas como links internos. Portanto, se esses são produtos ou categorias individuais que não estão sendo encontrados, tente descobrir o que você pode fazer de maneira sistemática para garantir que todos esses URLs estejam melhor vinculados entre si. […] Especialmente com um site de comércio eletrônico maior, pode ser complicado, porque você não pode olhar para cada URL individualmente o tempo todo.

Mas, às vezes, há truques que você pode fazer onde diz: qualquer coisa que seja categoria de primeiro nível, eu vinculo a ela na minha página inicial. E eu me certifico de que minha categoria de primeiro nível tenha no máximo […] talvez 100 itens ou 200 itens, para que você tenha um pouco de função de forçar em termos do que você dá ao Google para rastrear e indexar. Com base nisso, você pode construí-lo um pouco mais sistematicamente.

[…] Até certo ponto, eu apenas aceitaria que o Google não pode rastrear e indexar tudo. […] Se você reconhecer, por exemplo, que […] produtos individuais não estão sendo rastreados e indexados, certifique-se de que pelo menos a página de categoria desses produtos seja rastreada e indexada. Porque dessa forma, as pessoas ainda podem encontrar algum conteúdo para esses produtos individuais em seu site […].

Veja se você mesmo pode rastrear seu site para ter um pouco mais de dados diretos de como um site como o seu pode ser rastreado. Existem várias ferramentas de rastreamento por aí. […] Ao rastrear o site você mesmo, você pode ver quais dessas URLs estão vinculadas muito longe da página inicial e quais delas estão vinculadas mais próximas à sua página inicial. E com base nisso, às vezes você pode ajustar um pouco a estrutura do site para ter certeza de que as coisas estão razoavelmente próximas ou razoavelmente estáveis, com relação à distância da sua página inicial”.