O que o vazamento do código-fonte Yandex revelou sobre os mecanismos de pesquisa

Publicados: 2023-02-17

Já se perguntou o que acontece dentro dos gigantes dos mecanismos de busca como Google, Bing e Yahoo?

Em 27 de janeiro de 2023, o quarto maior mecanismo de busca do mundo, o Yandex, alcançou as manchetes após um enorme vazamento de dados (44 GB para ser exato).

“Então, o mecanismo de busca mais popular da Rússia sofreu uma violação. Como isso é relevante para mim?” você pode perguntar.

O que muitos canais de notícias consideraram um ato malicioso contra a empresa e a segurança dos dados do cliente, especialistas digitais avaliaram como uma visão rara de como os mecanismos de busca operam.

E mais importante, qual conteúdo eles priorizam e por quê.

O vazamento de dados tornou público o que pensávamos inicialmente serem 1.922 fatores de classificação, mas graças a Ben Wills, o número foi corrigido para 17.853. Enorme, certo?

Tweet do Mic King no Yandex

Passamos por todos os 1.992.

Continue lendo para ver o que achamos mais interessante.


Posso usar os aprendizados do vazamento do Yandex para ter uma classificação mais alta no Google?

Escusado será dizer que o Yandex não é o Google.

Mas vários fatores notáveis ​​tornam esse vazamento relevante (e educacional) fora da Rússia e dentro de seus experimentos de classificação de pesquisa:

  • Há aproximadamente 70% de correspondência entre os resultados de pesquisa do Yandex e do Google
  • Yandex usa PageRank (quase idêntico ao do Google)
  • Yandex emprega muitos ex-Googlers, e muitos especulam que foi projetado de maneira semelhante
  • O Yandex segue práticas recomendadas de recuperação de informações semelhantes às do Google, como o índice invertido ou incorporações
  • Assim como os mecanismos de pesquisa Google e Bing, o Yandex usa a função de classificação Okapi BM25 para estimar a relevância dos documentos para uma determinada consulta de pesquisa

Tweet de Alex Buraks no Yandex

Dito isto, o que o vazamento do código-fonte do Yandex revela nos ajuda, pela primeira vez, a diferenciar melhor entre assumir e saber como funcionam as classificações de pesquisa.

Por dentro do vazamento de código Yandex: 11 descobertas sobre como os mecanismos de pesquisa operam

Geralmente, os fatores de classificação do Yandex podem ser divididos em três categorias:

  • Fatores estáticos , como backlinks de entrada, links internos de entrada, cabeçalhos, proporção de anúncios, etc. Eles estão relacionados ao seu site.
  • Fatores dinâmicos , como relevância do texto, inclusões de palavras-chave, etc. Eles estão relacionados ao seu site e à consulta de pesquisa.
  • Fatores relacionados à pesquisa do usuário, como localização do usuário, idioma da consulta, modificadores de intenção etc. Eles estão diretamente relacionados à consulta do usuário.

Os maiores fatores de ponderação usados ​​nos modelos estatísticos são:

Fatores de pesagem Yandex

1. Publicidade na página

A publicidade em uma página é vista como um fator negativo. Aliás, é o fator com maior peso negativo no ranking:

Mic King Tweet no peso dos fatores de classificação do Yandex

Vários fatores relacionados a anúncios, como o número de posicionamentos de anúncios na página e se o plano de fundo é clicável, sugerem que o Yandex não gosta de páginas com uma alta proporção de anúncios na tela visível.

2. Fatores de nível de URL

A construção da URL é outro fator que o Yandex leva em consideração. E mais especificamente:

  • A presença de números na URL.
  • O número de barras finais (“/”) no URL
  • O número de letras maiúsculas no URL

Voltando ao argumento de que o Yandex não é o Google, e esse vazamento não será valioso, bem, esses fatores de URL se assemelham muito aos das diretrizes de estrutura de URL do Google.


3. Fatores no nível da página

Há muito para revelar aqui. Acontece que o Yandex tem vários fatores no nível da página que desempenham um papel na construção da SERP. Alguns dos mais notáveis ​​incluem:

  • Atualização da página - especialmente para conteúdo de blog e sites de notícias. É um fator de classificação negativo se uma página de conteúdo tiver mais de 10 anos. Portanto, atualize seu conteúdo com frequência.
  • Último destino - o Yandex recompensa as páginas que encerram a jornada de pesquisa do usuário, o que significa que ele encontrou o que procurava.
  • Taxa de fonte de tráfego saudável - Yandex não gosta de páginas que recebem tráfego de uma única fonte (por exemplo, pesquisa orgânica). Para uma página ter uma classificação alta, ela precisa obter tráfego de todos os tipos de fontes - orgânica, paga, direta etc.
  • Qualidade do conteúdo - É fundamental que seu texto seja original e não recheado de palavras-chave. É um aumento de classificação se o seu texto foi citado/linkado em domínios externos. Além disso, ter conteúdo de baixa qualidade reduzirá a classificação do conteúdo de boa qualidade.

4. Fatores no nível do site

Com base no fator de atualização da página, a combinação final seria ter um site bem estabelecido que esteja ativo há muito tempo e atualize seu conteúdo com frequência.

Além disso, o Yandex julga a qualidade geral de um site por sua perspectiva de cliques. Em outras palavras, com que frequência os usuários clicam no URL para a pesquisa?

Outro fator de classificação positivo é o nome de domínio. O Yandex aumenta a classificação dos domínios .COM.


5. Qualidade da página

Já discutimos a qualidade do conteúdo, mas e a qualidade geral da página? Bem, o Yandex avalia a qualidade de uma página com base em vários fatores:

  • Número de visitas
  • Número de visitantes únicos
  • Tempo gasto em uma página
  • Número de ações realizadas em uma página

6. Comportamento e engajamento do usuário

Houve várias conclusões interessantes sobre o comportamento do usuário do vazamento que precisamos discutir.

Um fator chave é o número de cliques e impressões que um host recebe em geral. O Yandex também leva em consideração se uma página é compatível com dispositivos móveis e analisa o comportamento do usuário em dispositivos móveis, incluindo a duração da sessão e o tempo gasto na página. Além disso, quando os visitantes retornam a um site no mesmo mês, isso é um fator de classificação positivo.

Mas provavelmente o mais fascinante é que:

As páginas que apresentam avaliações de usuários têm prioridade nos resultados da pesquisa.

7. Classificação e localização do anfitrião

O Yandex enfatiza muito a priorização de conteúdo geograficamente próximo ao usuário. Portanto, quando dois nomes de domínio estão lutando pela mesma consulta de pesquisa, aquele que estiver mais próximo do usuário obterá um aumento na classificação.

Em termos de fatores de classificação técnica, reduzir o número de 400 erros de cliente e 500 erros de servidor o colocará à frente no SERP. Além disso, o Yandex presta muita atenção à profundidade do rastreamento. É por isso que certifique-se de que nenhuma página importante esteja a mais de dois cliques de sua página inicial.


8. Qualidade dos backlinks

Yandex emprega várias medidas para penalizar a criação de cadeias de referência, que aumentam artificialmente a popularidade de um site.

Uma dessas medidas é analisar a porcentagem de texto com hiperlink, pois links excessivos podem indicar comportamento manipulador. Também considera a qualidade dos links que direcionam para um site e penaliza sites com grande número de links pagos ou de baixa qualidade.

Falando em qualidade de link, os fatores que contribuem diretamente para a qualidade do link são o número de redirecionamentos e como os links são construídos.


9. Impacto no tráfego de pesquisa

Semelhante ao Google, sites que incorporam boas práticas de SEO têm melhor desempenho do que aqueles que não o fazem. Ser facilmente descoberto é uma maneira infalível de obter uma classificação mais alta no Yandex.

Sem surpresa, as páginas que podem atender à intenção de pesquisa são as líderes para a respectiva consulta de pesquisa. As páginas com a consulta de pesquisa exata em sua tag de título e corpo de texto têm uma vantagem. Além disso, o uso de sinônimos é outro sinal positivo que pode levar a um aumento no ranking.


10. Aumento da Wikipédia

Outro sinal forte para uma página de alta qualidade é se ela estiver vinculada à Wikipedia. O Yandex favorece as páginas com links da Wikipedia e as classifica mais alto.

11. Conteúdo de vídeo

Os sites que contêm conteúdo de vídeo são priorizados. Mas há um problema, Yandex classifica páginas mais altas com vídeos hospedados por Yandex (duh).

Em termos de avaliação do conteúdo de vídeo de uma página, aplicam-se as medidas padrão - qual é o tempo médio de exibição em relação à duração total do vídeo.

E embora todas essas 11 descobertas tenham fornecido ótimos insights, houve algum debate no mundo do SEO se os dados vazados são valiosos ou não.

Reações aos fatores de classificação vazados no mundo do SEO

Da rejeição total à análise aprofundada, os SEOs expressaram opiniões divergentes sobre o vazamento do Yandex.

Kevin Indig resumiu as objeções mais comuns e deu excelentes contribuições sobre a importância dos fatores de classificação.

Trecho do artigo de Kevin Indig sobre vazamento de dados do Yandex
Trecho do artigo “SEOs estão subestimando o vazamento do Yandex” por Kevin Indig

Nomes notáveis ​​no campo de SEO, como Ben Wills, Alex Buraks e Mic King, arregaçaram as mangas e mergulharam fundo para decodificar os dados vazados.

Ben Wills está entre os primeiros especialistas a entender o código-fonte e nos ajudar a entender o significado do evento (mesmo que ele tenha aberto o tópico no Twitter um pouco mais tarde).

Tweet de Ben Willis no yandex

Mais ou menos na mesma época, Rob Ousbey compartilhou uma versão alfa de uma ferramenta de exploração para o código Yandex:

Tweet de Rob Ousbey no Yandex

Mic King compartilhou suas primeiras impressões ao vivo enquanto analisava o código-fonte, dizendo-nos: “Não durma com este código”.

Tweet do Mic King no Yandex


Os fóruns de SEO na Rússia não eram menos lotados, e os webmasters tinham uma visão semelhante para compartilhar com o mundo ocidental de SEO. No entanto, também houve muita conversa sobre o Yandex favorecer seus produtos e serviços, conforme abordado pelo especialista em SEO russo Dan Taylor.

Conclusão

O vazamento do código-fonte do Yandex mudará a forma como você faz SEO?

Provavelmente não.

Mas será um grande erro rotulá-lo como não importante e passar por cima dele.

Aparentemente, existem muitas semelhanças entre o Yandex e o Google. Portanto, esse vazamento pode servir como um excelente ponto de partida para mais experimentos e incentivá-lo a se concentrar ainda mais na experiência do usuário e no conteúdo de qualidade.

Então junte-se a nós e comece a testar.