Lo que reveló la filtración del código fuente de Yandex sobre los motores de búsqueda
Publicado: 2023-02-17¿Alguna vez se preguntó qué hay dentro de los gigantes de los motores de búsqueda como Google, Bing y Yahoo?
El 27 de enero de 2023, el cuarto motor de búsqueda más grande del mundo, Yandex, llegó a los principales titulares después de una fuga de datos masiva (44 GB para ser exactos).
“Entonces, el motor de búsqueda más popular en Rusia sufrió una brecha. ¿Cómo es relevante para mí?” Tu puedes preguntar.
Lo que muchos canales de noticias rechazaron como un acto malicioso contra la empresa y la seguridad de los datos de los clientes, los expertos digitales lo evaluaron como una visión poco común de cómo funcionan los motores de búsqueda.
Y lo que es más importante, qué contenido priorizan y por qué.
La fuga de datos hizo público lo que inicialmente pensamos que eran 1922 factores de clasificación, pero gracias a Ben Wills, el número se corrigió a 17 853. Masivo, ¿verdad?

Pasamos por todos los 1.992.
Siga leyendo para ver lo que encontramos más interesante.
¿Puedo usar los aprendizajes de la filtración de Yandex para obtener una clasificación más alta en Google?
No hace falta decir que Yandex no es Google.
Pero varios factores notables hacen que esta filtración sea relevante (y educativa) fuera de Rusia y dentro de sus experimentos de clasificación de búsqueda:
- Hay ~70% de coincidencia entre los resultados de búsqueda de Yandex y Google
- Yandex usa PageRank (casi idéntico al de Google)
- Yandex emplea a muchos ex-Googlers, y muchos especulan que fue diseñado de manera similar.
- Yandex sigue las mejores prácticas de recuperación de información similares a las de Google, como el índice de inversión o las incrustaciones.
- Al igual que los motores de búsqueda de Google y Bing, Yandex utiliza la función de clasificación Okapi BM25 para estimar la relevancia de los documentos para una consulta de búsqueda determinada.

Dicho esto, lo que revela la filtración del código fuente de Yandex nos ayuda, por primera vez, a diferenciar mejor entre asumir y saber cómo funcionan las clasificaciones de búsqueda.
Dentro de la fuga de código de Yandex: 11 hallazgos sobre cómo funcionan los motores de búsqueda
En general, los factores de clasificación de Yandex se pueden dividir en tres categorías:
- Factores estáticos como backlinks entrantes, enlaces internos entrantes, encabezados, proporción de anuncios, etc. Estos se relacionan con su sitio web.
- Factores dinámicos como la relevancia del texto, la inclusión de palabras clave, etc. Estos se relacionan tanto con su sitio web como con la consulta de búsqueda.
- Factores relacionados con la búsqueda del usuario, como la ubicación del usuario, el idioma de consulta, los modificadores de intención, etc. Estos se relacionan directamente con la consulta del usuario.
Los mayores factores de ponderación utilizados en los modelos estadísticos son:

1. Publicidad en la página
La publicidad en una página se ve como un factor negativo. De hecho, es el factor con mayor peso negativo en el ranking:

Múltiples factores relacionados con los anuncios, como la cantidad de ubicaciones de anuncios en la página y si se puede hacer clic en el fondo, sugieren que a Yandex no le gustan las páginas con una alta proporción de anuncios en la pantalla visible.
2. Factores de nivel de URL
La construcción de la URL es otro factor que Yandex tiene en cuenta. Y mas especificamente:
- La presencia de números en la URL.
- El número de barras inclinadas ("/") en la URL
- El número de letras mayúsculas en la URL
Volviendo al argumento de que Yandex no es Google, y esta filtración no será valiosa, bueno, estos factores de URL se parecen mucho a los de las pautas de estructura de URL de Google.
3. Factores de nivel de página
Hay mucho que desarrollar aquí. Resulta que Yandex tiene numerosos factores a nivel de página que juegan un papel en la construcción del SERP. Algunos de los más notables incluyen:
- Actualización de la página , especialmente para contenido de blogs y sitios web de noticias. Es un factor de clasificación negativo si una página de contenido tiene más de 10 años. Así que actualice su contenido con frecuencia.
- Último destino : Yandex recompensa las páginas que finalizan el viaje de búsqueda del usuario, lo que significa que ha encontrado lo que busca.
- Proporción de fuente de tráfico saludable : a Yandex no le gustan las páginas que obtienen tráfico de una sola fuente (por ejemplo, búsqueda orgánica). Para que una página tenga una clasificación alta, necesita obtener tráfico de todo tipo de fuentes: orgánica, paga, directa, etc.
- Calidad del contenido : es esencial que su texto sea original y no esté lleno de palabras clave. Es un impulso de clasificación si su texto ha sido citado/enlazado en dominios externos. Además, tener contenido de mala calidad reducirá la clasificación del contenido de buena calidad.
4. Factores a nivel del sitio web
Sobre la base del factor de frescura de la página, la mejor combinación sería tener un sitio web bien establecido que haya estado activo durante mucho tiempo y actualice su contenido con frecuencia.
Además, Yandex juzga la calidad general de un sitio web por su perspectiva de capacidad de clic. En otras palabras, ¿con qué frecuencia los usuarios hacen clic en la URL para la búsqueda?
Otro factor de clasificación positivo es el nombre de dominio. Yandex da un impulso de clasificación a los dominios .COM.
5. Calidad de la página
Ya hemos discutido la calidad del contenido, pero ¿qué pasa con la calidad general de la página? Bueno, Yandex evalúa la calidad de una página en función de varios factores:

- Número de visitas
- Número de visitantes únicos
- Tiempo de permanencia en una página
- Número de acciones realizadas en una página
6. Comportamiento y compromiso del usuario
Hubo varias conclusiones interesantes sobre el comportamiento de los usuarios a partir de la filtración que debemos analizar.
Un factor clave es la cantidad de clics e impresiones que recibe un host en general. Yandex también tiene en cuenta si una página es compatible con dispositivos móviles y analiza el comportamiento de los usuarios en los dispositivos móviles, incluida la duración de la sesión y el tiempo que pasan en la página. Además, cuando los visitantes regresan a un sitio web en el mismo mes, eso es un factor de clasificación positivo.
Pero probablemente la más fascinante es que:
Las páginas que cuentan con reseñas de usuarios tienen prioridad en los resultados de búsqueda.
7. Clasificación y ubicación del anfitrión
Yandex pone mucho énfasis en priorizar el contenido que está geográficamente cerca del usuario. Entonces, cuando dos nombres de dominio luchan por la misma consulta de búsqueda, el que está más cerca del usuario obtendrá un impulso en la clasificación.
En términos de factores de clasificación técnica, reducir la cantidad de 400 errores del cliente y 500 errores del servidor lo pondrá por delante en el SERP. Además de eso, Yandex presta mucha atención a la profundidad de rastreo. Por eso, asegúrese de que ninguna página importante esté a más de dos clics de distancia de su página de inicio.
8. Calidad de los vínculos de retroceso
Yandex emplea varias medidas para penalizar la creación de cadenas de referencia, que inflan artificialmente la popularidad de un sitio web.
Una de esas medidas es analizar el porcentaje de texto con hipervínculos, ya que los enlaces excesivos pueden indicar un comportamiento de manipulación. También considera la calidad de los enlaces que dirigen a un sitio y penaliza los sitios con una gran cantidad de enlaces pagados o de baja calidad.
Hablando de la calidad del enlace, los factores que contribuyen directamente a la calidad del enlace son la cantidad de redireccionamientos y cómo se construyen los enlaces.
9. Impacto en el tráfico de búsqueda
Al igual que Google, los sitios web que incorporan buenas prácticas de SEO funcionan mejor que los que no lo hacen. Ser fácilmente reconocible es una forma segura de lograr una clasificación más alta en Yandex.
Como era de esperar, las páginas que pueden servir a la intención de búsqueda son las líderes de la consulta de búsqueda respectiva. Las páginas con la consulta de búsqueda exacta en su etiqueta de título y texto del cuerpo tienen una ventaja. Además, el uso de sinónimos es otra señal positiva que puede conducir a un aumento en la clasificación.
10. Impulso de Wikipedia
Otra señal fuerte para una página de alta calidad es si está enlazada desde Wikipedia. Yandex favorece las páginas que están vinculadas desde Wikipedia y las clasifica más alto.
11. Contenido de vídeo
Se priorizan los sitios web que contienen contenido de video. Pero hay una trampa, Yandex clasifica páginas más altas con videos alojados por Yandex (duh).
En cuanto a la evaluación del contenido de video de una página, se aplican las medidas estándar: cuál es el tiempo de reproducción promedio en comparación con la duración total del video.
Y si bien estos 11 hallazgos proporcionaron algunas ideas excelentes, hubo cierto debate en el mundo del SEO sobre si los datos filtrados son valiosos o no.
Reacciones a los factores de clasificación filtrados en el mundo SEO
Desde el despido total hasta el análisis en profundidad, los SEO expresaron opiniones encontradas sobre la filtración de Yandex.
Kevin Indig resumió las objeciones más comunes y ofreció un gran aporte sobre la importancia de los factores de clasificación.

Fragmento del artículo "Los SEO están subestimando la fuga de Yandex" por Kevin Indig
Nombres notables en el campo de SEO, como Ben Wills, Alex Buraks y Mic King, se arremangaron y se sumergieron profundamente para decodificar los datos filtrados.
Ben Wills es uno de los primeros expertos en dar sentido al código fuente y ayudarnos a comprender la importancia del evento (aunque abrió el hilo de Twitter un poco más tarde).

Casi al mismo tiempo, Rob Ousbey compartió una versión alfa de una herramienta de exploración para el código de Yandex:

Mic King compartió sus primeras impresiones en vivo mientras revisaba el código fuente y nos dijo: "No se duerman con este código".

Los foros de SEO en Rusia no estaban menos concurridos, y los webmasters tenían una idea similar para compartir con el mundo occidental de SEO. Sin embargo, también se habló mucho de que Yandex favorecía sus productos y servicios, como lo cubrió el experto en SEO ruso Dan Taylor.
Conclusión
¿La fuga del código fuente de Yandex cambiará la forma en que haces SEO?
Probablemente no.
Pero sería un gran error etiquetarlo como no importante y pasarlo por alto.
Aparentemente, hay muchas similitudes entre Yandex y Google. Por lo tanto, esta filtración puede servir como un excelente punto de partida para más experimentos y empujarlo a concentrarse aún más en la experiencia del usuario y el contenido de calidad.
Así que anímate y empieza a probar.
