Horario de oficina de SEO, 18 de febrero de 2022

Publicado: 2022-02-28

Este es un resumen de las preguntas y respuestas más interesantes del Google SEO Office Hours con John Mueller el 18 de febrero de 2022.

ocultar contenido

1 Tipos de sitios web afectados por la actualización de Product Reviews

2 El uso de la API de indexación

3 EAT y los algoritmos de Google

4 Menciones de marca no vinculadas y contenido generado por el usuario

5 Googlebot y desplazamiento infinito

6 Actualizar y descubrir datos en el informe de estadísticas de rastreo

7 Rastreo reducido de un sitio web

8 Cómo identifica Google los países a los que se dirigen las páginas

9 Grandes cantidades de URL marcadas como descubiertas, actualmente no indexadas

Tipos de sitios web afectados por la actualización de Reseñas de productos

4:03 “[…] Mi pregunta es sobre la actualización de las reseñas de productos […]. Quería saber cómo identifica Google si una página o un sitio está relacionado con reseñas de productos. […] Por ejemplo, hay un sitio de comercio electrónico […] y también tienen un blog donde revisan sus propios productos. Escriben sobre los pros y los contras de sus productos, comparan diferentes productos. […] ¿Dirá Google que […] esto también son reseñas de productos y se pueden analizar mediante la actualización de reseñas de productos? […]”

Como explicó John, “[…] Las recomendaciones que tenemos para las revisiones de productos […] serían relevantes para cualquier tipo de revisión de productos. Así que no necesariamente trataría de ver si Google cree que mi sitio es un sitio de revisión de productos o no […]. Pero más bien, si cree que estas buenas prácticas se aplicarían a su contenido, simplemente practique esas buenas prácticas […]”.

El uso de la API de indexación

6:53 “[…] [La documentación de Google] menciona que la API de indexación debe usarse para páginas como publicación de trabajos o transmisión de eventos. ¿Es posible que podamos probar esta API para diferentes tipos de contenido, como algunos artículos de noticias o contenido de blogs?

John respondió: “La gente lo prueba. Pero esencialmente, lo que hemos documentado es para lo que usamos la API. Si no tiene contenido que entre en esas categorías, entonces la API no lo ayudará allí”.

EAT y los algoritmos de Google

10:54 "[...] EAT se menciona en [ Quality Rater Guidelines ], pero quiero saber si los algoritmos reales también [incluyen] factores EAT como la experiencia del autor".

John dijo: “Supongo que se realiza algún trabajo indirecto para tratar de hacer cosas similares. […] Ponemos esto en las pautas para que podamos guiar a los probadores de calidad para que verifiquen dos veces estas cosas. Y si pensamos que es algo importante, entonces asumiría que la gente del lado de la calidad de búsqueda también trabaja para tratar de entender eso de una manera más algorítmica.

Pero no vería […] [que habría] un puntaje EAT, y tienes que obtener cinco o algo así. Es más tratar de entender el contexto del contenido en la web”.

Menciones de marca no vinculadas y contenido generado por el usuario

12:01 “[…] Veo que la gente habla de menciones de marca no vinculadas […]. ¿Crees que también es importante para los algoritmos [de Google] […]?”

Por menciones de marca no vinculadas, la persona se refería a situaciones en las que otros sitios mencionan su marca pero no incluyen un vínculo a su sitio web.

John dijo: “[…] Creo que eso es un poco complicado, porque realmente no sabemos cuál es el contexto. No creo que sea algo malo […] para los usuarios porque si pueden encontrar su sitio web a través de esa mención, eso siempre es algo bueno. Pero no asumiría que hay algún […] factor de SEO que está tratando de averiguar dónde alguien menciona el nombre de su sitio web”.

12:58 “[…] ¿Qué pasa con las reseñas o comentarios de los usuarios? ¿Crees que también es un factor de clasificación para un artículo o producto?”

John respondió que “[…] A menudo, las personas escriben sobre la página con sus propias palabras y eso nos brinda un poco más de información sobre cómo podemos mostrar esta página en los resultados de búsqueda. Desde ese punto de vista, creo que los comentarios son algo bueno en una página. Obviamente, encontrar una manera de mantenerlos de manera razonable a veces es complicado porque la gente también envía spam a esos comentarios […]. Si puede encontrar una manera de mantener comentarios en una página web, eso le brinda un poco más de contexto y ayuda a las personas que buscan de diferentes maneras a encontrar su contenido también”.

Googlebot y desplazamiento infinito

24:00 "[...] ¿Sabes si Googlebot es lo suficientemente avanzado como para manejar el desplazamiento infinito , o al menos algo donde el contenido sigue construyéndose en algo?"

Juan dijo: “ Un poquito […].

Lo que sucede cuando renderizamos una página es que usamos una ventana gráfica bastante alta, como si tuviera una pantalla muy larga, y renderizamos la página para ver qué mostraría allí. Por lo general, eso activaría una cierta cantidad de desplazamiento infinito en cualquier método de JavaScript que esté utilizando para activar el desplazamiento infinito. Lo que sea que termine cargándose allí, eso sería lo que podríamos indexar.

[…] Dependiendo de cómo implemente el desplazamiento infinito, puede suceder que tengamos esta página más larga en el índice. Puede que no tengamos todo lo que cabría en esa página. Porque dependiendo de cómo active el desplazamiento infinito, es posible que solo esté cargando la página siguiente. Entonces podríamos tener dos o tres de estas páginas cargadas en una página con desplazamiento infinito, pero no todo. […] Recomendaría probar eso con la herramienta de inspección [URL] y solo ver cuánto recogería Google”.

Actualizar y descubrir datos en el informe de estadísticas de rastreo

33:32 “En el informe [ Estadísticas de rastreo ] de Search Console , el 97 % de las solicitudes del rastreador son de actualización y solo el 3 % son de descubrimiento. ¿Cómo optimizar esto y dejar que Google descubra más páginas?

John respondió: “[…] Es normal que […] un sitio web más antiguo y más establecido tenga mucho rastreo de actualización porque veremos la cantidad de páginas que conocemos que crecen con el tiempo. Y la cantidad de páginas nuevas que ingresan tiende a ser bastante estable. Es bastante común, especialmente para un sitio web que está algo establecido y que está creciendo lentamente, tener un equilibrio como este, que la mayor parte del rastreo se realiza en el rastreo de actualización y no tanto en el rastreo de descubrimiento.

Creo que sería diferente si tuvieras un sitio web […] donde tienes muchos artículos nuevos que ingresan, y el contenido anterior se vuelve irrelevante muy rápidamente. Entonces creo que tenderíamos a centrarnos más en el descubrimiento. […] Si tiene algo así como un sitio de comercio electrónico, donde la cantidad de contenido que tiene aumenta lentamente, y la mayor parte del contenido antiguo sigue siendo válido, […] la cantidad de rastreo de actualización [es] probablemente va a ser un poco más alto”.

Rastreo reducido de un sitio web

35:09 “Durante las últimas semanas, noté una gran caída en las estadísticas de rastreo, de 700 a 50 por día. ¿Hay alguna manera de entender a partir del informe de Search Console cuál podría ser la causa de esta caída? ¿Podría ser la carga de la página de origen? ¿Cómo puedo leer correctamente el desglose de la solicitud de rastreo?

John proporcionó una explicación detallada de cómo rastrea Google los sitios web y qué factores afectan el rastreo: “[…] Hay algunas cosas que influyen en la cantidad de rastreo que hacemos.

[…] Tratamos de averiguar cuánto necesitamos rastrear desde un sitio web para mantener las cosas frescas y útiles en nuestros resultados de búsqueda. Y eso se basa en comprender la calidad de su sitio web, cómo cambian las cosas en su sitio web. A eso lo llamamos la demanda de rastreo.

Por otro lado, [existen] las limitaciones que vemos en su servidor, […] sitio web, […] infraestructura de red con respecto a cuánto podemos rastrear en un sitio web. Tratamos de equilibrar esos dos.

Y las restricciones tienden a estar vinculadas a dos cosas principales: […] el tiempo de respuesta general a las solicitudes

al sitio web, y […] la cantidad de […] errores del servidor que vemos durante el rastreo. Si vemos muchos errores del servidor, ralentizaremos el rastreo […]. Si vemos que su servidor se está volviendo más lento, también ralentizaremos el rastreo […].

La dificultad con el aspecto de la velocidad es que tenemos dos […] formas diferentes de ver la velocidad. A veces eso se vuelve confuso cuando observas la frecuencia de rastreo. Específicamente para la tasa de rastreo, solo observamos qué tan rápido podemos solicitar una URL de su servidor.

Y el otro aspecto de la velocidad con el que probablemente te encuentres es todo lo relacionado con Core Web Vitals y la rapidez con la que se carga una página en un navegador. La velocidad que tarda un navegador tiende a no estar directamente relacionada con la velocidad que tardamos en obtener una URL individual en un sitio web. Porque en un navegador, debe procesar el JavaScript, extraer todos estos archivos externos, representar el contenido, recalcular las posiciones de todos los elementos en la página. Y eso toma una cantidad de tiempo diferente a simplemente obtener esa URL.

[…] Si está tratando de diagnosticar un cambio en la tasa de rastreo, entonces no mire cuánto tarda en procesarse una página. […] Mire simplemente cuánto tiempo se tarda en obtener esa URL del servidor.

La otra cosa […] es que […] tratamos de entender dónde está alojado el sitio web […]. Si reconocemos que un sitio web está cambiando el alojamiento de un servidor a otro servidor, que podría ser a un proveedor de alojamiento diferente, […] moviéndose a un CDN o cambiando de CDN […], entonces nuestros sistemas volverán automáticamente a algún tasa segura donde sabemos que no vamos a causar ningún problema y luego, paso a paso, aumentar de nuevo.

Cada vez que realice un cambio mayor en el alojamiento de su sitio web, supongo que la tasa de rastreo disminuirá. Y luego, durante las próximas dos semanas, volverá a lo que creamos que podemos rastrear de manera segura en nuestro sitio web. Eso podría ser algo que estás viendo aquí.

La otra cosa es que, de vez en cuando, nuestros algoritmos para determinar cómo clasificamos sitios web y servidores […] también pueden actualizarse. […] Incluso si no cambia nada con su infraestructura de alojamiento, nuestros algoritmos intentarán averiguar [que] este sitio web está alojado en este servidor, y este servidor es uno que se sobrecarga con frecuencia. Deberíamos ser más cautelosos con el rastreo de este sitio web para no causar ningún problema. Eso es algo que también se establece automáticamente con el tiempo, generalmente en un par de semanas […].

[…] En [Google] Search Console, puede especificar una frecuencia de rastreo […] y eso nos ayuda a comprender que tiene una configuración específica […] para su sitio web y trataremos de tener eso en cuenta. La dificultad con la configuración de la frecuencia de rastreo es que es una configuración máxima. No es una señal de que debamos rastrear tanto como eso, sino que debemos rastrear como máximo lo que especifique allí. Por lo general, esa configuración es más útil para los momentos en que necesita reducir la cantidad de rastreo, no cuando desea aumentar la cantidad de rastreo.

[…] Una cosa que también puede hacer es que, en el Centro de ayuda de Search Console, tenemos un enlace para informar problemas con Googlebot. Si nota que el rastreo de su sitio web está fuera del rango esperado, entonces puede informar problemas con Googlebot a través de ese enlace […]”.

Cómo identifica Google los países a los que se dirigen las páginas

56:25 "[...] En cuanto a la segmentación geográfica, además de usar hreflang, ¿cómo averigua Google a qué [país] te estás dirigiendo [con] este sitio web específico o el subdirectorio específico?"

La respuesta de John fue: “ Intentamos agrupar las URL por patrones claros que podamos reconocer […], por ejemplo, por subdominio o por subdirectorio. Si tiene el país en el subdirectorio en un lugar más alto en una ruta, entonces es mucho más fácil para nosotros decir, todo lo que está en esta ruta es para este país, todo lo que está en esta otra ruta es para otro país.

También puede verificar rutas individuales en Search Console […], lo que nos lo hace un poco más fácil. En la práctica, no escucho muchos comentarios de personas que digan que esto hace una gran diferencia.

[…] Intentaría dejar […] lo más claro posible qué país es relevante para las URL individuales, con una ruta clara en la URL. Creo que alguien también envió una pregunta sobre el uso del país como parámetro de URL al final. Teóricamente, puedes hacer eso […]. Para nuestros sistemas, hace que sea mucho más difícil reconocer qué URL pertenecen a qué país […]. Si está utilizando hreflang, entonces ese es un problema menor allí, porque puede hacerlo por URL”.

Grandes cantidades de URL marcadas como descubiertas, actualmente no indexadas

58:25 “[…] Somos un gran sitio de comercio electrónico y cuando revisamos nuestro informe de rastreo, descubrimos que hay una gran cantidad de URL en la [ sección Descubierta: actualmente no indexada ] […]. ¿Es esto una indicación de [un] problema [en nuestro sitio] […]?”

John dijo: “ Creo que depende de qué son esas páginas y cómo las usa dentro de su sitio web. […] Encontramos todo tipo de URL en la web y muchas de esas URL no necesitan ser rastreadas e indexadas, porque tal vez sean solo variaciones de las URL que ya conocemos, o […] algún foro aleatorio o raspador script ha copiado las URL de su sitio web y las ha incluido de forma rota. […] Es muy normal tener muchas de estas URL que se rastrean y no se indexan o se descubren y no se rastrean, solo porque hay muchas fuentes diferentes de URL en la web.

[…] Intente descargar […] una muestra de ellos, para que pueda ver ejemplos individuales, y […] clasifique cuáles de esas URL son las que le interesan y cuáles […] son las que puede ignorar.

[…] Los que sí te importan, eso es algo en lo que intentaría averiguar qué podrías hacer para vincularlos mejor en tu sitio web con respecto a cosas como los enlaces internos. Entonces, si estos son productos individuales o categorías que no se encuentran, intente averiguar qué puede hacer de manera sistemática para asegurarse de que todas estas URL estén mejor vinculadas entre sí. […] Especialmente con un sitio de comercio electrónico más grande, puede ser complicado, porque no puedes mirar cada URL individualmente todo el tiempo.

Pero a veces, hay trucos que puedes hacer donde dices: cualquier cosa que sea de categoría de primer nivel, la enlazo desde mi página de inicio. Y me aseguro de que mi categoría de primer nivel tenga como máximo […] tal vez 100 elementos o 200 elementos, de modo que tenga un poco de función forzada en términos de lo que le da a Google para rastrear e indexar. En base a eso, puede construirlo un poco más sistemáticamente.

[…] Hasta cierto punto, simplemente aceptaría que Google no puede rastrear e indexar todo. […] Si reconoce, por ejemplo, que […] los productos individuales no se están rastreando ni indexando, asegúrese de que al menos la página de categoría de esos productos se rastree e indexe. Porque de esa manera, las personas aún pueden encontrar contenido para esos productos individuales en su sitio web […].

Vea si puede rastrear su sitio web usted mismo para tener un poco más de datos directos de cómo se puede rastrear un sitio web como el suyo. Hay varias herramientas de rastreo por ahí. […] Al rastrear el sitio web usted mismo, puede ver cuáles de estas URL están vinculadas muy lejos de la página de inicio y cuáles están vinculadas más cerca de su página de inicio. Y en base a eso, a veces puedes modificar un poco la estructura del sitio para asegurarte de que las cosas estén razonablemente cerca o razonablemente estables, con respecto a la distancia desde tu página de inicio”.