Horario de oficina de SEO, 12 de noviembre de 2021

Publicado: 2021-11-16

Este es un resumen de las preguntas y respuestas más interesantes del Google SEO Office Hours con John Mueller el 12 de noviembre de 2021.

ocultar contenido

1 páginas sin índice en Google Search Console

2 etiquetas canónicas y alternativas

3 Canonicalización o etiqueta noindex

4 Indexación y rastreo basados en dispositivos móviles

5 Tecnologías web vs ranking

6 Google PageSpeed Insights frente a Lighthouse

7 Descubrir Google

8 Tiempo de respuesta

Sin páginas de índice en Google Search Console

8:16 “ [Algunas páginas] se configuraron incorrectamente como noindex. Esto se solucionó hace un par de meses. […] Intentamos solicitar la indexación a través de Search Console [y] volver a enviar los mapas del sitio, pero aún así, no indexamos estas páginas. ¿Tiene alguna idea sobre qué podría hacer que Googlebot no escuche las solicitudes de indexación o si hay algún problema conocido en Search Console con la indexación?

John: “No creo que haya ningún problema conocido en ese sentido, pero a veces somos un poco conservadores con respecto al envío de solicitudes de indexación, que es probablemente en parte lo que está viendo allí. […] Por un lado, si vemos que una página no está indexada durante un período de tiempo más largo, generalmente disminuimos la velocidad con el rastreo de eso. […] También significa que cuando la página se vuelva indexable, volveremos a rastrear, por lo que es esencialmente ese tipo de impulso que debe hacer.

Otra cosa es que, dado que Search Console informa esencialmente sobre las URL que conocemos para el sitio web, es posible que la imagen se vea peor de lo que realmente es. Eso podría ser algo que podría ver, por ejemplo, mirando el Informe de rendimiento y filtrando esa sección del sitio web, o esos patrones de URL, para ver si esa cantidad de páginas sin índice alto en Search Console está informando sobre páginas que no eran realmente importantes y las páginas importantes de esas secciones en realidad están indexadas”.

John también afirmó que “[…] un mapa del sitio es esencialmente un buen comienzo, pero otra cosa que podría hacer es dejar en claro con enlaces internos que estas páginas son muy importantes para el sitio web para que podamos rastrearlas un poco más rápido. Puede ser un enlace interno temporal en el que diga: durante un par de semanas, enlazamos a productos individuales desde nuestra página de inicio. […] Esencialmente, cuando encontramos que el enlace interno ha cambiado significativamente, generalmente nos vamos y verificamos dos veces esas páginas también. Entonces, ese podría ser un enfoque temporal para empujar las cosas al índice nuevamente. Con los enlaces internos, no es que esté diciendo que estas son páginas importantes en la web, sino páginas importantes relacionadas con su sitio web. Entonces, si cambia significativamente el enlace interno, puede suceder que otras partes del sitio web, que tal vez apenas estaban indexadas, abandonen en algún momento. Es por eso que haría eso en un nivel temporal y diría, quiero volver a insertarlos en el sistema para que se vuelvan a rastrear a la velocidad normal, y luego volveré a cambiar el enlace interno para que todo vuelva a ser más normal. .”

Con respecto a agregar enlaces al pie de página, John agregó: “Creo que eso también funcionaría. Por lo general, es mejor si podemos encontrarlo en páginas realmente importantes del sitio web, generalmente como en su página de inicio, […] donde dice que esto es importante para usted, por lo tanto, revisaremos esa página dos veces. ”

Etiquetas canónicas y alternativas

14:25 “Estoy usando un sitio web de WordPress y estoy usando dos complementos. Uno [de ellos] agrega automáticamente un enlace rel="canónico" a cada página. […] [El otro es un complemento de traductor] que agrega [a] cada página un enlace rel="alternativo". ¿Es lógico que diga: para esa URL, es canónica, pero también es alternativa? ¿Hay algún conflicto en algún lugar del rastreador?

Juan dijo: “No. Quiero decir que no sé exactamente qué hacen estos dos complementos. Desde un punto de vista general, si tienes una página que tiene un rel=canonical, estás esencialmente con un dicho canónico: el enlace que se menciona allí es la URL preferida que quiero. Si es la misma página, entonces es perfecto porque entonces nos da confirmación de que esta página es la que desea indexar.

El rel="alternate" básicamente significa que también hay versiones alternativas de esta página. Entonces, con diferentes idiomas, por ejemplo, si tiene una página en inglés, una página en francés, tendría el enlace rel = "alternativo" entre esas dos versiones de idioma. Y no está diciendo que la página donde está ese enlace es la alternativa, sino que son dos versiones diferentes, una de ellas está en inglés y la otra en francés. Ambos pueden ser canónicos, por lo que tener esa combinación suele estar bien.

El único lugar para tener un poco de cuidado es que el canónico no debe estar en todos los idiomas. Entonces, no debería ser que en su página en francés, tenga un conjunto canónico para la versión en inglés porque son páginas esencialmente diferentes. Pero la página en francés puede ser canónica, y la página en inglés puede ser canónica, y tienes el enlace alternativo entre las dos, y ese es esencialmente un buen conjunto”.

Canonicalización o etiqueta noindex

16:49 “Tenemos un sitio web con una tienda de comercio electrónico con muchas variaciones de productos que tienen contenido delgado o duplicado. Hice una lista de todas las URL que queremos indexar […] y no queremos indexar. […] No estoy seguro de qué sería mejor: ¿canonicalización o no indexación?”

John dijo: “Creo que la pregunta general de si debo usar noindex o rel=”canonic” para otra página es algo para lo que probablemente no haya una respuesta absoluta. […] Si estás luchando con eso, no eres la única persona que dice, oh, ¿cuál debo usar? Eso también suele significar que ambas opciones pueden estar bien. Entonces, por lo general, lo que vería allí es cuál es su preferencia realmente fuerte. Si la preferencia fuerte es que realmente no desea que este contenido se muestre en absoluto en la búsqueda, entonces usaría noindex. Si tu preferencia es más, realmente quiero todo combinado en una sola página […], entonces usaría un rel="canónico". En última instancia, el efecto es similar en el sentido de que es probable que la página que está viendo no se muestre en la búsqueda, pero con un índice no se muestra definitivamente, y con un rel="canónico" es más probable que no se muestre. ”

John resumió: “ También puedes hacer ambas cosas. Si los enlaces externos, por ejemplo, apuntan a esta página, tener ambos allí nos ayuda a determinar bien si no desea que se indexe esta página, pero también especificó otra, por lo que tal vez algunas de las señales que podemos solo adelante.”

Indexación y rastreo basados en dispositivos móviles

28:26 “[…] Optimizamos nuestro sitio en consecuencia [para la indexación móvil primero]. En cuanto a la configuración, Google recomienda dos formas de hacerlo. El primero es un diseño web receptivo y el segundo es un servicio dinámico. Debido a que la primera forma es un poco difícil de lograr para nosotros a través de nuestro entorno tecnológico, usamos la segunda forma. Pero todavía vemos que hoy en día, hay más de doscientos mil rastreos diarios hacia nuestro dominio móvil. ¿Es esto algo normal de ver? […] Teníamos el dominio m-dot, luego lo redirigimos al dominio principal”.

John respondió: “Algo de gatear así es normal. Nuestros sistemas tardan mucho tiempo en dejar de rastrear por completo un dominio, incluso después de que se redirige, por lo que no lo vería como un problema. Nuestros sistemas tienen una memoria muy larga para cosas como esta a veces, y si mueve un sitio de un dominio a otro, o si hace que este móvil cambie con un subdominio, a veces el rastreo tarda años en detenerse por completo”.

Tecnologías web vs ranking

36:00 “ ¿Hay alguna relación o impacto en las clasificaciones de los sitios web que se realizan con HTML normal, CSS, JS y otro, PWA? […] Uno de nuestros principales competidores lo adoptó recientemente, y notamos un gran salto en sus clasificaciones SERP”.

John dijo: “Estas son esencialmente diferentes formas de hacer un sitio web, y puedes hacer un sitio web con muchos marcos y formatos diferentes. En su mayor parte, las vemos como páginas HTML normales. Entonces, si es un sitio web basado en JavaScript, lo representaremos y luego lo procesaremos como una página HTML normal. Si ya es HTML al principio, podemos hacerlo. [Hay] diferentes marcos y CMS detrás de él. Por lo general, básicamente ignoramos eso y simplemente decimos, bueno, aquí hay una página HTML y podemos procesarla.

Entonces, el solo hecho de que uno de sus competidores se haya movido de un marco a otro y haya visto una mejora en la búsqueda, ese cambio de marco, desde mi punto de vista, no sería responsable de eso. Pero más bien, tal vez ahora tengan un sitio web más nuevo, junto con ese cambio de marco. Tal vez el sitio web más nuevo tiene enlaces internos diferentes, contenido interno diferente, [es] significativamente más rápido o significativamente más lento, a los usuarios les gusta mucho o hicieron una campaña de marketing junto con el lanzamiento del sitio web. Todas estas cosas juegan allí, y estas son todas las cosas que no están limitadas al marco que estás usando”.

Google PageSpeed Insights frente a Lighthouse

37:39 “¿Los resultados de los datos de laboratorio en Google PageSpeed Insights son los mismos que los resultados de Lighthouse en mi navegador Chrome? ¿Usan la misma fórmula?

John dijo: “No lo sé al cien por cien, pero se hacen de manera completamente diferente. […] Si usa PageSpeed Insights que se ejecuta en un centro de datos en algún lugar con dispositivos esencialmente emulados donde tratamos de actuar como una computadora normal, y tenemos restricciones que lo hacen un poco más lento. […] En Lighthouse, básicamente se ejecuta en su computadora con su conexión a Internet. Creo que Lighthouse dentro de Chrome también tiene algunas restricciones que aplica para que parezca un poco más lento de lo que su computadora podría hacer solo para asegurarse de que sea comparable.

Pero esencialmente, estos se ejecutan en entornos completamente diferentes, y es por eso que a menudo verá números diferentes allí. […] Si prueba con otras herramientas de velocidad que se ejecutan en línea, es posible que [también] vea números diferentes. Además, los datos de campo, los datos que usamos para la clasificación de búsqueda que ve en Search Console, también pueden ser números completamente diferentes solo porque sus usuarios pueden tener, en promedio, un tipo diferente de dispositivo o un tipo diferente de conexión a Internet. Entonces, incluso si las fórmulas son las mismas, todo el entorno en torno a estos sistemas es muy diferente”.

Descubrir Google

47:09 “Hemos notado un gran problema con Google Discover en nuestro sitio web. En dos días, el tráfico se redujo en un setenta por ciento. […] ¿Así que nos preguntamos si hicimos algo mal? […] ¿Puede aclarar qué sucedió exactamente ya que es un empate tan drástico? […] ¿Podría ser un error técnico?”

John dijo: "No sé específicamente con respecto a su sitio web, pero recibo informes de muchas personas que dicen que el tráfico de Discover está activado o desactivado en el sentido de que hay muy poco espacio en el medio si nuestros algoritmos determinan que No vamos a mostrar mucho contenido de este sitio web en Discover en este momento, entonces básicamente todo ese tráfico desaparece. Por otro lado, es lo mismo que si mostramos algo de su sitio web en Descubrir, de repente vuelve a tener esa gran avalancha de tráfico.

Si se trata de un problema técnico, también lo verá en la búsqueda web y verá que aparecen problemas de rastreo. No tengo una visión completa de lo que sucede exactamente en Discover, pero por lo general, los problemas de los que veo que la gente habla son, por un lado, problemas de calidad en los que tal vez la calidad del sitio web no sea tan buena y con respecto a la pólizas individuales que tenemos para Discover. En particular, para Discover, tenemos algunas políticas que son diferentes de la búsqueda web y recomendaciones que son un poco diferentes con respecto, creo, a contenido para adultos, contenido clickbaity. […] Todo eso se menciona en la página del Centro de ayuda que tenemos para Discover. Me imagino que muchos sitios web tienen un poco de una mezcla de todas estas cosas, y a veces sospecho que nuestros algoritmos simplemente encuentran un poco demasiado, y luego dicen, oh, tenemos que tener cuidado ahora con este sitio web. Entonces, sin conocer su sitio web y sin conocer los detalles de lo que Discover está captando exactamente allí, esa es la dirección que tomaría allí. […]

Desde nuestro punto de vista, Discover es donde tratamos de mostrar un flujo de información a las personas y, por eso, tendemos a no tener mucha información detallada sobre qué es exactamente lo que necesita proporcionar allí para funcionar realmente bien. Así que a veces tiene sentido mirar lo que otras personas han descubierto”.

Tiempo de respuesta

50:41 "¿Cuál sería un buen tiempo de respuesta para un nuevo sitio de medios de comunicación?"

Según John, “ El tiempo de respuesta es algo que influye en nuestra capacidad para calcular cuánto tiempo de rastreo puede llevar un servidor. Por lo general, el tiempo de respuesta, desde un punto de vista práctico, limita o juega con la cantidad de conexiones paralelas que se requerirían para rastrear. Entonces, si queremos rastrear mil URL de un sitio web, entonces el tiempo de respuesta para distribuirlo en el transcurso de un día puede ser bastante grande. Mientras que si queremos rastrear un millón de URL de un sitio web y hay un tiempo de respuesta alto, eso significa que terminaremos con muchas conexiones paralelas al servidor. Creo que tenemos algunos límites con respecto a que no queremos causar problemas en el servidor, por eso el tiempo de respuesta está directamente relacionado con la tasa de rastreo.

Para un sitio web de noticias, no se trata tanto de si es noticia o no, sino de la cantidad de URL que necesitamos rastrear por día. Así que ese es el ángulo que miraría allí. Puede ser que en un sitio web de noticias, rastreamos diez mil páginas al día, y esos son los artículos de noticias importantes que están todos cubiertos. Puede ser que tengamos que rastrear millones de artículos al día porque siempre tenemos que actualizar el archivo […], entonces, obviamente, el tiempo de respuesta, la tasa de rastreo, se ve diferente”.