Horario de oficina de SEO, 3 de junio de 2022

Publicado: 2022-07-04

Este es un resumen de las preguntas y respuestas más interesantes del Google SEO Office Hours con John Mueller el 3 de junio de 2022.

ocultar contenido
1 ¿Puedo usar dos códigos de resultado HTTP en una página?
2 ¿Usar un CDN mejora la clasificación si mi sitio ya es rápido en mi país principal?
3 ¿Debo rechazar las solicitudes de API para reducir el rastreo?
4 ¿Debo usar rel=”nofollow” en enlaces internos?
5 ¿Hay alguna forma de forzar la aparición de enlaces de sitio?
6 Nuestro sitio incrusta archivos PDF con iframes, ¿debemos OCR el texto?
7 ¿Google rastrea las URL en el marcado de datos estructurados?

¿Puedo usar dos códigos de resultado HTTP en una página?

1:22 “[…] En teoría, es posible tener dos códigos de resultado HTTP diferentes en una página, pero ¿qué hará Google con esos dos códigos? ¿Google los verá? Y si es así, ¿qué hará Google? Por ejemplo, un 503 más un 302”.

La respuesta de John fue: “[…] Con los códigos de resultado HTTP, puedes incluir muchas cosas diferentes. Google observará el primer código de resultado HTTP y esencialmente lo procesará.

Y , en teoría, aún puede tener dos códigos de resultado HTTP o más allí si son redireccionamientos que conducen a alguna página final. Entonces, por ejemplo, podría tener una redirección de una página a otra página. Ese es un código de resultado. Y luego, en esa otra página, podría servir un código de resultado diferente. Eso podría ser una redirección 301 a una página 404 […]. Y desde nuestro punto de vista, en aquellas situaciones en cadena en las que podemos seguir la redirección para obtener un resultado final, esencialmente nos centraremos en ese resultado final.

Y si ese resultado final tiene contenido, entonces eso es algo que podríamos usar para la canonicalización. Si ese resultado final es una página de error, entonces es una página de error. Y eso también está bien para nosotros”.

¿Usar un CDN mejora la clasificación si mi sitio ya es rápido en mi país principal?

2:50 “[…] Obtenemos la mayoría de nuestro tráfico de un país específico. Alojamos nuestro sitio web en un servidor ubicado en ese país. ¿Sugiere poner todo nuestro sitio web detrás de un CDN para mejorar la velocidad de la página para los usuarios a nivel mundial, o eso no es necesario en nuestro caso?

John respondió: “ No creo que tenga un gran efecto en Google en lo que respecta al SEO.

El único efecto en el que podría imaginar que algo podría suceder es lo que los usuarios terminan viendo. […] Si la mayoría de sus usuarios ya están viendo un sitio web muy rápido porque su servidor está ubicado allí, entonces está […] haciendo lo correcto. Pero, por supuesto, si los usuarios en otras ubicaciones ven un resultado muy lento, porque tal vez la conexión con su país no sea tan buena, entonces eso es algo en lo que podría tener algunas oportunidades para mejorar eso.

[…] Si hay algo que puedes hacer para mejorar globalmente las cosas de tu sitio web, creo que es una buena idea. No creo que sea crítico […]. Pero es algo que puede hacer para […] hacer crecer su sitio web más allá de su país actual.

Tal vez una cosa que debería aclarar, si el rastreo de Google es muy, muy lento, entonces, por supuesto, eso puede afectar cuánto podemos rastrear e indexar desde el sitio web […]. Realmente no he visto esto como un problema con respecto a cualquier sitio web que no tenga millones y millones de páginas […].

Puede comprobar la velocidad de rastreo de Google en Search Console y las estadísticas de rastreo. Y si eso parece razonable, incluso si no es súper rápido, entonces realmente no me preocuparía por eso”.

¿Debo rechazar las solicitudes de API para reducir el rastreo?

5:20 “[…] Nuestro sitio actualmente gasta alrededor del 20 % del presupuesto de rastreo en el subdominio API, otro 20 % en miniaturas de imágenes de videos. Ninguno de estos subdominios tiene contenido que sea parte de nuestra estrategia de SEO. ¿Deberíamos prohibir el rastreo de estos subdominios o cómo se descubren o utilizan los puntos finales de la API?

Como dijo John, “[…] En muchos casos, los puntos finales de API terminan siendo utilizados por JavaScript en un sitio web , y renderizaremos sus páginas. Y si acceden a una API que está en su sitio web, intentaremos cargar el contenido de esa API y utilizarlo para representar la página.

Y dependiendo de cómo esté configurada su API y cómo esté configurado su JavaScript, puede ser difícil para nosotros almacenar en caché los resultados de la API, lo que significa que tal vez rastreamos muchas de estas solicitudes de API para intentar obtener una versión renderizada. de sus páginas para que podamos usarlas para la indexación. Así que ese suele ser el lugar donde se descubre esto. Y eso es algo en lo que puede ayudar asegurándose de que los resultados de la API se puedan almacenar en caché, que no inyecte ninguna marca de tiempo en las URL […] cuando esté usando JavaScript para la API […].

Si no le importa el contenido que se devuelve con estos puntos finales de API, entonces, por supuesto, puede bloquear todo este subdominio para que no se rastree con el archivo robots.txt. Y eso esencialmente bloqueará todas esas solicitudes de API para que no sucedan.

[…] En primer lugar, debe averiguar si estos resultados de API son […] parte de […] contenido crítico que quiero que Google indexe. Y si es así, entonces probablemente no deberías bloquear el rastreo. Pero si […] está […] generando algo […] que no es crítico para sus páginas […], entonces podría valer la pena verificar dos veces cómo se ve cuando están bloqueadas.

Y una forma en que podría verificar esto es si pudiera crear una página de prueba separada que no llame a la API o que use una URL rota para el punto final de la API. […] ¿Puedes ver cómo se representa realmente esta página en mi navegador? ¿Cómo se representa para Google?

¿Debo usar rel=”nofollow” en enlaces internos?

8:05 "¿Es apropiado usar un atributo nofollow en enlaces internos para evitar solicitudes innecesarias de rastreadores a URL que no deseamos que se rastreen o indexen?"

Así es como John respondió: “[…] Creo que, en su mayor parte, tiene muy poco sentido usar nofollow en enlaces internos. Pero si eso es algo que quieres hacer, hazlo.

En la mayoría de los casos, intentaré hacer algo como usar rel=canonical para apuntar a las URL que desea indexar o usar robots.txt para cosas que realmente no desea rastrear.

Trate de averiguar, ¿es más como algo sutil […] que prefiere tener indexado y luego usar rel=canonical para eso? ¿O es algo donde dices? En realidad, cuando Googlebot accede a estas URL, causa problemas a mi servidor. Provoca una gran carga. Hace que todo sea muy lento. Es caro o lo que sea.

Y para esos casos, simplemente prohibiría el rastreo de esas URL. […] Con el rel=canonical, obviamente, primero tendremos que rastrear esa página para ver el rel=canonical. Pero con el tiempo, nos centraremos en la canónica que ha definido. Y lo usaremos principalmente para rastrear e indexar”.

¿Hay alguna forma de forzar la aparición de enlaces de sitio?

16:02 "¿Existe alguna estrategia mediante la cual las páginas deseadas puedan aparecer como un enlace de sitio en los resultados de búsqueda de Google?"

John aclaró que “[…] No hay una metaetiqueta o datos estructurados que pueda usar para hacer que se muestre un enlace del sitio .

[…] Nuestros sistemas intentan descubrir qué está […] relacionado o es relevante para los usuarios cuando miran esta página web […]? […] Nuestra recomendación es esencialmente tener una buena estructura del sitio web, tener enlaces internos claros para que nos sea fácil reconocer qué páginas están relacionadas con esas páginas, y tener títulos claros que podamos usar y […] mostrar como un enlace del sitio.

[…] No es que haya una garantía de que algo de esto se muestre así. Pero nos ayuda a descubrir qué está relacionado. Y si creemos que tiene sentido mostrar un vínculo a un sitio, será mucho más fácil para nosotros elegir uno en función de esa información”.

Nuestro sitio incrusta archivos PDF con iframes, ¿debemos OCR el texto?

17:14 “Nuestro sitio web utiliza iframes y un script para incrustar archivos PDF en nuestras páginas y nuestro sitio web. ¿Hay alguna ventaja en tomar el texto OCR del PDF y pegarlo en algún lugar del HTML del documento con fines de SEO, o Google simplemente analizará el contenido del PDF con el mismo peso y relevancia para indexar el contenido?

John respondió: “[…] Parece que quieres tomar el texto del PDF y […] ocultarlo en el HTML con fines de SEO. Y eso es algo que definitivamente no recomendaría hacer. Si desea que el contenido sea indexable, hágalo visible en la página.

[…] Intentamos sacar el texto de los PDF e indexarlo para los PDF mismos. Desde un punto de vista práctico, lo que sucede con un PDF es como uno de los primeros pasos, lo convertimos en una página HTML y tratamos de indexarlo como una página HTML. […] Lo que estás haciendo es […] iframeing de una página HTML indirecta. Y cuando se trata de iframes, podemos tener en cuenta ese contenido para la indexación dentro de la página principal. Pero también puede suceder que indexemos el PDF por separado de todos modos. […] Le daría la vuelta a la pregunta y la enmarcaría como ¿qué quieres que suceda?

Y si desea que sus páginas web normales se indexen con el contenido del archivo PDF, hágalo de modo que ese contenido sea inmediatamente visible en la página HTML. Entonces, en lugar de incrustar el PDF como una pieza principal de contenido, haga que el contenido HTML sea la pieza principal y enlace al archivo PDF.

Y luego está la pregunta de si desea que esos archivos PDF se indexen por separado o no. A veces desea que los archivos PDF se indexen por separado. Y si desea que se indexen por separado, vincularlos es excelente.

Si no desea que se indexen por separado, también está bien usar robots.txt para bloquear su indexación. También puede usar el noindex [? x-robots?] Encabezado HTTP. Es un poco más complicado porque tiene que servir como encabezado para los archivos PDF si desea tener esos archivos PDF disponibles en el iframe, pero no indexados".

¿Google rastrea las URL en el marcado de datos estructurados?

23:24 "¿Google rastrea las URL ubicadas en el marcado de datos estructurados o Google solo almacena los datos?"

John explicó que “en su mayor parte, cuando miramos páginas HTML, si vemos algo que se parece a un enlace, podemos salir y probar esa URL también. […] Si encontramos una URL en JavaScript, podemos intentar tomarla e intentar usarla. Si encontramos un enlace en un archivo de texto en un sitio, podemos intentar rastrearlo y usarlo. Pero en realidad no es un enlace normal.

[…] Si desea que Google salga y rastree esa URL, asegúrese de que haya un enlace HTML natural a esa URL , con un texto de anclaje claro también, que brinde información sobre la página de destino.

Si no desea que Google rastree esa URL específica, puede bloquearla con robots.txt o en esa página, use un rel=canonical apuntando a su versión preferida, algo así. […] No asumiría ciegamente que solo porque está en datos estructurados no se encontrará, ni asumiría ciegamente que solo porque está en datos estructurados se encontrará.

[…] En su lugar, me centraría en lo que quieres que suceda allí. Si desea que se vea como un enlace, conviértalo en un enlace. Si no desea que se rastree o indexe, entonces bloquee el rastreo o la indexación […]”.