Preguntas frecuentes de Google BERT: ¿La actualización está aniquilando mi clasificación?

Publicado: 2019-12-05

Según Google, la actualización BERT es uno de los mayores avances hasta la fecha en la evolución de la búsqueda y la mayor actualización en los últimos cinco años. Comprensiblemente, el anuncio de la actualización molestó mucho y planteó muchas preguntas para los especialistas en marketing en línea y SEO: ¿Mi clasificación está en peligro? ¿Para qué debo optimizar el sitio web en el futuro? ¿Qué significa BERT para la búsqueda por voz? En este artículo se pueden encontrar respuestas detalladas a las preguntas más importantes sobre la actualización de Google BERT.

Si está buscando apoyo con la optimización de motores de búsqueda de su sitio web, puede obtener más información y análisis de nuestros expertos:

¡Organizar una cita!

Vídeo: Todo lo que necesitas saber sobre BERT

En un seminario web con Jan Potzscher, CMO de semcona, tratamos de responder todas sus preguntas sobre la actualización BERT de Google. Para cualquiera que no pudo asistir al seminario web de BERT el 22 de noviembre de 2019, aquí está el video. El seminario web cubre los siguientes temas :

  • Por qué la nueva actualización BERT de Google afecta sus rutinas diarias de marketing de contenido y SEO y cómo debe cambiar su comprensión de la relevancia.
  • Cómo identificar temas relevantes y de tendencia, así como palabras clave que encajen en tu estrategia de marketing de contenidos.
  • Cómo escribir y enriquecer textos que se ajusten a la demanda de relevancia, holismo y centrado en el usuario de BERT.

También recibimos muchas preguntas adicionales de la audiencia de nuestro seminario web, que querían saber acerca de la Actualización BERT, la causa de las caídas en la clasificación y cómo optimizar sus sitios web. En este post, intentaré responder a las preguntas más relevantes. Aquí vamos:

Hubo una gran turbulencia en nuestro sitio (y en algunos otros) el 13 de septiembre. ¿Podría haber sido este un lanzamiento temprano de BERT? Perdimos términos de búsqueda de marca y la visibilidad de nuestras palabras clave se redujo en un 30 %. No se tomó ninguna acción manual en nuestro sitio, pero definitivamente parece una penalización.

El momento que mencionas coincide con la actualización principal de Google de septiembre de 2019, que fue anunciada oficialmente por Google y que no tiene nada que ver con BERT. Muchos sitios web vieron victorias y/o pérdidas en sus clasificaciones. Debido a estos cambios en las clasificaciones, muchos sitios web vieron un aumento o disminución en su visibilidad (y tráfico) de SEO. Es importante aclarar que esto no es una sanción. Significa que Google considera que su sitio web por los términos por los que perdió clasificaciones es menos satisfactorio para los usuarios que las páginas que lo han reemplazado en las clasificaciones. Puede haber varias razones para esto.

¿Cuándo cree que se implementará el nuevo algoritmo de Google en Europa? ¿BERT ya afectó a Alemania? ¿BERT también afectará las búsquedas en inglés en Alemania?

BERT es una actualización de cómo Google interpreta las consultas de búsqueda. Inicialmente, esta forma avanzada de interpretación entrenada en ML solo se aplicaba a las búsquedas orgánicas en inglés para el índice estadounidense de Google.com. El lanzamiento mundial de BERT, que afecta los resultados de búsqueda orgánicos para más de 70 idiomas, comenzó a principios de diciembre de 2019. Con respecto a los fragmentos destacados, BERT ya estaba en uso en todo el mundo desde el principio, es decir, desde el 24 de octubre en todos los idiomas.


malte-landwehr_01_sw “Bert es un desarrollo lógico para Google, siguiendo los pasos de Panda, Hummingbird y RankBrain. Sin embargo, esta vez no estamos viendo un cambio en la forma en que se indexan o clasifican los datos. En cambio, Google está tratando de identificar el contexto de una consulta de búsqueda y proporcionar resultados en consecuencia. Esta es una adición emocionante a lo que pueden ofrecer los modelos libres de contexto como Word2Vec y GloVe. Para la búsqueda por voz y la búsqueda conversacional, esperaría ver avances significativos en la calidad de los resultados en un futuro cercano". Malte Landwehr, vicepresidente de productos, Searchmetrics


Operamos en el mercado holandés, por lo que hasta ahora no hemos sentido el impacto de BERT. ¿Significa eso que debemos permanecer más orientados a las palabras clave de la "vieja escuela"? ¿O deberíamos comenzar a centrarnos más en palabras clave de cola larga y temas que sean interesantes para los usuarios?

Entendí la presentación de Jan de manera diferente. No creo que "centrarse" en la optimización de cola larga sea la pista que quería darte (aunque muchos espectadores comenzaron a preguntar sobre la cola larga). La idea es, más bien, tratar y comprender la intención del usuario que usted, como propietario del sitio web, desea satisfacer. Luego, piensa cuál es exactamente el punto de esta intención del usuario e intenta convertirlo en contenido de la mejor manera posible. Para "cubrir" el vocabulario que muchos usuarios diferentes de su público objetivo podrían estar usando para buscar respuestas a sus intenciones de usuario, también debe analizar estos términos y ver si puede usarlos y cómo. Piense en qué tipo de contenido serviría mejor a la intención del usuario (tabla de datos, listas, incrustación de video, incrustación de audio, imágenes, párrafos de texto, citas de expertos de la industria en la que se encuentra, etc.) y utilícelo. Y asegúrese de que Google lo use de una manera que pueda analizarlo bien (así que no use películas Flash, subprogramas de Java o formularios para acceder al contenido, o acciones de JavaScript que carguen el contenido después de la interacción del usuario), sino técnicas que sean fáciles. para que Google se entienda. Utilice datos estructurados, ya que esto ayuda a Google a comprender sus páginas mucho mejor (y si Google comprende que su página responde a una intención especial del usuario, aumentará la posibilidad de que clasifiquen mejor su sitio, especialmente ahora que BERT les ayuda a comprender la intención del usuario). consulta de búsqueda y si consideran que su contenido ha respondido a esta consulta.

Incluso sin BERT, Google ya ha estado tratando de hacer esto: comprender la entrada del usuario y ofrecer las mejores respuestas. Durante muchos años, Google ha podido enumerar páginas como buenos resultados, incluso si los términos buscados no están incluidos, porque Google ya es bastante bueno en la entrega de contenido que coincide con la intención del usuario. Con BERT solo mejorarán en esto.

Para abreviar una larga historia: no se apegue a las técnicas de SEO pasadas de moda llenando su contenido con palabras clave para las que desea clasificar. ¡Crea contenido para el usuario! Este ya debería ser el caso y esto no cambiará con BERT. Si desea un enfoque basado en datos sobre cómo se debe escribir este contenido, también puede usar nuestra herramienta "Experiencia de contenido" y obtener acceso a nuestro enfoque basado en inteligencia artificial para la creación de contenido.

Nuestro sitio web ha experimentado un tremendo aumento de visibilidad durante las últimas dos semanas en Alemania. Dado que dijo que BERT aún no había llegado a Alemania, ¿eso significa que debe haber otra razón?

Lo más probable es que su sitio web se haya visto afectado por una o algunas de las muchas actualizaciones menores que Google no ha confirmado pero que se han producido en las últimas semanas, por lo que no están relacionadas con BERT. Google optimiza constantemente sus algoritmos. En este sentido, es muy posible que, por ejemplo, la última actualización de medios o la limpieza de las SERP haya tenido un impacto en tu sitio.

Un sitio web al que ayudamos con gran contenido ha perdido un 80 % de visibilidad. ¿Puede ser BERT u otro motivo? Google no tomó ninguna acción manual.

¿Es visibilidad SEO o son impresiones/tráfico GSC? Personalmente, creo que es bastante poco probable que BERT afecte muchas búsquedas con un alto volumen de búsqueda. Google entiende bastante bien si cumplen con las expectativas del usuario al analizar los CTR, las tasas de regreso a SERP y los clics finales. Más bien creo que aplican BERT a más consultas de búsqueda de cola larga, que probablemente se buscan por primera vez en el historial de búsqueda de Google (el lenguaje humano es tan complejo: alrededor del 15% de todas las búsquedas realizadas en Google nunca se han buscado antes de). A Google le cuesta entender frases tan desconocidas y aquí entran en juego AI, ML y con eso BERT. Como consecuencia, creo que BERT golpea principalmente frases que los servicios de escucha de SERP como Searchmetrics SEO Visibility ni siquiera están rastreando. Por lo tanto, es más probable que vea un aumento o una disminución como resultado de BERT en los datos de análisis de búsqueda de Google Search Console.

¿Recomendaría centrarse solo en palabras clave de cola larga? ¿O deberíamos usar una combinación de palabras clave de cabeza corta y palabras clave de cola larga? ¿Recomendaría también usar más palabras clave de cola larga para las páginas de categoría?

Nunca recomendaría centrarse en palabras clave de cola larga. La cola larga cubre los términos de búsqueda que casi nunca se buscan. Solo una gran cantidad de búsquedas de cola larga pueden sumar una gran cantidad de tráfico. Pero, ¿cómo querrías enfocarte en las masas? Mi recomendación sigue siendo satisfacer a sus usuarios y su público objetivo proporcionando contenido que aborde sus necesidades y la intención del usuario. Si realiza su investigación sobre esto y proporciona el contenido correcto, automáticamente se clasificará para la cola larga. Y con BERT entrando en juego, Google aprenderá a comprender la cola larga aún mejor y brindará los mejores resultados de búsqueda que coincidan con la intención del usuario, y (supongo que) más y más páginas se clasificarán para esas palabras clave de cola larga sin siquiera contener las palabras de las que se compone la cola larga.

¿Cree que el CMS headless podría ser una solución en el futuro para las páginas de destino optimizadas para palabras clave de cola larga?

El CMS sin cabeza no ayudará ni obstaculizará sus páginas optimizadas (de cola larga) desde el punto de vista de la cobertura de palabras clave. Ayudarán a acelerar sus sitios web, lo cual es bueno para su SEO, pero esto no está relacionado con BERT o palabras clave (ni de cola larga ni de cabeza corta).

Teniendo en cuenta que la intención del usuario es comprar, ¿la creación de contenido SEO sigue proporcionando una ventaja competitiva?

En primer lugar, no cree contenido SEO para ninguna página. Si hay contenido que crees que está solo “para el motor de búsqueda” y tus visitantes no están interesados ​​en él, bórralo (o mejor: ni siquiera lo escribas para empezar).

Permítame reformular su pregunta: " Teniendo en cuenta que la intención de un usuario es comprar, ¿cree que algunos usuarios podrían necesitar más ayuda que podría entregarse a través de uno o dos párrafos de texto?

Sí, creo que no todos los visitantes de sus páginas de comercio electrónico, aunque ya tienen la intención de comprar algo, ya saben qué producto comprar y solo buscan hacer clic en él y completar la transacción. Algunos de ellos pueden necesitar su ayuda, ayudándolos a comprender cómo decidir cuál es el producto perfecto para ellos. Su contenido podría ayudarlos con su decisión. Escríbelo para esos usuarios. Diséñalo para esos usuarios. Ayude a esos usuarios a ver este contenido fácilmente para que puedan beneficiarse de él. Esto también será reconocido por Google y es posible que obtenga más tráfico de personas que necesitan este consejo y que compren en su sitio web.

¿Debo crear contenido que tenga una temática similar a la de la competencia y que ya esté clasificado en la página 1?

Si y no. Solo pensando lógicamente, el contenido que ya está clasificado en la página 1 es considerado relevante por Google para un tema e intención de búsqueda determinados. Esto significa que el contenido semánticamente similar a las 10 mejores piezas de clasificación también podría considerarse relevante.

Sin embargo, si solo copia semánticamente lo que ya está clasificado en la página 1, Google no tendrá ningún motivo para cambiar uno de los rankings actuales para su página, porque su página no proporcionará ninguna perspectiva, información o palabra que no esté ya cubierta por los demás.

Su objetivo debe ser incluir semánticamente lo que ya se considera relevante y volverse mejor, más completo, más satisfactorio, más atractivo, más multifacético, simplemente: convertirse en la mejor página sobre este tema e intención de búsqueda que se puede encontrar en el Internet completo. Cree una página que Google se avergonzaría de no clasificar en la primera posición de un tema; entonces habrá alcanzado su objetivo. Entonces habrá establecido un nuevo estándar para lo que otras páginas deben contener semánticamente para clasificarse en la página 1.

¿Puede resumir el cambio más significativo de BERT en una frase?

El cambio más significativo de BERT (para los usuarios de Google) es que comprende consultas de búsqueda complejas mucho mejor que antes. (Una oración )

¿Puede explicar qué significa "representación de codificador bidireccional de transformadores"?

No soy un experto en Machine Learning, pero por lo que leo y entiendo es lo siguiente: BERT es un procedimiento de Machine Learning que consume mucho contenido para “experimentar” el lenguaje humano. Luego toma esta entrada y elimina palabras aleatorias de ella, dejándolas en blanco para luego "adivinar" cuáles serían las palabras que mejor se ajustan a estos espacios en blanco. Este uso bidireccional de entrada ayuda a los algoritmos de ML a usar los datos de entrenamiento con mucha más frecuencia (y sin supervisión) para aprender, probar y aprender de ellos continuamente. De esta manera, los algoritmos, por ejemplo, pueden entender que en algunas oraciones las preposiciones pequeñas (que podrían haber sido interpretadas erróneamente como "palabras de parada" por algoritmos del pasado que solo se enfocaban en consultas de palabras clave) son realmente importantes para el significado. de una frase. Por lo tanto, Google ha dado un gran paso más en la dirección de "comprender" realmente lo que significa una frase.

Algunos enlaces que me gustaría recomendar a los lectores que estén más interesados ​​en los aspectos técnicos de BERT:

  • El BERT ilustrado, ELMo y compañía de Jay Alammar escrito en 2018: http://jalammar.github.io/illustrated-bert/
  • Comprender BERT: ¿es un cambio de juego en PNL? por Bharat S Raj: https://towardsdatascience.com/understanding-bert-is-it-a-game-changer-in-nlp-7cca943cf3ad
  • ¿Cuáles son las principales diferencias entre las incrustaciones de palabras de ELMo, BERT, Word2Vec y GloVe? Respuesta de Ajit Rajasekharan: https://www.quora.com/What-are-the-main-differences- between-the-word-embeddings-of-ELMo-BERT-Word2vec-and-GloVe

¿Qué conclusión debo hacer en base a la actualización, cómo debo reaccionar y optimizar mi sitio web en función de BERT? ¿Hay algún cambio debido a BERT en un aspecto más técnico, como nombres de imágenes, encabezados H1, etc.?

No. Debe optimizar su sitio web para dar las mejores respuestas a la intención de sus usuarios. Cuanto mejor sirva su contenido para este propósito, más probable es que se clasifique para frases de búsqueda interpretadas por algoritmos entrenados por BERT.

¿Cómo ve las consultas de búsqueda por voz en relación con BERT?

El lenguaje hablado es mucho más complejo que el lenguaje escrito. Esto significa que en la búsqueda por voz/lenguaje hablado, Google encontrará incluso más frases de búsqueda que nunca antes se habían escuchado que en la búsqueda clásica basada en escritorio. A medida que BERT mejora la comprensión de oraciones complejas, también será extremadamente importante para la búsqueda por voz.

¿Cómo puedo optimizar mi contenido para la búsqueda por voz?

Para las primeras iteraciones de Google Voice Search (diferentes de Amazon Voice Search), podría producir respuestas a consultas de búsqueda informativas que respondan preguntas con párrafos cortos y concretos. Dado que gran parte de la interpretación de las consultas de búsqueda todavía se basa en términos, recomendaría recopilar algunas formas en que las personas podrían solicitar esta información especial a la que pretende dar una respuesta, elegir una de esas preguntas como encabezado e implementar las palabras utilizadas en las otras preguntas para elaborar su respuesta. De esta manera, se encontrarán en su pregunta y respuesta varias combinaciones de palabras que podrían usarse en la pregunta (hablada). Su respuesta debe sonar suave y concreta cuando se lee en voz alta. Es posible que desee utilizar un marcado de datos estructurados "decibles" para mostrarle a Google que su respuesta podría ser una buena combinación para las respuestas que se leen en voz alta a los usuarios.

En el futuro, un paso podría ser proporcionar contenido hablado en la página de destino que Google (algún día) podría simplemente cortar una parte para "reproducir" la respuesta y recomendar a los usuarios que escuchen todo el texto hablado.

¿Los podcasts son mejores para Google que las publicaciones de blog? ¿O es una combinación de contenido que aumenta su visibilidad en la búsqueda de Google?

Actualmente, diría que ni los podcasts ni las publicaciones de blog son buenos para aumentar su visibilidad de SEO en Google. El texto hablado de los podcasts aún no se analiza ni se utiliza para dar respuestas en la Búsqueda de Google. Los blogs generalmente se entienden como una especie de revista, como un periódico que podría clasificarse bien para el momento en que se publicó pero, a medida que pasa el tiempo, se perderá en los archivos, conservando potencialmente algunas clasificaciones de cola larga y atrayendo a algunos visitantes. . Escribir un blog para SEO no es una estrategia que sugeriría. Sin embargo, crear contenido perenne, la información que se actualiza cada vez que hay algo que agregar (o eliminar porque la información también puede quedar obsoleta) sería la mejor manera de crear contenido que puedo sugerir.

¿Qué tan bueno es Google en este momento en la comprensión de archivos de audio, video o imágenes como podcasts, YouTube, Instagram, etc.?

Creo que son bastante buenos para comprender el lenguaje hablado (solo mire los subtítulos que YouTube crea automáticamente para las imágenes habladas de los videos subidos, o mire qué tan bien Google Home entiende sus preguntas). También son bastante buenos para comprender lo que se muestra en las imágenes; incluso venden sus capacidades en esta área a quien quiera usarla (https://cloud.google.com/vision/). Las películas son solo una combinación de lenguaje hablado e imágenes. Pero si quieres saber más sobre mi opinión personal sobre cuántas de estas capacidades están usando realmente para comprender el contenido de imágenes, sonido y películas: no creo que usen mucho sus capacidades. Supongo que esto consumiría demasiado tiempo y energía. Y actualmente, siendo Google el (en mi opinión) mejor motor de búsqueda web del mundo, no necesitan usar todos sus poderes todavía… basta con saber que están listos para implementarse una vez que se necesiten para estar por delante de los demás.