Cómo la cadena de pensamiento mejora los resultados de ChatGPT

Publicado: 2024-03-09

Contenido del artículo

Google está tomando medidas enérgicas contra el abuso de contenido a gran escala . Pero eso no significa que tengas que dejar de escalar tu motor de contenidos. Ni siquiera significa que tengas que dejar de usar la IA para respaldar el escalamiento. Simplemente significa que no puedes confiar en contenido escaso y spam para competir.

Entonces, ¿cómo se adopta la IA para aumentar el volumen de contenido sin ser penalizado?

Es simple: adopte la IA como una herramienta de aumento, no como un reemplazo de los creadores humanos.

Una forma de aumentar sus esfuerzos de creación de contenido es utilizar nuevas tácticas de inteligencia artificial, como la cadena de pensamiento, para crear contenido de mayor calidad más rápido.

Profundicemos en el mundo de CoT y cómo puede ayudarle a mejorar su motor de contenidos.

¿Qué es la cadena de pensamiento que incita?

La cadena de indicaciones de pensamiento (CoT) es una técnica que se utiliza para mejorar las capacidades de razonamiento de los modelos de lenguaje grandes (LLM). La idea central es alentar al modelo a dividir un problema complejo en pasos más pequeños y manejables, proporcionando una cadena explícita de razonamiento que conduzca a la respuesta final.

Es similar a la forma en que aprendiste a resolver problemas de matemáticas o razonamiento en la escuela. Aquí hay una versión rápida (altamente simplificada) de cómo funciona:

  • Transformación del problema: en lugar de simplemente presentar una tarea o pregunta al LLM, una cadena de pensamiento reestructura la entrada para incluir la frase "Pensemos paso a paso".Esta señal le indica al modelo que genere pasos de razonamiento intermedios.
  • Razonamiento intermedio: se anima al modelo a exponer explícitamente su proceso de pensamiento, paso a paso, hasta llegar a la solución.Esto podría implicar cálculos, deducciones lógicas o recordar información relevante.
  • Respuesta final: el modelo llega a la respuesta final, idealmente respaldada por la cadena de razonamiento transparente que produjo.

Este tipo de mensaje se puede entregar en un solo mensaje, como se muestra en el siguiente ejemplo, o puede dividir los pasos en varios mensajes secuenciales que se complementan entre sí (más sobre esto más adelante).

El enfoque fue acuñado por primera vez por Jason Wei y un equipo de expertos del Google Research Brain Team en un artículo de 2022 . El siguiente ejemplo es del documento que presentó CoT:

  • El mensaje estándar contiene un problema de ejemplo y una solución, así como la pregunta que la IA debe responder.
  • El mensaje de CoT incluye el mismo conjunto de problema y solución,una serie de pasos que describen cómo se alcanzó esa solucióny luego una nueva pregunta para que la IA responda.

Una captura de pantalla que muestra los pasos de razonamiento adicionales involucrados en la cadena de pensamiento que incita a una ecuación matemática.

Como puede ver, el modelo no responde correctamente al primer problema, pero tiene éxito cuando se le pide que siga una "cadena de pensamiento" para llegar allí.

Este artículo identificó algunos beneficios clave que esta táctica de ingeniería rápida aporta a una serie de problemas de razonamiento diferentes:

  • El proceso paso a paso obliga a la IA a pensar más a fondo y evitar saltos en la lógica, lo que ayuda a mejorar los resultados.
  • CoT proporciona una ventana al proceso de toma de decisiones de la IA, brindando a los usuarios y diseñadores de modelos más información sobre cómo funcionan estos modelos.
  • Al exigir una explicación de por qué la IA elige un resultado específico, CoT puede potencialmente mitigar algunos de los sesgos a los que son propensos los LLM.
  • Los usuarios de IA pueden mejorar los resultados simplemente incluyendo declaraciones como “vamos paso a paso” o “explica tu razonamiento”, similar a la táctica de las emociones .

Lo más importante es que esta táctica tiene el potencial de mejorar el resultado de cualquier tarea basada en lenguaje que envíe a ChatGPT , Gemini, Jasper u otras IA basadas en LLM. De hecho, Google lleva entrenando sus modelos con CoT desde 2022:

Bien, ahora que sabes un poco más sobre las indicaciones en cadena de pensamiento, veamos las formas en que puedes usarlas para mejorar la eficiencia de la creación de contenido.

Cómo la cadena de pensamiento ayuda a la creación de contenido

Utilizar indicaciones en cadena de pensamiento para mejorar los resultados de las tareas de escritura es más complejo que el simple razonamiento matemático o de sentido común. Existen reglas específicas para problemas matemáticos y planteados que lo llevan a una única respuesta correcta, pero hay muchas formas diferentes de abordar la estrategia o la creación de contenido.

La redacción SEO , el marketing de contenidos y la distribución son todo un arte. Dicho esto, también hay mucho razonamiento involucrado en estas tareas, especialmente a escala empresarial .

El estudio CoT original de Google enfatiza que este estilo de indicaciones mejora significativamente las habilidades de razonamiento de los LLM al proporcionar un enfoque estructurado paso a paso que imita los procesos humanos de resolución de problemas.

La razón fundamental de su aplicabilidad a las tareas de escritura radica en la naturaleza de la escritura como un proceso que requiere razonamiento, planificación, organización de pensamientos y desarrollo de ideas de varios pasos de una manera coherente y lógica.

Las tareas de escritura, especialmente aquellas que implican la creación de narrativas, ensayos argumentativos o informes técnicos, pueden beneficiarse de un enfoque CoT que describa el proceso de pensamiento que conduce al desarrollo de la pieza final.

Así es como los principios subyacentes de la cadena de pensamiento (estructurar procesos de pensamiento, descomponer problemas complejos y guiar la progresión lógica) se alinean bien con los requisitos de una escritura eficaz.

Recuerde:los resultados de la IA solo deben utilizarse como paso inicial.Ya sea que se trate de una publicación breve, un borrador, una investigación o una publicación social, debepasar pornumerosas verificaciones y revisiones de hechosantes de entregarla o publicarla .

1) Investigación temática

El espacio B2B SaaS está lleno de nichos altamente técnicos, desde infraestructura en la nube hasta gestión de funciones y, bueno, inteligencia artificial.

Ya sea que trabaje como autónomo, en una agencia o incluso para una gran marca con muchas integraciones de API, digerir rápidamente nuevos temas probablemente sea fundamental para el trabajo.

Las indicaciones en cadena de pensamientos pueden resultar beneficiosas para esta tarea. Al intentar comprender un tema nuevo, dividir el proceso de aprendizaje en una serie de preguntas y respuestas, cada una de las cuales se basa en la anterior, puede ayudar a construir gradualmente una comprensión integral de ese tema.

CoT puede guiar el modelo para explorar secuencialmente diferentes facetas del tema, haciendo que la información compleja sea más fácil de digerir y comprender.

Supongamos que trabaja en una agencia y le acaban de asignar un producto de infraestructura en la nube como Terraform de Hashicorp . Para darle un ejemplo de la complejidad a la que se enfrenta, aquí hay una explicación del producto de Wikipedia:

Captura de pantalla de la descripción del software Terraform en Wikipedia

Infraestructura como código (IaC). Lenguaje de configuración declarativo. JSON. De buenas a primeras, esos son tres temas muy complejos.

Veamos si puedo conseguir que ChatGPT acelere el proceso de aprendizaje identificando los conceptos más relevantes relacionados con esas tres palabras clave.

Un mensaje de CoT que indica a ChatGPT que identifique los conceptos más importantes relacionados con tres temas de infraestructura de nube

Al agregar "explicar el fundamento detrás de los conceptos que seleccionas", estoy (teóricamente) incitando a ChatGPT de una manera que lo dirige a brindar una respuesta más deliberada.

Como puedes ver a continuación, cada uno de los conceptos claves para IaC va acompañado de una explicación de su importancia.

A través de este enfoque, aprenderá que no sólo es importante conocer herramientas como Terraform y Ansible; También es importante saber que el primero es independiente del proveedor y el segundo proporciona gestión de configuración sin agentes.

Este es el tipo de contexto que puede ayudarle a desglosar y digerir un contexto complejo más rápidamente, algo muy útil para un principiante en infraestructura de nube como yo.

El resultado de ChatGPT en un mensaje de CoT, que describe la importancia detrás de los conceptos relacionados con la tecnología de infraestructura como código

Ahora veamos la dirección que obtendría si simplemente diera un mensaje normal sin indicarle a la IA que explique su "proceso de pensamiento":

Un mensaje normal de ChatGPT produce información sobre conceptos relacionados con IaC, pero no explica la razón para aprender sobre ellos.

La información contenida debajo de cada viñeta numerada aquí es importante, sin duda, pero no vienen con el mismo nivel de contexto.

Entonces, simplemente agregando una declaración como "explica tu razonamiento" o "sigue esto paso a paso", puedes aumentar el valor que obtienes de cada interacción con tu IA.

2) Generación de Breves y Borradores

Como alguien que se centra principalmente en la creación de contenido escrito de formato largo, conozco bien las complejidades (y la locura) del proceso creativo. El viaje desde una idea hasta una pieza terminada pasa por los mismos puntos de control (planificación del tema, investigación, informe y redacción), pero el camino entre esos puntos es más serpenteante para algunos que para otros.

Uno de los mayores beneficios que he obtenido de la IA generativa hasta ahora es la optimización de aspectos del flujo de trabajo creativo. La IA es útil para poner en marcha resúmenes creativos y borradores, y las indicaciones de CoT tienen el potencial de ayudar aún más.

Obtenga acceso a investigación y contenido premium exclusivo

Esta investigación es para clientes de Foundation Insiders y Inner Circle.
No te lo pierdas. Para leer el artículo completo, regístrese y obtenga acceso inmediato.

Suscríbete Iniciar sesión