(Todas las imágenes son del autor a menos que se indique lo contrario)
Introducción
Ingeniería rápida es la práctica de diseñar y refinar indicaciones (entradas de texto) para mejorar el comportamiento de modelos de lenguaje grandes (LLM). El objetivo es obtener las respuestas deseadas del modelo elaborando cuidadosamente las instrucciones. Las técnicas de incentivos más utilizadas son:
- Cadena de pensamiento: Implica generar un proceso de razonamiento paso a paso para llegar a una conclusión. Se empuja al modelo a “pensar en voz alta” al establecer explícitamente los pasos lógicos que conducen a la respuesta final.
- Reaccionar (Razón+Acto): combina razonamiento y acción. El modelo no sólo piensa en un problema, sino que también actúa en función de su razonamiento. Por lo tanto, es más interactivo ya que el modelo alterna entre etapas de razonamiento y acciones, refinando su enfoque de forma iterativa. Básicamente, es un bucle de “pensamiento”, “acción”, “observación”.
Tomemos un ejemplo: imaginemos pedirle a una IA que «encuentre la mejor computadora portátil por menos de $1000».
– Respuesta normal: “Lenovo ThinkPad”.
– Cadena de respuesta de pensamiento.: “Tengo que considerar factores como el rendimiento, la duración de la batería y…