Inteligencia Artificial

Por qué la generación de recuperación aumentada sigue siendo relevante en la era de los modelos lingüísticos de contexto largo | de Jérôme Díaz | diciembre 2024

Juan Morell4 horas atrás02 minutos

En este artículo, exploraremos por qué los modelos con 128.000 tokens (y más) no pueden ser reemplazados por completo por RAG.

Comenzaremos con un breve recordatorio de los problemas que se pueden resolver con RAG, antes de discutir las mejoras de los LLM y su impacto en el necesidad usar RAG.

Ilustración del autor.

RAG no es realmente nuevo

La idea de inyectar un contexto para permitir que un modelo de lenguaje acceda a datos actualizados es bastante “antigua” (en el nivel LLM). Fue presentado por primera vez por un investigador de IA/Meta de Facebook en este artículo de 2020 »Generación de recuperación aumentada para tareas de PNL intensivas en conocimiento«. En comparación, la primera versión de ChatGPT no se lanzó hasta noviembre de 2022.

En este artículo distinguen dos tipos de memoria:

EL paramétrico uno, que es lo inherente al LLM, lo que aprendió mientras se alimenta de muchos textos durante el entrenamiento,
EL no paramétrico uno, que es la memoria que puedes proporcionar en rellenar un contexto en el mensaje.

Noticias relacionadas

TSMixer: el innovador modelo de previsión de aprendizaje profundo de Google | de Nikos Kafritsas | diciembre 2024

TSMixer: el innovador modelo de previsión de aprendizaje profundo de Google | de Nikos Kafritsas | diciembre 2024

Juan Morell20 horas atrás 0

3 habilidades comerciales que necesita para avanzar en su carrera en ciencia de datos en 2025 | de Dra. Varshita Sher | diciembre 2024

3 habilidades comerciales que necesita para avanzar en su carrera en ciencia de datos en 2025 | de Dra. Varshita Sher | diciembre 2024

Juan Morell2 días atrás 0

Datos faltantes en series temporales: técnicas de aprendizaje automático | de Sara Nóbrega | diciembre 2024

Datos faltantes en series temporales: técnicas de aprendizaje automático | de Sara Nóbrega | diciembre 2024

Juan Morell2 días atrás 0

Por qué los científicos de datos necesitan estas habilidades de ingeniería de software | de Egor Howell | diciembre 2024

Por qué los científicos de datos necesitan estas habilidades de ingeniería de software | de Egor Howell | diciembre 2024

Juan Morell4 días atrás 0