RAG significa combinar un modelo de lenguaje con una base de conocimiento externa antes de generar la respuesta. La idea es sencilla: no pedirle al modelo que “se invente” todo, sino darle contexto real de la empresa.
Como funciona
Un usuario hace una pregunta especifica, por ejemplo sobre churn en una region concreta. Un LLM general entiende la pregunta, pero no conoce esos datos internos.
Entonces entra el segundo paso:
- se consulta la informacion relevante en documentos, apps o bases de datos;
- esa informacion se indexa en una base vectorial;
- se recupera el contexto mas util;
- se le vuelve a pasar al modelo junto con la pregunta.
Por que es util
RAG permite responder sobre informacion cambiante y propia del negocio, algo que un modelo general no puede hacer bien por si solo.
Donde hay que tener cuidado
La calidad del resultado depende mucho de la calidad del dato, del gobierno de la informacion y de la forma en que se construye la recuperacion.
Conclusiones
RAG no sustituye a una base de datos ni resuelve cualquier caso. Pero es una forma muy efectiva de conectar LLMs con conocimiento vivo de la empresa y reducir respuestas irrelevantes o alucinadas.