Pregunta de entrevista sobre IA n.º 4: Diseño del sistema de memoria del agente: esquemas de implementación de memoria a corto y largo plazo
Diseño del sistema de memoria del agente: esquemas de implementación de memoria a corto y largo plazo
Este artículo explora el diseño del sistema de memoria del agente, dividiéndolo en dos niveles: memoria a corto plazo y memoria a largo plazo, y detalla sus respectivos esquemas de implementación y consideraciones.
Marco y puntos clave:
-
Principio de diseño general: Dividir el sistema de memoria del agente en dos capas:
- Memoria a corto plazo: Sirve a la sesión actual, controlando la longitud del contexto mediante técnicas técnicas mientras mantiene la coherencia semántica.
- Memoria a largo plazo: Sirve a escenarios entre sesiones, extrayendo recuerdos relevantes de la información histórica según sea necesario mediante un mecanismo de recuperación.
-
Dos esquemas principales para la memoria a corto plazo:
- Truncamiento de ventana fija: Solo se conservan las últimas N rondas de diálogo o tokens, descartando el resto. La ventaja es que es simple de implementar, de bajo costo y longitud estable, adecuado para charlas informales o escenarios simples de servicio al cliente; la desventaja es que puede perder información clave temprana debido a un "corte único", causando que el agente "pierda la memoria".
- Resumen continuo: Cuando el historial de diálogo está a punto de exceder la ventana, se resume el contenido temprano en un resumen más corto para reemplazar el registro original. La ventaja es que, mientras se comprime la longitud, se retiene información de alto valor como objetivos de tarea y preferencias de estilo, y se alivia la dilución de atención causada por contextos largos, siendo más adecuado para tareas largas como planificación de proyectos o creación de contenido extenso; el costo es que requiere llamadas adicionales al modelo, y la calidad del resumen afecta directamente el efecto posterior.
-
Esquema de construcción de memoria a largo plazo: Esquema general para construir una base de conocimiento utilizando una base de datos vectorial.
- Idea central: Procesar diálogos pasados en fragmentos de memoria recuperables, recuperándolos según la relevancia cuando sea necesario.
- Proceso clave de tres pasos:
- Almacenamiento: Vectorizar el diálogo y almacenarlo junto con el texto original en la base de memoria a largo plazo.
- Recuperación: Realizar una búsqueda de similitud basada en la nueva pregunta del usuario.
- Combinación: Ingresar los fragmentos históricos más relevantes junto con la pregunta actual al modelo.
- Ventajas: Supera las limitaciones de la ventana de contexto, pudiendo extraer información relevante con precisión de un vasto historial, siendo la base para construir sistemas de interacción a largo plazo como asistentes personalizados o bases de conocimiento empresarial.
- Desventajas: Alta complejidad del sistema, requiriendo la introducción de modelos de embedding, bases de datos vectoriales y toda la lógica de recuperación.
-
Consideraciones importantes en la práctica:
- Criterios de escritura de memoria: No se debe almacenar todo el contenido por defecto, sino establecer condiciones de admisión para la memoria a largo plazo, como solo escribir preferencias de usuario a largo plazo, objetivos centrales de tarea, hechos importantes confirmados y conclusiones reutilizables.
- Gobernanza de la memoria: Se enfatiza que la memoria es un activo de datos dinámico, que requiere limpieza, fusión, actualización y verificación de hechos periódicas, y proporcionar interfaces de gestión para el usuario, asegurando el funcionamiento estable del sistema de memoria a largo plazo.
评论
暂无已展示的评论。
发表评论(匿名)