Pergunta de Entrevista sobre IA #4: Design do Sistema de Memória do Agente – Implementação de Memória de Curto e Longo Prazo
Design do Sistema de Memória do Agente: Implementação de Memória de Curto e Longo Prazo
Este artigo explora o design do sistema de memória de um agente, dividindo-o em dois níveis: memória de curto prazo e memória de longo prazo, e detalha suas respectivas implementações e considerações.
Estrutura e Pontos Principais:
-
Princípio Geral de Design: O sistema de memória do agente é dividido em duas camadas:
- Memória de Curto Prazo: Atende à sessão atual, controlando o comprimento do contexto por meios técnicos, mantendo a coerência semântica.
- Memória de Longo Prazo: Atende a cenários entre sessões, recuperando memórias relevantes do histórico conforme necessário por meio de mecanismos de busca.
-
Duas Principais Abordagens para Memória de Curto Prazo:
- Corte por Janela Fixa: Mantém apenas as últimas N rodadas de diálogo ou tokens, descartando o restante. Vantagens: implementação simples, baixo custo, comprimento estável, adequado para bate-papo casual ou atendimento ao cliente simples; desvantagens: pode perder informações críticas iniciais devido ao corte abrupto, causando "amnésia" no agente.
- Resumo Rolante: Quando o histórico de diálogo está prestes a exceder a janela, resume as primeiras partes do diálogo em um resumo mais curto para substituir os registros originais. Vantagens: comprime o comprimento enquanto retém informações de alto valor, como objetivos da tarefa e requisitos de estilo, aliviando a diluição da atenção em contextos longos, mais adequado para tarefas longas como planejamento de projetos e criação de textos extensos; custo: requer chamadas adicionais ao modelo, e a qualidade do resumo afeta diretamente o desempenho subsequente.
-
Abordagem para Construir Memória de Longo Prazo: Solução geral usando banco de dados vetorial para construir uma base de conhecimento.
- Ideia Central: Processar diálogos passados em fragmentos de memória recuperáveis, recuperando-os por relevância quando necessário.
- Processo de Três Etapas Chave:
- Armazenamento: Vetorizar o diálogo e armazená-lo junto com o texto original no banco de memória de longo prazo.
- Recuperação: Realizar busca por similaridade com base na nova pergunta do usuário.
- Combinação: Inserir os fragmentos históricos mais relevantes junto com a pergunta atual no modelo.
- Vantagens: Supera a limitação da janela de contexto, permitindo extrair informações relevantes com precisão de um vasto histórico, sendo a base para construir sistemas de interação de longo prazo, como assistentes personalizados e bases de conhecimento empresariais.
- Desvantagens: Alta complexidade do sistema, exigindo a introdução de modelos de embedding, banco de dados vetorial e toda a lógica de recuperação.
-
Considerações Práticas Importantes:
- Critérios de Gravação de Memória: Não se deve armazenar todo o conteúdo por padrão; é necessário definir condições de admissão para a memória de longo prazo, como armazenar apenas preferências de longo prazo do usuário, objetivos principais da tarefa, fatos importantes confirmados e conclusões reutilizáveis.
- Governança da Memória: Enfatiza que a memória é um ativo de dados dinâmico, exigindo limpeza, mesclagem, atualização e verificação de fatos periódicas, além de fornecer interfaces de gerenciamento para o usuário, garantindo a operação estável do sistema de memória de longo prazo.
评论
暂无已展示的评论。
发表评论(匿名)