← 返回列表

Pergunta de Entrevista sobre IA #4: Design do Sistema de Memória do Agente – Implementação de Memória de Curto e Longo Prazo

Design do Sistema de Memória do Agente: Implementação de Memória de Curto e Longo Prazo

Este artigo explora o design do sistema de memória de um agente, dividindo-o em dois níveis: memória de curto prazo e memória de longo prazo, e detalha suas respectivas implementações e considerações.

Estrutura e Pontos Principais:

  1. Princípio Geral de Design: O sistema de memória do agente é dividido em duas camadas:

    • Memória de Curto Prazo: Atende à sessão atual, controlando o comprimento do contexto por meios técnicos, mantendo a coerência semântica.
    • Memória de Longo Prazo: Atende a cenários entre sessões, recuperando memórias relevantes do histórico conforme necessário por meio de mecanismos de busca.
  2. Duas Principais Abordagens para Memória de Curto Prazo:

    • Corte por Janela Fixa: Mantém apenas as últimas N rodadas de diálogo ou tokens, descartando o restante. Vantagens: implementação simples, baixo custo, comprimento estável, adequado para bate-papo casual ou atendimento ao cliente simples; desvantagens: pode perder informações críticas iniciais devido ao corte abrupto, causando "amnésia" no agente.
    • Resumo Rolante: Quando o histórico de diálogo está prestes a exceder a janela, resume as primeiras partes do diálogo em um resumo mais curto para substituir os registros originais. Vantagens: comprime o comprimento enquanto retém informações de alto valor, como objetivos da tarefa e requisitos de estilo, aliviando a diluição da atenção em contextos longos, mais adequado para tarefas longas como planejamento de projetos e criação de textos extensos; custo: requer chamadas adicionais ao modelo, e a qualidade do resumo afeta diretamente o desempenho subsequente.
  3. Abordagem para Construir Memória de Longo Prazo: Solução geral usando banco de dados vetorial para construir uma base de conhecimento.

    • Ideia Central: Processar diálogos passados em fragmentos de memória recuperáveis, recuperando-os por relevância quando necessário.
    • Processo de Três Etapas Chave:
      • Armazenamento: Vetorizar o diálogo e armazená-lo junto com o texto original no banco de memória de longo prazo.
      • Recuperação: Realizar busca por similaridade com base na nova pergunta do usuário.
      • Combinação: Inserir os fragmentos históricos mais relevantes junto com a pergunta atual no modelo.
    • Vantagens: Supera a limitação da janela de contexto, permitindo extrair informações relevantes com precisão de um vasto histórico, sendo a base para construir sistemas de interação de longo prazo, como assistentes personalizados e bases de conhecimento empresariais.
    • Desvantagens: Alta complexidade do sistema, exigindo a introdução de modelos de embedding, banco de dados vetorial e toda a lógica de recuperação.
  4. Considerações Práticas Importantes:

    • Critérios de Gravação de Memória: Não se deve armazenar todo o conteúdo por padrão; é necessário definir condições de admissão para a memória de longo prazo, como armazenar apenas preferências de longo prazo do usuário, objetivos principais da tarefa, fatos importantes confirmados e conclusões reutilizáveis.
    • Governança da Memória: Enfatiza que a memória é um ativo de dados dinâmico, exigindo limpeza, mesclagem, atualização e verificação de fatos periódicas, além de fornecer interfaces de gerenciamento para o usuário, garantindo a operação estável do sistema de memória de longo prazo.

评论

暂无已展示的评论。

发表评论(匿名)