← 返回列表

AI Intervju Pitanje 4: Dizajn Memorijskog Sistema Agenta - Implementacija Kratkoročne i Dugoročne Memorije

Dizajn Memorijskog Sistema Agenta: Implementacija Kratkoročne i Dugoročne Memorije

Ovaj članak istražuje dizajn memorijskog sistema Agenta, dijeleći ga na dva nivoa: kratkoročnu i dugoročnu memoriju, te detaljno opisuje njihove implementacijske pristupe i važna razmatranja.

Okvir i Ključne Tačke:

  1. Opšti Principi Dizajna: Memorijski sistem Agenta podijeljen je u dva sloja:

    • Kratkoročna memorija: Služi za trenutnu sesiju, kontrolira dužinu konteksta tehničkim sredstvima, dok održava semantičku koherentnost.
    • Dugoročna memorija: Služi za međusesijske scenarije, koristeći mehanizme pretraživanja za izvlačenje relevantnih sjećanja iz historijskih informacija po potrebi.
  2. Dva Glavna Pristupa za Kratkoročnu Memoriju:

    • Fiksno skraćivanje prozora: Zadržava samo posljednjih N rundi dijaloga ili tokena, a ostatak se odbacuje. Prednosti su jednostavna implementacija, niska cijena i stabilna dužina, pogodno za opušteni razgovor ili jednostavne korisničke servise; nedostatak je mogući gubitak ranih ključnih informacija zbog "jednog reza", što dovodi do "gubitka pamćenja" Agenta.
    • Klizni sažetak: Kada historija dijaloga prijeti da premaši prozor, rani dijalog se sažima u kraći sažetak koji zamjenjuje originalni zapis. Prednosti su kompresija dužine uz zadržavanje visokovrijednih informacija poput ciljeva zadatka i zahtjeva stila, te ublažavanje slabljenja pažnje uzrokovanog dugim kontekstom, pogodnije za duge zadatke poput planiranja projekata ili dugotrajnog pisanja; cijena je dodatni poziv modela, a kvalitet sažetka direktno utječe na kasnije rezultate.
  3. Pristup Izgradnji Dugoročne Memorije: Opšti pristup korištenja vektorske baze podataka za izgradnju baze znanja.

    • Osnovna ideja: Obrada prošlih dijaloga u pretražive memorijske fragmente, koji se prizivaju po relevantnosti kada je potrebno.
    • Ključni trostepeni proces:
      • Skladištenje: Vektorizacija dijaloga i pohrana zajedno s originalnim tekstom u dugoročnu memoriju.
      • Pretraživanje: Pretraživanje sličnosti na osnovu novog pitanja korisnika.
      • Kombinacija: Unošenje najrelevantnijih historijskih fragmenata zajedno s trenutnim pitanjem modelu.
    • Prednosti: Prevazilazi ograničenja kontekstnog prozora, omogućavajući precizno izvlačenje relevantnih informacija iz ogromne historije, što je osnova za izgradnju personaliziranih asistenata, korporativnih baza znanja i drugih dugoročnih interaktivnih sistema.
    • Nedostaci: Visoka složenost sistema, zahtijeva uvođenje Embedding modela, vektorske baze podataka i cjelokupne logike pretraživanja.
  4. Važna Razmatranja u Praksi:

    • Kriteriji za upis memorije: Ne treba podrazumijevano pohranjivati sav sadržaj; potrebno je postaviti uvjete za pristup dugoročnoj memoriji, npr. upisivati samo dugoročne korisničke preferencije, ključne ciljeve zadatka, potvrđene važne činjenice i ponovno upotrebljive zaključke.
    • Upravljanje memorijom: Naglašava se da je memorija dinamički podatkovni resurs koji zahtijeva redovno čišćenje, spajanje, ažuriranje i provjeru činjenica, te pružanje korisničkog sučelja za upravljanje kako bi se osigurao stabilan rad dugoročnog memorijskog sistema.

评论

暂无已展示的评论。

发表评论(匿名)