AI Intervju Pitanje 4: Dizajn Memorijskog Sistema Agenta - Implementacija Kratkoročne i Dugoročne Memorije
Dizajn Memorijskog Sistema Agenta: Implementacija Kratkoročne i Dugoročne Memorije
Ovaj članak istražuje dizajn memorijskog sistema Agenta, dijeleći ga na dva nivoa: kratkoročnu i dugoročnu memoriju, te detaljno opisuje njihove implementacijske pristupe i važna razmatranja.
Okvir i Ključne Tačke:
-
Opšti Principi Dizajna: Memorijski sistem Agenta podijeljen je u dva sloja:
- Kratkoročna memorija: Služi za trenutnu sesiju, kontrolira dužinu konteksta tehničkim sredstvima, dok održava semantičku koherentnost.
- Dugoročna memorija: Služi za međusesijske scenarije, koristeći mehanizme pretraživanja za izvlačenje relevantnih sjećanja iz historijskih informacija po potrebi.
-
Dva Glavna Pristupa za Kratkoročnu Memoriju:
- Fiksno skraćivanje prozora: Zadržava samo posljednjih N rundi dijaloga ili tokena, a ostatak se odbacuje. Prednosti su jednostavna implementacija, niska cijena i stabilna dužina, pogodno za opušteni razgovor ili jednostavne korisničke servise; nedostatak je mogući gubitak ranih ključnih informacija zbog "jednog reza", što dovodi do "gubitka pamćenja" Agenta.
- Klizni sažetak: Kada historija dijaloga prijeti da premaši prozor, rani dijalog se sažima u kraći sažetak koji zamjenjuje originalni zapis. Prednosti su kompresija dužine uz zadržavanje visokovrijednih informacija poput ciljeva zadatka i zahtjeva stila, te ublažavanje slabljenja pažnje uzrokovanog dugim kontekstom, pogodnije za duge zadatke poput planiranja projekata ili dugotrajnog pisanja; cijena je dodatni poziv modela, a kvalitet sažetka direktno utječe na kasnije rezultate.
-
Pristup Izgradnji Dugoročne Memorije: Opšti pristup korištenja vektorske baze podataka za izgradnju baze znanja.
- Osnovna ideja: Obrada prošlih dijaloga u pretražive memorijske fragmente, koji se prizivaju po relevantnosti kada je potrebno.
- Ključni trostepeni proces:
- Skladištenje: Vektorizacija dijaloga i pohrana zajedno s originalnim tekstom u dugoročnu memoriju.
- Pretraživanje: Pretraživanje sličnosti na osnovu novog pitanja korisnika.
- Kombinacija: Unošenje najrelevantnijih historijskih fragmenata zajedno s trenutnim pitanjem modelu.
- Prednosti: Prevazilazi ograničenja kontekstnog prozora, omogućavajući precizno izvlačenje relevantnih informacija iz ogromne historije, što je osnova za izgradnju personaliziranih asistenata, korporativnih baza znanja i drugih dugoročnih interaktivnih sistema.
- Nedostaci: Visoka složenost sistema, zahtijeva uvođenje Embedding modela, vektorske baze podataka i cjelokupne logike pretraživanja.
-
Važna Razmatranja u Praksi:
- Kriteriji za upis memorije: Ne treba podrazumijevano pohranjivati sav sadržaj; potrebno je postaviti uvjete za pristup dugoročnoj memoriji, npr. upisivati samo dugoročne korisničke preferencije, ključne ciljeve zadatka, potvrđene važne činjenice i ponovno upotrebljive zaključke.
- Upravljanje memorijom: Naglašava se da je memorija dinamički podatkovni resurs koji zahtijeva redovno čišćenje, spajanje, ažuriranje i provjeru činjenica, te pružanje korisničkog sučelja za upravljanje kako bi se osigurao stabilan rad dugoročnog memorijskog sistema.
评论
暂无已展示的评论。
发表评论(匿名)