Дизајн на мемориски систем на агенти: Имплементација на краткорочна и долгорочна меморија

Оваа статија го истражува дизајнот на меморискиот систем на агенти, поделен на две нивоа: краткорочна и долгорочна меморија, и детално ги опишува нивните имплементации и размислувања.

Рамка и клучни гледишта:

Општи принципи на дизајн: Меморискиот систем на агентот е поделен на два слоја:
- Краткорочна меморија: Служи за тековната сесија, контролирајќи ја должината на контекстот преку технички средства, додека се одржува семантичка кохерентност.
- Долгорочна меморија: Служи за сценарија низ повеќе сесии, извлекувајќи релевантни сеќавања од историските информации по потреба преку механизам за пребарување.
Две главни шеми за краткорочна меморија:
- Отсекување со фиксен прозорец: Се задржуваат само последните N разговори или токени, а остатокот се отфрла. Предности: едноставна имплементација, ниска цена, стабилна должина, погодна за случајни разговори или едноставни сценарија за корисничка поддршка; недостатоци: може да доведе до губење на рани клучни информации поради „сечење со една големина“, предизвикувајќи „губење на меморијата“ кај агентот.
- Превртувачко сумирање: Кога историјата на разговори ќе го надмине прозорецот, раната содржина се сумира во пократок преглед за да ги замени оригиналните записи. Предности: овозможува компресија на должината додека се задржуваат високо вредни информации како цели на задачите и барања за стил, и го ублажува разредувањето на вниманието предизвикано од долг контекст, попогодно за долги задачи како планирање на проекти или долги текстови; цена: бара дополнителни повици на моделот, а квалитетот на прегледот директно влијае на последователните резултати.
Шема за градење на долгорочна меморија: Општа шема за градење на база на знаење користејќи векторска база на податоци.
- Основна идеја: Обработка на минатите разговори во пребарувачки мемориски фрагменти, кои се повикуваат според релевантност кога е потребно.
- Клучен три-чекор процес:
  - Складирање: По векторизација на разговорите, тие се складираат заедно со оригиналниот текст во долгорочната меморија.
  - Пребарување: Врз основа на новото прашање на корисникот, се врши пребарување по сличност.
  - Комбинирање: Најрелевантните историски фрагменти се внесуваат заедно со тековното прашање во моделот.
- Предности: Го надминува ограничувањето на контекстниот прозорец, овозможувајќи прецизно извлекување на релевантни информации од огромна историја, што е основа за градење на долгорочни интерактивни системи како персонализирани асистенти и корпоративни бази на знаење.
- Недостатоци: Висока сложеност на системот, бара воведување на Embedding модел, векторска база на податоци и целата логика за пребарување.
Практични размислувања:
- Критериуми за запишување во меморија: Не треба стандардно да се складира целата содржина; треба да се постават услови за пристап за долгорочната меморија, на пример, да се запишуваат само долгорочни кориснички преференции, основни цели на задачите, потврдени важни факти и повторно употребливи заклучоци.
- Управување со меморија: Се нагласува дека меморијата е динамичен податочен ресурс, кој мора редовно да се чисти, спојува, ажурира и проверува за факти, и да се обезбеди интерфејс за управување за корисниците, за да се обезбеди стабилно работење на долгорочниот мемориски систем.

AI интервју прашање 4: Дизајн на мемориски систем на агенти – Имплементација на краткорочна и долгорочна меморија

Дизајн на мемориски систем на агенти: Имплементација на краткорочна и долгорочна меморија

Рамка и клучни гледишта:

评论

发表评论（匿名）