← 返回列表

AI интервју прашање 4: Дизајн на мемориски систем на агенти – Имплементација на краткорочна и долгорочна меморија

Дизајн на мемориски систем на агенти: Имплементација на краткорочна и долгорочна меморија

Оваа статија го истражува дизајнот на меморискиот систем на агенти, поделен на две нивоа: краткорочна и долгорочна меморија, и детално ги опишува нивните имплементации и размислувања.

Рамка и клучни гледишта:

  1. Општи принципи на дизајн: Меморискиот систем на агентот е поделен на два слоја:

    • Краткорочна меморија: Служи за тековната сесија, контролирајќи ја должината на контекстот преку технички средства, додека се одржува семантичка кохерентност.
    • Долгорочна меморија: Служи за сценарија низ повеќе сесии, извлекувајќи релевантни сеќавања од историските информации по потреба преку механизам за пребарување.
  2. Две главни шеми за краткорочна меморија:

    • Отсекување со фиксен прозорец: Се задржуваат само последните N разговори или токени, а остатокот се отфрла. Предности: едноставна имплементација, ниска цена, стабилна должина, погодна за случајни разговори или едноставни сценарија за корисничка поддршка; недостатоци: може да доведе до губење на рани клучни информации поради „сечење со една големина“, предизвикувајќи „губење на меморијата“ кај агентот.
    • Превртувачко сумирање: Кога историјата на разговори ќе го надмине прозорецот, раната содржина се сумира во пократок преглед за да ги замени оригиналните записи. Предности: овозможува компресија на должината додека се задржуваат високо вредни информации како цели на задачите и барања за стил, и го ублажува разредувањето на вниманието предизвикано од долг контекст, попогодно за долги задачи како планирање на проекти или долги текстови; цена: бара дополнителни повици на моделот, а квалитетот на прегледот директно влијае на последователните резултати.
  3. Шема за градење на долгорочна меморија: Општа шема за градење на база на знаење користејќи векторска база на податоци.

    • Основна идеја: Обработка на минатите разговори во пребарувачки мемориски фрагменти, кои се повикуваат според релевантност кога е потребно.
    • Клучен три-чекор процес:
      • Складирање: По векторизација на разговорите, тие се складираат заедно со оригиналниот текст во долгорочната меморија.
      • Пребарување: Врз основа на новото прашање на корисникот, се врши пребарување по сличност.
      • Комбинирање: Најрелевантните историски фрагменти се внесуваат заедно со тековното прашање во моделот.
    • Предности: Го надминува ограничувањето на контекстниот прозорец, овозможувајќи прецизно извлекување на релевантни информации од огромна историја, што е основа за градење на долгорочни интерактивни системи како персонализирани асистенти и корпоративни бази на знаење.
    • Недостатоци: Висока сложеност на системот, бара воведување на Embedding модел, векторска база на податоци и целата логика за пребарување.
  4. Практични размислувања:

    • Критериуми за запишување во меморија: Не треба стандардно да се складира целата содржина; треба да се постават услови за пристап за долгорочната меморија, на пример, да се запишуваат само долгорочни кориснички преференции, основни цели на задачите, потврдени важни факти и повторно употребливи заклучоци.
    • Управување со меморија: Се нагласува дека меморијата е динамичен податочен ресурс, кој мора редовно да се чисти, спојува, ажурира и проверува за факти, и да се обезбеди интерфејс за управување за корисниците, за да се обезбеди стабилно работење на долгорочниот мемориски систем.

评论

暂无已展示的评论。

发表评论(匿名)