Desain Sistem Memori Agen AI: Solusi Implementasi Memori Jangka Pendek dan Jangka Panjang
Desain Sistem Memori Agen: Solusi Implementasi Memori Jangka Pendek dan Jangka Panjang
Artikel ini membahas desain sistem memori Agen, yang dibagi menjadi dua level: memori jangka pendek dan memori jangka panjang, serta memperkenalkan solusi implementasi dan pertimbangan masing-masing secara rinci.
Kerangka Kerja dan Poin Inti:
-
Prinsip Desain Umum: Memecah sistem memori Agen menjadi dua lapisan:
- Memori Jangka Pendek: Melayani sesi saat ini, mengontrol panjang konteks melalui teknik, sambil menjaga koherensi semantik.
- Memori Jangka Panjang: Melayani skenario lintas sesi, mengambil memori yang relevan sesuai kebutuhan dari informasi historis melalui mekanisme pencarian.
-
Dua Solusi Utama untuk Memori Jangka Pendek:
- Pemotongan Jendela Tetap: Hanya menyimpan N putaran percakapan atau token terbaru, sisanya langsung dibuang. Kelebihannya adalah implementasi sederhana, biaya rendah, panjang stabil, cocok untuk obrolan santai atau skenario layanan pelanggan sederhana; kekurangannya adalah dapat kehilangan informasi kunci awal karena "satu ukuran untuk semua", menyebabkan Agen "kehilangan memori".
- Ringkasan Bergulir: Ketika riwayat percakapan akan melampaui jendela, konten percakapan awal diringkas menjadi ringkasan yang lebih pendek untuk menggantikan catatan asli. Kelebihannya adalah dapat mempertahankan informasi bernilai tinggi seperti tujuan tugas, persyaratan gaya, sambil memampatkan panjang, dan mengurangi pengenceran perhatian akibat konteks panjang, lebih cocok untuk perencanaan proyek, penulisan panjang, dll.; biayanya adalah memerlukan panggilan model tambahan, dan kualitas ringkasan secara langsung mempengaruhi efek selanjutnya.
-
Solusi Pembangunan Memori Jangka Panjang: Solusi umum membangun basis pengetahuan menggunakan basis data vektor.
- Ide Inti: Memproses percakapan masa lalu menjadi fragmen memori yang dapat dicari, dan memanggilnya berdasarkan relevansi saat diperlukan.
- Tiga Langkah Kunci:
- Penyimpanan: Vektorisasi percakapan, lalu simpan bersama teks asli ke dalam basis memori jangka panjang.
- Pencarian: Lakukan pencarian kemiripan berdasarkan pertanyaan baru pengguna.
- Komposisi: Masukkan fragmen historis yang paling relevan bersama pertanyaan saat ini ke model.
- Kelebihan: Melampaui batasan jendela konteks, dapat secara tepat mengekstrak informasi relevan dari sejarah yang luas, merupakan dasar untuk membangun asisten yang dipersonalisasi, basis pengetahuan perusahaan, dan sistem interaksi jangka panjang lainnya.
- Kekurangan: Kompleksitas sistem tinggi, perlu memperkenalkan model Embedding, basis data vektor, dan seluruh logika pencarian.
-
Pertimbangan Penting dalam Praktik:
- Kriteria Penulisan Memori: Tidak boleh menyimpan semua konten secara default, tetapi tetapkan kondisi akses untuk memori jangka panjang, misalnya hanya menyimpan preferensi pengguna jangka panjang, tujuan tugas inti, fakta penting yang telah dikonfirmasi, dan kesimpulan yang dapat digunakan kembali.
- Tata Kelola Memori: Tekankan bahwa memori adalah aset data dinamis, harus dilakukan pembersihan, penggabungan, pembaruan, dan verifikasi fakta secara berkala, serta menyediakan antarmuka manajemen bagi pengguna, untuk memastikan operasi stabil sistem memori jangka panjang.
评论
暂无已展示的评论。
发表评论(匿名)