AI Müsahibə Sualları 6: AI Agent-in Üç Əsas Metodologiyası: ReAct, Plan-and-Solve və Reflection
AI Agent-in Üç Əsas Metodologiyası: ReAct, Plan-and-Solve və Reflection
AI Agent, ətraf mühiti qavraya, qərarlar qəbul edə və hərəkətləri icra edə bilən avtonom ağıllı varlıqdır. Onun əsas metodologiyaları üçdür: ReAct, Plan-and-Solve və Reflection. Aşağıda hər biri izah edilir, axın diaqramları və kod nümunələri ilə dəstəklənir.
1. ReAct (Reasoning + Acting)
Əsas ideya: Düşünmə (Reasoning) və hərəkət (Acting) növbəli şəkildə aparılır. Agent hər addımda əvvəlcə cari vəziyyəti və növbəti planı düşünür (düşünmə), sonra bir hərəkət icra edir (məsələn, aləti çağırmaq, məlumat axtarmaq), nəticəyə əsasən yenidən düşünür.
Axın diaqramı:
[İlkin vəziyyət] → [Düşünmə: növbəti addımı düşün] → [Hərəkət: əməliyyatı icra et] → [Nəticəni müşahidə et] → [Düşünmə: planı yenilə] → ... → [Son cavab]
Nümunə kod (psevdokod):
def react_agent(question):
context = []
while not solved:
# Düşünmə: düşüncə addımını yarat
thought = llm.generate_thought(question, context)
# Hərəkət: düşüncəyə əsasən hərəkət seç
action = llm.choose_action(thought)
# Hərəkəti icra et, müşahidəni al
observation = execute_action(action)
# Düşüncə, hərəkət və müşahidəni kontekstə əlavə et
context.append((thought, action, observation))
return final_answer
Nümunə:
- İstifadəçi soruşur: "Bu gün Bakıda hava necədir?"
- Agent düşünür: "Hava API-ni çağırmalıyam, şəhər adı və tarix lazımdır."
- Hərəkət: Hava API-ni çağır (parametrlər: Bakı, bu gün)
- Müşahidə: "Günəşli, 25°C" qaytarır
- Düşünmə: "Məlumatı aldım, cavab verə bilərəm."
- Çıxış: "Bu gün Bakıda hava günəşli, 25°C."
2. Plan-and-Solve
Əsas ideya: Əvvəlcə tam plan hazırlanır (Plan), sonra addım-addım icra edilir (Solve). Plan mərhələsində mürəkkəb tapşırıq alt-addımlara bölünür, icra mərhələsində ardıcıllıqla tamamlanır, aralıq nəticələrə əsasən plan tənzimlənə bilər.
Axın diaqramı:
[Tapşırıq] → [Plan hazırla: alt-addımlara böl] → [Addım 1-i icra et] → [Addım 2-ni icra et] → ... → [Addım N-i icra et] → [Son cavab]
Nümunə kod:
def plan_and_solve(task):
# Plan mərhələsi
plan = llm.generate_plan(task) # Məsələn: ["Məlumat axtar", "Məlumatı təşkil et", "Hesabat yaz"]
context = {}
for step in plan:
# Hər addımı icra et
result = execute_step(step, context)
context[step] = result
# Nəticələri birləşdir
final = llm.synthesize(context)
return final
Nümunə:
- Tapşırıq: "AI Agent haqqında blog yaz"
- Plan:
1. AI Agent tərifi və ən son inkişafları axtar
2. Əsas məqamları oxu və təşkil et
3. Blog konturunu yaz
4. Məzmunu doldur
5. Yoxla və dərc et
- İcra: Hər addımı ardıcıllıqla tamamla, nəticədə blog çıxışı.
3. Reflection
Əsas ideya: Agent icra zamanı və ya sonra öz hərəkətlərini əks etdirir (Reflection), nəticəni qiymətləndirir və sonrakı hərəkətləri yaxşılaşdırır. Adətən özünütənqid, səhv düzəltmə və ya strategiya optimallaşdırmasını ehtiva edir.
Axın diaqramı:
[Hərəkət] → [Nəticəni müşahidə et] → [Əks etdirmə: uğurlu olub-olmadığını qiymətləndir] → [Uğursuz olarsa: strategiyanı tənzimlə] → [Yenidən hərəkət et] → ... → [Uğur]
Nümunə kod:
def reflection_agent(task):
max_attempts = 3
for attempt in range(max_attempts):
action = llm.generate_action(task)
result = execute(action)
# Əks etdirmə
reflection = llm.reflect(task, action, result)
if reflection['success']:
return result
else:
# Əks etdirməyə əsasən tapşırıq təsvirini və ya strategiyanı tənzimlə
task = reflection['improved_task']
return None
Nümunə:
- Tapşırıq: "1234 * 5678 hesabla"
- Hərəkət: Birbaşa hesabla, nəticə 7006652
- Əks etdirmə: Hesablama prosesini yoxla, daşıma xətası tap
- Tənzimləmə: Yenidən hesabla, düzgün nəticə 7006652 (əslində düzgün)
- Səhv olarsa, düzgün olana qədər əks etdirməyə davam et.
Xülasə Müqayisəsi
| Metodologiya | Xüsusiyyətlər | Uyğun ssenarilər |
|---|---|---|
| ReAct | Düşünmə və hərəkət növbəli, dinamik tənzimləmə | Real vaxt məlumat qarşılıqlı tələb edən tapşırıqlar (məsələn, sual-cavab, axtarış) |
| Plan-and-Solve | Əvvəlcə plan, sonra icra, strukturlaşdırılmış bölgü | Mürəkkəb çoxaddımlı tapşırıqlar (məsələn, yazı, məlumat analizi) |
| Reflection | Özünü əks etdirmə və düzəltmə, iterativ optimallaşdırma | Yüksək dəqiqlik tələb edən tapşırıqlar (məsələn, riyazi hesablama, kod yaratma) |
Praktik tətbiqlərdə bu üç metodologiya tez-tez birləşdirilir, məsələn ReAct-a əks etdirmə mexanizmi əlavə etmək və ya Plan-and-Solve-da hər addımdan sonra əks etdirmə aparmaq.
评论
暂无已展示的评论。
发表评论(匿名)