← 返回列表

AI Müsahibə Sualları 6: AI Agent-in Üç Əsas Metodologiyası: ReAct, Plan-and-Solve və Reflection

AI Agent-in Üç Əsas Metodologiyası: ReAct, Plan-and-Solve və Reflection

AI Agent, ətraf mühiti qavraya, qərarlar qəbul edə və hərəkətləri icra edə bilən avtonom ağıllı varlıqdır. Onun əsas metodologiyaları üçdür: ReAct, Plan-and-Solve və Reflection. Aşağıda hər biri izah edilir, axın diaqramları və kod nümunələri ilə dəstəklənir.

1. ReAct (Reasoning + Acting)

Əsas ideya: Düşünmə (Reasoning) və hərəkət (Acting) növbəli şəkildə aparılır. Agent hər addımda əvvəlcə cari vəziyyəti və növbəti planı düşünür (düşünmə), sonra bir hərəkət icra edir (məsələn, aləti çağırmaq, məlumat axtarmaq), nəticəyə əsasən yenidən düşünür.

Axın diaqramı:

[İlkin vəziyyət] → [Düşünmə: növbəti addımı düşün] → [Hərəkət: əməliyyatı icra et] → [Nəticəni müşahidə et] → [Düşünmə: planı yenilə] → ... → [Son cavab]

Nümunə kod (psevdokod):

def react_agent(question):
    context = []
    while not solved:
        # Düşünmə: düşüncə addımını yarat
        thought = llm.generate_thought(question, context)
        # Hərəkət: düşüncəyə əsasən hərəkət seç
        action = llm.choose_action(thought)
        # Hərəkəti icra et, müşahidəni al
        observation = execute_action(action)
        # Düşüncə, hərəkət və müşahidəni kontekstə əlavə et
        context.append((thought, action, observation))
    return final_answer

Nümunə:
- İstifadəçi soruşur: "Bu gün Bakıda hava necədir?"
- Agent düşünür: "Hava API-ni çağırmalıyam, şəhər adı və tarix lazımdır."
- Hərəkət: Hava API-ni çağır (parametrlər: Bakı, bu gün)
- Müşahidə: "Günəşli, 25°C" qaytarır
- Düşünmə: "Məlumatı aldım, cavab verə bilərəm."
- Çıxış: "Bu gün Bakıda hava günəşli, 25°C."

2. Plan-and-Solve

Əsas ideya: Əvvəlcə tam plan hazırlanır (Plan), sonra addım-addım icra edilir (Solve). Plan mərhələsində mürəkkəb tapşırıq alt-addımlara bölünür, icra mərhələsində ardıcıllıqla tamamlanır, aralıq nəticələrə əsasən plan tənzimlənə bilər.

Axın diaqramı:

[Tapşırıq] → [Plan hazırla: alt-addımlara böl] → [Addım 1-i icra et] → [Addım 2-ni icra et] → ... → [Addım N-i icra et] → [Son cavab]

Nümunə kod:

def plan_and_solve(task):
    # Plan mərhələsi
    plan = llm.generate_plan(task)  # Məsələn: ["Məlumat axtar", "Məlumatı təşkil et", "Hesabat yaz"]
    context = {}
    for step in plan:
        # Hər addımı icra et
        result = execute_step(step, context)
        context[step] = result
    # Nəticələri birləşdir
    final = llm.synthesize(context)
    return final

Nümunə:
- Tapşırıq: "AI Agent haqqında blog yaz"
- Plan:
1. AI Agent tərifi və ən son inkişafları axtar
2. Əsas məqamları oxu və təşkil et
3. Blog konturunu yaz
4. Məzmunu doldur
5. Yoxla və dərc et
- İcra: Hər addımı ardıcıllıqla tamamla, nəticədə blog çıxışı.

3. Reflection

Əsas ideya: Agent icra zamanı və ya sonra öz hərəkətlərini əks etdirir (Reflection), nəticəni qiymətləndirir və sonrakı hərəkətləri yaxşılaşdırır. Adətən özünütənqid, səhv düzəltmə və ya strategiya optimallaşdırmasını ehtiva edir.

Axın diaqramı:

[Hərəkət] → [Nəticəni müşahidə et] → [Əks etdirmə: uğurlu olub-olmadığını qiymətləndir] → [Uğursuz olarsa: strategiyanı tənzimlə] → [Yenidən hərəkət et] → ... → [Uğur]

Nümunə kod:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # Əks etdirmə
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # Əks etdirməyə əsasən tapşırıq təsvirini və ya strategiyanı tənzimlə
            task = reflection['improved_task']
    return None

Nümunə:
- Tapşırıq: "1234 * 5678 hesabla"
- Hərəkət: Birbaşa hesabla, nəticə 7006652
- Əks etdirmə: Hesablama prosesini yoxla, daşıma xətası tap
- Tənzimləmə: Yenidən hesabla, düzgün nəticə 7006652 (əslində düzgün)
- Səhv olarsa, düzgün olana qədər əks etdirməyə davam et.

Xülasə Müqayisəsi

Metodologiya Xüsusiyyətlər Uyğun ssenarilər
ReAct Düşünmə və hərəkət növbəli, dinamik tənzimləmə Real vaxt məlumat qarşılıqlı tələb edən tapşırıqlar (məsələn, sual-cavab, axtarış)
Plan-and-Solve Əvvəlcə plan, sonra icra, strukturlaşdırılmış bölgü Mürəkkəb çoxaddımlı tapşırıqlar (məsələn, yazı, məlumat analizi)
Reflection Özünü əks etdirmə və düzəltmə, iterativ optimallaşdırma Yüksək dəqiqlik tələb edən tapşırıqlar (məsələn, riyazi hesablama, kod yaratma)

Praktik tətbiqlərdə bu üç metodologiya tez-tez birləşdirilir, məsələn ReAct-a əks etdirmə mexanizmi əlavə etmək və ya Plan-and-Solve-da hər addımdan sonra əks etdirmə aparmaq.

评论

暂无已展示的评论。

发表评论(匿名)