← 返回列表

Mistoqsijiet ta' Intervista dwar AI Serje 6: It-tliet Metodoloġiji Ewlenin ta' AI Agent: ReAct, Plan-and-Solve u Reflection

It-tliet Metodoloġiji Ewlenin ta' AI Agent: ReAct, Plan-and-Solve u Reflection

AI Agent huwa aġent intelliġenti li jista' jħoss l-ambjent b'mod awtonomu, jieħu deċiżjonijiet u jwettaq azzjonijiet. Il-metodoloġiji ewlenin tiegħu huma tlieta: ReAct, Plan-and-Solve u Reflection. Hawn taħt se nispjegaw kull waħda, flimkien ma' dijagrammi tal-fluss u eżempji ta' kodiċi.

1. ReAct (Raġunament + Azzjoni)

Ħsieb Ewlieni: Jalterna bejn ir-raġunament (Reasoning) u l-azzjoni (Acting). L-Agent f'kull pass l-ewwel jaħseb dwar l-istat attwali u l-pjan li jmiss (raġunament), imbagħad iwettaq azzjoni (bħal li juża għodda, ifittex informazzjoni), u mbagħad ikompli jirraġuna abbażi tar-riżultat.

Dijagramma tal-Fluss:

[Stat Inizjali] → [Raġunament: Aħseb dwar il-pass li jmiss] → [Azzjoni: Wettaq azzjoni] → [Osserva r-riżultat] → [Raġunament: Aġġorna l-pjan] → ... → [Tweġiba Finali]

Eżempju ta' Kodiċi (psewdo-kodiċi):

def react_agent(question):
    context = []
    while not solved:
        # Raġunament: Iġġenera pass ta' ħsieb
        thought = llm.generate_thought(question, context)
        # Azzjoni: Agħżel azzjoni abbażi tal-ħsieb
        action = llm.choose_action(thought)
        # Wettaq l-azzjoni, ikseb osservazzjoni
        observation = execute_action(action)
        # Żid il-ħsieb, l-azzjoni u l-osservazzjoni fil-kuntest
        context.append((thought, action, observation))
    return final_answer

Eżempju:
- Utent jistaqsi: "Kif it-temp illum f'Beijing?"
- Agent jirraġuna: "Għandi bżonn nikkonsulta API tat-temp, għandi bżonn l-isem tal-belt u d-data."
- Azzjoni: Sejjaħ API tat-temp (parametri: Beijing, illum)
- Osservazzjoni: Jirritorna "Xemx, 25°C"
- Raġunament: "Kisbajt l-informazzjoni, nista' nwieġeb."
- Output: "Beijing illum xemx, 25°C."

2. Plan-and-Solve

Ħsieb Ewlieni: L-ewwel ifassal pjan komplut (Plan), imbagħad iwettaqu pass pass (Solve). Fil-fażi tal-pjan, il-kompitu kumpless jinqasam f'sotto-passi; fil-fażi tal-eżekuzzjoni, isiru fl-ordni, u l-pjan jista' jiġi aġġustat abbażi ta' riżultati intermedji.

Dijagramma tal-Fluss:

[Kompitu] → [Ifassal pjan: Aqsam f'sotto-passi] → [Wettaq pass 1] → [Wettaq pass 2] → ... → [Wettaq pass N] → [Tweġiba Finali]

Eżempju ta' Kodiċi:

def plan_and_solve(task):
    # Fażi tal-pjan
    plan = llm.generate_plan(task)  # eż.: ["Fittex informazzjoni", "Organizza l-informazzjoni", "Ikteb rapport"]
    context = {}
    for step in plan:
        # Wettaq kull pass
        result = execute_step(step, context)
        context[step] = result
    # Ikkombina r-riżultati
    final = llm.synthesize(context)
    return final

Eżempju:
- Kompitu: "Ikteb blog post dwar AI Agent"
- Pjan:
1. Fittex definizzjoni ta' AI Agent u l-aħħar żviluppi
2. Aqra u organizza l-punti ewlenin
3. Ikteb abbozz tal-blog
4. Imla l-kontenut
5. Ikkoreġi u ppubblika
- Eżekuzzjoni: Tlesti kull pass fl-ordni, finalment tipproduċi l-blog post.

3. Reflection

Ħsieb Ewlieni: L-Agent, waqt jew wara l-eżekuzzjoni, jirrifletti (Reflection) dwar l-imġiba tiegħu stess, jevalwa r-riżultati u jtejjeb l-azzjonijiet futuri. Normalment jinkludi awto-kritika, korrezzjoni ta' żbalji jew ottimizzazzjoni tal-istrateġija.

Dijagramma tal-Fluss:

[Azzjoni] → [Osserva r-riżultat] → [Riflessjoni: Evalwa jekk irnexxietx] → [Jekk falliet: Aġġusta l-istrateġija] → [Azzjoni mill-ġdid] → ... → [Suċċess]

Eżempju ta' Kodiċi:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # Riflessjoni
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # Aġġusta d-deskrizzjoni tal-kompitu jew l-istrateġija abbażi tar-riflessjoni
            task = reflection['improved_task']
    return None

Eżempju:
- Kompitu: "Ikkalkula 1234 * 5678"
- Azzjoni: Ikkalkula direttament, ikseb riżultat 7006652
- Riflessjoni: Iċċekkja l-proċess tal-kalkolu, sib żball fil-ġarr
- Aġġustament: Ikkalkula mill-ġdid, ikseb riżultat korrett 7006652 (attwalment korrett)
- Jekk għadu żbaljat, kompli rrifletti sakemm ikun korrett.

Sommarju u Tqabbil

Metodoloġija Karatteristiċi Xenarji Applikabbli
ReAct Raġunament u azzjoni jalternaw, aġġustament dinamiku Kompiti li jeħtieġu interazzjoni ta' informazzjoni f'ħin reali (eż. mistoqsijiet u tweġibiet, tfittxija)
Plan-and-Solve L-ewwel ippjana, imbagħad eżegwixxi, dekompożizzjoni strutturata Kompiti kumplessi b'ħafna passi (eż. kitba, analiżi tad-data)
Reflection Awto-riflessjoni u korrezzjoni, ottimizzazzjoni iterattiva Kompiti li jeħtieġu preċiżjoni għolja (eż. kalkoli matematiċi, ġenerazzjoni ta' kodiċi)

Fl-applikazzjonijiet prattiċi, ħafna drabi jingħaqdu t-tlieta, pereżempju billi żżid mekkaniżmu ta' riflessjoni ma' ReAct, jew billi tirrifletti wara kull pass f'Plan-and-Solve.

评论

暂无已展示的评论。

发表评论(匿名)