Mistoqsijiet ta' Intervista dwar AI Serje 6: It-tliet Metodoloġiji Ewlenin ta' AI Agent: ReAct, Plan-and-Solve u Reflection
It-tliet Metodoloġiji Ewlenin ta' AI Agent: ReAct, Plan-and-Solve u Reflection
AI Agent huwa aġent intelliġenti li jista' jħoss l-ambjent b'mod awtonomu, jieħu deċiżjonijiet u jwettaq azzjonijiet. Il-metodoloġiji ewlenin tiegħu huma tlieta: ReAct, Plan-and-Solve u Reflection. Hawn taħt se nispjegaw kull waħda, flimkien ma' dijagrammi tal-fluss u eżempji ta' kodiċi.
1. ReAct (Raġunament + Azzjoni)
Ħsieb Ewlieni: Jalterna bejn ir-raġunament (Reasoning) u l-azzjoni (Acting). L-Agent f'kull pass l-ewwel jaħseb dwar l-istat attwali u l-pjan li jmiss (raġunament), imbagħad iwettaq azzjoni (bħal li juża għodda, ifittex informazzjoni), u mbagħad ikompli jirraġuna abbażi tar-riżultat.
Dijagramma tal-Fluss:
[Stat Inizjali] → [Raġunament: Aħseb dwar il-pass li jmiss] → [Azzjoni: Wettaq azzjoni] → [Osserva r-riżultat] → [Raġunament: Aġġorna l-pjan] → ... → [Tweġiba Finali]
Eżempju ta' Kodiċi (psewdo-kodiċi):
def react_agent(question):
context = []
while not solved:
# Raġunament: Iġġenera pass ta' ħsieb
thought = llm.generate_thought(question, context)
# Azzjoni: Agħżel azzjoni abbażi tal-ħsieb
action = llm.choose_action(thought)
# Wettaq l-azzjoni, ikseb osservazzjoni
observation = execute_action(action)
# Żid il-ħsieb, l-azzjoni u l-osservazzjoni fil-kuntest
context.append((thought, action, observation))
return final_answer
Eżempju:
- Utent jistaqsi: "Kif it-temp illum f'Beijing?"
- Agent jirraġuna: "Għandi bżonn nikkonsulta API tat-temp, għandi bżonn l-isem tal-belt u d-data."
- Azzjoni: Sejjaħ API tat-temp (parametri: Beijing, illum)
- Osservazzjoni: Jirritorna "Xemx, 25°C"
- Raġunament: "Kisbajt l-informazzjoni, nista' nwieġeb."
- Output: "Beijing illum xemx, 25°C."
2. Plan-and-Solve
Ħsieb Ewlieni: L-ewwel ifassal pjan komplut (Plan), imbagħad iwettaqu pass pass (Solve). Fil-fażi tal-pjan, il-kompitu kumpless jinqasam f'sotto-passi; fil-fażi tal-eżekuzzjoni, isiru fl-ordni, u l-pjan jista' jiġi aġġustat abbażi ta' riżultati intermedji.
Dijagramma tal-Fluss:
[Kompitu] → [Ifassal pjan: Aqsam f'sotto-passi] → [Wettaq pass 1] → [Wettaq pass 2] → ... → [Wettaq pass N] → [Tweġiba Finali]
Eżempju ta' Kodiċi:
def plan_and_solve(task):
# Fażi tal-pjan
plan = llm.generate_plan(task) # eż.: ["Fittex informazzjoni", "Organizza l-informazzjoni", "Ikteb rapport"]
context = {}
for step in plan:
# Wettaq kull pass
result = execute_step(step, context)
context[step] = result
# Ikkombina r-riżultati
final = llm.synthesize(context)
return final
Eżempju:
- Kompitu: "Ikteb blog post dwar AI Agent"
- Pjan:
1. Fittex definizzjoni ta' AI Agent u l-aħħar żviluppi
2. Aqra u organizza l-punti ewlenin
3. Ikteb abbozz tal-blog
4. Imla l-kontenut
5. Ikkoreġi u ppubblika
- Eżekuzzjoni: Tlesti kull pass fl-ordni, finalment tipproduċi l-blog post.
3. Reflection
Ħsieb Ewlieni: L-Agent, waqt jew wara l-eżekuzzjoni, jirrifletti (Reflection) dwar l-imġiba tiegħu stess, jevalwa r-riżultati u jtejjeb l-azzjonijiet futuri. Normalment jinkludi awto-kritika, korrezzjoni ta' żbalji jew ottimizzazzjoni tal-istrateġija.
Dijagramma tal-Fluss:
[Azzjoni] → [Osserva r-riżultat] → [Riflessjoni: Evalwa jekk irnexxietx] → [Jekk falliet: Aġġusta l-istrateġija] → [Azzjoni mill-ġdid] → ... → [Suċċess]
Eżempju ta' Kodiċi:
def reflection_agent(task):
max_attempts = 3
for attempt in range(max_attempts):
action = llm.generate_action(task)
result = execute(action)
# Riflessjoni
reflection = llm.reflect(task, action, result)
if reflection['success']:
return result
else:
# Aġġusta d-deskrizzjoni tal-kompitu jew l-istrateġija abbażi tar-riflessjoni
task = reflection['improved_task']
return None
Eżempju:
- Kompitu: "Ikkalkula 1234 * 5678"
- Azzjoni: Ikkalkula direttament, ikseb riżultat 7006652
- Riflessjoni: Iċċekkja l-proċess tal-kalkolu, sib żball fil-ġarr
- Aġġustament: Ikkalkula mill-ġdid, ikseb riżultat korrett 7006652 (attwalment korrett)
- Jekk għadu żbaljat, kompli rrifletti sakemm ikun korrett.
Sommarju u Tqabbil
| Metodoloġija | Karatteristiċi | Xenarji Applikabbli |
|---|---|---|
| ReAct | Raġunament u azzjoni jalternaw, aġġustament dinamiku | Kompiti li jeħtieġu interazzjoni ta' informazzjoni f'ħin reali (eż. mistoqsijiet u tweġibiet, tfittxija) |
| Plan-and-Solve | L-ewwel ippjana, imbagħad eżegwixxi, dekompożizzjoni strutturata | Kompiti kumplessi b'ħafna passi (eż. kitba, analiżi tad-data) |
| Reflection | Awto-riflessjoni u korrezzjoni, ottimizzazzjoni iterattiva | Kompiti li jeħtieġu preċiżjoni għolja (eż. kalkoli matematiċi, ġenerazzjoni ta' kodiċi) |
Fl-applikazzjonijiet prattiċi, ħafna drabi jingħaqdu t-tlieta, pereżempju billi żżid mekkaniżmu ta' riflessjoni ma' ReAct, jew billi tirrifletti wara kull pass f'Plan-and-Solve.
评论
暂无已展示的评论。
发表评论(匿名)