Maswali 6 ya Mfululizo wa AI: Taja Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection
Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection
AI Agent ni wakala mahiri ambao wanaweza kujitegemea kutambua mazingira, kufanya maamuzi na kutekeleza vitendo. Mbinu zake za msingi ni tatu: ReAct, Plan-and-Solve na Reflection. Hapa chini tunazielezea kwa kina, pamoja na michoro ya mtiririko na mifano ya msimbo.
1. ReAct (Reasoning + Acting)
Wazo kuu: Kuchanganya hoja (Reasoning) na hatua (Acting) kwa njia mbadala. Katika kila hatua, Agent kwanza anafikiri juu ya hali ya sasa na mpango unaofuata (hoja), kisha anatekeleza kitendo (kama vile kutumia zana, kutafuta habari), na kisha anaendelea na hoja kulingana na matokeo.
Mchoro wa mtiririko:
[Hali ya awali] → [Hoja: fikiria hatua inayofuata] → [Kitendo: tekeleza kitendo] → [Angalia matokeo] → [Hoja: sasisha mpango] → ... → [Jibu la mwisho]
Mfano wa msimbo (pseudo-code):
def react_agent(question):
context = []
while not solved:
# Hoja: toa hatua za kufikiri
thought = llm.generate_thought(question, context)
# Kitendo: chagua kitendo kulingana na mawazo
action = llm.choose_action(thought)
# Tekeleza kitendo, pata uchunguzi
observation = execute_action(action)
# Ongeza mawazo, kitendo, uchunguzi kwenye muktadha
context.append((thought, action, observation))
return final_answer
Mfano:
- Mtumiaji anauliza: "Hali ya hewa ya Beijing leo ikoje?"
- Agent anafikiri: "Nahitaji kuangalia API ya hali ya hewa, nahitaji jina la mji na tarehe."
- Kitendo: Piga API ya hali ya hewa (vigezo: Beijing, leo)
- Uchunguzi: Inarudi "Jua, 25°C"
- Hoja: "Nimepata habari, naweza kujibu."
- Pato: "Beijing leo ni jua, 25°C."
2. Plan-and-Solve
Wazo kuu: Kwanza tengeneza mpango kamili (Plan), kisha tekeleza hatua kwa hatua (Solve). Katika awamu ya kupanga, kazi ngumu inagawanywa katika hatua ndogo; katika awamu ya utekelezaji, hatua zinatekelezwa kwa mpangilio, na mpango unaweza kubadilishwa kulingana na matokeo ya kati.
Mchoro wa mtiririko:
[Kazi] → [Tengeneza mpango: gawanya katika hatua ndogo] → [Tekeleza hatua 1] → [Tekeleza hatua 2] → ... → [Tekeleza hatua N] → [Jibu la mwisho]
Mfano wa msimbo:
def plan_and_solve(task):
# Awamu ya kupanga
plan = llm.generate_plan(task) # Kwa mfano: ["Tafuta nyaraka", "Panga habari", "Andika ripoti"]
context = {}
for step in plan:
# Tekeleza kila hatua
result = execute_step(step, context)
context[step] = result
# Unganisha matokeo
final = llm.synthesize(context)
return final
Mfano:
- Kazi: "Andika blogu kuhusu AI Agent"
- Mpango:
1. Tafuta ufafanuzi wa AI Agent na maendeleo ya hivi karibuni
2. Soma na panga mambo muhimu
3. Andika muhtasari wa blogu
4. Jaza maudhui
5. Hariri na chapisha
- Utekelezaji: Tekeleza kila hatua kwa mpangilio, hatimaye toa blogu.
3. Reflection
Wazo kuu: Wakati wa utekelezaji au baada ya utekelezaji, Agent anajitafakari (Reflection), kutathmini matokeo na kuboresha hatua zinazofuata. Kwa kawaida inajumuisha kujikosoa, kusahihisha makosa au kuboresha mkakati.
Mchoro wa mtiririko:
[Kitendo] → [Angalia matokeo] → [Tafakari: tathmini kama imefaulu] → [Ikishindwa: rekebisha mkakati] → [Tekeleza tena] → ... → [Mafanikio]
Mfano wa msimbo:
def reflection_agent(task):
max_attempts = 3
for attempt in range(max_attempts):
action = llm.generate_action(task)
result = execute(action)
# Tafakari
reflection = llm.reflect(task, action, result)
if reflection['success']:
return result
else:
# Rekebisha maelezo ya kazi au mkakati kulingana na tafakari
task = reflection['improved_task']
return None
Mfano:
- Kazi: "Hesabu 1234 * 5678"
- Kitendo: Hesabu moja kwa moja, pata matokeo 7006652
- Tafakari: Angalia mchakato wa hesabu, gundua kosa la kubeba
- Rekebisha: Hesabu tena, pata matokeo sahihi 7006652 (kwa kweli sahihi)
- Ikiwa bado kosa, endelea kutafakari hadi sahihi.
Muhtasari na Ulinganisho
| Mbinu | Sifa | Matumizi yanayofaa |
|---|---|---|
| ReAct | Hoja na vitendo kwa njia mbadala, kubadilika kwa wakati | Kazi zinazohitaji mwingiliano wa habari kwa wakati halisi (kama vile maswali na majibu, utafutaji) |
| Plan-and-Solve | Panga kwanza kisha tekeleza, mgawanyo wa muundo | Kazi ngumu za hatua nyingi (kama vile uandishi, uchambuzi wa data) |
| Reflection | Kujitafakari na kusahihisha, kuboresha kwa kurudia | Kazi zinazohitaji usahihi wa juu (kama vile hesabu za hisabati, uzalishaji wa msimbo) |
Katika matumizi halisi, mbinu hizi mara nyingi huunganishwa, kwa mfano ReAct ikiongezwa utaratibu wa kutafakari, au Plan-and-Solve kila hatua ikifuatiwa na kutafakari.
评论
暂无已展示的评论。
发表评论(匿名)