Maswali 6 ya Mfululizo wa AI: Taja Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection

Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection

AI Agent ni wakala mahiri ambao wanaweza kujitegemea kutambua mazingira, kufanya maamuzi na kutekeleza vitendo. Mbinu zake za msingi ni tatu: ReAct, Plan-and-Solve na Reflection. Hapa chini tunazielezea kwa kina, pamoja na michoro ya mtiririko na mifano ya msimbo.

1. ReAct (Reasoning + Acting)

Wazo kuu: Kuchanganya hoja (Reasoning) na hatua (Acting) kwa njia mbadala. Katika kila hatua, Agent kwanza anafikiri juu ya hali ya sasa na mpango unaofuata (hoja), kisha anatekeleza kitendo (kama vile kutumia zana, kutafuta habari), na kisha anaendelea na hoja kulingana na matokeo.

Mchoro wa mtiririko:

[Hali ya awali] → [Hoja: fikiria hatua inayofuata] → [Kitendo: tekeleza kitendo] → [Angalia matokeo] → [Hoja: sasisha mpango] → ... → [Jibu la mwisho]

Mfano wa msimbo (pseudo-code):

def react_agent(question):
    context = []
    while not solved:
        # Hoja: toa hatua za kufikiri
        thought = llm.generate_thought(question, context)
        # Kitendo: chagua kitendo kulingana na mawazo
        action = llm.choose_action(thought)
        # Tekeleza kitendo, pata uchunguzi
        observation = execute_action(action)
        # Ongeza mawazo, kitendo, uchunguzi kwenye muktadha
        context.append((thought, action, observation))
    return final_answer

Mfano:
- Mtumiaji anauliza: "Hali ya hewa ya Beijing leo ikoje?"
- Agent anafikiri: "Nahitaji kuangalia API ya hali ya hewa, nahitaji jina la mji na tarehe."
- Kitendo: Piga API ya hali ya hewa (vigezo: Beijing, leo)
- Uchunguzi: Inarudi "Jua, 25°C"
- Hoja: "Nimepata habari, naweza kujibu."
- Pato: "Beijing leo ni jua, 25°C."

2. Plan-and-Solve

Wazo kuu: Kwanza tengeneza mpango kamili (Plan), kisha tekeleza hatua kwa hatua (Solve). Katika awamu ya kupanga, kazi ngumu inagawanywa katika hatua ndogo; katika awamu ya utekelezaji, hatua zinatekelezwa kwa mpangilio, na mpango unaweza kubadilishwa kulingana na matokeo ya kati.

Mchoro wa mtiririko:

[Kazi] → [Tengeneza mpango: gawanya katika hatua ndogo] → [Tekeleza hatua 1] → [Tekeleza hatua 2] → ... → [Tekeleza hatua N] → [Jibu la mwisho]

Mfano wa msimbo:

def plan_and_solve(task):
    # Awamu ya kupanga
    plan = llm.generate_plan(task)  # Kwa mfano: ["Tafuta nyaraka", "Panga habari", "Andika ripoti"]
    context = {}
    for step in plan:
        # Tekeleza kila hatua
        result = execute_step(step, context)
        context[step] = result
    # Unganisha matokeo
    final = llm.synthesize(context)
    return final

Mfano:
- Kazi: "Andika blogu kuhusu AI Agent"
- Mpango:
1. Tafuta ufafanuzi wa AI Agent na maendeleo ya hivi karibuni
2. Soma na panga mambo muhimu
3. Andika muhtasari wa blogu
4. Jaza maudhui
5. Hariri na chapisha
- Utekelezaji: Tekeleza kila hatua kwa mpangilio, hatimaye toa blogu.

3. Reflection

Wazo kuu: Wakati wa utekelezaji au baada ya utekelezaji, Agent anajitafakari (Reflection), kutathmini matokeo na kuboresha hatua zinazofuata. Kwa kawaida inajumuisha kujikosoa, kusahihisha makosa au kuboresha mkakati.

Mchoro wa mtiririko:

[Kitendo] → [Angalia matokeo] → [Tafakari: tathmini kama imefaulu] → [Ikishindwa: rekebisha mkakati] → [Tekeleza tena] → ... → [Mafanikio]

Mfano wa msimbo:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # Tafakari
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # Rekebisha maelezo ya kazi au mkakati kulingana na tafakari
            task = reflection['improved_task']
    return None

Mfano:
- Kazi: "Hesabu 1234 * 5678"
- Kitendo: Hesabu moja kwa moja, pata matokeo 7006652
- Tafakari: Angalia mchakato wa hesabu, gundua kosa la kubeba
- Rekebisha: Hesabu tena, pata matokeo sahihi 7006652 (kwa kweli sahihi)
- Ikiwa bado kosa, endelea kutafakari hadi sahihi.

Muhtasari na Ulinganisho

Mbinu	Sifa	Matumizi yanayofaa
ReAct	Hoja na vitendo kwa njia mbadala, kubadilika kwa wakati	Kazi zinazohitaji mwingiliano wa habari kwa wakati halisi (kama vile maswali na majibu, utafutaji)
Plan-and-Solve	Panga kwanza kisha tekeleza, mgawanyo wa muundo	Kazi ngumu za hatua nyingi (kama vile uandishi, uchambuzi wa data)
Reflection	Kujitafakari na kusahihisha, kuboresha kwa kurudia	Kazi zinazohitaji usahihi wa juu (kama vile hesabu za hisabati, uzalishaji wa msimbo)

Katika matumizi halisi, mbinu hizi mara nyingi huunganishwa, kwa mfano ReAct ikiongezwa utaratibu wa kutafakari, au Plan-and-Solve kila hatua ikifuatiwa na kutafakari.

Maswali 6 ya Mfululizo wa AI: Taja Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection

Mbinu Tatu za Msingi za AI Agent: ReAct, Plan-and-Solve na Reflection

1. ReAct (Reasoning + Acting)

2. Plan-and-Solve

3. Reflection

Muhtasari na Ulinganisho

评论

发表评论（匿名）