AI தொடர் நேர்காணல் கேள்வி 6: AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection

AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection

AI ஏஜென்ட் என்பது சூழலை உணர்ந்து, முடிவுகளை எடுத்து, செயல்களைச் செய்யும் தன்னாட்சி நிறுவனமாகும். இதன் முக்கிய முறைகள் மூன்று: ReAct, Plan-and-Solve மற்றும் Reflection. கீழே ஒவ்வொன்றும் விளக்கப்பட்டுள்ளன, ஓட்ட விளக்கப்படங்கள் மற்றும் குறியீடு எடுத்துக்காட்டுகளுடன்.

1. ReAct (Reasoning + Acting)

முக்கிய கருத்து: பகுத்தறிதல் (Reasoning) மற்றும் செயல் (Acting) ஆகியவற்றை மாறி மாறி செய்யவும். ஏஜென்ட் ஒவ்வொரு அடியிலும் தற்போதைய நிலை மற்றும் அடுத்த படியை (பகுத்தறிதல்) சிந்தித்து, பின்னர் ஒரு செயலைச் செய்து (கருவியை அழைப்பது, தகவலைத் தேடுவது போன்றவை), முடிவின் அடிப்படையில் மீண்டும் பகுத்தறியும்.

ஓட்ட விளக்கப்படம்:

[ஆரம்ப நிலை] → [பகுத்தறிதல்: அடுத்த படியை சிந்தி] → [செயல்: செயலைச் செய்] → [முடிவைக் கவனி] → [பகுத்தறிதல்: திட்டத்தைப் புதுப்பி] → ... → [இறுதி விடை]

எடுத்துக்காட்டு குறியீடு (போலிக் குறியீடு):

def react_agent(question):
    context = []
    while not solved:
        # பகுத்தறிதல்: சிந்தனை படியை உருவாக்கு
        thought = llm.generate_thought(question, context)
        # செயல்: சிந்தனையின் அடிப்படையில் செயலைத் தேர்ந்தெடு
        action = llm.choose_action(thought)
        # செயலைச் செய்து, கவனிப்பைப் பெறு
        observation = execute_action(action)
        # சிந்தனை, செயல், கவனிப்பை சூழலில் சேர்
        context.append((thought, action, observation))
    return final_answer

எடுத்துக்காட்டு:
- பயனர் கேட்கிறார்: "இன்று பெய்ஜிங் வானிலை எப்படி?"
- ஏஜென்ட் பகுத்தறிதல்: "நான் வானிலை API ஐ வினவ வேண்டும், நகரம் மற்றும் தேதி தேவை."
- செயல்: வானிலை API ஐ அழை (அளவுருக்கள்: பெய்ஜிங், இன்று)
- கவனிப்பு: "தெளிவு, 25°C" திரும்புகிறது
- பகுத்தறிதல்: "தகவல் கிடைத்தது, பதிலளிக்கலாம்."
- வெளியீடு: "பெய்ஜிங் இன்று தெளிவு, 25°C."

2. Plan-and-Solve

முக்கிய கருத்து: முதலில் முழுமையான திட்டத்தை (Plan) உருவாக்கி, பின்னர் படிப்படியாக செயல்படுத்தவும் (Solve). திட்டமிடல் கட்டத்தில் சிக்கலான பணியை துணைப் படிகளாகப் பிரித்து, செயல்படுத்தும் கட்டத்தில் வரிசையாக முடித்து, இடைநிலை முடிவுகளின் அடிப்படையில் திட்டத்தை சரிசெய்யலாம்.

ஓட்ட விளக்கப்படம்:

[பணி] → [திட்டமிடல்: துணைப் படிகளைப் பிரி] → [படி 1 ஐ செயல்படுத்து] → [படி 2 ஐ செயல்படுத்து] → ... → [படி N ஐ செயல்படுத்து] → [இறுதி விடை]

எடுத்துக்காட்டு குறியீடு:

def plan_and_solve(task):
    # திட்டமிடல் கட்டம்
    plan = llm.generate_plan(task)  # எ.கா.: ["தகவல் தேடு", "தகவலை ஒழுங்குபடுத்து", "அறிக்கை எழுது"]
    context = {}
    for step in plan:
        # ஒவ்வொரு படியையும் செயல்படுத்து
        result = execute_step(step, context)
        context[step] = result
    # முடிவுகளை ஒருங்கிணை
    final = llm.synthesize(context)
    return final

எடுத்துக்காட்டு:
- பணி: "AI ஏஜெண்டுகள் பற்றி ஒரு வலைப்பதிவு எழுது"
- திட்டம்:
1. AI ஏஜெண்டின் வரையறை மற்றும் சமீபத்திய முன்னேற்றங்களைத் தேடு
2. முக்கிய புள்ளிகளைப் படித்து ஒழுங்குபடுத்து
3. வலைப்பதிவின் வெளிப்புறத்தை எழுது
4. உள்ளடக்கத்தை நிரப்பு
5. சரிபார்த்து வெளியிடு
- செயல்படுத்தல்: ஒவ்வொரு படியையும் வரிசையாக முடித்து, இறுதியாக வலைப்பதிவை வெளியிடு.

3. Reflection

முக்கிய கருத்து: ஏஜென்ட் செயல்பாட்டின் போது அல்லது பின், தனது சொந்த நடத்தையைப் பற்றி சிந்தித்து (Reflection), முடிவுகளை மதிப்பிட்டு அடுத்த செயல்களை மேம்படுத்தும். பொதுவாக சுய விமர்சனம், பிழை திருத்தம் அல்லது உத்தி மேம்படுத்தல் ஆகியவை அடங்கும்.

ஓட்ட விளக்கப்படம்:

[செயல்] → [முடிவைக் கவனி] → [சிந்தனை: வெற்றியா என மதிப்பிடு] → [தோல்வி என்றால்: உத்தியை சரிசெய்] → [மீண்டும் செயல்] → ... → [வெற்றி]

எடுத்துக்காட்டு குறியீடு:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # சிந்தனை
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # சிந்தனையின் அடிப்படையில் பணி விளக்கம் அல்லது உத்தியை சரிசெய்
            task = reflection['improved_task']
    return None

எடுத்துக்காட்டு:
- பணி: "1234 * 5678 கணக்கிடு"
- செயல்: நேரடியாகக் கணக்கிட்டு, முடிவு 7006652
- சிந்தனை: கணக்கீட்டு செயல்முறையைச் சரிபார்த்து, கேரி பிழை கண்டறியப்பட்டது
- சரிசெய்தல்: மீண்டும் கணக்கிட்டு, சரியான முடிவு 7006652 (உண்மையில் சரி)
- இன்னும் பிழை இருந்தால், சரியாகும் வரை சிந்தனை தொடரும்.

சுருக்க ஒப்பீடு

முறை	பண்புகள்	பொருந்தும் சூழல்கள்
ReAct	பகுத்தறிதல் மற்றும் செயல் மாறி மாறி, மாறும் சரிசெய்தல்	நிகழ்நேர தகவல் தொடர்பு தேவைப்படும் பணிகள் (கேள்வி-பதில், தேடல்)
Plan-and-Solve	முதலில் திட்டமிட்டு பின் செயல்படுத்தல், கட்டமைக்கப்பட்ட பிரித்தல்	சிக்கலான பல-படி பணிகள் (எழுத்து, தரவு பகுப்பாய்வு)
Reflection	சுய சிந்தனை மற்றும் திருத்தம், மீள்செயல் மேம்படுத்தல்	உயர் துல்லியம் தேவைப்படும் பணிகள் (கணித கணக்கீடு, குறியீடு உருவாக்கம்)

நடைமுறை பயன்பாடுகளில், இவை மூன்றும் இணைக்கப்படுகின்றன, எ.கா., ReAct இல் சிந்தனை பொறிமுறையைச் சேர்ப்பது அல்லது Plan-and-Solve இல் ஒவ்வொரு படியின் பின்னும் சிந்தனை செய்வது.

AI தொடர் நேர்காணல் கேள்வி 6: AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection

AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection

1. ReAct (Reasoning + Acting)

2. Plan-and-Solve

3. Reflection

சுருக்க ஒப்பீடு

评论

发表评论（匿名）