AI தொடர் நேர்காணல் கேள்வி 6: AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection
AI ஏஜெண்டின் மூன்று முக்கிய முறைகள்: ReAct, Plan-and-Solve மற்றும் Reflection
AI ஏஜென்ட் என்பது சூழலை உணர்ந்து, முடிவுகளை எடுத்து, செயல்களைச் செய்யும் தன்னாட்சி நிறுவனமாகும். இதன் முக்கிய முறைகள் மூன்று: ReAct, Plan-and-Solve மற்றும் Reflection. கீழே ஒவ்வொன்றும் விளக்கப்பட்டுள்ளன, ஓட்ட விளக்கப்படங்கள் மற்றும் குறியீடு எடுத்துக்காட்டுகளுடன்.
1. ReAct (Reasoning + Acting)
முக்கிய கருத்து: பகுத்தறிதல் (Reasoning) மற்றும் செயல் (Acting) ஆகியவற்றை மாறி மாறி செய்யவும். ஏஜென்ட் ஒவ்வொரு அடியிலும் தற்போதைய நிலை மற்றும் அடுத்த படியை (பகுத்தறிதல்) சிந்தித்து, பின்னர் ஒரு செயலைச் செய்து (கருவியை அழைப்பது, தகவலைத் தேடுவது போன்றவை), முடிவின் அடிப்படையில் மீண்டும் பகுத்தறியும்.
ஓட்ட விளக்கப்படம்:
[ஆரம்ப நிலை] → [பகுத்தறிதல்: அடுத்த படியை சிந்தி] → [செயல்: செயலைச் செய்] → [முடிவைக் கவனி] → [பகுத்தறிதல்: திட்டத்தைப் புதுப்பி] → ... → [இறுதி விடை]
எடுத்துக்காட்டு குறியீடு (போலிக் குறியீடு):
def react_agent(question):
context = []
while not solved:
# பகுத்தறிதல்: சிந்தனை படியை உருவாக்கு
thought = llm.generate_thought(question, context)
# செயல்: சிந்தனையின் அடிப்படையில் செயலைத் தேர்ந்தெடு
action = llm.choose_action(thought)
# செயலைச் செய்து, கவனிப்பைப் பெறு
observation = execute_action(action)
# சிந்தனை, செயல், கவனிப்பை சூழலில் சேர்
context.append((thought, action, observation))
return final_answer
எடுத்துக்காட்டு:
- பயனர் கேட்கிறார்: "இன்று பெய்ஜிங் வானிலை எப்படி?"
- ஏஜென்ட் பகுத்தறிதல்: "நான் வானிலை API ஐ வினவ வேண்டும், நகரம் மற்றும் தேதி தேவை."
- செயல்: வானிலை API ஐ அழை (அளவுருக்கள்: பெய்ஜிங், இன்று)
- கவனிப்பு: "தெளிவு, 25°C" திரும்புகிறது
- பகுத்தறிதல்: "தகவல் கிடைத்தது, பதிலளிக்கலாம்."
- வெளியீடு: "பெய்ஜிங் இன்று தெளிவு, 25°C."
2. Plan-and-Solve
முக்கிய கருத்து: முதலில் முழுமையான திட்டத்தை (Plan) உருவாக்கி, பின்னர் படிப்படியாக செயல்படுத்தவும் (Solve). திட்டமிடல் கட்டத்தில் சிக்கலான பணியை துணைப் படிகளாகப் பிரித்து, செயல்படுத்தும் கட்டத்தில் வரிசையாக முடித்து, இடைநிலை முடிவுகளின் அடிப்படையில் திட்டத்தை சரிசெய்யலாம்.
ஓட்ட விளக்கப்படம்:
[பணி] → [திட்டமிடல்: துணைப் படிகளைப் பிரி] → [படி 1 ஐ செயல்படுத்து] → [படி 2 ஐ செயல்படுத்து] → ... → [படி N ஐ செயல்படுத்து] → [இறுதி விடை]
எடுத்துக்காட்டு குறியீடு:
def plan_and_solve(task):
# திட்டமிடல் கட்டம்
plan = llm.generate_plan(task) # எ.கா.: ["தகவல் தேடு", "தகவலை ஒழுங்குபடுத்து", "அறிக்கை எழுது"]
context = {}
for step in plan:
# ஒவ்வொரு படியையும் செயல்படுத்து
result = execute_step(step, context)
context[step] = result
# முடிவுகளை ஒருங்கிணை
final = llm.synthesize(context)
return final
எடுத்துக்காட்டு:
- பணி: "AI ஏஜெண்டுகள் பற்றி ஒரு வலைப்பதிவு எழுது"
- திட்டம்:
1. AI ஏஜெண்டின் வரையறை மற்றும் சமீபத்திய முன்னேற்றங்களைத் தேடு
2. முக்கிய புள்ளிகளைப் படித்து ஒழுங்குபடுத்து
3. வலைப்பதிவின் வெளிப்புறத்தை எழுது
4. உள்ளடக்கத்தை நிரப்பு
5. சரிபார்த்து வெளியிடு
- செயல்படுத்தல்: ஒவ்வொரு படியையும் வரிசையாக முடித்து, இறுதியாக வலைப்பதிவை வெளியிடு.
3. Reflection
முக்கிய கருத்து: ஏஜென்ட் செயல்பாட்டின் போது அல்லது பின், தனது சொந்த நடத்தையைப் பற்றி சிந்தித்து (Reflection), முடிவுகளை மதிப்பிட்டு அடுத்த செயல்களை மேம்படுத்தும். பொதுவாக சுய விமர்சனம், பிழை திருத்தம் அல்லது உத்தி மேம்படுத்தல் ஆகியவை அடங்கும்.
ஓட்ட விளக்கப்படம்:
[செயல்] → [முடிவைக் கவனி] → [சிந்தனை: வெற்றியா என மதிப்பிடு] → [தோல்வி என்றால்: உத்தியை சரிசெய்] → [மீண்டும் செயல்] → ... → [வெற்றி]
எடுத்துக்காட்டு குறியீடு:
def reflection_agent(task):
max_attempts = 3
for attempt in range(max_attempts):
action = llm.generate_action(task)
result = execute(action)
# சிந்தனை
reflection = llm.reflect(task, action, result)
if reflection['success']:
return result
else:
# சிந்தனையின் அடிப்படையில் பணி விளக்கம் அல்லது உத்தியை சரிசெய்
task = reflection['improved_task']
return None
எடுத்துக்காட்டு:
- பணி: "1234 * 5678 கணக்கிடு"
- செயல்: நேரடியாகக் கணக்கிட்டு, முடிவு 7006652
- சிந்தனை: கணக்கீட்டு செயல்முறையைச் சரிபார்த்து, கேரி பிழை கண்டறியப்பட்டது
- சரிசெய்தல்: மீண்டும் கணக்கிட்டு, சரியான முடிவு 7006652 (உண்மையில் சரி)
- இன்னும் பிழை இருந்தால், சரியாகும் வரை சிந்தனை தொடரும்.
சுருக்க ஒப்பீடு
| முறை | பண்புகள் | பொருந்தும் சூழல்கள் |
|---|---|---|
| ReAct | பகுத்தறிதல் மற்றும் செயல் மாறி மாறி, மாறும் சரிசெய்தல் | நிகழ்நேர தகவல் தொடர்பு தேவைப்படும் பணிகள் (கேள்வி-பதில், தேடல்) |
| Plan-and-Solve | முதலில் திட்டமிட்டு பின் செயல்படுத்தல், கட்டமைக்கப்பட்ட பிரித்தல் | சிக்கலான பல-படி பணிகள் (எழுத்து, தரவு பகுப்பாய்வு) |
| Reflection | சுய சிந்தனை மற்றும் திருத்தம், மீள்செயல் மேம்படுத்தல் | உயர் துல்லியம் தேவைப்படும் பணிகள் (கணித கணக்கீடு, குறியீடு உருவாக்கம்) |
நடைமுறை பயன்பாடுகளில், இவை மூன்றும் இணைக்கப்படுகின்றன, எ.கா., ReAct இல் சிந்தனை பொறிமுறையைச் சேர்ப்பது அல்லது Plan-and-Solve இல் ஒவ்வொரு படியின் பின்னும் சிந்தனை செய்வது.
评论
暂无已展示的评论。
发表评论(匿名)