AI साक्षात्कार प्रश्न 6: AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection
AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection
AI एजेंट एक बुद्धिमान इकाई है जो स्वायत्त रूप से पर्यावरण को समझ सकता है, निर्णय ले सकता है और कार्य कर सकता है। इसकी तीन मुख्य विधियाँ हैं: ReAct, Plan-and-Solve और Reflection। नीचे प्रत्येक का परिचय दिया गया है, साथ ही फ़्लोचार्ट और कोड उदाहरण भी दिए गए हैं।
1. ReAct (Reasoning + Acting)
मुख्य विचार: तर्क (Reasoning) और क्रिया (Acting) को एक-दूसरे के साथ मिलाकर किया जाता है। एजेंट प्रत्येक चरण में पहले वर्तमान स्थिति और अगले कदम की योजना (तर्क) पर विचार करता है, फिर एक क्रिया (जैसे टूल कॉल करना, जानकारी खोजना) करता है, और परिणाम के आधार पर तर्क जारी रखता है।
फ़्लोचार्ट:
[प्रारंभिक स्थिति] → [तर्क: अगला कदम सोचें] → [क्रिया: कार्य करें] → [परिणाम देखें] → [तर्क: योजना अपडेट करें] → ... → [अंतिम उत्तर]
उदाहरण कोड (सूडोकोड):
def react_agent(question):
context = []
while not solved:
# तर्क: विचार चरण उत्पन्न करें
thought = llm.generate_thought(question, context)
# क्रिया: विचार के आधार पर कार्य चुनें
action = llm.choose_action(thought)
# क्रिया निष्पादित करें, परिणाम प्राप्त करें
observation = execute_action(action)
# विचार, क्रिया, परिणाम को संदर्भ में जोड़ें
context.append((thought, action, observation))
return final_answer
उदाहरण:
- उपयोगकर्ता पूछता है: "आज बीजिंग का मौसम कैसा है?"
- एजेंट तर्क: "मुझे मौसम API कॉल करनी होगी, शहर का नाम और तारीख चाहिए।"
- क्रिया: मौसम API कॉल करें (पैरामीटर: बीजिंग, आज)
- परिणाम: "साफ़, 25°C"
- तर्क: "जानकारी मिल गई, उत्तर दे सकता हूँ।"
- आउटपुट: "बीजिंग आज साफ़, 25°C।"
2. Plan-and-Solve
मुख्य विचार: पहले पूरी योजना (Plan) बनाएं, फिर चरणबद्ध तरीके से निष्पादित करें (Solve)। योजना चरण में जटिल कार्य को उप-चरणों में विभाजित किया जाता है, निष्पादन चरण में क्रम से पूरा किया जाता है, और मध्यवर्ती परिणामों के आधार पर योजना को समायोजित किया जा सकता है।
फ़्लोचार्ट:
[कार्य] → [योजना बनाएं: उप-चरणों में विभाजित करें] → [चरण 1 निष्पादित करें] → [चरण 2 निष्पादित करें] → ... → [चरण N निष्पादित करें] → [अंतिम उत्तर]
उदाहरण कोड:
def plan_and_solve(task):
# योजना चरण
plan = llm.generate_plan(task) # उदाहरण: ["जानकारी खोजें", "जानकारी व्यवस्थित करें", "रिपोर्ट लिखें"]
context = {}
for step in plan:
# प्रत्येक चरण निष्पादित करें
result = execute_step(step, context)
context[step] = result
# परिणामों को संश्लेषित करें
final = llm.synthesize(context)
return final
उदाहरण:
- कार्य: "AI एजेंट पर एक ब्लॉग लिखें"
- योजना:
1. AI एजेंट की परिभाषा और नवीनतम प्रगति खोजें
2. पढ़ें और मुख्य बिंदु व्यवस्थित करें
3. ब्लॉग की रूपरेखा लिखें
4. सामग्री भरें
5. प्रूफ़रीड करें और प्रकाशित करें
- निष्पादन: प्रत्येक चरण क्रम से पूरा करें, अंत में ब्लॉग आउटपुट करें।
3. Reflection
मुख्य विचार: एजेंट निष्पादन के दौरान या बाद में अपने व्यवहार पर चिंतन (Reflection) करता है, परिणाम का मूल्यांकन करता है और बाद की कार्रवाइयों में सुधार करता है। इसमें आमतौर पर आत्म-आलोचना, त्रुटि सुधार या रणनीति अनुकूलन शामिल होता है।
फ़्लोचार्ट:
[क्रिया] → [परिणाम देखें] → [चिंतन: सफलता का मूल्यांकन] → [यदि असफल: रणनीति समायोजित करें] → [पुनः क्रिया] → ... → [सफल]
उदाहरण कोड:
def reflection_agent(task):
max_attempts = 3
for attempt in range(max_attempts):
action = llm.generate_action(task)
result = execute(action)
# चिंतन
reflection = llm.reflect(task, action, result)
if reflection['success']:
return result
else:
# चिंतन के आधार पर कार्य विवरण या रणनीति समायोजित करें
task = reflection['improved_task']
return None
उदाहरण:
- कार्य: "1234 * 5678 की गणना करें"
- क्रिया: सीधे गणना करें, परिणाम 7006652 प्राप्त करें
- चिंतन: गणना प्रक्रिया की जाँच करें, कैरी त्रुटि पाएँ
- समायोजन: पुनः गणना करें, सही परिणाम 7006652 प्राप्त करें (वास्तव में सही)
- यदि फिर भी त्रुटि हो, तब तक चिंतन जारी रखें जब तक सही न हो जाए।
सारांश तुलना
| विधि | विशेषताएँ | उपयुक्त परिदृश्य |
|---|---|---|
| ReAct | तर्क और क्रिया का अंतर्संबंध, गतिशील समायोजन | वास्तविक समय सूचना आदान-प्रदान वाले कार्य (जैसे प्रश्नोत्तर, खोज) |
| Plan-and-Solve | पहले योजना फिर निष्पादन, संरचित विभाजन | जटिल बहु-चरणीय कार्य (जैसे लेखन, डेटा विश्लेषण) |
| Reflection | आत्म-चिंतन और सुधार, पुनरावृत्त अनुकूलन | उच्च सटीकता वाले कार्य (जैसे गणितीय गणना, कोड निर्माण) |
व्यावहारिक अनुप्रयोगों में, इन तीनों को अक्सर संयोजित किया जाता है, जैसे ReAct में चिंतन तंत्र जोड़ना, या Plan-and-Solve में प्रत्येक चरण के बाद चिंतन करना।
评论
暂无已展示的评论。
发表评论(匿名)