AI साक्षात्कार प्रश्न 6: AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection

AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection

AI एजेंट एक बुद्धिमान इकाई है जो स्वायत्त रूप से पर्यावरण को समझ सकता है, निर्णय ले सकता है और कार्य कर सकता है। इसकी तीन मुख्य विधियाँ हैं: ReAct, Plan-and-Solve और Reflection। नीचे प्रत्येक का परिचय दिया गया है, साथ ही फ़्लोचार्ट और कोड उदाहरण भी दिए गए हैं।

1. ReAct (Reasoning + Acting)

मुख्य विचार: तर्क (Reasoning) और क्रिया (Acting) को एक-दूसरे के साथ मिलाकर किया जाता है। एजेंट प्रत्येक चरण में पहले वर्तमान स्थिति और अगले कदम की योजना (तर्क) पर विचार करता है, फिर एक क्रिया (जैसे टूल कॉल करना, जानकारी खोजना) करता है, और परिणाम के आधार पर तर्क जारी रखता है।

फ़्लोचार्ट:

[प्रारंभिक स्थिति] → [तर्क: अगला कदम सोचें] → [क्रिया: कार्य करें] → [परिणाम देखें] → [तर्क: योजना अपडेट करें] → ... → [अंतिम उत्तर]

उदाहरण कोड (सूडोकोड):

def react_agent(question):
    context = []
    while not solved:
        # तर्क: विचार चरण उत्पन्न करें
        thought = llm.generate_thought(question, context)
        # क्रिया: विचार के आधार पर कार्य चुनें
        action = llm.choose_action(thought)
        # क्रिया निष्पादित करें, परिणाम प्राप्त करें
        observation = execute_action(action)
        # विचार, क्रिया, परिणाम को संदर्भ में जोड़ें
        context.append((thought, action, observation))
    return final_answer

उदाहरण:
- उपयोगकर्ता पूछता है: "आज बीजिंग का मौसम कैसा है?"
- एजेंट तर्क: "मुझे मौसम API कॉल करनी होगी, शहर का नाम और तारीख चाहिए।"
- क्रिया: मौसम API कॉल करें (पैरामीटर: बीजिंग, आज)
- परिणाम: "साफ़, 25°C"
- तर्क: "जानकारी मिल गई, उत्तर दे सकता हूँ।"
- आउटपुट: "बीजिंग आज साफ़, 25°C।"

2. Plan-and-Solve

मुख्य विचार: पहले पूरी योजना (Plan) बनाएं, फिर चरणबद्ध तरीके से निष्पादित करें (Solve)। योजना चरण में जटिल कार्य को उप-चरणों में विभाजित किया जाता है, निष्पादन चरण में क्रम से पूरा किया जाता है, और मध्यवर्ती परिणामों के आधार पर योजना को समायोजित किया जा सकता है।

फ़्लोचार्ट:

[कार्य] → [योजना बनाएं: उप-चरणों में विभाजित करें] → [चरण 1 निष्पादित करें] → [चरण 2 निष्पादित करें] → ... → [चरण N निष्पादित करें] → [अंतिम उत्तर]

उदाहरण कोड:

def plan_and_solve(task):
    # योजना चरण
    plan = llm.generate_plan(task)  # उदाहरण: ["जानकारी खोजें", "जानकारी व्यवस्थित करें", "रिपोर्ट लिखें"]
    context = {}
    for step in plan:
        # प्रत्येक चरण निष्पादित करें
        result = execute_step(step, context)
        context[step] = result
    # परिणामों को संश्लेषित करें
    final = llm.synthesize(context)
    return final

उदाहरण:
- कार्य: "AI एजेंट पर एक ब्लॉग लिखें"
- योजना:
1. AI एजेंट की परिभाषा और नवीनतम प्रगति खोजें
2. पढ़ें और मुख्य बिंदु व्यवस्थित करें
3. ब्लॉग की रूपरेखा लिखें
4. सामग्री भरें
5. प्रूफ़रीड करें और प्रकाशित करें
- निष्पादन: प्रत्येक चरण क्रम से पूरा करें, अंत में ब्लॉग आउटपुट करें।

3. Reflection

मुख्य विचार: एजेंट निष्पादन के दौरान या बाद में अपने व्यवहार पर चिंतन (Reflection) करता है, परिणाम का मूल्यांकन करता है और बाद की कार्रवाइयों में सुधार करता है। इसमें आमतौर पर आत्म-आलोचना, त्रुटि सुधार या रणनीति अनुकूलन शामिल होता है।

फ़्लोचार्ट:

[क्रिया] → [परिणाम देखें] → [चिंतन: सफलता का मूल्यांकन] → [यदि असफल: रणनीति समायोजित करें] → [पुनः क्रिया] → ... → [सफल]

उदाहरण कोड:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # चिंतन
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # चिंतन के आधार पर कार्य विवरण या रणनीति समायोजित करें
            task = reflection['improved_task']
    return None

उदाहरण:
- कार्य: "1234 * 5678 की गणना करें"
- क्रिया: सीधे गणना करें, परिणाम 7006652 प्राप्त करें
- चिंतन: गणना प्रक्रिया की जाँच करें, कैरी त्रुटि पाएँ
- समायोजन: पुनः गणना करें, सही परिणाम 7006652 प्राप्त करें (वास्तव में सही)
- यदि फिर भी त्रुटि हो, तब तक चिंतन जारी रखें जब तक सही न हो जाए।

सारांश तुलना

विधि	विशेषताएँ	उपयुक्त परिदृश्य
ReAct	तर्क और क्रिया का अंतर्संबंध, गतिशील समायोजन	वास्तविक समय सूचना आदान-प्रदान वाले कार्य (जैसे प्रश्नोत्तर, खोज)
Plan-and-Solve	पहले योजना फिर निष्पादन, संरचित विभाजन	जटिल बहु-चरणीय कार्य (जैसे लेखन, डेटा विश्लेषण)
Reflection	आत्म-चिंतन और सुधार, पुनरावृत्त अनुकूलन	उच्च सटीकता वाले कार्य (जैसे गणितीय गणना, कोड निर्माण)

व्यावहारिक अनुप्रयोगों में, इन तीनों को अक्सर संयोजित किया जाता है, जैसे ReAct में चिंतन तंत्र जोड़ना, या Plan-and-Solve में प्रत्येक चरण के बाद चिंतन करना।

AI साक्षात्कार प्रश्न 6: AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection

AI एजेंट की तीन मुख्य विधियाँ: ReAct, Plan-and-Solve और Reflection

1. ReAct (Reasoning + Acting)

2. Plan-and-Solve

3. Reflection

सारांश तुलना

评论

发表评论（匿名）