← 返回列表

AI سیریز کے انٹرویو سوالات 6: AI ایجنٹ کے تین بنیادی طریقہ کار: ReAct، Plan-and-Solve اور Reflection

AI ایجنٹ کے تین بنیادی طریقہ کار: ReAct، Plan-and-Solve اور Reflection

AI ایجنٹ ایک ذہین وجود ہے جو خود مختار طور پر ماحول کو محسوس کر سکتا ہے، فیصلے کر سکتا ہے اور اعمال انجام دے سکتا ہے۔ اس کے بنیادی طریقہ کار تین ہیں: ReAct، Plan-and-Solve اور Reflection۔ ذیل میں ان کا تعارف، فلو چارٹ اور کوڈ کی مثالیں پیش کی گئی ہیں۔

1. ReAct (Reasoning + Acting)

بنیادی خیال: استدلال (Reasoning) اور عمل (Acting) کو باری باری انجام دینا۔ ایجنٹ ہر قدم پر پہلے موجودہ حالت اور اگلے منصوبے کے بارے میں سوچتا ہے (استدلال)، پھر ایک عمل انجام دیتا ہے (جیسے ٹول استعمال کرنا، معلومات تلاش کرنا)، اور پھر نتیجہ کی بنیاد پر استدلال جاری رکھتا ہے۔

فلو چارٹ:

[ابتدائی حالت] → [استدلال: اگلے قدم کے بارے میں سوچنا] → [عمل: عمل انجام دینا] → [نتیجہ دیکھنا] → [استدلال: منصوبہ اپ ڈیٹ کرنا] → ... → [حتمی جواب]

مثالی کوڈ (سیوڈو کوڈ):

def react_agent(question):
    context = []
    while not solved:
        # استدلال: سوچ کا مرحلہ تیار کریں
        thought = llm.generate_thought(question, context)
        # عمل: سوچ کی بنیاد پر عمل منتخب کریں
        action = llm.choose_action(thought)
        # عمل انجام دیں، مشاہدہ حاصل کریں
        observation = execute_action(action)
        # سوچ، عمل اور مشاہدہ کو سیاق میں شامل کریں
        context.append((thought, action, observation))
    return final_answer

مثال:
- صارف پوچھتا ہے: "آج بیجنگ کا موسم کیسا ہے؟"
- ایجنٹ استدلال: "مجھے موسم کی API استعمال کرنی ہے، شہر کا نام اور تاریخ چاہیے۔"
- عمل: موسم کی API کو کال کریں (پیرامیٹر: بیجنگ، آج)
- مشاہدہ: واپسی "صاف، 25°C"
- استدلال: "معلومات مل گئی، جواب دے سکتا ہوں۔"
- آؤٹ پٹ: "بیجنگ آج صاف، 25°C۔"

2. Plan-and-Solve

بنیادی خیال: پہلے ایک مکمل منصوبہ (Plan) بنائیں، پھر اسے مرحلہ وار انجام دیں (Solve)۔ منصوبہ بندی کے مرحلے میں پیچیدہ کام کو ذیلی مراحل میں تقسیم کیا جاتا ہے، اور عمل کے مرحلے میں ترتیب سے مکمل کیا جاتا ہے، ممکنہ طور پر درمیانی نتائج کی بنیاد پر منصوبہ میں تبدیلی کی جا سکتی ہے۔

فلو چارٹ:

[کام] → [منصوبہ بنانا: ذیلی مراحل میں تقسیم] → [مرحلہ 1 انجام دینا] → [مرحلہ 2 انجام دینا] → ... → [مرحلہ N انجام دینا] → [حتمی جواب]

مثالی کوڈ:

def plan_and_solve(task):
    # منصوبہ بندی کا مرحلہ
    plan = llm.generate_plan(task)  # مثال: ["معلومات تلاش کریں", "معلومات ترتیب دیں", "رپورٹ لکھیں"]
    context = {}
    for step in plan:
        # ہر مرحلہ انجام دیں
        result = execute_step(step, context)
        context[step] = result
    # نتائج کو یکجا کریں
    final = llm.synthesize(context)
    return final

مثال:
- کام: "AI ایجنٹ کے بارے میں ایک بلاگ لکھیں"
- منصوبہ:
1. AI ایجنٹ کی تعریف اور تازہ ترین پیشرفت تلاش کریں
2. اہم نکات پڑھیں اور ترتیب دیں
3. بلاگ کا خاکہ لکھیں
4. مواد بھریں
5. پروف ریڈنگ اور شائع کریں
- عمل: ہر مرحلہ ترتیب سے مکمل کریں، آخر میں بلاگ آؤٹ پٹ کریں۔

3. Reflection

بنیادی خیال: ایجنٹ عمل کے دوران یا اس کے بعد اپنے رویے پر غور و فکر (Reflection) کرتا ہے، نتائج کا جائزہ لیتا ہے اور بعد کے اعمال کو بہتر بناتا ہے۔ اس میں خود تنقید، غلطیوں کی اصلاح یا حکمت عملی کی بہتری شامل ہو سکتی ہے۔

فلو چارٹ:

[عمل] → [نتیجہ دیکھنا] → [غور و فکر: کامیابی کا جائزہ] → [اگر ناکام: حکمت عملی تبدیل کریں] → [دوبارہ عمل] → ... → [کامیابی]

مثالی کوڈ:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # غور و فکر
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # غور و فکر کی بنیاد پر کام کی تفصیل یا حکمت عملی تبدیل کریں
            task = reflection['improved_task']
    return None

مثال:
- کام: "1234 * 5678 کا حساب لگائیں"
- عمل: براہ راست حساب، نتیجہ 7006652
- غور و فکر: حساب کے عمل کا جائزہ، کیری کی غلطی پائی گئی
- تبدیلی: دوبارہ حساب، صحیح نتیجہ 7006652 (درحقیقت صحیح)
- اگر پھر بھی غلطی ہو، صحیح ہونے تک غور و فکر جاری رکھیں۔

خلاصہ موازنہ

طریقہ کار خصوصیات مناسب مواقع
ReAct استدلال اور عمل باری باری، متحرک تبدیلی وہ کام جن میں حقیقی وقت میں معلومات کا تبادلہ ضروری ہو (جیسے سوال و جواب، تلاش)
Plan-and-Solve پہلے منصوبہ پھر عمل، ساختی تقسیم پیچیدہ کثیر المراحل کام (جیسے تحریر، ڈیٹا تجزیہ)
Reflection خود غور و فکر اور اصلاح، تکراری بہتری وہ کام جن میں زیادہ درستگی ضروری ہو (جیسے ریاضی کے حساب، کوڈ جنریشن)

عملی استعمال میں، ان تینوں کو اکثر ملایا جاتا ہے، مثلاً ReAct میں غور و فکر کا طریقہ کار شامل کرنا، یا Plan-and-Solve میں ہر مرحلے کے بعد غور و فکر کرنا۔

评论

暂无已展示的评论。

发表评论(匿名)