← 返回列表

AI ප්‍රශ්න මාලාව 6: AI Agent හි ප්‍රධාන ක්‍රමවේද තුන: ReAct, Plan-and-Solve සහ Reflection

AI Agent හි ප්‍රධාන ක්‍රමවේද තුන: ReAct, Plan-and-Solve සහ Reflection

AI Agent යනු පරිසරය වටහා ගැනීමට, තීරණ ගැනීමට සහ ක්‍රියා කිරීමට හැකි බුද්ධිමත් ඒකකයකි. එහි ප්‍රධාන ක්‍රමවේද තුනක් ඇත: ReAct, Plan-and-Solve සහ Reflection. පහත දී ඒ සෑම එකක්ම හඳුන්වා දී ඇති අතර, ප්‍රවාහ සටහන් සහ කේත උදාහරණ ද ඇතුළත් වේ.

1. ReAct (Reasoning + Acting)

මූලික අදහස: තර්ක කිරීම (Reasoning) සහ ක්‍රියා කිරීම (Acting) අතරමැදිව සිදු කරයි. Agent එක එක් පියවරකදී පළමුව වත්මන් තත්ත්වය සහ ඊළඟ පියවර ගැන සිතා (තර්ක කිරීම), පසුව ක්‍රියාවක් කරයි (උදා: මෙවලමක් ඇමතීම, තොරතුරු සෙවීම), ප්‍රතිඵලය අනුව නැවත තර්ක කරයි.

ප්‍රවාහ සටහන:

[ආරම්භක තත්ත්වය] → [තර්ක කිරීම: ඊළඟ පියවර ගැන සිතීම] → [ක්‍රියාව: ක්‍රියාව ක්‍රියාත්මක කිරීම] → [ප්‍රතිඵලය නිරීක්ෂණය] → [තර්ක කිරීම: සැලැස්ම යාවත්කාලීන කිරීම] → ... → [අවසාන පිළිතුර]

උදාහරණ කේතය (ව්‍යාජ කේතය):

def react_agent(question):
    context = []
    while not solved:
        # තර්ක කිරීම: සිතුවිලි පියවර උත්පාදනය
        thought = llm.generate_thought(question, context)
        # ක්‍රියාව: සිතුවිල්ල අනුව ක්‍රියාව තෝරා ගැනීම
        action = llm.choose_action(thought)
        # ක්‍රියාව ක්‍රියාත්මක කිරීම, නිරීක්ෂණය ලබා ගැනීම
        observation = execute_action(action)
        # සිතුවිල්ල, ක්‍රියාව, නිරීක්ෂණය සන්දර්භයට එකතු කිරීම
        context.append((thought, action, observation))
    return final_answer

උදාහරණය:
- පරිශීලකයා අසයි: "අද බීජිං කාලගුණය කෙසේද?"
- Agent තර්ක කරයි: "මට කාලගුණ API එකක් ඇමතීමට අවශ්‍යයි, නගරයේ නම සහ දිනය අවශ්‍යයි."
- ක්‍රියාව: කාලගුණ API ඇමතීම (පරාමිති: බීජිං, අද)
- නිරීක්ෂණය: "හිරු, 25°C" ලැබේ
- තර්ක කිරීම: "තොරතුරු ලැබී ඇත, පිළිතුරු දිය හැක."
- ප්‍රතිදානය: "බීජිං අද හිරු, 25°C."

2. Plan-and-Solve

මූලික අදහස: පළමුව සම්පූර්ණ සැලැස්මක් සකස් කර (Plan), පසුව පියවරෙන් පියවර ක්‍රියාත්මක කරයි (Solve). සැලසුම් අවධියේදී සංකීර්ණ කාර්යය උප පියවරවලට බෙදනු ලැබේ, ක්‍රියාත්මක කිරීමේ අවධියේදී අනුපිළිවෙලින් සම්පූර්ණ කරනු ලබන අතර, අතරමැදි ප්‍රතිඵල අනුව සැලැස්ම සකස් කළ හැක.

ප්‍රවාහ සටහන:

[කාර්යය] → [සැලැස්ම සකස් කිරීම: උප පියවරවලට බෙදීම] → [පියවර 1 ක්‍රියාත්මක කිරීම] → [පියවර 2 ක්‍රියාත්මක කිරීම] → ... → [පියවර N ක්‍රියාත්මක කිරීම] → [අවසාන පිළිතුර]

උදාහරණ කේතය:

def plan_and_solve(task):
    # සැලසුම් අවධිය
    plan = llm.generate_plan(task)  # උදා: ["තොරතුරු සෙවීම", "තොරතුරු සංවිධානය කිරීම", "වාර්තාව ලිවීම"]
    context = {}
    for step in plan:
        # එක් එක් පියවර ක්‍රියාත්මක කිරීම
        result = execute_step(step, context)
        context[step] = result
    # ප්‍රතිඵල ඒකාබද්ධ කිරීම
    final = llm.synthesize(context)
    return final

උදාහරණය:
- කාර්යය: "AI Agent ගැන බ්ලොග් සටහනක් ලියන්න"
- සැලැස්ම:
1. AI Agent අර්ථ දැක්වීම සහ නවතම දියුණුව සොයන්න
2. ප්‍රධාන කරුණු කියවා සංවිධානය කරන්න
3. බ්ලොග් දළ සටහන ලියන්න
4. අන්තර්ගතය පුරවන්න
5. සංශෝධනය කර ප්‍රකාශයට පත් කරන්න
- ක්‍රියාත්මක කිරීම: එක් එක් පියවර අනුපිළිවෙලින් සම්පූර්ණ කර, අවසානයේ බ්ලොග් සටහන ලබා දෙයි.

3. Reflection

මූලික අදහස: Agent එක ක්‍රියාත්මක වන අතරතුර හෝ පසුව, තම ක්‍රියාකාරකම් පිළිබඳව පරාවර්තනය කර (Reflection), ප්‍රතිඵල තක්සේරු කර පසුව ක්‍රියා වැඩිදියුණු කරයි. සාමාන්‍යයෙන් ස්වයං-විවේචනය, දෝෂ නිවැරදි කිරීම හෝ උපාය මාර්ග ප්‍රශස්තිකරණය ඇතුළත් වේ.

ප්‍රවාහ සටහන:

[ක්‍රියාව] → [ප්‍රතිඵලය නිරීක්ෂණය] → [පරාවර්තනය: සාර්ථකද යන්න තක්සේරු කිරීම] → [අසාර්ථක නම්: උපාය මාර්ගය සකස් කිරීම] → [නැවත ක්‍රියා කිරීම] → ... → [සාර්ථක]

උදාහරණ කේතය:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # පරාවර්තනය
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # පරාවර්තනය අනුව කාර්ය විස්තරය හෝ උපාය මාර්ගය සකස් කිරීම
            task = reflection['improved_task']
    return None

උදාහරණය:
- කාර්යය: "1234 * 5678 ගණනය කරන්න"
- ක්‍රියාව: සෘජුව ගණනය කර, ප්‍රතිඵලය 7006652 ලබා ගැනීම
- පරාවර්තනය: ගණනය කිරීමේ ක්‍රියාවලිය පරීක්ෂා කර, ඉලක්කම් රැගෙන යාමේ දෝෂයක් සොයා ගැනීම
- සකස් කිරීම: නැවත ගණනය කර, නිවැරදි ප්‍රතිඵලය 7006652 ලබා ගැනීම (ඇත්ත වශයෙන්ම නිවැරදි)
- තවමත් වැරදි නම්, නිවැරදි වන තෙක් පරාවර්තනය කරන්න.

සාරාංශ සංසන්දනය

ක්‍රමවේදය ලක්ෂණ යෙදුම් අවස්ථා
ReAct තර්ක කිරීම සහ ක්‍රියා කිරීම අතරමැදිව, ගතිකව සකස් කිරීම තත්ය කාලීන තොරතුරු අන්තර්ක්‍රියා අවශ්‍ය කාර්යයන් (උදා: ප්‍රශ්නෝත්තර, සෙවීම)
Plan-and-Solve පළමුව සැලසුම් කර පසුව ක්‍රියාත්මක කිරීම, ව්‍යුහගත බෙදීම සංකීර්ණ බහු-පියවර කාර්යයන් (උදා: ලිවීම, දත්ත විශ්ලේෂණය)
Reflection ස්වයං-පරාවර්තනය සහ නිවැරදි කිරීම, පුනරාවර්තන ප්‍රශස්තිකරණය ඉහළ නිරවද්‍යතාව අවශ්‍ය කාර්යයන් (උදා: ගණිත ගණනය, කේත උත්පාදනය)

ප්‍රායෝගික යෙදුම්වලදී, මෙම ක්‍රම තුන බොහෝ විට ඒකාබද්ධ කරනු ලැබේ, උදාහරණයක් ලෙස ReAct හි පරාවර්තන යාන්ත්‍රණයක් එකතු කිරීම, හෝ Plan-and-Solve හි එක් එක් පියවර ක්‍රියාත්මක කිරීමෙන් පසු පරාවර්තනය කිරීම.

评论

暂无已展示的评论。

发表评论(匿名)