← 返回列表

AI сериясындагы суроо-жооптор 6: AI Agentтин үч негизги методологиясы: ReAct, Plan-and-Solve жана Reflection

AI Agentтин үч негизги методологиясы: ReAct, Plan-and-Solve жана Reflection

AI Agent – бул чөйрөнү өз алдынча кабыл алып, чечим чыгарып, аракеттерди аткара алуучу интеллектуалдык агент. Анын негизги методологиялары үчөө: ReAct, Plan-and-Solve жана Reflection. Төмөндө алардын ар бири сүрөттөлүп, блок-схемалар жана код мисалдары менен коштолот.

1. ReAct (Reasoning + Acting)

Негизги идеясы: Ой жүгүртүү (Reasoning) менен аракетти (Acting) кезектештирүү. Агент ар бир кадамда алгач учурдагы абалды жана кийинки кадамды ойлонуп (ой жүгүртүү), андан кийин бир аракетти аткарат (мисалы, куралды чакыруу, маалымат издөө), андан соң натыйжанын негизинде ой жүгүртүүнү улантат.

Блок-схема:

[Баштапкы абал] → [Ой жүгүртүү: кийинки кадамды ойло] → [Аракет: аракетти аткар] → [Натыйжаны байка] → [Ой жүгүртүү: планын жаңырт] → ... → [Акыркы жооп]

Мисал коду (псевдокод):

def react_agent(question):
    context = []
    while not solved:
        # Ой жүгүртүү: ой кадамын түзүү
        thought = llm.generate_thought(question, context)
        # Аракет: ойго ылайык аракетти тандоо
        action = llm.choose_action(thought)
        # Аракетти аткаруу, натыйжаны алуу
        observation = execute_action(action)
        # Ойду, аракетти, байкоону контекстке кошуу
        context.append((thought, action, observation))
    return final_answer

Мисал:
- Колдонуучу сурайт: "Бүгүн Пекинде аба ырайы кандай?"
- Агент ой жүгүртөт: "Мага аба ырайы APIсин чакыруу керек, шаардын аты жана күнү керек."
- Аракет: аба ырайы APIсин чакыруу (параметрлер: Пекин, бүгүн)
- Байкоо: "Ачык, 25°C" кайтарылды
- Ой жүгүртүү: "Маалымат алынды, жооп берсе болот."
- Чыгаруу: "Пекинде бүгүн ачык, 25°C."

2. Plan-and-Solve

Негизги идеясы: Алгач толук план түзүү (Plan), андан кийин этап менен аткаруу (Solve). Пландоо этабында татаал тапшырма кичине кадамдарга бөлүнөт, аткаруу этабында тартип менен аткарылат, аралык натыйжаларга жараша план өзгөртүлүшү мүмкүн.

Блок-схема:

[Тапшырма] → [План түзүү: кадамдарга бөлүү] → [1-кадамды аткаруу] → [2-кадамды аткаруу] → ... → [N-кадамды аткаруу] → [Акыркы жооп]

Мисал коду:

def plan_and_solve(task):
    # Пландоо этабы
    plan = llm.generate_plan(task)  # Мисалы: ["Маалымат издөө", "Маалыматты иреттөө", "Отчет жазуу"]
    context = {}
    for step in plan:
        # Ар бир кадамды аткаруу
        result = execute_step(step, context)
        context[step] = result
    # Жыйынтыктоо
    final = llm.synthesize(context)
    return final

Мисал:
- Тапшырма: "AI Agent жөнүндө блог жазуу"
- План:
1. AI Agentтин аныктамасын жана акыркы жетишкендиктерин издөө
2. Негизги пункттарды окуп, иреттөө
3. Блогдун планын түзүү
4. Мазмунду толтуруу
5. Текшерүү жана жарыялоо
- Аткаруу: ар бир кадамды кезеги менен аткарып, акыры блогду чыгаруу.

3. Reflection

Негизги идеясы: Агент аткаруу учурунда же андан кийин өзүнүн жүрүм-турумун рефлексия кылып (Reflection), натыйжаны баалап, кийинки аракеттерин жакшыртат. Адатта өзүн-өзү сындоо, каталарды оңдоо же стратегияны оптималдаштыруу камтылат.

Блок-схема:

[Аракет] → [Натыйжаны байкоо] → [Рефлексия: ийгиликке жеткендигин баалоо] → [Ийгиликсиз болсо: стратегияны тууралоо] → [Кайра аракет] → ... → [Ийгилик]

Мисал коду:

def reflection_agent(task):
    max_attempts = 3
    for attempt in range(max_attempts):
        action = llm.generate_action(task)
        result = execute(action)
        # Рефлексия
        reflection = llm.reflect(task, action, result)
        if reflection['success']:
            return result
        else:
            # Рефлексиянын негизинде тапшырманы же стратегияны тууралоо
            task = reflection['improved_task']
    return None

Мисал:
- Тапшырма: "1234 * 5678 эсептөө"
- Аракет: түз эсептөө, натыйжа 7006652
- Рефлексия: эсептөө процессин текшерүү, ката табуу (мисалы, орун алмаштыруу катасы)
- Тууралоо: кайра эсептөө, туура натыйжа 7006652 (чындыгында туура)
- Эгер дагы ката болсо, туура болгонго чейин рефлексияны улантуу.

Жыйынтыктоочу салыштыруу

Методология Өзгөчөлүктөрү Колдонуу чөйрөсү
ReAct Ой жүгүртүү жана аракет кезектешип, динамикалык түзөтүү Реалдуу убакытта маалымат алмашууну талап кылган тапшырмалар (мисалы, суроо-жооп, издөө)
Plan-and-Solve Алгач план, андан кийин аткаруу, структураланган бөлүү Татаал көп кадамдуу тапшырмалар (мисалы, жазуу, маалымат анализи)
Reflection Өзүн-өзү рефлексиялоо жана оңдоо, кайталап оптималдаштыруу Жогорку тактыкты талап кылган тапшырмалар (мисалы, математикалык эсептөөлөр, код түзүү)

Иш жүзүндө, үч методология көбүнчө айкалыштырылат, мисалы, ReActке рефлексия механизмин кошуу же Plan-and-Solveдо ар бир кадамдан кийин рефлексия жүргүзүү.

评论

暂无已展示的评论。

发表评论(匿名)