AI အင်တာဗျူးမေးခွန်း ၂- LLM ကိရိယာခေါ်ဆိုမှု ယုံကြည်စိတ်ချရအောင် မည်သို့သေချာစေမည်နည်း
AI အင်တာဗျူးမေးခွန်း ၂- LLM ကိရိယာခေါ်ဆိုမှု ယုံကြည်စိတ်ချရအောင် မည်သို့သေချာစေမည်နည်း
Large Language Model (LLM) သည် ကိရိယာခေါ်ဆိုမှုတွင် ယုံကြည်စိတ်ချရပြီး ထိန်းချုပ်နိုင်စွာ အလုပ်လုပ်နိုင်ရန် သေချာစေရန် နည်းလမ်းမှာ ပရော့ပ်များကိုသာ အားကိုးခြင်းမဟုတ်ဘဲ စနစ်ကျသော အဆင့်ပေါင်းများစွာ ကန့်သတ်မှုဘောင်တစ်ခု ပေးရန်ဖြစ်သည်။
ဥပမာ ရာသီဥတုမေးမြန်းခြင်းတွင် မော်ဒယ်သည် ကိရိယာခေါ်ဆိုမှုတွင် ဖြစ်လေ့ရှိသော "လုပ်ကြံဖြေဆိုခြင်း" အပြုအမူ သုံးမျိုးရှိသည်-
1. ကိရိယာကို မခေါ်ဘဲ တိုက်ရိုက်လုပ်ကြံဖြေဆိုခြင်း။
2. ကိရိယာခေါ်ဆိုရာတွင် ပုံစံမှားသော ပါရာမီတာများ ပေးပို့ခြင်း (ဥပမာ ကိရိယာက "မနက်ဖြန်" ကို မပံ့ပိုးသော်လည်း date="မနက်ဖြန်" ဟု ပေးပို့ခြင်း)။
3. ကိုယ်တိုင်ဆုံးဖြတ်၍ ပါရာမီတာပုံစံပြောင်းလဲခြင်း (ဥပမာ ကိရိယာက မလိုအပ်သော်လည်း "မနက်ဖြန်" ကို ရက်စွဲအတိအကျသို့ ပြောင်းလဲခြင်း)။
ပြဿနာ၏ အရင်းအမြစ်မှာ မော်ဒယ်၏ output သည် ဖြစ်နိုင်ခြေအခြေပြု ဖြစ်ပြီး ပရော့ပ်များသည် ဖြစ်နိုင်ခြေဖြန့်ဝေမှုအပေါ် "ပျော့ပျောင်းသောကန့်သတ်ချက်" ကိုသာ သက်ရောက်စေကာ မော်ဒယ်ကို တင်းကျပ်စွာလိုက်နာစေရန် အာမခံချက်မရှိပါ။ ရှုပ်ထွေးသော အခြေအနေများတွင် ဤ "ပျော့ပျောင်းသောကန့်သတ်ချက်" သည် လွယ်ကူစွာ ပျက်ကွက်နိုင်သည်။
ဤပြဿနာကိုဖြေရှင်းရန် အဆင့်ပေါင်းများစွာပါသော အင်ဂျင်နီယာဆိုင်ရာ ဖြေရှင်းနည်း လိုအပ်သည်-
-
ပထမအဆင့်- ပရော့ပ်များကို အကောင်းဆုံးဖြစ်အောင်ပြုလုပ်ခြင်း (ပျော့ပျောင်းသောကန့်သတ်ချက်)
- ဤသည်မှာ ကန့်သတ်မှုစနစ်၏ အစမှတ်ဖြစ်သော်လည်း အဆုံးမဟုတ်ပါ။
- ပရော့ပ်ကို "လုပ်ဆောင်ချက်စာချုပ်" အဖြစ် ရှုမြင်သင့်ပြီး ကိရိယာ၏ရည်ရွယ်ချက်၊ ပါရာမီတာတစ်ခုချင်းစီ၏ အမျိုးအစား၊ နယ်နိမိတ်များကို ရှင်းလင်းစွာဖော်ပြကာ တရားမဝင်တန်ဖိုးများ၏ ဥပမာများကိုလည်း ထည့်သွင်းသင့်သည်။
- Few-shot ဥပမာများ ထည့်သွင်းသင့်ပြီး "မှန်ကန်သောထည့်သွင်းမှု → မှန်ကန်သောခေါ်ဆိုမှု" ၏ နမူနာများကိုပြသခြင်းဖြင့် ဆက်စပ်သင်ယူမှုကို အသုံးပြုကာ မော်ဒယ်၏ အပြုအမူပုံစံကို ကျောက်ချရပ်တည်စေသည်။
-
ဒုတိယအဆင့်- JSON Schema မိတ်ဆက်ခြင်း (တင်းကျပ်သောကန့်သတ်ချက်)
- ဤသည်မှာ "ဆင်ခြင်တွေးခေါ်ခြင်း" မှ "အတားအဆီးများထားရှိခြင်း" သို့ ပြောင်းလဲသည့် အဓိကခြေလှမ်းဖြစ်သည်။
- ပါရာမီတာများကို သဘာဝဘာသာစကားဖြင့်ဖော်ပြမည့်အစား စက်ဖြင့်ဖတ်နိုင်၊ အတည်ပြုနိုင်သော ဖွဲ့စည်းတည်ဆောက်ပုံဆိုင်ရာ အဓိပ္ပါယ်ဖွင့်ဆိုချက် (JSON Schema) ကို အသုံးပြုပါ။ ၎င်းသည် အကွက်အမျိုးအစား၊ မဖြစ်မနေလိုအပ်မှု၊ enumeration တန်ဖိုးအကွာအဝေးတို့ကို တင်းကျပ်စွာသတ်မှတ်နိုင်ပြီး
additionalProperties: falseသတ်မှတ်ခြင်းဖြင့် မော်ဒယ်မှ မသတ်မှတ်ထားသော အကွက်များကို output ထုတ်ခြင်းကို တားမြစ်နိုင်သည်။ - ပင်မအသုံးပြုသူ API ပလက်ဖောင်းများသည် မော်ဒယ် decoding အဆင့်တွင် ဤကဲ့သို့သော ဖွဲ့စည်းတည်ဆောက်ပုံဆိုင်ရာ output ကန့်သတ်ချက်များကို ပံ့ပိုးပေးကာ ထုတ်လုပ်မှုအရင်းအမြစ်မှ ပုံစံချိုးဖောက်မှုများကို ရှောင်ရှားနိုင်သည်။
-
တတိယအဆင့်- အတည်ပြု-ပြုပြင်-ပြန်ကြိုးစားမှု သံသရာတည်ဆောက်ခြင်း (လုပ်ဆောင်မှုအာမခံချက်)
- Schema ရှိသော်လည်း မော်ဒယ် output ရရှိပြီးနောက် syntax နှင့် Schema အတည်ပြုခြင်းကို ပြုလုပ်ရန် လိုအပ်သေးသည်။
- အတည်ပြုမှုမအောင်မြင်ပါက အလိုအလျောက် သန့်ရှင်းရေးနှင့် ပြန်ကြိုးစားမှု ယန္တရား (အကန့်အသတ်ရှိ) ကို ဒီဇိုင်းဆွဲသင့်ပြီး အမှားအယွင်းအချက်အလက်ကို မော်ဒယ်သို့ ပြန်ပို့ကာ output ကို ပြင်ဆင်စေသည်။ ပြန်ကြိုးစားမှုအကြိမ်ရေ ကျော်လွန်ပါက အဆင့်နှိမ့်ချခြင်း သို့မဟုတ် လူကိုယ်တိုင်ကိုင်တွယ်ခြင်း အစီအစဉ်ရှိရန် လိုအပ်သည်။
-
ဗိသုကာအဆင့်- တာဝန်ခွဲဝေခြင်း
- ဆုံးဖြတ်ချက်ချခြင်း နှင့် လုပ်ဆောင်ခြင်း ကို ခွဲထုတ်ကာ အဆင့်သုံးဆင့်ပါ ဗိသုကာတစ်ခု တည်ဆောက်သင့်သည်-
- မော်ဒယ်အလွှာ- ဆုံးဖြတ်ချက်ချရန်သာ တာဝန်ရှိသည် (မည်သည့်ကိရိယာကိုခေါ်ရန်၊ မည်သည့်ပါရာမီတာများထုတ်ရန် ဆုံးဖြတ်ခြင်း)။
- မူဘောင်အလွှာ- Schema အတည်ပြုခြင်း၊ ကိရိယာခေါ်ဆိုခြင်း၊ ပြန်ကြိုးစားခြင်းနှင့် ရလဒ်များပေါင်းစပ်ခြင်းအပါအဝင် လုပ်ဆောင်မှုမူဘောင်အတွက် တာဝန်ရှိသည်။ ၎င်းသည် မော်ဒယ်အမှားများသည် ကိရိယာလုံခြုံရေးကို တိုက်ရိုက်မထိခိုက်စေရန်နှင့် ကိရိယာပြောင်းလဲမှုများအတွက် ပရော့ပ်များကို မကြာခဏပြင်ဆင်ရန် မလိုအပ်စေရန် သေချာစေသည်။
- ကိရိယာအလွှာ- သီးခြားလုပ်ငန်းဆောင်တာစွမ်းရည်များ၏ အကောင်အထည်ဖော်မှု။
- LangChain, LlamaIndex စသည့် မူဘောင်များသည် ဤကဲ့သို့သော အလုပ်ကို လုပ်ဆောင်နေသည်။
- ဆုံးဖြတ်ချက်ချခြင်း နှင့် လုပ်ဆောင်ခြင်း ကို ခွဲထုတ်ကာ အဆင့်သုံးဆင့်ပါ ဗိသုကာတစ်ခု တည်ဆောက်သင့်သည်-
လက်ရှိဖြေရှင်းနည်း၏ ကန့်သတ်ချက်များ- ပါရာမီတာပုံစံ ပြဿနာများကို ကောင်းစွာကိုင်တွယ်နိုင်သော်လည်း ပါရာမီတာအဓိပ္ပါယ် (ဥပမာ "ရန်ကုန်" နှင့် "YG" ၏ တူညီမှု) အတည်ပြုခြင်းကို လုံလောက်စွာ မဖုံးလွှမ်းနိုင်သေးပါ။ ဤသည်မှာ အနာဂတ်တွင် ရင်ဆိုင်ရမည့် အင်ဂျင်နီယာဆိုင်ရာ စိန်ခေါ်မှုဖြစ်သည်။
အဓိကကောက်ချက်- LLM ကို ကိရိယာများကို ယုံကြည်စိတ်ချရအောင် ခေါ်ဆိုစေရန်မှာ အခြေခံအားဖြင့် ဆော့ဖ်ဝဲအင်ဂျင်နီယာပြဿနာ တစ်ခုဖြစ်ပြီး ပျော့ပျောင်းသောကန့်သတ်ချက်၊ တင်းကျပ်သောကန့်သတ်ချက်၊ လုပ်ဆောင်မှုအာမခံချက်နှင့် ဗိသုကာဒီဇိုင်းတို့မှ စနစ်ကျသော အင်ဂျင်နီယာဆိုင်ရာ ဖြေရှင်းနည်းတစ်ခု တည်ဆောက်ရန် လိုအပ်ပြီး ပရော့ပ်များကို အကောင်းဆုံးဖြစ်အောင်ပြုလုပ်ခြင်းကိုသာ အားကိုးခြင်းမဟုတ်ပါ။
评论
暂无已展示的评论。
发表评论(匿名)