← 返回列表

AI நேர்காணல் கேள்வி 2: பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாக எப்படி உறுதி செய்வது

AI நேர்காணல் கேள்வி 2: பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாக எப்படி உறுதி செய்வது

பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாகவும் கட்டுப்படுத்தக்கூடியதாகவும் எப்படி உறுதி செய்வது, வெறும் தூண்டுதல் வார்த்தைகளை மட்டும் நம்பாமல். இதற்கு பல அடுக்கு கட்டுப்பாட்டு கட்டமைப்பை முறையாக வழங்க வேண்டும்.

வானிலை வினவல் உதாரணம், மாதிரி கருவி அழைப்பில் பொதுவான மூன்று "கற்பனை" நடத்தைகள்:
1. கருவியை அழைக்காமல், நேரடியாக பொய்யான பதிலை உருவாக்குதல்.
2. கருவியை அழைக்கும்போது தவறான வடிவ அளவுருக்களை அனுப்புதல் (எ.கா., கருவி "நாளை மறுநாள்" ஐ ஆதரிக்கவில்லை, ஆனால் date="நாளை மறுநாள்" என அனுப்புதல்).
3. தானாக முடிவு செய்து அளவுரு வடிவத்தை மாற்றுதல் (எ.கா., "நாளை மறுநாள்" ஐ குறிப்பிட்ட தேதியாக மாற்றுதல்), கருவிக்கு அத்தேவை இல்லாவிட்டாலும்.

பிரச்சினையின் மூலம் மாதிரி வெளியீடு நிகழ்தகவு சார்ந்தது என்பதே. தூண்டுதல் வார்த்தைகள் நிகழ்தகவு பரவலில் "மென்மையான கட்டுப்பாடுகளை" மட்டுமே விதிக்கின்றன, மாதிரி கண்டிப்பாக பின்பற்ற வேண்டிய கட்டாய வழிமுறைகள் அல்ல. சிக்கலான சூழல்களில், இந்த "மென்மையான கட்டுப்பாடுகள்" எளிதில் தோல்வியடையும்.

இந்த பிரச்சினையை தீர்க்க, பல அடுக்கு பொறியியல் தீர்வு தேவை:

  1. முதல் அடுக்கு: தூண்டுதல் வார்த்தைகளை மேம்படுத்துதல் (மென்மையான கட்டுப்பாடு)

    • இது கட்டுப்பாட்டு அமைப்பின் தொடக்க புள்ளி, ஆனால் முடிவு அல்ல.
    • தூண்டுதல் வார்த்தைகளை "செயல்பாட்டு ஒப்பந்தமாக" கருத வேண்டும், கருவியின் நோக்கம், ஒவ்வொரு அளவுருவின் வகை, எல்லைகள் மற்றும் தவறான மதிப்புகளின் உதாரணங்களை தெளிவாக விளக்க வேண்டும்.
    • சில-ஷாட் உதாரணங்களை சேர்க்க வேண்டும், "சரியான உள்ளீடு → சரியான அழைப்பு" என்பதைக் காண்பித்து, சூழல் கற்றல் மூலம் மாதிரியின் நடத்தை முறையை நிலைநிறுத்த வேண்டும்.
  2. இரண்டாவது அடுக்கு: JSON Schema ஐ அறிமுகப்படுத்துதல் (கடுமையான கட்டுப்பாடு)

    • இது "பேச்சு" இலிருந்து "தடுப்புகள்" வரை முக்கியமான படி.
    • இயற்கை மொழி விளக்கங்களுக்கு பதிலாக இயந்திரம் படிக்கக்கூடிய, சரிபார்க்கக்கூடிய கட்டமைக்கப்பட்ட வரையறைகளை (JSON Schema) பயன்படுத்தவும். புல வகை, கட்டாயம், எண்ணிக்கை மதிப்புகள் வரம்பு ஆகியவற்றை கண்டிப்பாக வரையறுக்கலாம், மேலும் additionalProperties: false அமைப்பதன் மூலம் மாதிரி வரையறுக்கப்படாத எந்த புலத்தையும் வெளியிடுவதை தடுக்கலாம்.
    • முக்கிய API தளங்கள் மாதிரி குறியீட்டு நிலையிலேயே இந்த கட்டமைக்கப்பட்ட வெளியீட்டு கட்டுப்பாட்டை ஆதரிக்கின்றன, உருவாக்கத்தின் மூலத்திலேயே வடிவ மீறலை தவிர்க்கின்றன.
  3. மூன்றாவது அடுக்கு: சரிபார்ப்பு-திருத்தம்-மீண்டும் முயற்சி சுழற்சியை நிறுவுதல் (செயல்பாட்டு பாதுகாப்பு)

    • Schema இருந்தாலும், மாதிரி வெளியீட்டைப் பெற்ற பிறகு இலக்கண மற்றும் Schema சரிபார்ப்பு தேவை.
    • சரிபார்ப்பு தோல்வியடைந்தால், தானியங்கி சுத்தம் மற்றும் மீண்டும் முயற்சி பொறிமுறையை (வரம்புடன்) வடிவமைக்க வேண்டும், பிழை தகவலை மாதிரிக்கு திருப்பி அனுப்பி வெளியீட்டை சரிசெய்ய. மீண்டும் முயற்சி எண்ணிக்கை மீறப்பட்டால், தரமிறக்கம் அல்லது மனித தலையீடு திட்டம் இருக்க வேண்டும்.
  4. கட்டமைப்பு நிலை: பொறுப்புகளை பிரித்தல்

    • முடிவு மற்றும் செயல்படுத்தல் ஆகியவற்றை பிரிக்க வேண்டும், மூன்று அடுக்கு கட்டமைப்பை உருவாக்க:
      • மாதிரி அடுக்கு: முடிவெடுப்பதற்கு மட்டுமே பொறுப்பு (எந்த கருவியை அழைக்க வேண்டும், என்ன அளவுருக்களை உருவாக்க வேண்டும் என்பதை தீர்மானித்தல்).
      • கட்டமைப்பு அடுக்கு: செயல்பாட்டு கட்டமைப்பை நிறைவேற்றுவதற்கு பொறுப்பு, Schema சரிபார்ப்பு, கருவி அழைப்பு, மீண்டும் முயற்சி மற்றும் முடிவுகளை ஒருங்கிணைத்தல் உட்பட. இது மாதிரி பிழைகள் நேரடியாக கருவி பாதுகாப்பை பாதிக்காமல் தடுக்கிறது, மேலும் கருவி மாற்றங்களுக்கு அடிக்கடி தூண்டுதல் வார்த்தைகளை மாற்ற வேண்டியதில்லை.
      • கருவி அடுக்கு: குறிப்பிட்ட வணிக திறன் செயலாக்கம்.
    • LangChain, LlamaIndex போன்ற கட்டமைப்புகள் இந்த வேலையை செய்கின்றன.

தற்போதைய தீர்வின் வரம்புகள்: அளவுரு வடிவ சிக்கல்களை நன்கு கையாள முடியும், ஆனால் அளவுரு பொருள் (எ.கா., "சாங்காய்" மற்றும் "ஹு" இன் சமநிலை) சரிபார்ப்பு இன்னும் போதுமானதாக இல்லை. இது எதிர்காலத்தில் எதிர்கொள்ள வேண்டிய பொறியியல் சவாலாகும்.

முக்கிய முடிவு: LLM கருவி அழைப்புகளை நம்பகமானதாக மாற்றுவது அடிப்படையில் ஒரு மென்பொருள் பொறியியல் பிரச்சினை ஆகும், இது மென்மையான கட்டுப்பாடு, கடுமையான கட்டுப்பாடு, செயல்பாட்டு பாதுகாப்பு மற்றும் கட்டமைப்பு வடிவமைப்பு வரை முறையான பொறியியல் தீர்வை நிறுவ வேண்டும், வெறும் தூண்டுதல் வார்த்தைகளை மேம்படுத்துவதை மட்டும் நம்பாமல்.

评论

暂无已展示的评论。

发表评论(匿名)