AI நேர்காணல் கேள்வி 2: பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாக எப்படி உறுதி செய்வது
AI நேர்காணல் கேள்வி 2: பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாக எப்படி உறுதி செய்வது
பெரிய மொழி மாதிரி (LLM) கருவி அழைப்புகளை நம்பகமானதாகவும் கட்டுப்படுத்தக்கூடியதாகவும் எப்படி உறுதி செய்வது, வெறும் தூண்டுதல் வார்த்தைகளை மட்டும் நம்பாமல். இதற்கு பல அடுக்கு கட்டுப்பாட்டு கட்டமைப்பை முறையாக வழங்க வேண்டும்.
வானிலை வினவல் உதாரணம், மாதிரி கருவி அழைப்பில் பொதுவான மூன்று "கற்பனை" நடத்தைகள்:
1. கருவியை அழைக்காமல், நேரடியாக பொய்யான பதிலை உருவாக்குதல்.
2. கருவியை அழைக்கும்போது தவறான வடிவ அளவுருக்களை அனுப்புதல் (எ.கா., கருவி "நாளை மறுநாள்" ஐ ஆதரிக்கவில்லை, ஆனால் date="நாளை மறுநாள்" என அனுப்புதல்).
3. தானாக முடிவு செய்து அளவுரு வடிவத்தை மாற்றுதல் (எ.கா., "நாளை மறுநாள்" ஐ குறிப்பிட்ட தேதியாக மாற்றுதல்), கருவிக்கு அத்தேவை இல்லாவிட்டாலும்.
பிரச்சினையின் மூலம் மாதிரி வெளியீடு நிகழ்தகவு சார்ந்தது என்பதே. தூண்டுதல் வார்த்தைகள் நிகழ்தகவு பரவலில் "மென்மையான கட்டுப்பாடுகளை" மட்டுமே விதிக்கின்றன, மாதிரி கண்டிப்பாக பின்பற்ற வேண்டிய கட்டாய வழிமுறைகள் அல்ல. சிக்கலான சூழல்களில், இந்த "மென்மையான கட்டுப்பாடுகள்" எளிதில் தோல்வியடையும்.
இந்த பிரச்சினையை தீர்க்க, பல அடுக்கு பொறியியல் தீர்வு தேவை:
-
முதல் அடுக்கு: தூண்டுதல் வார்த்தைகளை மேம்படுத்துதல் (மென்மையான கட்டுப்பாடு)
- இது கட்டுப்பாட்டு அமைப்பின் தொடக்க புள்ளி, ஆனால் முடிவு அல்ல.
- தூண்டுதல் வார்த்தைகளை "செயல்பாட்டு ஒப்பந்தமாக" கருத வேண்டும், கருவியின் நோக்கம், ஒவ்வொரு அளவுருவின் வகை, எல்லைகள் மற்றும் தவறான மதிப்புகளின் உதாரணங்களை தெளிவாக விளக்க வேண்டும்.
- சில-ஷாட் உதாரணங்களை சேர்க்க வேண்டும், "சரியான உள்ளீடு → சரியான அழைப்பு" என்பதைக் காண்பித்து, சூழல் கற்றல் மூலம் மாதிரியின் நடத்தை முறையை நிலைநிறுத்த வேண்டும்.
-
இரண்டாவது அடுக்கு: JSON Schema ஐ அறிமுகப்படுத்துதல் (கடுமையான கட்டுப்பாடு)
- இது "பேச்சு" இலிருந்து "தடுப்புகள்" வரை முக்கியமான படி.
- இயற்கை மொழி விளக்கங்களுக்கு பதிலாக இயந்திரம் படிக்கக்கூடிய, சரிபார்க்கக்கூடிய கட்டமைக்கப்பட்ட வரையறைகளை (JSON Schema) பயன்படுத்தவும். புல வகை, கட்டாயம், எண்ணிக்கை மதிப்புகள் வரம்பு ஆகியவற்றை கண்டிப்பாக வரையறுக்கலாம், மேலும்
additionalProperties: falseஅமைப்பதன் மூலம் மாதிரி வரையறுக்கப்படாத எந்த புலத்தையும் வெளியிடுவதை தடுக்கலாம். - முக்கிய API தளங்கள் மாதிரி குறியீட்டு நிலையிலேயே இந்த கட்டமைக்கப்பட்ட வெளியீட்டு கட்டுப்பாட்டை ஆதரிக்கின்றன, உருவாக்கத்தின் மூலத்திலேயே வடிவ மீறலை தவிர்க்கின்றன.
-
மூன்றாவது அடுக்கு: சரிபார்ப்பு-திருத்தம்-மீண்டும் முயற்சி சுழற்சியை நிறுவுதல் (செயல்பாட்டு பாதுகாப்பு)
- Schema இருந்தாலும், மாதிரி வெளியீட்டைப் பெற்ற பிறகு இலக்கண மற்றும் Schema சரிபார்ப்பு தேவை.
- சரிபார்ப்பு தோல்வியடைந்தால், தானியங்கி சுத்தம் மற்றும் மீண்டும் முயற்சி பொறிமுறையை (வரம்புடன்) வடிவமைக்க வேண்டும், பிழை தகவலை மாதிரிக்கு திருப்பி அனுப்பி வெளியீட்டை சரிசெய்ய. மீண்டும் முயற்சி எண்ணிக்கை மீறப்பட்டால், தரமிறக்கம் அல்லது மனித தலையீடு திட்டம் இருக்க வேண்டும்.
-
கட்டமைப்பு நிலை: பொறுப்புகளை பிரித்தல்
- முடிவு மற்றும் செயல்படுத்தல் ஆகியவற்றை பிரிக்க வேண்டும், மூன்று அடுக்கு கட்டமைப்பை உருவாக்க:
- மாதிரி அடுக்கு: முடிவெடுப்பதற்கு மட்டுமே பொறுப்பு (எந்த கருவியை அழைக்க வேண்டும், என்ன அளவுருக்களை உருவாக்க வேண்டும் என்பதை தீர்மானித்தல்).
- கட்டமைப்பு அடுக்கு: செயல்பாட்டு கட்டமைப்பை நிறைவேற்றுவதற்கு பொறுப்பு, Schema சரிபார்ப்பு, கருவி அழைப்பு, மீண்டும் முயற்சி மற்றும் முடிவுகளை ஒருங்கிணைத்தல் உட்பட. இது மாதிரி பிழைகள் நேரடியாக கருவி பாதுகாப்பை பாதிக்காமல் தடுக்கிறது, மேலும் கருவி மாற்றங்களுக்கு அடிக்கடி தூண்டுதல் வார்த்தைகளை மாற்ற வேண்டியதில்லை.
- கருவி அடுக்கு: குறிப்பிட்ட வணிக திறன் செயலாக்கம்.
- LangChain, LlamaIndex போன்ற கட்டமைப்புகள் இந்த வேலையை செய்கின்றன.
- முடிவு மற்றும் செயல்படுத்தல் ஆகியவற்றை பிரிக்க வேண்டும், மூன்று அடுக்கு கட்டமைப்பை உருவாக்க:
தற்போதைய தீர்வின் வரம்புகள்: அளவுரு வடிவ சிக்கல்களை நன்கு கையாள முடியும், ஆனால் அளவுரு பொருள் (எ.கா., "சாங்காய்" மற்றும் "ஹு" இன் சமநிலை) சரிபார்ப்பு இன்னும் போதுமானதாக இல்லை. இது எதிர்காலத்தில் எதிர்கொள்ள வேண்டிய பொறியியல் சவாலாகும்.
முக்கிய முடிவு: LLM கருவி அழைப்புகளை நம்பகமானதாக மாற்றுவது அடிப்படையில் ஒரு மென்பொருள் பொறியியல் பிரச்சினை ஆகும், இது மென்மையான கட்டுப்பாடு, கடுமையான கட்டுப்பாடு, செயல்பாட்டு பாதுகாப்பு மற்றும் கட்டமைப்பு வடிவமைப்பு வரை முறையான பொறியியல் தீர்வை நிறுவ வேண்டும், வெறும் தூண்டுதல் வார்த்தைகளை மேம்படுத்துவதை மட்டும் நம்பாமல்.
评论
暂无已展示的评论。
发表评论(匿名)