AI श्रृंखला साक्षात्कार 12: प्रॉम्प्ट कैसे अनुकूलित करें?
प्रॉम्प्ट अनुकूलन (प्रॉम्प्ट इंजीनियरिंग / ऑप्टिमाइज़ेशन) एक महत्वपूर्ण कौशल है जो बड़ी भाषा मॉडल को "आज्ञाकारी" बनाता है। विशेष रूप से RAG सिस्टम में, यह सीधे तौर पर निर्धारित करता है कि मॉडल खोजी गई सामग्री पर ईमानदारी से निर्भर करेगा या नहीं, भ्रम से बचेगा, और आउटपुट प्रारूप मानकों का पालन करेगा।
एक, प्रॉम्प्ट अनुकूलन के मूल सिद्धांत
- स्पष्टता > जटिलता: सरल सीधे निर्देश अक्सर फैंसी चेन-ऑफ-थॉट से अधिक प्रभावी होते हैं।
- पर्याप्त बाधाएँ दें: मॉडल को स्पष्ट रूप से बताएं "क्या कर सकता है, क्या नहीं कर सकता"।
- उदाहरण प्रदान करें: फ्यू-शॉट जीरो-शॉट से अधिक स्थिर होता है।
- सत्यापनीय: मॉडल को उद्धरण या आत्मविश्वास स्तर आउटपुट करने दें, जिससे डाउनस्ट्रीम निर्णय आसान हो।
- पुनरावृत्त अनुकूलन: बेसलाइन से शुरू करें, एक बार में केवल एक चर बदलें, प्रभावों की तुलना करें।
दो, विशिष्ट अनुकूलन तकनीकें (आसान से कठिन)
1. भूमिका निर्धारण (सिस्टम प्रॉम्प्ट)
आप एक पेशेवर ग्राहक सेवा सहायक हैं। आप केवल नीचे दिए गए 【संदर्भ सामग्री】 के आधार पर प्रश्नों का उत्तर दे सकते हैं।
यदि आप उत्तर नहीं जानते हैं, तो सीधे कहें "सामग्री में कोई संबंधित जानकारी नहीं है", स्वयं मत बनाइए।
- भूमिका: सीमाएँ और लहज़ा निर्धारित करता है।
- अनुकूलन बिंदु: लहज़ा (पेशेवर/मैत्रीपूर्ण), बाधा की तीव्रता (सख्त/ढीला)।
2. स्पष्ट निर्देश
❌ खराब: "उपयोगकर्ता के प्रश्न का उत्तर दें।"
✅ अच्छा: "नीचे दिए गए 【संदर्भ सामग्री】 के आधार पर ही उत्तर दें। यदि संदर्भ सामग्री में उत्तर नहीं है, तो उत्तर दें 'मैं इस प्रश्न का उत्तर नहीं दे सकता'।"
3. आउटपुट प्रारूप नियंत्रण
कृपया निम्नलिखित JSON प्रारूप में आउटपुट दें:
{
"answer": "आपका उत्तर",
"confidence": "उच्च/मध्यम/निम्न",
"sources": [1, 3]
}
- उपयोग: डाउनस्ट्रीम पार्सिंग, संदर्भ, डीबगिंग के लिए सुविधाजनक।
4. फ्यू-शॉट उदाहरण (अत्यंत प्रभावी)
उदाहरण 1:
प्रश्न: वार्षिक छुट्टी कितने दिन है?
संदर्भ सामग्री: वार्षिक छुट्टी नियम: 1 वर्ष पूरा होने पर 5 दिन, 10 वर्ष पूरा होने पर 10 दिन।
उत्तर: 1 वर्ष पूरा होने पर 5 दिन, 10 वर्ष पूरा होने पर 10 दिन।
उदाहरण 2:
प्रश्न: ओवरटाइम वेतन कैसे गणना होती है?
संदर्भ सामग्री: कार्यदिवस ओवरटाइम 1.5 गुना, सप्ताहांत 2 गुना।
उत्तर: कार्यदिवस 1.5 गुना, सप्ताहांत 2 गुना।
अब उत्तर दें:
प्रश्न: {उपयोगकर्ता प्रश्न}
संदर्भ सामग्री: {खोजी गई सामग्री}
उत्तर:
- टिप: उदाहरण विभिन्न कठिनाई स्तरों को कवर करें, और एक "उत्तर नहीं दे सकता" का उदाहरण शामिल करना सबसे अच्छा है।
5. अनिवार्य उद्धरण
उत्तर के अंत में [citation:X] का उपयोग करके स्रोत संख्या चिह्नित करें। उदाहरण: "वार्षिक छुट्टी 5 दिन है[citation:1]।"
यदि कई स्रोतों को जोड़ा गया है, तो अलग-अलग चिह्नित करें।
6. अस्वीकरण सीमा निर्धारित करें
- कठोर बाधा: "यदि संदर्भ सामग्री प्रश्न से पूरी तरह असंबंधित है, तो उत्तर दें 'सामग्री अप्रासंगिक है'।"
- नरम बाधा: खोज आत्मविश्वास स्कोर के साथ जोड़ें, सीमा से कम होने पर स्वचालित रूप से अस्वीकरण शाखा पर जाएँ।
7. विचार श्रृंखला (चेन-ऑफ-थॉट) बहु-चरणीय तर्क के लिए
प्रश्न: झांग सान का बॉस कौन है?
चरण: 1. पहले झांग सान का विभाग खोजें। 2. फिर उस विभाग के प्रमुख को खोजें। 3. अंतिम उत्तर दें।
कृपया चरणों के अनुसार सोचकर आउटपुट दें।
8. नकारात्मक निर्देश (नेगेटिव प्रॉम्प्टिंग)
उत्तर स्वयं न बनाएं। "शायद", "संभवतः" जैसे अस्पष्ट शब्दों का उपयोग न करें। संदर्भ सामग्री के बाहर के किसी भी अंक को आउटपुट न करें।
तीन, प्रॉम्प्ट की गुणवत्ता का मूल्यांकन कैसे करें?
| मीट्रिक | अर्थ | माप कैसे करें |
|---|---|---|
| वफादारी | क्या उत्तर संदर्भ सामग्री पर सख्ती से आधारित है | मानव या RAGAS की Faithfulness |
| अस्वीकरण सटीकता | क्या आवश्यक होने पर अस्वीकार करता है | उत्तर-रहित परीक्षण सेट पर गणना करें |
| प्रारूप अनुपालन दर | क्या JSON / उद्धरण आवश्यकतानुसार आउटपुट करता है | रेगेक्स मिलान |
| उपयोगकर्ता संतुष्टि | क्या उत्तर उपयोगी है | ऑनलाइन फीडबैक / A/B परीक्षण |
सुझाव: एक छोटा परीक्षण सेट (20-50 किनारे के मामले) तैयार करें, हर बार प्रॉम्प्ट बदलने पर उसे चलाएँ और बदलाव रिकॉर्ड करें।
चार, सामान्य नुकसान और अनुकूलन दिशाएँ
| समस्या का प्रदर्शन | संभावित कारण | अनुकूलन विधि |
|---|---|---|
| मॉडल संदर्भ सामग्री को अनदेखा करता है, स्वयं उत्तर देता है | निर्देश पर्याप्त बाध्यकारी नहीं | "केवल नीचे दी गई सामग्री के आधार पर" में बदलें और फ्यू-शॉट में अस्वीकरण दिखाएँ |
| मॉडल हमेशा "पता नहीं" कहता है | अस्वीकरण सीमा बहुत अधिक | सीमा कम करें या खोज गुणवत्ता जाँचें |
| आउटपुट प्रारूप गड़बड़, JSON का पालन नहीं | निर्देश अस्पष्ट | सख्त प्रारूप उदाहरण जोड़ें, या फंक्शन कॉलिंग का उपयोग करें |
| उत्तर बहुत लंबा/बहुत छोटा | लंबाई निर्दिष्ट नहीं | "3 वाक्यों से अधिक में उत्तर न दें" |
| बहु-चरणीय तर्क में त्रुटि | मॉडल की तर्क क्षमता अपर्याप्त | चरण-दर-चरण तर्क प्रदर्शित करने की आवश्यकता है, या मजबूत मॉडल का उपयोग करें |
| भ्रम संबंधी अंक/तिथियाँ दिखाई देना | मॉडल अपने ज्ञान पर निर्भर करता है | "अपनी स्मृति के किसी भी अंक का उपयोग न करें, केवल सामग्री देखें" पर जोर दें |
评论
暂无已展示的评论。
发表评论(匿名)