AI श्रृंखला साक्षात्कार 12: प्रॉम्प्ट कैसे अनुकूलित करें?

प्रॉम्प्ट अनुकूलन (प्रॉम्प्ट इंजीनियरिंग / ऑप्टिमाइज़ेशन) एक महत्वपूर्ण कौशल है जो बड़ी भाषा मॉडल को "आज्ञाकारी" बनाता है। विशेष रूप से RAG सिस्टम में, यह सीधे तौर पर निर्धारित करता है कि मॉडल खोजी गई सामग्री पर ईमानदारी से निर्भर करेगा या नहीं, भ्रम से बचेगा, और आउटपुट प्रारूप मानकों का पालन करेगा।

एक, प्रॉम्प्ट अनुकूलन के मूल सिद्धांत

स्पष्टता > जटिलता: सरल सीधे निर्देश अक्सर फैंसी चेन-ऑफ-थॉट से अधिक प्रभावी होते हैं।
पर्याप्त बाधाएँ दें: मॉडल को स्पष्ट रूप से बताएं "क्या कर सकता है, क्या नहीं कर सकता"।
उदाहरण प्रदान करें: फ्यू-शॉट जीरो-शॉट से अधिक स्थिर होता है।
सत्यापनीय: मॉडल को उद्धरण या आत्मविश्वास स्तर आउटपुट करने दें, जिससे डाउनस्ट्रीम निर्णय आसान हो।
पुनरावृत्त अनुकूलन: बेसलाइन से शुरू करें, एक बार में केवल एक चर बदलें, प्रभावों की तुलना करें।

दो, विशिष्ट अनुकूलन तकनीकें (आसान से कठिन)

1. भूमिका निर्धारण (सिस्टम प्रॉम्प्ट)

आप एक पेशेवर ग्राहक सेवा सहायक हैं। आप केवल नीचे दिए गए 【संदर्भ सामग्री】 के आधार पर प्रश्नों का उत्तर दे सकते हैं।
यदि आप उत्तर नहीं जानते हैं, तो सीधे कहें "सामग्री में कोई संबंधित जानकारी नहीं है", स्वयं मत बनाइए।

भूमिका: सीमाएँ और लहज़ा निर्धारित करता है।
अनुकूलन बिंदु: लहज़ा (पेशेवर/मैत्रीपूर्ण), बाधा की तीव्रता (सख्त/ढीला)।

2. स्पष्ट निर्देश

❌ खराब: "उपयोगकर्ता के प्रश्न का उत्तर दें।"
✅ अच्छा: "नीचे दिए गए 【संदर्भ सामग्री】 के आधार पर ही उत्तर दें। यदि संदर्भ सामग्री में उत्तर नहीं है, तो उत्तर दें 'मैं इस प्रश्न का उत्तर नहीं दे सकता'।"

3. आउटपुट प्रारूप नियंत्रण

कृपया निम्नलिखित JSON प्रारूप में आउटपुट दें:
{
  "answer": "आपका उत्तर",
  "confidence": "उच्च/मध्यम/निम्न",
  "sources": [1, 3]
}

उपयोग: डाउनस्ट्रीम पार्सिंग, संदर्भ, डीबगिंग के लिए सुविधाजनक।

4. फ्यू-शॉट उदाहरण (अत्यंत प्रभावी)

उदाहरण 1:
प्रश्न: वार्षिक छुट्टी कितने दिन है?
संदर्भ सामग्री: वार्षिक छुट्टी नियम: 1 वर्ष पूरा होने पर 5 दिन, 10 वर्ष पूरा होने पर 10 दिन।
उत्तर: 1 वर्ष पूरा होने पर 5 दिन, 10 वर्ष पूरा होने पर 10 दिन।

उदाहरण 2:
प्रश्न: ओवरटाइम वेतन कैसे गणना होती है?
संदर्भ सामग्री: कार्यदिवस ओवरटाइम 1.5 गुना, सप्ताहांत 2 गुना।
उत्तर: कार्यदिवस 1.5 गुना, सप्ताहांत 2 गुना।

अब उत्तर दें:
प्रश्न: {उपयोगकर्ता प्रश्न}
संदर्भ सामग्री: {खोजी गई सामग्री}
उत्तर:

टिप: उदाहरण विभिन्न कठिनाई स्तरों को कवर करें, और एक "उत्तर नहीं दे सकता" का उदाहरण शामिल करना सबसे अच्छा है।

5. अनिवार्य उद्धरण

उत्तर के अंत में [citation:X] का उपयोग करके स्रोत संख्या चिह्नित करें। उदाहरण: "वार्षिक छुट्टी 5 दिन है[citation:1]।"
यदि कई स्रोतों को जोड़ा गया है, तो अलग-अलग चिह्नित करें।

6. अस्वीकरण सीमा निर्धारित करें

कठोर बाधा: "यदि संदर्भ सामग्री प्रश्न से पूरी तरह असंबंधित है, तो उत्तर दें 'सामग्री अप्रासंगिक है'।"
नरम बाधा: खोज आत्मविश्वास स्कोर के साथ जोड़ें, सीमा से कम होने पर स्वचालित रूप से अस्वीकरण शाखा पर जाएँ।

7. विचार श्रृंखला (चेन-ऑफ-थॉट) बहु-चरणीय तर्क के लिए

प्रश्न: झांग सान का बॉस कौन है?
चरण: 1. पहले झांग सान का विभाग खोजें। 2. फिर उस विभाग के प्रमुख को खोजें। 3. अंतिम उत्तर दें।
कृपया चरणों के अनुसार सोचकर आउटपुट दें।

8. नकारात्मक निर्देश (नेगेटिव प्रॉम्प्टिंग)

उत्तर स्वयं न बनाएं। "शायद", "संभवतः" जैसे अस्पष्ट शब्दों का उपयोग न करें। संदर्भ सामग्री के बाहर के किसी भी अंक को आउटपुट न करें।

तीन, प्रॉम्प्ट की गुणवत्ता का मूल्यांकन कैसे करें?

मीट्रिक	अर्थ	माप कैसे करें
वफादारी	क्या उत्तर संदर्भ सामग्री पर सख्ती से आधारित है	मानव या RAGAS की Faithfulness
अस्वीकरण सटीकता	क्या आवश्यक होने पर अस्वीकार करता है	उत्तर-रहित परीक्षण सेट पर गणना करें
प्रारूप अनुपालन दर	क्या JSON / उद्धरण आवश्यकतानुसार आउटपुट करता है	रेगेक्स मिलान
उपयोगकर्ता संतुष्टि	क्या उत्तर उपयोगी है	ऑनलाइन फीडबैक / A/B परीक्षण

सुझाव: एक छोटा परीक्षण सेट (20-50 किनारे के मामले) तैयार करें, हर बार प्रॉम्प्ट बदलने पर उसे चलाएँ और बदलाव रिकॉर्ड करें।

चार, सामान्य नुकसान और अनुकूलन दिशाएँ

समस्या का प्रदर्शन	संभावित कारण	अनुकूलन विधि
मॉडल संदर्भ सामग्री को अनदेखा करता है, स्वयं उत्तर देता है	निर्देश पर्याप्त बाध्यकारी नहीं	"केवल नीचे दी गई सामग्री के आधार पर" में बदलें और फ्यू-शॉट में अस्वीकरण दिखाएँ
मॉडल हमेशा "पता नहीं" कहता है	अस्वीकरण सीमा बहुत अधिक	सीमा कम करें या खोज गुणवत्ता जाँचें
आउटपुट प्रारूप गड़बड़, JSON का पालन नहीं	निर्देश अस्पष्ट	सख्त प्रारूप उदाहरण जोड़ें, या फंक्शन कॉलिंग का उपयोग करें
उत्तर बहुत लंबा/बहुत छोटा	लंबाई निर्दिष्ट नहीं	"3 वाक्यों से अधिक में उत्तर न दें"
बहु-चरणीय तर्क में त्रुटि	मॉडल की तर्क क्षमता अपर्याप्त	चरण-दर-चरण तर्क प्रदर्शित करने की आवश्यकता है, या मजबूत मॉडल का उपयोग करें
भ्रम संबंधी अंक/तिथियाँ दिखाई देना	मॉडल अपने ज्ञान पर निर्भर करता है	"अपनी स्मृति के किसी भी अंक का उपयोग न करें, केवल सामग्री देखें" पर जोर दें