AI সিরিজ ইন্টারভিউ ১২: প্রম্পট কীভাবে অপ্টিমাইজ করবেন?
প্রম্পট অপ্টিমাইজেশন (Prompt Engineering / Optimization) বড় ভাষার মডেলকে ‘আনুগত্য’ করার মূল দক্ষতা, বিশেষ করে RAG সিস্টেমে, যা সরাসরি নির্ধারণ করে মডেলটি বিশ্বস্তভাবে পুনরুদ্ধার করা বিষয়বস্তুর ওপর নির্ভর করবে, হ্যালুসিনেশন এড়াবে এবং আউটপুট ফরম্যাট মেনে চলবে।
১. প্রম্পট অপ্টিমাইজেশনের মূল নীতি
- স্পষ্টতা > জটিলতা: সহজ সরাসরি নির্দেশনা প্রায়ই জটিল চিন্তা-শৃঙ্খলের চেয়ে বেশি কার্যকর।
- পর্যাপ্ত সীমাবদ্ধতা: মডেলকে স্পষ্টভাবে বলুন “কী করতে পারে এবং কী করতে পারে না”।
- উদাহরণ প্রদান: Few-shot Zero-shot এর চেয়ে বেশি স্থিতিশীল।
- যাচাইযোগ্যতা: মডেলকে উদ্ধৃতি বা আত্মবিশ্বাস আউটপুট করতে দিন, যা ডাউনস্ট্রিম বিচারের জন্য সুবিধাজনক।
- পুনরাবৃত্তিমূলক অপ্টিমাইজেশন: বেসলাইন থেকে শুরু করুন, প্রতিবার শুধু একটি ভেরিয়েবল পরিবর্তন করুন এবং ফলাফল তুলনা করুন।
২. নির্দিষ্ট অপ্টিমাইজেশন কৌশল (সহজ থেকে কঠিন)
১. ভূমিকা নির্ধারণ (System Prompt)
তুমি একজন পেশাদার গ্রাহক সহায়ক সহকারী। তুমি শুধুমাত্র নিচে প্রদত্ত 【রেফারেন্স ম্যাটেরিয়াল】-এর ভিত্তিতে প্রশ্নের উত্তর দিতে পারো।
যদি উত্তর জানা না থাকে, তাহলে সরাসরি বলো “উপাদানে প্রাসঙ্গিক তথ্য নেই”, নিজে তৈরি করো না।
- কাজ: সীমানা এবং সুর নির্ধারণ করা।
- অপ্টিমাইজেশন পয়েন্ট: সুর (পেশাদার/বন্ধুত্বপূর্ণ), সীমাবদ্ধতার তীব্রতা (কঠোর/নমনীয়)।
২. স্পষ্ট নির্দেশনা
❌ খারাপ: “ব্যবহারকারীর প্রশ্নের উত্তর দাও।”
✅ ভালো: “শুধুমাত্র নিচের 【রেফারেন্স ম্যাটেরিয়াল】-এর ভিত্তিতে উত্তর দাও। যদি রেফারেন্স ম্যাটেরিয়ালে উত্তর না থাকে, তাহলে উত্তর দাও ‘আমি এই প্রশ্নের উত্তর দিতে পারছি না’।”
৩. আউটপুট ফরম্যাট নিয়ন্ত্রণ
অনুগ্রহ করে নিচের JSON ফরম্যাটে আউটপুট দিন:
{
"answer": "তোমার উত্তর",
"confidence": "উচ্চ/মধ্যম/নিম্ন",
"sources": [1, 3]
}
- ব্যবহার: ডাউনস্ট্রিম পার্সিং, উদ্ধৃতি, ডিবাগিংয়ের জন্য সুবিধাজনক।
৪. Few-shot উদাহরণ (অত্যন্ত কার্যকর)
উদাহরণ ১:
প্রশ্ন: বার্ষিক ছুটি কত দিন?
রেফারেন্স ম্যাটেরিয়াল: বার্ষিক ছুটির নিয়ম: ১ বছর পূর্ণ হলে ৫ দিন, ১০ বছর পূর্ণ হলে ১০ দিন।
উত্তর: ১ বছর পূর্ণ হলে ৫ দিন, ১০ বছর পূর্ণ হলে ১০ দিন।
উদাহরণ ২:
প্রশ্ন: ওভারটাইম বেতন কীভাবে গণনা করা হয়?
রেফারেন্স ম্যাটেরিয়াল: কর্মদিবসে ওভারটাইম ১.৫ গুণ, সপ্তাহান্তে ২ গুণ।
উত্তর: কর্মদিবসে ১.৫ গুণ, সপ্তাহান্তে ২ গুণ।
এখন উত্তর দাও:
প্রশ্ন: {ব্যবহারকারীর প্রশ্ন}
রেফারেন্স ম্যাটেরিয়াল: {পুনরুদ্ধার করা বিষয়বস্তু}
উত্তর:
- কৌশল: উদাহরণগুলি বিভিন্ন কঠিনতাকে কভার করবে, এবং একটি “উত্তর দিতে না পারা” উদাহরণ অন্তর্ভুক্ত করা ভাল।
৫. বাধ্যতামূলক উদ্ধৃতি
উত্তরের শেষে উৎস নম্বরটি [citation:X] ফরম্যাটে চিহ্নিত করুন। যেমন: “বার্ষিক ছুটি ৫ দিন[citation:1]।”
একাধিক উৎস একত্রিত করা হলে, প্রতিটি আলাদাভাবে চিহ্নিত করুন।
৬. উত্তর অস্বীকার করার থ্রেশহোল্ড নির্ধারণ
- কঠোর সীমাবদ্ধতা: “যদি রেফারেন্স ম্যাটেরিয়াল প্রশ্নের সাথে সম্পূর্ণ অপ্রাসঙ্গিক হয়, তাহলে উত্তর দাও ‘উপাদান প্রাসঙ্গিক নয়’।”
- নমনীয় সীমাবদ্ধতা: পুনরুদ্ধারের আত্মবিশ্বাস স্কোরের সাথে মিলিয়ে, থ্রেশহোল্ডের নিচে হলে স্বয়ংক্রিয়ভাবে উত্তর অস্বীকার শাখায় যান।
৭. চিন্তা-শৃঙ্খল (Chain-of-Thought) মাল্টি-হপ যুক্তির জন্য
প্রশ্ন: ঝাং সানের বস কে?
পদক্ষেপ: ১. প্রথমে ঝাং সানের বিভাগ খুঁজুন। ২. তারপর সেই বিভাগের দায়িত্বপ্রাপ্ত ব্যক্তি খুঁজুন। ৩. চূড়ান্ত উত্তর দিন।
অনুগ্রহ করে ধাপে ধাপে চিন্তা করে আউটপুট দিন।
৮. নেতিবাচক নির্দেশনা (Negative Prompting)
কোনও উত্তর তৈরি করো না। “হতে পারে”, “সম্ভবত” ইত্যাদি অস্পষ্ট শব্দ ব্যবহার করো না। রেফারেন্স ম্যাটেরিয়ালের বাইরের কোনও সংখ্যা আউটপুট করো না।
৩. কীভাবে প্রম্পটের গুণমান মূল্যায়ন করবেন?
| মেট্রিক | অর্থ | কীভাবে পরিমাপ করবেন |
|---|---|---|
| বিশ্বস্ততা | উত্তর কঠোরভাবে রেফারেন্স ম্যাটেরিয়ালের ভিত্তিতে কিনা | ম্যানুয়ালি অথবা RAGAS-এর Faithfulness |
| উত্তর অস্বীকারের নির্ভুলতা | যখন উত্তর অস্বীকার করা উচিত, তখন তা করা হচ্ছে কিনা | উত্তরবিহীন টেস্ট সেটে গণনা করুন |
| ফরম্যাট অনুসরণের হার | নির্দেশিত JSON/উদ্ধৃতি আউটপুট দিচ্ছে কিনা | রেজেক্স ম্যাচ |
| ব্যবহারকারী সন্তুষ্টি | উত্তর উপকারী কিনা | অনলাইন ফিডব্যাক / A/B টেস্ট |
পরামর্শ: একটি ছোট টেস্ট সেট প্রস্তুত করুন (২০-৫০টি এজ কেস), প্রতিবার প্রম্পট পরিবর্তনের পর এটি চালান এবং পরিবর্তন রেকর্ড করুন।
৪. সাধারণ ফাঁদ ও অপ্টিমাইজেশনের দিক
| সমস্যার প্রকাশ | সম্ভাব্য কারণ | অপ্টিমাইজেশন পদ্ধতি |
|---|---|---|
| মডেল রেফারেন্স উপেক্ষা করে নিজে উত্তর দেয় | নির্দেশ যথেষ্ট জোরালো নয় | “শুধুমাত্র নিচের উপাদানের ভিত্তিতে” পরিবর্তন করুন, এবং few-shot-এ উত্তর অস্বীকার দেখান |
| মডেল সবসময় “জানি না” বলে | উত্তর অস্বীকারের থ্রেশহোল্ড বেশি | থ্রেশহোল্ড কমিয়ে দিন অথবা পুনরুদ্ধারের গুণমান পরীক্ষা করুন |
| আউটপুট ফরম্যাট বিশৃঙ্খল, JSON অনুসরণ করে না | নির্দেশ স্পষ্ট নয় | কঠোর ফরম্যাট উদাহরণ যোগ করুন, অথবা function calling ব্যবহার করুন |
| উত্তর খুব দীর্ঘ/খুব ছোট | দৈর্ঘ্য নির্ধারণ করা হয়নি | “৩ বাক্যের বেশি নয় উত্তর দিন” |
| মাল্টি-হপ যুক্তিতে ভুল | মডেলের যুক্তি ক্ষমতা অপর্যাপ্ত | ধাপে ধাপে যুক্তি দেখাতে বলুন, অথবা শক্তিশালী মডেলে পরিবর্তন করুন |
| হ্যালুসিনেটেড সংখ্যা/তারিখ | মডেল নিজস্ব জ্ঞানের ওপর নির্ভর করে | “তোমার স্মৃতির কোনও সংখ্যা ব্যবহার করো না, শুধু উপাদান দেখো” জোর দিন |
评论
暂无已展示的评论。
发表评论(匿名)