AI系列面试12：Prompt 怎么调优？

Prompt 调优（Prompt Engineering / Optimization）是让大语言模型“听话”的关键技能，尤其在 RAG 系统中，直接决定模型是否愿意忠实依据检索内容、避免幻觉、输出格式规范。

一、Prompt 调优的核心原则

你是一个专业的客服助手。你只能根据下面提供的【参考资料】回答问题。
如果你不知道答案，请直接说“资料中没有相关信息”，不要自己编造。

❌ 差：“回答用户问题。”
✅ 好：“仅依据下方【参考资料】回答。如果参考资料不包含答案，请回答‘我无法回答这个问题’。”

请按以下 JSON 格式输出：
{
  "answer": "你的答案",
  "confidence": "高/中/低",
  "sources": [1, 3]
}

示例1：
问题：年假有几天？
参考资料：年假规则：满1年5天，满10年10天。
答案：满1年5天，满10年10天。

示例2：
问题：加班费怎么算？
参考资料：工作日加班1.5倍，周末2倍。
答案：工作日1.5倍，周末2倍。

现在请回答：
问题：{用户问题}
参考资料：{检索内容}
答案：

在答案末尾用[citation:X]标注来源编号。例如：“年假为5天[citation:1]。”
如果综合多个资料，分别标注。

问题：张三的老板是谁？
步骤：1. 先找出张三的部门。2. 再找出该部门负责人。3. 给出最终答案。
请按步骤思考后输出。

不要编造答案。不要使用“可能”“也许”等模糊词。不要输出任何参考资料以外的数字。

建议：准备一个小型测试集（20-50 个边缘案例），每次改 prompt 后跑一遍，记录变化。

问题表现	可能原因	调优方法
模型忽略参考资料，自行回答	指令不够强制	改为“仅根据以下资料”，并用 few-shot 展示拒答
模型总是说“不知道”	拒答阈值过高	降低阈值或检查检索质量
输出格式乱，不按 JSON	指令不清晰	加上严格的格式示例，或者使用 function calling
答案太长/太短	没指定长度	“用不超过3句话回答”
多跳推理出错	模型推理能力不够	要求展示逐步推理，或换用更强模型
出现幻觉数字/日期	模型依赖自身知识	强调“不要使用任何你记忆中的数字，只看资料”