Entrevista de la sèrie AI 12: Com ajustar el Prompt?
L'ajust de prompts (enginyeria/optimització de prompts) és una habilitat clau per fer que els models de llenguatge grans siguin "obedients", especialment en sistemes RAG, determinant directament si el model vol basar-se fidelment en el contingut recuperat, evitar al·lucinacions i donar un format de sortida estàndard.
1. Principis fonamentals de l'ajust de prompts
- Claredat > Complexitat: Les instruccions senzilles i directes sovint són més efectives que les cadenes de pensament elegants.
- Doneu prou restriccions: Indiqueu clarament al model "què pot fer i què no pot fer".
- Proporcioneu exemples: Few-shot és més estable que zero-shot.
- Verificable: Feu que el model doni cites o nivells de confiança per facilitar la decisió posterior.
- Optimització iterativa: Comenceu des d'una línia de base, canvieu només una variable cada vegada i compareu els efectes.
2. Tècniques específiques d'ajust (de fàcil a difícil)
1. Configuració del rol (System Prompt)
Ets un assistent d'atenció al client professional. Només pots respondre preguntes basant-te en els 【Materials de referència】 proporcionats a continuació.
Si no saps la resposta, digues directament "No hi ha informació rellevant als materials", no inventis res.
- Funció: Establir límits i to.
- Punts d'ajust: To (professional/amable), intensitat de la restricció (estricte/relaxat).
2. Instruccions clares
❌ Dolent: "Respon a la pregunta de l'usuari."
✅ Bo: "Només respon basant-te en els 【Materials de referència】 següents. Si els materials no contenen la resposta, contesta 'No puc respondre a aquesta pregunta'."
3. Control del format de sortida
Si us plau, genera la sortida en el format JSON següent:
{
"answer": "La teva resposta",
"confidence": "alt/mig/baix",
"sources": [1, 3]
}
- Ús: Facilita l'anàlisi, la citació i la depuració posteriors.
4. Exemples Few-shot (molt eficaços)
Exemple 1:
Pregunta: Quants dies de vacances tinc?
Materials de referència: Normativa de vacances: 5 dies per 1 any, 10 dies per 10 anys.
Resposta: 5 dies per 1 any, 10 dies per 10 anys.
Exemple 2:
Pregunta: Com es calculen les hores extraordinàries?
Materials de referència: Hores extraordinàries en dies laborables 1.5 vegades, caps de setmana 2 vegades.
Resposta: 1.5 vegades en dies laborables, 2 vegades en caps de setmana.
Ara respon:
Pregunta: {pregunta de l'usuari}
Materials de referència: {contingut recuperat}
Resposta:
- Consell: Els exemples han de cobrir diferents nivells de dificultat, incloent preferiblement un cas "no es pot respondre".
5. Citació forçada
Al final de la resposta, marca el número de font amb [citation:X]. Per exemple: "Les vacances són 5 dies [citation:1]."
Si combines múltiples fonts, marca-les per separat.
6. Establir un llindar de rebuig
- Restricció dura: "Si els materials de referència no tenen res a veure amb la pregunta, respon 'Els materials no són rellevants'."
- Restricció suau: Combina amb la puntuació de confiança de la recuperació; si està per sota del llindar, pren automàticament la branca de rebuig.
7. Cadena de pensament (Chain-of-Thought) per a raonament de múltiples salts
Pregunta: Qui és el cap de Zhang San?
Passos: 1. Primer troba el departament de Zhang San. 2. Després troba el responsable d'aquest departament. 3. Dóna la resposta final.
Si us plau, pensa pas a pas i després dóna la sortida.
8. Instrucció negativa (Negative Prompting)
No inventis respostes. No utilitzis paraules vagues com "potser" o "probablement". No donis cap número que no estigui als materials de referència.
3. Com avaluar si un prompt és bo?
| Mètrica | Significat | Com mesurar-ho |
|---|---|---|
| Fidelitat | La resposta es basa estrictament en els materials de referència | Manualment o amb Faithfulness de RAGAS |
| Precisió de rebuig | Si s'ha de rebutjar, ho fa correctament | Calcular en un conjunt de proves sense resposta |
| Taxa de compliment del format | Si la sortida segueix el JSON/les cites requerits | Coincidència amb expressions regulars |
| Satisfacció de l'usuari | Si la resposta és útil | Feedback en línia / proves A/B |
Recomanació: Prepareu un petit conjunt de proves (20-50 casos límit), executeu-lo cada cop que canvieu el prompt i registreu els canvis.
4. Errors comuns i direccions d'ajust
| Problema observat | Possible causa | Mètode d'ajust |
|---|---|---|
| El model ignora els materials de referència i respon pel seu compte | La instrucció no és prou forçada | Canvieu a "Només basant-se en els materials següents" i mostreu el rebuig amb few-shot |
| El model sempre diu "no ho sé" | El llindar de rebuig és massa alt | Reduïu el llindar o reviseu la qualitat de la recuperació |
| El format de sortida és desordenat, no segueix JSON | La instrucció no és clara | Afegiu exemples estrictes de format o utilitzeu function calling |
| La resposta és massa llarga/curta | No s'ha especificat la longitud | "Respon en no més de 3 frases" |
| Error en el raonament de múltiples salts | La capacitat de raonament del model és insuficient | Demaneu que mostri el raonament pas a pas o canvieu a un model més fort |
| Apareixen números/dates al·lucinats | El model es basa en el seu propi coneixement | Emfatitzeu "No utilitzis cap número que recordis, mira només els materials" |
评论
暂无已展示的评论。
发表评论(匿名)