Entrevista de la sèrie AI 12: Com ajustar el Prompt?

L'ajust de prompts (enginyeria/optimització de prompts) és una habilitat clau per fer que els models de llenguatge grans siguin "obedients", especialment en sistemes RAG, determinant directament si el model vol basar-se fidelment en el contingut recuperat, evitar al·lucinacions i donar un format de sortida estàndard.

1. Principis fonamentals de l'ajust de prompts

Claredat > Complexitat: Les instruccions senzilles i directes sovint són més efectives que les cadenes de pensament elegants.
Doneu prou restriccions: Indiqueu clarament al model "què pot fer i què no pot fer".
Proporcioneu exemples: Few-shot és més estable que zero-shot.
Verificable: Feu que el model doni cites o nivells de confiança per facilitar la decisió posterior.
Optimització iterativa: Comenceu des d'una línia de base, canvieu només una variable cada vegada i compareu els efectes.

2. Tècniques específiques d'ajust (de fàcil a difícil)

1. Configuració del rol (System Prompt)

Ets un assistent d'atenció al client professional. Només pots respondre preguntes basant-te en els 【Materials de referència】 proporcionats a continuació.
Si no saps la resposta, digues directament "No hi ha informació rellevant als materials", no inventis res.

Funció: Establir límits i to.
Punts d'ajust: To (professional/amable), intensitat de la restricció (estricte/relaxat).

2. Instruccions clares

❌ Dolent: "Respon a la pregunta de l'usuari."
✅ Bo: "Només respon basant-te en els 【Materials de referència】 següents. Si els materials no contenen la resposta, contesta 'No puc respondre a aquesta pregunta'."

3. Control del format de sortida

Si us plau, genera la sortida en el format JSON següent:
{
  "answer": "La teva resposta",
  "confidence": "alt/mig/baix",
  "sources": [1, 3]
}

Ús: Facilita l'anàlisi, la citació i la depuració posteriors.

4. Exemples Few-shot (molt eficaços)

Exemple 1:
Pregunta: Quants dies de vacances tinc?
Materials de referència: Normativa de vacances: 5 dies per 1 any, 10 dies per 10 anys.
Resposta: 5 dies per 1 any, 10 dies per 10 anys.

Exemple 2:
Pregunta: Com es calculen les hores extraordinàries?
Materials de referència: Hores extraordinàries en dies laborables 1.5 vegades, caps de setmana 2 vegades.
Resposta: 1.5 vegades en dies laborables, 2 vegades en caps de setmana.

Ara respon:
Pregunta: {pregunta de l'usuari}
Materials de referència: {contingut recuperat}
Resposta:

Consell: Els exemples han de cobrir diferents nivells de dificultat, incloent preferiblement un cas "no es pot respondre".

5. Citació forçada

Al final de la resposta, marca el número de font amb [citation:X]. Per exemple: "Les vacances són 5 dies [citation:1]."
Si combines múltiples fonts, marca-les per separat.

6. Establir un llindar de rebuig

Restricció dura: "Si els materials de referència no tenen res a veure amb la pregunta, respon 'Els materials no són rellevants'."
Restricció suau: Combina amb la puntuació de confiança de la recuperació; si està per sota del llindar, pren automàticament la branca de rebuig.

7. Cadena de pensament (Chain-of-Thought) per a raonament de múltiples salts

Pregunta: Qui és el cap de Zhang San?
Passos: 1. Primer troba el departament de Zhang San. 2. Després troba el responsable d'aquest departament. 3. Dóna la resposta final.
Si us plau, pensa pas a pas i després dóna la sortida.

8. Instrucció negativa (Negative Prompting)

No inventis respostes. No utilitzis paraules vagues com "potser" o "probablement". No donis cap número que no estigui als materials de referència.

3. Com avaluar si un prompt és bo?

Mètrica	Significat	Com mesurar-ho
Fidelitat	La resposta es basa estrictament en els materials de referència	Manualment o amb Faithfulness de RAGAS
Precisió de rebuig	Si s'ha de rebutjar, ho fa correctament	Calcular en un conjunt de proves sense resposta
Taxa de compliment del format	Si la sortida segueix el JSON/les cites requerits	Coincidència amb expressions regulars
Satisfacció de l'usuari	Si la resposta és útil	Feedback en línia / proves A/B

Recomanació: Prepareu un petit conjunt de proves (20-50 casos límit), executeu-lo cada cop que canvieu el prompt i registreu els canvis.

4. Errors comuns i direccions d'ajust

Problema observat	Possible causa	Mètode d'ajust
El model ignora els materials de referència i respon pel seu compte	La instrucció no és prou forçada	Canvieu a "Només basant-se en els materials següents" i mostreu el rebuig amb few-shot
El model sempre diu "no ho sé"	El llindar de rebuig és massa alt	Reduïu el llindar o reviseu la qualitat de la recuperació
El format de sortida és desordenat, no segueix JSON	La instrucció no és clara	Afegiu exemples estrictes de format o utilitzeu function calling
La resposta és massa llarga/curta	No s'ha especificat la longitud	"Respon en no més de 3 frases"
Error en el raonament de múltiples salts	La capacitat de raonament del model és insuficient	Demaneu que mostri el raonament pas a pas o canvieu a un model més fort
Apareixen números/dates al·lucinats	El model es basa en el seu propi coneixement	Emfatitzeu "No utilitzis cap número que recordis, mira només els materials"