← 返回列表

Awọn ibeere ifọrọwanilẹnuwo AI 11: Bawo ni a ṣe n ṣe atunṣe RAG?

Atunṣe RAG kii ṣe atunṣe ẹyọ kan, ṣugbọn o jẹ ilana isọdọtun gbogbo ọna asopọ. Nibayi, lati inu ẹgbẹ data atọka, ẹgbẹ wiwa, ẹgbẹ ipilẹṣẹ, ẹgbẹ igbelewọn mẹrin, Mo n fun awọn ilana atunṣe eto, pẹlu awọn iriri iṣe ti a le mẹnuba ninu ifọrọwanilẹnuwo.


Ọkọọkan kan: Atunṣe ẹgbẹ data atọka (igbelaruge didara "iyè imọ")

Eyi ni ibi ti a ṣe akiyesi rẹ diẹ ṣugbọn o nṣiṣẹ ni kiakia.

Oju atunṣe Iṣẹlẹ iṣoro Ọna kan pato Atọka ipa
Itupalẹ iwe Awọn tabili, awọn fọto ṣiṣan ninu PDF ni a foju, tabi awọn ọrọ jẹ awọn koodu ti ko tọ, aṣẹ jẹ aṣiṣe. Lo awọn ile-ikawe itupalẹ ti o dara julọ (gẹgẹ bi unstructured, pypdf ni ipo ifipamọ ifilelẹ); fun awọn tabili lo pandas lati yọ jade ki o si yi pada si Markdown. Ipe agbapada +5~15%
Iwọn pipin ọrọ Chunk kekere pupa padanu agbegbe (bii "ó jẹ́ pé ó gbé” ninu “ó jẹ́ pé ó gbé” padanu itọka); chunk tobi fa ariwo wiwa pọ. Ṣe idanwo awọn iwọn chunk oriṣiriṣi (256/512/768 token), overlap fi si 10~20%; fun awọn iwe gigun, pin nipasẹ aala itumọ (ipin/akọle) kuku ju gigun ti o wa titi lọ. Oṣuwọn kọlu / iṣootọ
Afi metadata Wiwa si apakan ti o jọmọ, ṣugbọn ko le ṣe itọpa si orisun tabi akoko, tabi nilo lati ṣe àlẹmọ nipasẹ aaye. Fi metadata kun fun chunk kọọkan: source (orukọ faili/URL), timestamp, page_num, doc_type. Ni wiwa lo awọn àlẹmọ (bii doc_type == 'legal'). Ipeye àlẹmọ
Yiyan awoṣe ifibọ Ifibọ gbogbogbo ko dara ni aaye inaro (iwosan, koodu, ofin). Lo awọn awoṣe ti a tunṣe aaye (BGE‑large‑zh, GTE‑Qwen2‑7B‑instruct); tabi tunṣe awoṣe ifibọ tirẹ (lo triplet loss). Wiwa MRR@10 +10~20%

Ọkọọkan keji: Atunṣe ẹgbẹ wiwa (mu "kika iwe" jẹ deede)

Wiwa pinnu didara "awọn ohun elo itọkasi" ti a fun LLM.

Oju atunṣe Iṣẹlẹ iṣoro Ọna kan pato Ipa
Wiwa idapọ Wiwa fekito ko le baramu ọrọ pato (bii awoṣe ọja ABC-123), wiwa koko-ọrọ ko le loye awọn ọrọ-ìṣe. Lo wiwa fekito (itumọ) ati BM25 (koko-ọrọ) nigbakanna, nipasẹ fifi iwuwo (bii 0.7fekito + 0.3BM25) tabi rerank idapọ. Ipe agbapada +10~25%
Atunto (Rerank) Awọn abajade akọkọ ti wiwa fekito da pada kii ṣe pataki julọ, ẹkẹwa ni o dara julọ. Lo awoṣe cross‑encoder (bii BGE‑reranker-v2, Cohere Rerank) lati ṣe atunto awọn oludije (bii 20 akọkọ), mu top‑K. Oṣuwọn kọlu pọ si (paapaa top‑1)
Atunkọ ibeere Ibeere olumulo jẹ ṣoki tabi itọka ti ko ṣe kedere ninu ibaraẹnisọrọ pupọ ("Kini idiyele rẹ?"). Fi LLM ṣe atunkọ ibeere atilẹba si fọọmu ti o dara fun wiwa (bii "Kini idiyele iPhone 15?"); tabi lo itan ibaraẹnisọrọ lati pari. Ipe agbapada +5~15%
HyDE Ibeere olumulo kuru ju tabi áljẹbrà (bii "sọ nipa photosynthesis"), wiwa taara ko dara. Kọkọ jẹ ki LLM ṣe ipilẹṣẹ idahun arosọ, lẹhinna lo idahun yii lati wiwa iwe. O wulo fun aaye ṣiṣi, ṣugbọn kii ṣe fun ibeere otitọ kongẹ
Atunṣe nọmba wiwa Top‑K K kere ju le padanu alaye pataki; K tobi ju pọ si agbara token ati ariwo. Ṣe idanwo K=3/5/10, ṣe akiyesi iwọntunwọnsi laarin ipe agbapada ati iṣootọ idahun. Iṣẹ ṣiṣe ati ipa trade‑off

Ọkọọkan kẹta: Atunṣe ẹgbẹ ipilẹṣẹ (mu LLM lo awọn ohun elo itọkasi daradara)

Wiwa ti o dara julọ, ti a ko ba fi awọn ilana itọni to dara tabi awoṣe ko dara, ko wulo.

Oju atunṣe Iṣẹlẹ iṣoro Ọna kan pato Ipa
Imọ-ẹrọ itọka LLM foju awọn akoonu wiwa, tabi da awọn nkan ọfẹ. Paṣẹ kedere: "Dahun ibeere nikan da lori awọn ohun elo itọkasi ti a pese ti akoonu ko to tabi ko jọmọ, jọwọ dahun 'ko si alaye to'." Fi awọn apẹẹrẹ few‑shot ti o ṣe afihan bi a ṣe tọka orisun. Iṣootọ +20~40%
Fifunpin ọrọ Akoonu ti a wiwa gun ju (lọ kọja ferese ọrọ awoṣe), tabi pupọ julọ jẹ ariwo. Lo LLMLingua tabi Fifunpin ọrọ yiyan lati funpin, ṣe itọju awọn gbolohun ti o jẹ pataki julọ ki o si fi ran LLM. Dinku eewu pipadanu alaye
Imudara awoṣe LLM Awoṣe kekere (7B) ko le ṣe ero inu eka, tabi ko le ranti ọrọ gigun. Yipada si awoṣe ti o lagbara (GPT‑4o, Claude 3.5 Sonnet, Qwen2.5‑72B). Ipeye ero inu pọ si pupọ
Ṣiṣan ati itọka Olumulo ko le rii daju iṣootọ idahun. Ni ipilẹṣẹ jẹ ki LLM ṣe afihan [citation:1], tọka si nọmba iwe ti a wiwa. Ẹgbẹ ẹhin fi ọna asopọ atilẹba kun. Igbagbọ olumulo + agbara ṣiṣe àtúnṣe
Isọdọtun idahun kiko Awoṣe da nkan ọfẹ nigbati ko yẹ, tabi sọ pe ko mọ nigbati o yẹ ki o dahun. Ṣeto ala ibajọra kan: ti top‑1 chunk ti a wiwa ba ni ibajọra cosine kere ju 0.7 pẹlu ibeere, sọ fun LLM "akoonu ko jọmọ". Dinku iṣuwọn iruju

Ọkọọkan kẹrin: Ẹgbẹ igbelewọn ati atunṣe (mọ ibi ti a ti n ṣe atunṣe)

Laisi wiwọn, ko si imudara.

Oju atunṣe Ọna Atọka
Ṣeto akojo igbelewọn Ṣeto awọn ibeere olumulo gidi 100~300 + awọn idahun boṣewa + awọn ID iwe wiwa to tọ. Bo awọn iṣoro oriṣiriṣi, awọn ero oriṣiriṣi.
Igbelewọn adaṣe Lo RAGAS (Faithfulness, Answer Relevance, Context Recall) tabi TruLens. Awọn atọka pataki mẹta: iṣootọ, ibaramu idahun, ipadabọ ọrọ.
Igbelewọn eniyan Ṣe ayẹwo awọn ọran buburu 20 ni ọsẹ kọọkan, ṣe itupalẹ iru aṣiṣe (wiwa kuna / ipilẹṣẹ aṣiṣe / ikọja iyè imọ). Ṣeto iṣeto iṣaaju fun imudara.
Idanwo A/B Ni agbegbe iṣelọpọ, ṣe idanwo awọn ilana wiwa oriṣiriṣi ni awọn bata (fun apẹẹrẹ BM25 vs wiwa idapọ). Awọn atọka ori ayelujara: itẹlọrun olumulo, oṣuwọn ailabawọn idahun.

Ọkọọkan karun: Awọn "iriri iṣe" ti a le sọ ninu ifọrọwanilẹnuwo (aaye afikun)

"Ninu iṣẹ RAG ti Mo ṣe, ni ibẹrẹ oṣuwọn kọlu ipilẹ jẹ 67%. Mo ṣe awọn nkan mẹta:
1. Yipada pinpin lati 1022 kan si pipin itumọ dinamiki (nipasẹ akọle+ipin), oṣuwọn kọlu ga si 74%;
2. Fi wiwa idapọ (fekito + BM25) ati awoṣe rerank kekere kun, oṣuwọn kọlu ga si 83%;
3. Mu awọn ilana itọka dara si ati fi agbara mu pe ko si alaye to, iṣuwọn iruju dinku lati 22% si kere ju 5%.

Ni afikun, a ṣe idasile ọna ṣiṣe igbelewọn lemọlemọ, ṣaaju iyipada kọọkan a ni lati ṣe ayẹwo awọn ibeere 200 pẹlu Dimegilio RAGAS, lati rii daju pe ko si ipadasẹhin."


Ipari: Eto itọsọna atunṣe RAG pipe kan

Data Layer ─→ Ifọmọ iwe, imudara pinpin, imudara metadata, ifibọ aaye
Wiwa Layer ─→ Wiwa idapọ, rerank, atunkọ ibeere, HyDE, atunṣe Top-K
Ipilẹṣẹ Layer ─→ Agbara itọka, awọn ilana ibeere, funpin, itọka, ala kiko
Igbelewọn Layer ─→ Akojo igbelewọn, RAGAS, itupalẹ eniyan, idanwo A/B

评论

暂无已展示的评论。

发表评论(匿名)