AI-röð viðtöl 8: Hvað er RAG? Af hverju að gera RAG-verkefni?
Hvað er RAG?
RAG stendur fyrir Retrieval-Augmented Generation, sem á íslensku mætti kalla sækja-aukningu við myndun.
Einfaldlega sagt er það tækni sem gefur stórum tungumálalíkani „uppflettirit sem hægt er að skoða hvenær sem er“.
Þú getur hugsað um stóra tungumálalíkanið sem ofurmenni með gott minni og mikla þekkingu. En þetta ofurmenni hefur tvo eðlisgalla:
- Þekkingarmörk: Þekking hans nær aðeins til gagna sem hann lærði á þjálfunartíma. Hann veit ekkert um atburði eftir 2023.
- Getur „samið upp“ hluti: Þegar hann veit ekki svarið, segir hann ekki „ég veit ekki“, heldur „semur“ sennilegt svar (þetta er AI-blekking).
RAG leysir þessi tvö vandamál. Vinnuferlið er einfalt, í þremur skrefum:
- Sækja: Þegar þú spyrð spurningu, fer kerfið í „ytra þekkingarsafn“ (t.d. öll skjöl fyrirtækisins, nýjasta Wikipedia, eða lagasafn) og finnur fljótt nokkra viðeigandi kafla. Þetta er eins og að láta nemanda fletta eftir svari í bók.
- Auka: Kerfið pakkar saman „spurningunni þinni“ og „fundnu köflunum“ í eina aukta spurningu. Þetta er eins og að gefa nemandanum heimildir.
- Mynda: Stóra tungumálalíkanið myndar lokasvar út frá þessari auktu spurningu. Það treystir ekki lengur eingöngu á gamla þekkingu í minni sínu, heldur notar aðallega þær heimildir sem þú gafst. Þetta er eins og nemandi svarar með bókina við höndina, ekki úr lausu lofti.
Einföld samlíking:
- Hefðbundið LLM: „Hvernig laga ég hjól af gerð XX?“ → Líkanið svarar eftir minni, gæti verið úrelt eða rangt.
- RAG: „Hvernig laga ég hjól af gerð XX?“ → Sækir fyrst nýjustu viðgerðarhandbókina → Myndar svo: „Samkvæmt 3. kafla viðgerðarhandbókarinnar 2024 ættir þú fyrst að …“
Af hverju að gera RAG-verkefni?
Að gera RAG-verkefni snýst í raun um að nýta styrkleika og forðast veikleika til að losa um raunverulega möguleika stóru tungumálalíkananna. Hér eru helstu drifkraftar:
-
Leyna vandamálið „úrelt þekking“ og „blekkingar“
- Hvatning: Vilt að LLM geti svarað spurningum um nýlega atburði, innri gögn, einkaskjöl, og tryggt að svörin séu rökstudd.
- Gildi: Læknisfræðilegt spurningakerfi með RAG getur vísað í nýjustu læknatímarit til að svara „einkenni nýjustu Covid-afbrigðisins“ í stað úreltra upplýsinga frá 2021, og gefið heimildir, sem dregur verulega úr hættu á „óábyrgum svörum“.
-
Láta AI geta unnið með „einkagögn“ en halda öryggi
- Hvatning: Hvert fyrirtæki hefur sitt þekkingarsafn (samningar, kóði, þjónustuskrár o.s.frv.). Ekki er hægt að nota þessi gögn til að endurþjálfa eða fínstilla líkan (dýrt, tæknilega erfitt, áhættu á gagnavinnslu).
- Gildi: Með RAG geturðu byggt innra „AI-spurningasvarara“ fyrir fyrirtækið. Starfsmaður spyr, og AI sækir viðeigandi upplýsingar úr einkaskjölum fyrirtækisins til að svara. Einkagögnin eru alltaf geymd innanhúss, ekki send til líkanaframleiðenda til þjálfunar – þannig nýtist skilningur LLM ásamt gagnaöryggi.
-
Lækka kostnað og auka skilvirkni
- Hvatning: Að endurþjálfa eða fínstilla stórt líkan til að taka inn nýja þekkingu er eins og að læra allt bókasafnið aftur – gríðarlegur reikniafl og kostnaður.
- Gildi: RAG krefst nánast engrar þjálfunar, aðeins að byggja upp sækikerfi. Kostnaðurinn getur verið 1% af fínstillingu, eða minni. Og ef þekkingarsafnið uppfærist, uppfærast sækiniðurstöðurnar sjálfkrafa – engin þörf á að endurþjálfa líkanið, þannig að það er „rauntímauppfærsla“.
-
Láta AI vita „hvað það veit og hvað ekki“
- Hvatning: Vilt að líkanið hafi skýra vitund um eigin þekkingarmörk.
- Gildi: RAG-kerfi getur sett reglu: Ef engin viðeigandi skjöl finnast, svaraðu beint „Því miður fann ég engar upplýsingar í þekkingarsafninu. Vinsamlegast staðfestu spurninguna.“ Þessi „tilvísunarmistök“ gera AI vinnu áreiðanlegri og gagnsærri.
Samantekt:
Ástæðan fyrir að gera RAG-verkefni er sú að við viljum bæði hafa öflugan skilning og tjáningarmátt stóru tungumálalíkananna, og gera þau „heiðarleg, áreiðanleg, tímalega og fær um að skilja einkarekstur“. Það er eins og að setja nákvæman stýribúnað og rauntímauppfærða leiðsögukort (sækikerfi) á ofurvélina (LLM). Þetta er ein áhrifaríkasta og algengasta tæknileiðin til að láta LLM raunverulega virka í alvarlegum sviðum eins og fyrirtækjum, heilbrigðisþjónustu, lögfræði, fjármálum o.s.frv.
评论
暂无已展示的评论。
发表评论(匿名)