AI sērijas intervija 8: Kas ir RAG? Kāpēc radās doma veikt RAG projektu?

Kas ir RAG?

RAG pilnais nosaukums ir Retrieval-Augmented Generation, latviski — izguves papildinātā ģenerēšana.

Vienkārši sakot, tā ir tehnoloģija, kas nodrošina lielo valodas modeli ar "uzziņu grāmatu, ko vienmēr var pāršķirstīt".

Vari iedomāties lielo valodas modeli kā "superizglītotu cilvēku" ar izcilu atmiņu un plašām zināšanām. Bet šim "superizglītotajam" ir divi iedzimti "trūkumi":

Zināšanu termiņš: Viņa zināšanas ir ierobežotas līdz apmācības datu datumam. Par notikumiem pēc 2023. gada viņš neko nezina.
Iespējama "izdomāšana": Saskaroties ar jautājumu, uz kuru viņš nezina atbildi, viņš neteiks "Es nezinu", bet gan izdomās ticamu atbildi (tas ir AI halucināciju fenomens).

RAG ir izstrādāts, lai atrisinātu šīs divas problēmas. Tā darbība ir vienkārša, trīs soļos:

Izguve: Kad uzdod jautājumu, sistēma vispirms ātri meklē un atrod atbilstošākās informācijas fragmentus "ārējā zināšanu bāzē" (piemēram, visi uzņēmuma dokumenti, jaunākā Vikipēdija vai juridiskie teksti). Tas ir kā likt studentam vispirms sameklēt atbildi grāmatā.
Papildināšana: Sistēma apvieno "tavu uzdoto jautājumu" un "atrastās atbilstošās rindkopas", veidojot "papildinātu" pamudinājumu (prompt). Tas ir kā iedot studentam atsauces materiālus.
Ģenerēšana: Lielais valodas modelis, pamatojoties uz šo "papildināto" pamudinājumu, ģenerē galīgo atbildi. Tas vairs nepaļaujas tikai uz savā "atmiņā" esošajām novecojušajām zināšanām, bet galvenokārt izmanto sniegtos "atsauces materiālus". Tas ir kā students atbild uz jautājumu, skatoties grāmatā, nevis izdomājot.

Vienkārša analogija:
- Tradicionālais LLM: "Kā salabot manu XX modeļa velosipēdu?" → Modelis atbild no atmiņas, iespējams, novecojis vai nepareizi.
- RAG: "Kā salabot manu XX modeļa velosipēdu?" → Vispirms izgūst jaunāko oficiālo remonta rokasgrāmatu → Tad ģenerē: "Saskaņā ar 2024. gada remonta rokasgrāmatas 3. nodaļu, vispirms vajadzētu..."

Kāpēc radās doma veikt RAG projektu?

Veikt RAG projektu būtībā nozīmē izmantot stiprās puses un novērst vājās puses, lai atraisītu lielo valodas modeļu patieso potenciālu. Ir vairāki galvenie virzītājspēki:

Atrisināt "zināšanu novecošanas" un "halucināciju" problēmas
- Motivācija: Vēlme, lai LLM atbildētu uz jautājumiem par jaunākajiem notikumiem, iekšējiem datiem, privātiem dokumentiem, vienlaikus nodrošinot, ka atbildes ir pamatotas.
- Vērtība: Medicīnas jautājumu-atbilžu sistēma, kas izmanto RAG, var atsaukties uz jaunākajiem medicīnas žurnāliem, atbildot "jaunākā COVID paveida simptomi", nevis sniegt 2021. gada novecojušu informāciju, un pievienot atsauces, ievērojami samazinot risku "runāt bez pamata".
Ļaut AI apstrādāt "privātos datus", vienlaikus nodrošinot drošību
- Motivācija: Katram uzņēmumam ir savas zināšanu bāzes (līgumi, kods, klientu apkalpošanas ieraksti utt.). Šos datus nevar izmantot, lai no jauna apmācītu vai veiktu smalko regulēšanu (dārgi, tehniski sarežģīti, pastāv datu noplūdes risks).
- Vērtība: Ar RAG palīdzību var izveidot iekšēju "AI jautājumu-atbilžu asistentu". Darbinieki uzdod jautājumus, un AI atbild, izgūstot informāciju no uzņēmuma privātiem dokumentiem. Privātie dati vienmēr paliek uzņēmuma iekšienē un netiek nosūtīti modeļa ražotājam apmācībai — tiek izmantota LLM saprašanas spēja, vienlaikus saglabājot datu drošību.
Samazināt izmaksas, palielināt efektivitāti
- Motivācija: Pārmācīt vai veikt smalko regulēšanu lielam modelim, lai absorbētu jaunas zināšanas, ir kā no jauna apgūt visu bibliotēku — nepieciešami milzīgi skaitļošanas resursi un izmaksas.
- Vērtība: RAG gandrīz neprasa apmācību — nepieciešams tikai izveidot izguves sistēmu. Izmaksas var būt pat 1% no smalkās regulēšanas vai pat zemākas. Turklāt, atjauninot zināšanu bāzi, atjaunojas arī izguves rezultāti — nav nepieciešams pārmācīt modeli, nodrošinot "reāllaika atjauninājumus".
Ļaut AI "zināt, ko tas zina, un nezināt, ko nezina"
- Motivācija: Vēlme, lai modelim būtu skaidra izpratne par savu zināšanu robežu.
- Vērtība: RAG sistēmā var iestatīt noteikumu: ja nav atrasti atbilstoši dokumenti, tieši atbildēt: "Atvainojiet, es neatradu atbilstošu informāciju zināšanu bāzē. Lūdzu, pārbaudiet jautājumu." Šāds "neizdošanās citēšanas" mehānisms padara AI darbību uzticamāku un pārskatāmāku.

Kopsavilkums:

Doma veikt RAG projektu radās tāpēc, ka mēs vienlaikus vēlamies lielo valodas modeļu spēcīgo saprašanu un izteikšanos, kā arī padarīt tos "godīgus, uzticamus, neatpaliekošus no laika un zinošus par privāto biznesu". Tas ir kā uzstādīt precīzi kontrolējamu stūri un reāllaikā atjaunināmu navigācijas karti (izguves sistēmu) superdzinējam (LLM), un pašlaik tas ir viens no efektīvākajiem un populārākajiem tehniskajiem ceļiem, lai LLM patiešām ieviestu nopietnās jomās, piemēram, uzņēmējdarbībā, medicīnā, tiesībās un finansēs.

AI sērijas intervija 8: Kas ir RAG? Kāpēc radās doma veikt RAG projektu?

Kas ir RAG?

Kāpēc radās doma veikt RAG projektu?

评论

发表评论（匿名）