AI serija intervjua 8: Šta je RAG? Zašto raditi RAG projekat?

Šta je RAG?

RAG je skraćenica za Retrieval-Augmented Generation, na bosanskom Generisanje potpomognuto pretraživanjem.

Jednostavno rečeno, to je tehnika koja velikom jezičkom modelu daje „priručnik koji može listati u svakom trenutku".

Zamislite veliki jezički model kao „super učenika" sa odličnim pamćenjem i ogromnim znanjem. Ali ovaj učenik ima dva prirodna „nedostatka":

Datum završetka znanja: Njegovo znanje završava se podacima iz treninga. Ništa što se desilo nakon 2023. godine ne zna.
Može „izmisliti": Kada naiđe na pitanje koje ne zna, neće reći „ne znam", već će maštom „izmisliti" odgovor koji zvuči razumno (to je AI halucinacija).

RAG rješava ova dva problema. Njegov tok rada je jednostavan, u tri koraka:

Pretraživanje: Kada postavite pitanje, sistem prvo odlazi u „eksternu bazu znanja" (npr. sve dokumente vaše kompanije, najnoviju Wikipediju, ili skup zakonskih propisa) i brzo pronalazi najrelevantnije informacije. To je kao kad učenika pošaljete da otvori knjigu i potraži odgovor na pitanje.
Proširivanje: Sistem kombinuje „vaše pitanje" i „pronađene relevantne pasuse", formirajući „prošireni" upit. To je kao da ste učeniku dali referentne materijale.
Generisanje: Veliki jezički model na osnovu ovog „proširenog" upita generiše konačan odgovor. On se više ne oslanja samo na staro znanje iz „pamćenja", već uglavnom koristi dostavljene „referentne materijale". To je kao da učenik odgovara gledajući u knjigu i materijale, a ne izmišlja.

Jednostavna analogija:
- Tradicionalni LLM: „Kako popraviti moj bicikl modela XX?" → Model odgovara po sjećanju, možda zastarjelo ili pogrešno.
- RAG: „Kako popraviti moj bicikl modela XX?" → Prvo pretraži najnoviji službeni priručnik za popravku → Zatim generiše: „Prema poglavlju 3 priručnika za 2024., prvo treba da..."

Zašto raditi RAG projekat?

Rad na RAG projektu u suštini znači iskoristiti prednosti i izbjeći slabosti, osloboditi pravi potencijal velikih jezičkih modela. Postoji nekoliko ključnih pokretača:

Rješavanje problema „zastarjelog znanja" i „halucinacija"
- Motiv: Želimo da LLM odgovara na pitanja o najnovijim događajima, internim podacima, privatnim dokumentima, a istovremeno osiguramo da su odgovori potkrijepljeni izvorima.
- Vrijednost: Medicinski sistem za pitanja i odgovore koji koristi RAG može citirati najnovije medicinske časopise kada odgovara na pitanje „simptomi najnovije varijante COVID-19", umjesto da daje zastarjele informacije iz 2021. godine, uz izvore, što značajno smanjuje rizik od „izmišljanja".
Omogućiti AI da obrađuje „privatne podatke" uz očuvanje sigurnosti
- Motiv: Svaka kompanija ima svoju bazu znanja (ugovori, kod, zapisi korisničke podrške, itd.). Ovi podaci se ne mogu koristiti za ponovni trening ili fina podešavanja modela (skupi, tehnički zahtjevni, rizik od curenja podataka).
- Vrijednost: Kroz RAG možete izgraditi internog „AI asistenta za pitanja i odgovore". Kada zaposleni postavi pitanje, AI pretražuje relevantne informacije iz internih privatnih dokumenata i odgovara. Privatni podaci uvijek ostaju u kompaniji, ne šalju se proizvođaču modela za trening, čime se koristi sposobnost razumijevanja LLM-a, a istovremeno osigurava sigurnost podataka.
Smanjenje troškova, povećanje efikasnosti
- Motiv: Ponovno treniranje ili fino podešavanje velikog modela da bi apsorbirao novo znanje je poput ponovnog učenja cijele biblioteke, zahtijeva ogromne računarske resurse i troškove.
- Vrijednost: RAG gotovo ne zahtijeva trening, samo izgradnju sistema za pretraživanje. Trošak može biti samo 1% cijene finog podešavanja, ili čak manje. A kada se baza znanja ažurira, rezultati pretraživanja se automatski ažuriraju, bez potrebe za ponovnim treniranjem modela, što omogućava „ažuriranje u realnom vremenu".
Učiniti AI da „zna šta zna, a zna i šta ne zna"
- Motiv: Želimo da model ima jasnu svijest o granicama svog znanja.
- Vrijednost: RAG sistem može postaviti pravilo: ako ne pronađe relevantne dokumente, jednostavno odgovori „Nažalost, nisam pronašao relevantne informacije u bazi znanja. Molim vas, provjerite pitanje." Ovaj mehanizam „neuspješnog citiranja" čini rad AI pouzdanijim i transparentnijim.

Sažetak:

Razlog zašto se radi RAG projekat je taj što želimo i snažne sposobnosti razumijevanja i generisanja velikih jezičkih modela, a istovremeno želimo da model bude „pošten, pouzdan, u korak s vremenom i da razumije privatne poslove". To je poput ugradnje preciznog upravljača i navigacijske mape koja se ažurira u realnom vremenu (sistem za pretraživanje) u super motor (LLM), i predstavlja jednu od najefikasnijih i najpopularnijih tehničkih puteva za stvarnu primjenu LLM-a u ozbiljnim oblastima poput biznisa, medicine, prava, finansija itd.

AI serija intervjua 8: Šta je RAG? Zašto raditi RAG projekat?

Šta je RAG?

Zašto raditi RAG projekat?

评论

发表评论（匿名）