AI serija intervjua 8: Šta je RAG? Zašto raditi RAG projekat?
Šta je RAG?
RAG je skraćenica od Retrieval-Augmented Generation, što na srpskom znači generisanje obogaćeno pretragom.
Jednostavno rečeno, to je tehnika koja velikom jezičkom modelu daje „priručnik koji može da lista u bilo kom trenutku”.
Zamislite veliki jezički model kao „superučenika” sa odličnim pamćenjem i ogromnim znanjem. Ali ovaj učenik ima dva urođena „nedostatka”:
- Datum isteka znanja: Njegovo znanje se završava sa podacima na kojima je obučen. Ništa što se desilo posle 2023. godine mu nije poznato.
- Može da „izmišlja”: Kada ne zna odgovor, neće reći „ne znam”, već će maštom „izmisliti” verodostojan odgovor (to je AI halucinacija).
RAG rešava ova dva problema. Njegov rad je jednostavan, u tri koraka:
- Pretraga: Kada postavite pitanje, sistem prvo brzo pretražuje „eksternu bazu znanja” (npr. sve dokumente vaše kompanije, najnoviju Vikipediju ili zbirku zakona) i pronalazi nekoliko najrelevantnijih delova. To je kao da učenik najpre otvori knjigu i potraži odgovor.
- Obogaćivanje: Sistem kombinuje „vaše pitanje” i „pronađene relevantne delove” u jedan „obogaćeni” prompt. To je kao da učeniku date priručnik.
- Generisanje: Veliki jezički model na osnovu ovog „obogaćenog” prompta generiše konačan odgovor. Ne oslanja se više samo na staro znanje iz „sećanja”, već uglavnom koristi „priručnik” koji ste mu dali. To je kao da učenik odgovara gledajući u knjigu, a ne izmišljajući.
Jednostavna analogija:
- Tradicionalni LLM: „Kako da popravim svoj bicikl modela XX?” → Model odgovara po sećanju, što može biti zastarelo ili netačno.
- RAG: „Kako da popravim svoj bicikl modela XX?” → Prvo pretraži najnoviji zvanični servisni priručnik → Zatim generiše: „Prema poglavlju 3 servisnog priručnika iz 2024, prvo treba da...”.
Zašto raditi RAG projekat?
Rad na RAG projektu je suštinski iskorišćavanje prednosti i izbegavanje mana, kako bi se oslobodio pravi potencijal velikih jezičkih模型a. Glavni pokretači su:
-
Rešavanje problema „zastarelog znanja” i „halucinacija”
- Motivacija: Želimo da LLM odgovara na pitanja o najnovijim događajima, internim podacima, privatnim dokumentima, uz garanciju da su odgovori proverljivi.
- Vrednost: Medicinski sistem za pitanja i odgovore koji koristi RAG može da citira najnovije medicinske časopise dok odgovara na pitanje „simptomi najnovije varijante COVID-19”, umesto da daje zastarele informacije iz 2021. godine, i pritom navodi izvore, značajno smanjujući rizik od „izmišljanja”.
-
Omogućavanje AI da obrađuje „privatne podatke”, uz očuvanje bezbednosti
- Motivacija: Svaka kompanija ima sopstvenu bazu znanja (ugovori, kodovi, zapisi korisničke podrške, itd.). Ovi podaci se ne mogu koristiti za ponovno obučavanje ili fino podešavanje modela (skupo, tehnički teško, rizik od curenja podataka).
- Vrednost: Putem RAG-a možete izgraditi internog „AI asistenta za pitanja i odgovore”. Kada zaposleni postavi pitanje, AI pretražuje relevantne informacije iz internih privatnih dokumenata i odgovara. Privatni podaci ostaju u kompaniji i ne šalju se proizvođaču modela za obučavanje, čime se koristi sposobnost razumevanja LLM-a, a istovremeno čuva bezbednost podataka.
-
Smanjenje troškova, povećanje efikasnosti
- Motivacija: Ponovno obučavanje ili fino podešavanje velikog modela da bi apsorbovao novo znanje je kao ponovno učenje čitave biblioteke – zahteva ogromne računarske resurse i troškove.
- Vrednost: RAG gotovo da ne zahteva obučavanje, potrebno je samo izgraditi sistem za pretragu. Troškovi su možda samo 1% cene finog podešavanja, ili čak niži. A kada se baza znanja ažurira, rezultati pretrage se automatski ažuriraju, bez potrebe za ponovnim obučavanjem modela – „ažuriranje u realnom vremenu”.
-
Omogućavanje AI da „zna šta zna, a šta ne zna”
- Motivacija: Želimo da model ima jasnu svest o granicama svog znanja.
- Vrednost: RAG sistem može da postavi pravilo: ako se ne pronađe relevantan dokument, direktno odgovara „Izvinite, nisam pronašao relevantne informacije u bazi znanja. Molim vas, proverite pitanje.” Ovaj mehanizam „neuspešnog citiranja” čini rad AI pouzdanijim i transparentnijim.
Sažetak:
Ideja o RAG projektu proizlazi iz toga što želimo i snažne sposobnosti razumevanja i generisanja velikih jezičkih modela, ali i da oni budu „iskreni, pouzdani, u korak sa vremenom i upoznati sa privatnim poslovnim procesima”. RAG je kao dodavanje preciznog volana i navigacione mape koja se ažurira u realnom vremenu (sistem za pretragu) moćnom motoru (LLM). To je trenutno jedan od najefikasnijih i najzastupljenijih tehničkih puteva za stvarnu primenu LLM-a u ozbiljnim oblastima poput preduzeća, medicine, prava, finansija itd.
评论
暂无已展示的评论。
发表评论(匿名)