AI հարցազրույցների շարք 8: Ի՞նչ է RAG-ը: Ինչու՞ մտածել RAG նախագիծ անելու մասին:

Ի՞նչ է RAG-ը:

RAG-ի լրիվ անվանումն է Retrieval-Augmented Generation, որը հայերեն թարգմանվում է որպես Որոնման ուժեղացված գեներացիա։

Պարզ ասած, դա մեծ լեզվական մոդելին "մի գիրք տալու" տեխնոլոգիա է, որը կարելի է ցանկացած պահի թերթել։

Կարող եք պատկերացնել մեծ լեզվական մոդելը որպես հիանալի հիշողությամբ և գիտելիքներով օժտված "գերակայուն ուսանող": Բայց այս ուսանողն ունի երկու բնածին "թերություն"՝

Գիտելիքների սահմանափակում. Նրա սովորած գիտելիքները սահմանափակվում են միայն ուսուցման տվյալներով: 2023 թվականից հետո տեղի ունեցած իրադարձությունների մասին նա ոչինչ չգիտի:
Հնարավոր "հորինել". Երբ հանդիպում է իրեն անծանոթ հարցի, նա չի ասի "չգիտեմ", այլ երևակայությամբ "կհորինի" ողջամիտ թվացող պատասխան (սա է AI-ի հալյուցինացիան):

RAG-ը լուծում է այս երկու խնդիրները: Նրա աշխատանքային հոսքը պարզ է՝ երեք քայլով.

Որոնում. Երբ հարց եք տալիս, համակարգը նախ որոնում է "արտաքին գիտելիքների բազայում" (օրինակ՝ ձեր ընկերության բոլոր փաստաթղթերը, վերջին Վիքիպեդիան կամ իրավական նորմերի մի շարք) և արագ գտնում առավել համապատասխան տեղեկատվության մի քանի հատված: Սա նման է ուսանողին հարցի վերաբերյալ գիրքը թերթելու հանձնարարությանը:
Ուժեղացում. Համակարգը փաթեթավորում է "ձեր հարցը" և "գտնված համապատասխան հատվածները" մեկ ամբողջության մեջ՝ ձևավորելով "ուժեղացված" հուշում: Սա նման է ուսանողին տեղեկատու նյութեր տրամադրելուն:
Գեներացիա. Մեծ լեզվական մոդելը, հիմնվելով այս "ուժեղացված" հուշման վրա, գեներացնում է վերջնական պատասխանը: Այն այլևս չի ապավինում միայն իր "հիշողության" մեջ պահված հին գիտելիքներին, այլ հիմնականում հղում է կատարում ձեր տրամադրած "տեղեկատու նյութերին": Սա նման է ուսանողին գրքից նյութը նայելով պատասխանելուն, այլ ոչ թե երևակայելուն:

Պարզ համեմատություն.
- Ավանդական LLM. "Ինչպե՞ս վերանորոգել իմ XX մոդելի հեծանիվը:" → Մոդելը պատասխանում է հիշողությունից, կարող է հնացած կամ սխալ լինել:
- RAG. "Ինչպե՞ս վերանորոգել իմ XX մոդելի հեծանիվը:" → Նախ որոնում վերջին պաշտոնական վերանորոգման ձեռնարկը → Ապա գեներացնում՝ "2024 թվականի վերանորոգման ձեռնարկի 3-րդ գլխի համաձայն, դուք պետք է սկզբում..."

Ինչու՞ մտածել RAG նախագիծ անելու մասին:

RAG նախագիծ անելը, ըստ էության, նպատակ ունի օգտվել ուժեղ կողմերից և խուսափել թույլ կողմերից՝ բացահայտելով մեծ լեզվական մոդելի իրական ներուժը: Ահա հիմնական շարժիչ ուժերը.

Լուծել "գիտելիքների հնացումը" և "հալյուցինացիայի" խնդիրը
- Շարժառիթ. Ցանկություն՝ LLM-ին հնարավորություն տալ պատասխանելու վերջին իրադարձությունների, ներքին տվյալների, մասնավոր փաստաթղթերի վերաբերյալ հարցերին՝ միաժամանակ ապահովելով պատասխանների փաստաթղթային հիմքը:
- Արժեք. Բժշկական հարցուպատասխանի համակարգը, որը կարող է RAG կատարել, կարող է մեջբերել վերջին բժշկական հանդեսները՝ պատասխանելով "COVID-19-ի նոր տարբերակի ախտանիշները" հարցին՝ չտալով 2021 թվականի հնացած տեղեկատվություն և կցելով աղբյուրները՝ զգալիորեն նվազեցնելով "պատահական խոսելու" ռիսկը:
Թույլ տալ AI-ին մշակել "մասնավոր տվյալներ"՝ միաժամանակ ապահովելով անվտանգությունը
- Շարժառիթ. Յուրաքանչյուր ընկերություն ունի իր գիտելիքների բազան (պայմանագրեր, կոդ, հաճախորդների սպասարկման գրառումներ և այլն): Այս տվյալները չեն կարող օգտագործվել մոդելը վերապատրաստելու կամ նուրբ կարգաբերելու համար (թանկ, տեխնիկապես բարդ, տվյալների արտահոսքի ռիսկ):
- Արժեք. RAG-ի միջոցով դուք կարող եք ստեղծել ընկերության ներքին "AI հարցուպատասխանի օգնական": Աշխատակիցը հարց է տալիս, AI-ն որոնում է ընկերության ներքին մասնավոր փաստաթղթերից համապատասխան տեղեկատվություն և պատասխանում: Մասնավոր տվյալները միշտ մնում են ընկերության ներսում, չեն ուղարկվում մոդելի մատակարարին ուսուցման համար՝ օգտվելով LLM-ի ըմբռնման կարողությունից և միաժամանակ ապահովելով տվյալների անվտանգությունը:
Նվազեցնել ծախսերը, բարձրացնել արդյունավետությունը
- Շարժառիթ. Մեծ մոդելի վերապատրաստումը կամ նուրբ կարգաբերումը նոր գիտելիքներ կլանելու համար նման է ամբողջ գրադարանը նորից սովորելուն՝ պահանջելով հսկայական հաշվողական ռեսուրսներ և ծախսեր:
- Արժեք. RAG-ը գրեթե չի պահանջում ուսուցում, միայն որոնման համակարգի կառուցում: Ծախսերը կարող են կազմել նուրբ կարգաբերման 1%-ը կամ նույնիսկ ավելի քիչ: Ավելին, երբ գիտելիքների բազան թարմացվում է, որոնման արդյունքներն ինքնաբերաբար թարմացվում են՝ առանց մոդելը վերապատրաստելու անհրաժեշտության՝ ապահովելով "իրական ժամանակի թարմացում":
AI-ին դարձնել "գիտեմ, ինչ գիտեմ, չգիտեմ, ինչ չգիտեմ"
- Շարժառիթ. Ցանկություն, որ մոդելը հստակ պատկերացնի իր գիտելիքների սահմանները:
- Արժեք. RAG-ի համակարգը կարող է սահմանել կանոն. եթե համապատասխան փաստաթուղթ չգտնվի, ուղղակի պատասխանել "Ներեցեք, ես գիտելիքների բազայում համապատասխան տեղեկատվություն չգտա, խնդրում եմ ստուգել ձեր հարցը:" Այս "հղումը ձախողելու" մեխանիզմը AI-ի աշխատանքը դարձնում է ավելի հուսալի և թափանցիկ:

Ամփոփելով.

RAG նախագիծ անելու մտքին գալը պայմանավորված է նրանով, որ մենք ցանկանում ենք և՛ մեծ լեզվական մոդելի հզոր ըմբռնման և արտահայտման կարողությունները, և՛ այն դարձնել "ազնիվ, հուսալի, ժամանակակից և մասնավոր բիզնեսին ծանոթ": Այն նման է գերուժեղ շարժիչին (LLM) ճշգրիտ ղեկի և իրական ժամանակի թարմացվող նավիգացիոն քարտեզի (որոնման համակարգ) տեղադրմանը և հանդիսանում է ամենաարդյունավետ և տարածված տեխնիկական ուղիներից մեկը, որպեսզի LLM-ն իրական կիրառություն գտնի լուրջ ոլորտներում, ինչպիսիք են ձեռնարկատիրությունը, բժշկությունը, իրավունքը, ֆինանսները:

AI հարցազրույցների շարք 8: Ի՞նչ է RAG-ը: Ինչու՞ մտածել RAG նախագիծ անելու մասին:

Ի՞նչ է RAG-ը:

Ինչու՞ մտածել RAG նախագիծ անելու մասին:

评论

发表评论（匿名）