Entrevista de la sèrie AI 8: Què és RAG? Per què pensar en fer un projecte RAG?
Què és RAG?
RAG és l'acrònim de Retrieval-Augmented Generation, que en català significa Generació Augmentada per Recuperació.
En poques paraules, és una tècnica que dota al model de llenguatge gran d'un "llibre de consulta" que es pot fullejar en qualsevol moment.
Pots imaginar el model de llenguatge gran com un "superestudiant" amb una memòria excepcional i un coneixement profund. Però aquest superestudiant té dos "defectes" innats:
- Data límit del coneixement: els seus coneixements només arriben fins a les dades d'entrenament. No sap res del que ha passat després de 2023.
- Possible "invenció": quan es troba amb una pregunta que no sap, no diu "no ho sé", sinó que s'inventa una resposta que sembla raonable (això és l'al·lucinació de la IA).
RAG està dissenyat per resoldre aquests dos problemes. El seu flux de treball és senzill, en tres passos:
- Recuperació: quan fas una pregunta, el sistema primer cerca ràpidament en una "base de coneixement externa" (com tots els documents de la teva empresa, la Viquipèdia actualitzada o un conjunt de lleis) per trobar els fragments més rellevants. És com si l'estudiant consultés un llibre per al problema.
- Augmentació: el sistema empaqueta "la teva pregunta" i "els fragments rellevants recuperats" en un sol missatge, formant una indicació "augmentada". És com donar a l'estudiant un material de referència.
- Generació: el model de llenguatge gran genera la resposta final basant-se en aquesta indicació augmentada. Ja no es basa únicament en el coneixement antic de la seva memòria, sinó que es refereix principalment al material de referència que li has proporcionat. És com si l'estudiant respongués mirant el llibre, no imaginant.
Una analogia senzilla:
- LLM tradicional: "Com reparar la meva bicicleta model XX?" → el model respon de memòria, pot ser obsolet o incorrecte.
- RAG: "Com reparar la meva bicicleta model XX?" → primer recupera el manual de reparació oficial més recent → després genera: "Segons el capítol 3 del manual de reparació de 2024, primer has de..."
Per què pensar en fer un projecte RAG?
Fer un projecte RAG és, essencialment, per potenciar els punts forts i evitar els febles, alliberant el veritable potencial dels models de llenguatge gran. Les principals motivacions són:
-
Resoldre els problemes de "coneixement obsolet" i "al·lucinacions"
- Motivació: voler que el LLM respongui preguntes sobre esdeveniments recents, dades internes, documents privats, assegurant que les respostes siguin verificables.
- Valor: un sistema de consulta mèdica amb RAG pot citar les últimes revistes mèdiques per respondre "símptomes de la nova variant de COVID", en lloc de donar informació obsoleta de 2021, i adjuntar fonts de citació, reduint molt el risc de "dir coses sense fonament".
-
Permetre que la IA tracti "dades privades" tot garantint la seguretat
- Motivació: cada empresa té la seva pròpia base de coneixement (contractes, codi, registres d'atenció al client, etc.). Aquestes dades no es poden reentrenar o ajustar (cost elevat, tècnicament difícil, risc de filtració).
- Valor: mitjançant RAG, pots construir un "assistent de consulta AI" intern. Quan un empleat pregunta, la IA cerca informació dels documents privats de l'empresa per respondre. Les dades privades romanen sempre dins l'empresa, no s'envien als fabricants de models per entrenar, aprofitant la capacitat de comprensió del LLM i garantint la seguretat de les dades.
-
Reduir costos i millorar l'eficiència
- Motivació: reentrenar o ajustar un model gran per absorbir nous coneixements és com tornar a aprendre tota una biblioteca, requereix grans recursos computacionals i costos.
- Valor: RAG gairebé no requereix entrenament, només cal construir el sistema de recuperació. El cost pot ser de l'1% de l'ajustament, o fins i tot menys. A més, si la base de coneixement s'actualitza, els resultats de recuperació s'actualitzen automàticament, sense necessitat de reentrenar el model, oferint "actualització en temps real".
-
Fer que la IA "sàpiga el que sap i el que no sap"
- Motivació: voler que el model tingui una consciència clara dels límits del seu coneixement.
- Valor: un sistema RAG pot establir una regla: si no es recuperen documents rellevants, respon directament "Ho sento, no he trobat informació relacionada a la base de coneixement. Si us plau, confirmi la pregunta." Aquest mecanisme de "citació fallida" fa que el funcionament de la IA sigui més fiable i transparent.
Resumint:
Pensar en fer un projecte RAG és perquè volem tant la potent capacitat de comprensió i expressió dels models de llenguatge gran com fer-los "honests, fiables, actualitzats i experts en el negoci privat". És com posar un volant precís i un mapa de navegació actualitzat en temps real (sistema de recuperació) a un supermotor (LLM), i és actualment una de les vies tècniques més efectives i mainstream per desplegar LLM en àmbits seriosos com empreses, medicina, dret i finances.
评论
暂无已展示的评论。
发表评论(匿名)