AI-sarjan haastattelu 8: Mikä on RAG? Miksi ajateltiin tehdä RAG-projekti?
Mikä on RAG?
RAG on lyhenne sanoista Retrieval-Augmented Generation, suomeksi hakuvahvisteinen generointi.
Yksinkertaisesti sanottuna se on tekniikka, joka antaa suurelle kielelliselle mallille "käsikirjan, jota se voi milloin tahansa selata".
Voit ajatella suurta kielellistä mallia "superoppineena", jolla on erinomainen muisti ja laaja tietämys. Mutta tällä oppineella on kaksi synnynnäistä "puutetta":
- Tiedon vanheneminen: Hänen tietämyksensä ulottuu vain harjoitusdatan aikarajaan asti. Vuoden 2023 jälkeen tapahtuneista asioista hän ei tiedä mitään.
- Mahdollinen "sepittäminen": Kun hän kohtaa kysymyksen, johon ei tiedä vastausta, hän ei sano "en tiedä", vaan mielikuvituksensa avulla "keksii" uskottavan kuuloisen vastauksen (tämä on AI-hallusinaatio).
RAG ratkaisee nämä kaksi ongelmaa. Sen toimintaprosessi on yksinkertainen, kolme vaihetta:
- Haku: Kun esität kysymyksen, järjestelmä hakee nopeasti ulkoisesta tietokannasta (kuten yrityksesi kaikki asiakirjat, uusin Wikipedia tai joukko lakipykäliä) ja löytää olennaisimmat tiedot. Tämä on kuin oppilas etsii vastausta kirjasta.
- Vahvistus: Järjestelmä yhdistää "esittämäsi kysymyksen" ja "haetut olennaiset kohdat" yhdeksi "vahvistetuksi" kehotteeksi. Tämä on kuin antaisi oppilaalle lähdemateriaalia.
- Generointi: Suuri kielellinen malli tuottaa lopullisen vastauksen tämän "vahvistetun" kehotteen perusteella. Se ei enää luota pelkästään vanhaan tietoon, vaan käyttää ensisijaisesti antamiasi lähdemateriaaleja. Tämä on kuin oppilas vastaisi kirjan avulla, ei hatusta vedettynä.
Yksinkertainen vertaus:
- Perinteinen LLM: "Kuinka korjata XX-mallinen pyöräni?" → Malli vastaa muististaan, mahdollisesti vanhentuneesti tai virheellisesti.
- RAG: "Kuinka korjata XX-mallinen pyöräni?" → Hakee ensin uusimman virallisen huoltokäsikirjan → sitten generoi: "Vuoden 2024 huoltokäsikirjan luvun 3 mukaan sinun pitäisi ensin..."
Miksi ajateltiin tehdä RAG-projekti?
RAG-projektin tekeminen on olennaisesti vahvuuksien hyödyntämistä ja heikkouksien välttämistä, jotta suuren kielellisen mallin todellinen potentiaali vapautuu. Keskeisiä ajureita ovat:
-
Ratkaise "vanhentunut tieto" ja "hallusinaatiot"
- Motivaatio: Haluaa LLM:n vastaavan kysymyksiin viimeisimmistä tapahtumista, sisäisestä datasta, yksityisistä asiakirjoista, ja varmistaa, että vastauksilla on lähdeviitteet.
- Arvo: RAG-kyvykäs lääketieteellinen kysymys-vastausjärjestelmä voi viitata uusimpiin lääketieteellisiin aikakauslehtiin vastatessaan "COVIDin uusimman muunnoksen oireisiin" sen sijaan, että antaisi vuoden 2021 vanhentunutta tietoa, ja liittää mukaan lähdeviitteet, mikä vähentää suuresti "hatusta vedetyn tiedon" riskiä.
-
Mahdollistaa AI:n käsittelemään "yksityistä dataa" turvallisesti
- Motivaatio: Jokaisella yrityksellä on oma tietokanta (sopimukset, koodi, asiakaspalvelutallenteet jne.). Tätä dataa ei voida käyttää mallin uudelleenkoulutukseen tai hienosäätöön (kallis, teknisesti vaikea, tietovuotoriski).
- Arvo: RAG:n avulla voit rakentaa yrityksen sisäisen "AI-kysymysvastausavustajan". Työntekijä kysyy, AI hakee vastauksen yrityksen sisäisistä yksityisistä asiakirjoista. Yksityinen data säilyy aina yrityksen sisällä, eikä sitä lähetetä mallin valmistajalle harjoitukseen, hyödyntäen LLM:n ymmärrystä ja varmistaen tietoturvan.
-
Alenna kustannuksia, paranna tehokkuutta
- Motivaatio: Suuren mallin uudelleenkouluttaminen tai hienosäätö uuden tiedon omaksumiseksi on kuin koko kirjaston opiskelu uudelleen, vaatien valtavasti laskentatehoa ja kustannuksia.
- Arvo: RAG vaatii tuskin lainkaan koulutusta, vain hakujärjestelmän rakentamisen. Kustannukset voivat olla jopa 1% hienosäädön kustannuksista tai jopa vähemmän. Lisäksi tietokannan päivitys päivittää automaattisesti hakutulokset ilman mallin uudelleenkoulutusta, mahdollistaen "reaaliaikaiset päivitykset".
-
Tee AI:sta "tiedän mitä tiedän ja tiedän mitä en tiedä"
- Motivaatio: Halutaan, että mallilla on selkeä käsitys oman tietämyksensä rajoista.
- Arvo: RAG-järjestelmässä voidaan asettaa sääntö: jos asiaankuuluvia asiakirjoja ei löydy, vastaa suoraan "Anteeksi, en löytänyt tietokannastani asiaankuuluvaa tietoa. Tarkista kysymyksesi." Tämä "haku epäonnistui" -mekanismi tekee AI:n toiminnasta luotettavampaa ja läpinäkyvämpää.
Yhteenveto:
RAG-projektin idea syntyi, koska haluamme sekä suuren kielellisen mallin voimakkaan ymmärrys- ja ilmaisukyvyn että haluamme tehdä siitä "rehellisen, luotettavan, ajan tasalla olevan ja yksityistä liiketoimintaa ymmärtävän". Se on kuin asentaisi supermoottoriin (LLM) tarkkaan ohjattavan ohjauspyörän ja reaaliaikaisesti päivittyvän navigointikartan (hakujärjestelmä). Se on yksi tehokkaimmista ja yleisimmistä teknisistä reiteistä saada LLM todella käyttöön vakavilla aloilla, kuten yritysmaailmassa, terveydenhuollossa, lainsäädännössä ja rahoituksessa.
评论
暂无已展示的评论。
发表评论(匿名)