AI මාලාවේ සම්මුඛ පරීක්ෂණ 8: RAG යනු කුමක්ද? ඇයි RAG ව්‍යාපෘතියක් කිරීමට සිතුවේ?

RAG යනු කුමක්ද?

RAG හි පූර්ණ නම Retrieval-Augmented Generation වන අතර සිංහලෙන් ලබාගැනීම්-වර්ධක උත්පාදනය ලෙස හැඳින්වේ.

සරලව කිවහොත් එය මහා භාෂා ආකෘතියට (LLM) "ඕනෑම වේලාවක පෙරළා බැලිය හැකි යොමු පොතක්" ලබා දීමේ තාක්ෂණයකි.

ඔබට මහා භාෂා ආකෘතිය අතිශය මතක බලයක් සහ පුළුල් දැනුමක් ඇති "සුපිරි ශිෂ්‍යයෙකු" ලෙස සිතා ගත හැක. නමුත් මෙම ශිෂ්‍යයාට සහජ දෝෂ දෙකක් ඇත:

දැනුම අවසන් දිනය: ඔහු ඉගෙන ගත් දැනුම පුහුණු දත්තවල කාල සීමාවට පමණක් සීමා වේ. 2023 න් පසු සිදු වූ දේ ගැන ඔහු නොදනී.
"මනක්කල්පිත" කිරීමට ඉඩ ඇත: ඔහු නොදන්නා ප්‍රශ්නයකට මුහුණ දෙන විට, ඔහු "මම නොදනිමි" යැයි නොකියා, සාධාරණ බවක් පෙනෙන පිළිතුරක් මනඃකල්පිත කරයි (මෙය AI මායාවයි).

RAG මෙම ගැටළු දෙකම විසඳීමට පැමිණේ. එහි ක්‍රියාකාරී ප්‍රවාහය සරලයි, පියවර තුනකින්:

ලබාගැනීම: ඔබ ප්‍රශ්නයක් අසන විට, පද්ධතිය බාහිර "දැනුම් ගබඩාවක" (උදා: ඔබේ සමාගමේ සියලු ලේඛන, නවතම විකිපීඩියා, හෝ නීති රීති එකතුවක්) වෙත ගොස් වේගයෙන් සෙවුම් කර වඩාත් අදාළ කොටස් සොයා ගනී. මෙය ශිෂ්‍යයාට ප්‍රශ්නයට අදාළව පොත පෙරළීමට සමානය.
වර්ධනය: පද්ධතිය "ඔබ ඇසූ ප්‍රශ්නය" සහ "ලබාගත් අදාළ ඡේද" එකට ඇසුරුම් කර "වර්ධක ඉඟියක්" සාදයි. මෙය ශිෂ්‍යයාට යොමු ද්‍රව්‍යයක් ලබා දීමට සමානය.
උත්පාදනය: මහා භාෂා ආකෘතිය මෙම "වර්ධක ඉඟිය" මත පදනම්ව අවසන් පිළිතුර ජනනය කරයි. එය තම "මතකයේ" ඇති පැරණි දැනුම මත පමණක් රඳා නොසිට, ප්‍රධාන වශයෙන් ඔබ ලබා දුන් "යොමු ද්‍රව්‍ය" භාවිතා කර පිළිතුරු සපයයි. මෙය ශිෂ්‍යයා හිස් තැනින් පිළිතුරු නොදී පොත බලා පිළිතුරු දීමට සමානය.

සරල උපමාවක්:
- සාම්ප්‍රදායික LLM: "මගේ XX මාදිලියේ බයිසිකලය අලුත්වැඩියා කරන්නේ කෙසේද?" → ආකෘතිය මතකයෙන් පිළිතුරු දෙයි, යල් පැන ගිය හෝ වැරදි විය හැක.
- RAG: "මගේ XX මාදිලියේ බයිසිකලය අලුත්වැඩියා කරන්නේ කෙසේද?" → පළමුව සෙවුම් කරන්න නවතම නිල අලුත්වැඩියා අත්පොත → පසුව උත්පාදනය කරන්න: "2024 අලුත්වැඩියා අත්පොතේ 3 වන පරිච්ඡේදයට අනුව, ඔබ මුලින්ම ..."

ඇයි RAG ව්‍යාපෘතියක් කිරීමට සිතුවේ?

RAG ව්‍යාපෘතියක් කිරීම මූලික වශයෙන් හොඳ දේ පවත්වාගෙන නරක දේ වළක්වා ගැනීමට සහ මහා භාෂා ආකෘතියේ සැබෑ හැකියාව මුදා හැරීමට ය. ප්‍රධාන ධාවක කිහිපයක් මෙන්න:

"දැනුම යල්පැනීම" සහ "මායාව" ගැටළු විසඳීම
- චේතනාව: LLM වෙතින් නවතම සිදුවීම්, අභ්‍යන්තර දත්ත, පුද්ගලික ලේඛන පිළිබඳ ප්‍රශ්නවලට පිළිතුරු ලබා ගැනීමට අවශ්‍ය වීම, ඒ සමඟම පිළිතුරු සාක්ෂි සහිත බවට සහතික වීම.
- වටිනාකම: RAG හැකියාව ඇති වෛද්‍ය ප්‍රශ්නෝත්තර පද්ධතියකට නවතම වෛද්‍ය සඟරා උපුටා දක්වමින් "නවතම කොවිඩ් විකෘතියේ රෝග ලක්ෂණ" පිළිබඳ පිළිතුරු දිය හැකි අතර 2021 යල් පැන ගිය තොරතුරු ලබා නොදේ. එමෙන්ම මූලාශ්‍ර දක්වන බැවින් "අහවල් කතා" අවදානම බෙහෙවින් අඩු කරයි.
AI ට "පුද්ගලික දත්ත" සැකසීමට ඉඩ දීම, ආරක්ෂාව සහතික කිරීම
- චේතනාව: සෑම සමාගමකටම තමන්ගේම දැනුම් ගබඩාවක් ඇත (ගිවිසුම්, කේත, පාරිභෝගික සටහන් ආදිය). මෙම දත්ත ආකෘතිය නැවත පුහුණු කිරීමට හෝ සියුම් ලෙස සකස් කිරීමට භාවිතා කළ නොහැක (ඉහළ පිරිවැය, තාක්ෂණික අපහසුතා, දත්ත කාන්දු වීමේ අවදානම).
- වටිනාකම: RAG මගින් ඔබට සමාගම් අභ්‍යන්තර "AI ප්‍රශ්නෝත්තර සහායකයෙකු" ගොඩනගා ගත හැක. සේවකයෙකු ප්‍රශ්නයක් ඇසූ විට, AI සමාගමේ අභ්‍යන්තර පුද්ගලික ලේඛනවලින් අදාළ තොරතුරු ලබාගෙන පිළිතුරු දෙයි. පුද්ගලික දත්ත සමාගම තුළම පවතින අතර, ආකෘති සපයන්නාට පුහුණුව සඳහා එවනු නොලැබේ, එමඟින් LLM හි අවබෝධ හැකියාව උපයෝගී කරගනිමින් දත්ත ආරක්ෂාව සහතික කෙරේ.
පිරිවැය අඩු කිරීම, කාර්යක්ෂමතාව වැඩි කිරීම
- චේතනාව: නව දැනුම අවශෝෂණය කර ගැනීමට විශාල ආකෘතියක් නැවත පුහුණු කිරීම හෝ සියුම් ලෙස සකස් කිරීම යනු මුළු පුස්තකාලයම නැවත ඉගෙනීමට සමාන වන අතර එයට අතිවිශාල ගණනය කිරීමේ බලයක් සහ පිරිවැයක් අවශ්‍ය වේ.
- වටිනාකම: RAG සඳහා පුහුණුව අවශ්‍ය නොවේ, එයට අවශ්‍ය වන්නේ ලබාගැනීමේ පද්ධතියක් ගොඩනැගීම පමණි. පිරිවැය සියුම් සකස් කිරීමේ 1% ක් හෝ ඊටත් අඩු විය හැක. තවද, දැනුම් ගබඩාව යාවත්කාලීන කළ විට, ලබාගැනීමේ ප්‍රතිඵල ස්වයංක්‍රීයව යාවත්කාලීන වේ; ආකෘතිය නැවත පුහුණු කිරීම අවශ්‍ය නොවේ. මෙය "තත්ය කාලීන යාවත්කාලීන කිරීමක්" සපයයි.
AI ට "දන්නා දේ දනිමි, නොදන්නා දේ නොදනිමි" යැයි කීමට ඉඩ දීම
- චේතනාව: ආකෘතියට තම දැනුමේ සීමාවන් පිළිබඳ පැහැදිලි අවබෝධයක් ඇති කිරීමට අවශ්‍ය වීම.
- වටිනාකම: RAG පද්ධතියට රීතියක් සැකසිය හැක: අදාළ ලේඛනයක් හමු නොවුණහොත්, සරලව පිළිතුරු දෙන්න: "කණගාටුයි, දැනුම් ගබඩාවේ අදාළ තොරතුරු මට හමු නොවීය. කරුණාකර ඔබේ ප්‍රශ්නය තහවුරු කරන්න." මෙම "උපුටා දැක්වීම අසාර්ථක වීමේ" යාන්ත්‍රණය AI හි ක්‍රියාකාරීත්වය වඩාත් විශ්වාසදායක සහ විනිවිද පෙනෙන බවට පත් කරයි.

සාරාංශය:

RAG ව්‍යාපෘතියක් කිරීමට සිතුවේ අපට මහා භාෂා ආකෘතියේ ප්‍රබල අවබෝධය සහ ප්‍රකාශන හැකියාව අවශ්‍ය වන අතරම, එය "අවංක, විශ්වාසදායක, කාලයට ගැලපෙන සහ පුද්ගලික ව්‍යාපාරික කටයුතු තේරුම් ගන්නා" බවට පත් කිරීමට අවශ්‍ය වීමයි. එය සුපිරි එන්ජිමකට (LLM) නිවැරදිව පාලනය කළ හැකි සුක්කානමක් සහ තත්ය කාලීන නාවික සිතියමක් (ලබාගැනීමේ පද්ධතිය) සවි කිරීමක් වැනි ය. දැනට ව්‍යාපාර, වෛද්‍ය, නීති, මූල්‍ය වැනි බැරෑරුම් ක්ෂේත්‍රවල LLM සැබවින්ම භාවිතා කිරීමට ඇති වඩාත්ම ඵලදායී හා ප්‍රධාන තාක්ෂණික මාර්ගවලින් එකකි.

AI මාලාවේ සම්මුඛ පරීක්ෂණ 8: RAG යනු කුමක්ද? ඇයි RAG ව්‍යාපෘතියක් කිරීමට සිතුවේ?

RAG යනු කුමක්ද?

ඇයි RAG ව්‍යාපෘතියක් කිරීමට සිතුවේ?

评论

发表评论（匿名）