AI සම්මුඛ පරීක්ෂණ ප්‍රශ්නය 2: විශාල භාෂා ආකෘතියක් (LLM) මෙවලම් ඇමතුම් විශ්වාසදායක බව සහතික කරන්නේ කෙසේද

විශාල භාෂා ආකෘතියක් (LLM) මෙවලම් ඇමතුම් වලදී විශ්වාසදායක සහ පාලනය කළ හැකි ලෙස ක්‍රියා කරන බව සහතික කරන්නේ කෙසේද, එය ආකෘතිය "ඒත්තු ගැන්වීමට" ඉඟි වචන මත පමණක් රඳා නොසිට. බහු-ස්ථර සීමා රාමුවක් ක්‍රමානුකූලව ලබා දිය යුතුය.

කාලගුණය විමසීමේ උදාහරණයක් ලෙස, මෙවලම් ඇමතුම් වලදී ආකෘතියේ පොදු "මනඃකල්පිත" හැසිරීම් තුනක්:
1. මෙවලම ඇමතීමෙන් තොරව, සෘජුවම ප්‍රබන්ධිත පිළිතුරක් ලබා දීම.
2. මෙවලම ඇමතීමේදී වැරදි ආකෘතියේ පරාමිතීන් සම්ප්‍රේෂණය කිරීම (උදා: මෙවලම "අනිද්දා" සඳහා සහය නොදක්වන නමුත්, date="අනිද්දා" ලෙස පරාමිතිය යැවීම).
3. තමන්ගේ අභිමතය පරිදි පරාමිති ආකෘතිය පරිවර්තනය කිරීම (උදා: මෙවලමට එවැනි අවශ්‍යතාවයක් නොමැති වුවද, "අනිද්දා" නිශ්චිත දිනයකට පරිවර්තනය කිරීම).

ගැටලුවේ මූලය වන්නේ ආකෘතියේ ප්‍රතිදානය සාරාංශයක් ලෙස සම්භාවිතා සහගත වීමයි. ඉඟි වචන යනු සම්භාවිතා ව්‍යාප්තිය මත පනවන ලද "මෘදු සීමාවන්" පමණක් වන අතර, ආකෘතිය දැඩි ලෙස අනුගමනය කරන බලහත්කාර යාන්ත්‍රණයක් නොවේ. සංකීර්ණ අවස්ථා වලදී, මෙම "මෘදු සීමාවන්" පහසුවෙන් අසාර්ථක විය හැක.

මෙම ගැටලුව විසඳීම සඳහා, බහු-ස්ථර ඉංජිනේරු විසඳුමක් අවශ්‍ය වේ:

පළමු ස්ථරය: ඉඟි වචන ප්‍රශස්තිකරණය (මෘදු සීමාවන්)
- මෙය සීමා රාමුවේ ආරම්භක ලක්ෂ්‍යය වන නමුත් අවසානය නොවේ.
- ඉඟි වචන "මෙහෙයුම් ගිවිසුමක්" ලෙස සැලකිය යුතු අතර, මෙවලමේ අරමුණ, එක් එක් පරාමිතියේ වර්ගය, සීමාවන් පැහැදිලිව ප්‍රකාශ කළ යුතු අතර, වලංගු නොවන අගයන් සඳහා උදාහරණ ලැයිස්තුගත කළ යුතුය.
- Few-shot උදාහරණ ඇතුළත් කළ යුතු අතර, "නිවැරදි ආදානය → නිවැරදි ඇමතුම" ආදර්ශනය කරමින්, සන්දර්භ ඉගෙනීම භාවිතා කර ආකෘතියේ හැසිරීම් රටාව නැංගුරම් ලා ගැනීමට උපකාරී වේ.
දෙවන ස්ථරය: JSON Schema හඳුන්වා දීම (තද සීමාවන්)
- මෙය "තර්ක කිරීමේ" සිට "රේල් පීලි සැකසීම" දක්වා තීරණාත්මක පියවරකි.
- ස්වාභාවික භාෂා පරාමිති විස්තර වෙනුවට යන්ත්‍රයට කියවිය හැකි, සත්‍යාපනය කළ හැකි ව්‍යුහගත අර්ථ දැක්වීමක් (JSON Schema) භාවිතා කරන්න. ක්ෂේත්‍ර වර්ගය, අනිවාර්යතාවය, ගණන් කළ අගයන් පරාසය දැඩි ලෙස නිර්වචනය කළ හැකි අතර, additionalProperties: false සැකසීමෙන් ආකෘතියට අර්ථ දක්වා නොමැති කිසිදු ක්ෂේත්‍රයක් ප්‍රතිදානය කිරීම තහනම් කළ හැක.
- ප්‍රධාන ධාරාවේ API වේදිකා ආකෘතියේ විකේතන අවධියේදී මෙම ව්‍යුහගත ප්‍රතිදාන සීමාවන් සඳහා සහය දක්වන අතර, උත්පාදන මූලාශ්‍රයෙන්ම ආකෘති උල්ලංඝනයන් වළක්වයි.
තෙවන ස්ථරය: වලංගුකරණ-අලුත්වැඩියා-නැවත උත්සාහ කිරීමේ චක්‍රය ස්ථාපිත කිරීම (ක්‍රියාත්මක කිරීමේ ආරක්ෂණ ජාලය)
- Schema තිබුණද, ආකෘතියේ ප්‍රතිදානය ලැබීමෙන් පසුව වාක්‍ය ඛණ්ඩ සහ Schema වලංගුකරණය සිදු කළ යුතුය.
- වලංගුකරණය අසාර්ථක වූ විට, ස්වයංක්‍රීය පිරිසිදු කිරීමේ සහ නැවත උත්සාහ කිරීමේ යාන්ත්‍රණයක් (උපරිම සීමාවක් සහිතව) සැලසුම් කළ යුතු අතර, දෝෂ තොරතුරු ආකෘතියට ලබා දී ප්‍රතිදානය නිවැරදි කිරීමට ඉඩ සලසයි. නැවත උත්සාහ කිරීමේ සීමාව ඉක්මවා ගිය විට, පහත හෙලීමේ හෝ අතින් මැදිහත් වීමේ සැලැස්මක් තිබිය යුතුය.
ගෘහ නිර්මාණ මට්ටම: වගකීම් වෙන් කිරීම
- තීරණය සහ ක්‍රියාත්මක කිරීම වෙන් කර, ත්‍රි-ස්ථර ගෘහ නිර්මාණයක් සෑදිය යුතුය:
  - ආකෘති ස්ථරය: තීරණ ගැනීම සඳහා පමණක් වගකිව යුතුය (කුමන මෙවලම ඇමතිය යුතුද, කුමන පරාමිති ජනනය කළ යුතුද යන්න තීරණය කිරීම).
  - රාමු ස්ථරය: ක්‍රියාත්මක කිරීමේ රාමුව සඳහා වගකිව යුතුය, Schema වලංගුකරණය, මෙවලම් ඇමතීම, නැවත උත්සාහ කිරීම් හැසිරවීම සහ ප්‍රතිඵල ඒකාබද්ධ කිරීම ඇතුළුව. මෙය ආකෘතියේ දෝෂ සෘජුවම මෙවලම් ආරක්ෂාවට බලපෑම් කිරීම වළක්වන අතර, මෙවලම් වෙනස්කම් සඳහා නිතර ඉඟි වචන සකස් කිරීමට අවශ්‍ය නොවේ.
  - මෙවලම් ස්ථරය: නිශ්චිත ව්‍යාපාරික හැකියාවන් ක්‍රියාත්මක කිරීම.
- LangChain, LlamaIndex වැනි රාමු මෙම කාර්යය ඉටු කරයි.

වත්මන් විසඳුමේ සීමාවන්: පරාමිති ආකෘතිය පිළිබඳ ගැටළු හොඳින් හැසිරවිය හැකි නමුත්, පරාමිති අර්ථය (උදා: "ෂැංහයි" සහ "හු" සමානත්වය) පිළිබඳ වලංගුකරණ ආවරණය තවමත් ප්‍රමාණවත් නොවේ. මෙය අනාගතයේදී මුහුණ දීමට සිදුවන ඉංජිනේරු අභියෝගයක් වනු ඇත.

මූලික නිගමනය: LLM විශ්වාසදායක ලෙස මෙවලම් ඇමතීමට සැලැස්වීම, සාරාංශයක් ලෙස මෘදුකාංග ඉංජිනේරු ගැටලුවක් වන අතර, ඉඟි වචන ප්‍රශස්තිකරණය මත පමණක් රඳා නොසිට, මෘදු සීමාවන්, තද සීමාවන්, ක්‍රියාත්මක කිරීමේ ආරක්ෂණ ජාලය සහ ගෘහ නිර්මාණ සැලසුම් ඇතුළු ක්‍රමානුකූල ඉංජිනේරු විසඳුමක් අවශ්‍ය වේ.

AI සම්මුඛ පරීක්ෂණ ප්‍රශ්නය 2: විශාල භාෂා ආකෘතියක් (LLM) මෙවලම් ඇමතුම් විශ්වාසදායක බව සහතික කරන්නේ කෙසේද

AI සම්මුඛ පරීක්ෂණ ප්‍රශ්නය 2: විශාල භාෂා ආකෘතියක් (LLM) මෙවලම් ඇමතුම් විශ්වාසදායක බව සහතික කරන්නේ කෙසේද

评论

发表评论（匿名）