ഇന്ന് നമ്മളിൽ പലരും നിത്യവും ഉപയോഗിക്കുന്ന ഒന്നാണ് ChatGPT, Gemini തുടങ്ങിയ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) ടൂളുകൾ

ഇന്ന് നമ്മളിൽ പലരും നിത്യവും ഉപയോഗിക്കുന്ന ഒന്നാണ് ChatGPT, Gemini തുടങ്ങിയ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) ടൂളുകൾ.
നമ്മൾ എന്ത് ചോദിച്ചാലും നിമിഷങ്ങൾക്കകം മറുപടി തരാൻ ഇവയ്ക്ക് എങ്ങനെ സാധിക്കുന്നു.?
ഇവ മനുഷ്യരെപ്പോലെ ചിന്തിക്കുകയാണോ ചെയ്യുന്നത്?
യഥാർത്ഥത്തിൽ, AI നമ്മളോട് സംസാരിക്കുന്നതിന് പിന്നിൽ വലിയൊരു “പഠന പ്രക്രിയ” (Training Process) ഉണ്ട്.
വളരെ ലളിതമായി പറഞ്ഞാൽ, ഒരു കൊച്ചു കുട്ടി ഭാഷ പഠിച്ചെടുക്കുന്നതുപോലെയാണ് AI-യും കാര്യങ്ങൾ മനസിലാക്കുന്നത്.
നമ്മൾ ഭാഷയിലെ പാറ്റേണുകൾ പഠിച്ചെടുക്കുന്നതുപോലെ, AI-യും വലിയ അളവിലുള്ള വിവരങ്ങളിൽ നിന്ന് ഭാഷാപാറ്റേണുകൾ പഠിച്ചെടുക്കുന്നു.
ഇത് പ്രധാനമായും 4 ഘട്ടങ്ങളായാണ് നടക്കുന്നത്:
1. ഭീമമായ വിവരശേഖരണം (Data Collection):
ആദ്യം തന്നെ ലോകത്തിലുള്ള കോടിക്കണക്കിന് പുസ്തകങ്ങൾ, ലേഖനങ്ങൾ, വെബ്സൈറ്റുകൾ, വാർത്തകൾ, ഡിജിറ്റൽ ലൈബ്രറികൾ എന്നിവയിൽ നിന്നുള്ള വിവരങ്ങൾ AI-ലേക്ക് നൽകുന്നു.
ഇതിനെ ‘ട്രെയിനിങ് ഡാറ്റ’ (Training Data)എന്ന് വിളിക്കുന്നു. മനുഷ്യൻ തൻ്റെ ജീവിതകാലം മുഴുവൻ വായിച്ചാൽ തീരാത്തത്ര വിവരങ്ങൾ ഈ ഘട്ടത്തിൽ AI-യുടെ സിസ്റ്റത്തിലേക്ക് അപ്ലോഡ് ചെയ്യപ്പെടും.
2. പാറ്റേണുകൾ തിരിച്ചറിയൽ (Pattern Recognition):
ഇത്രയും വിവരങ്ങൾ വായിച്ചുതീർക്കുന്ന AI, വാക്കുകൾ തമ്മിലുള്ള ബന്ധം കണ്ടെത്താൻ ശ്രമിക്കുന്നു. ഉദാഹരണത്തിന്, “ആകാശം…” എന്ന് തുടങ്ങുന്ന ഒരു വാചകത്തിന് ശേഷം വരാൻ സാധ്യതയുള്ള വാക്ക് “നീലയാണ്” അല്ലെങ്കിൽ “മേഘാവൃതമാണ്” എന്നായിരിക്കുമെന്ന് AI അതിൻ്റെ മുൻപരിചയത്തിൽ നിന്ന് മനസ്സിലാക്കുന്നു.
ഇവിടെ AI അർത്ഥം പൂർണ്ണമായി ഉൾക്കൊള്ളുകയല്ല ചെയ്യുന്നത്, പകരം അടുത്തതായി വരാൻ ഏറ്റവും സാധ്യതയുള്ള വാക്ക് ഏതാണെന്ന് പ്രവചിക്കുകയാണ് (Next-token prediction)ചെയ്യുന്നത്.ഒരു സൂപ്പർ ഫാസ്റ്റ് പ്രെഡിക്റ്റീവ് കീബോർഡ് പോലെ..!
3. മനുഷ്യരുടെ മേൽനോട്ടത്തിലുള്ള തിരുത്തലുകൾ (Fine-Tuning):
വെറുതെ ഡാറ്റ മാത്രം നൽകിയാൽ AI ചിലപ്പോൾ തെറ്റായതോ, അനാവശ്യമായതോ ആയ മറുപടികൾ നൽകാം. ഇത് ഒഴിവാക്കാൻ മനുഷ്യരായ വിദഗ്ദ്ധർ AI-ക്ക് പരിശീലനം നൽകുന്നു. ഇതിനെ RLHF (Reinforcement Learning from Human Feedback)എന്ന് വിളിക്കുന്നു.
AI നൽകുന്ന പല മറുപടികളിൽ ഏറ്റവും മികച്ചതും മാന്യവുമായ മറുപടി ഏതാണെന്ന് മനുഷ്യർ റേറ്റിംഗ് നൽകി AI-യെ പഠിപ്പിക്കുന്നു.
തെറ്റുകൾ വരുത്തുമ്പോൾ അതിനെ തിരുത്തുന്നു. ഇതോടെ കൂടുതൽ കൃത്യതയോടെ മറുപടി നൽകാൻ AI പ്രാപ്തമാകുന്നു.
4. സുരക്ഷാ ക്രമീകരണങ്ങൾ (Safety Alignment):
മനുഷ്യർക്ക് ഹാനികരമായ കാര്യങ്ങൾ (ഉദാഹരണത്തിന്: ബോംബ് ഉണ്ടാക്കുന്നത് എങ്ങനെ?, ഒരാളെ എങ്ങനെ ചതിക്കാം?) തുടങ്ങിയ ചോദ്യങ്ങൾ ചോദിച്ചാൽ മറുപടി നൽകാതിരിക്കാനുള്ള പ്രത്യേക സുരക്ഷാ നിയമങ്ങളും (Safety Filters) ഈ ഘട്ടത്തിൽ AI-ൽ പ്രോഗ്രാം ചെയ്ത് ചേർക്കുന്നു.
മനുഷ്യരുടെ തലച്ചോറിൽ കോടിക്കണക്കിന് ന്യൂറോണുകൾ പരസ്പരം ബന്ധിപ്പിച്ചിരിക്കുന്നതുപോലെ, AI-യിലും ‘ആർട്ടിഫിഷ്യൽ ന്യൂറൽ നെറ്റ്വർക്കുകൾ’ എന്നറിയപ്പെടുന്ന ഗണിതശാസ്ത്ര മാതൃകകൾ ഉപയോഗിച്ചാണ് വിവരങ്ങൾ വിശകലനം ചെയ്യുന്നത്.
തങ്ങൾക്ക് ലഭിച്ച കോടിക്കണക്കിന് വിവരങ്ങളിൽ നിന്നും, മനുഷ്യർ നൽകിയ തിരുത്തലുകളിൽ നിന്നും ‘പഠിച്ചാണ്’ ഓരോ AI മോഡലുകളും നിങ്ങളുടെ സ്ക്രീനിലേക്ക് ഉത്തരങ്ങളുമായി എത്തുന്നത്.
ഇവയ്ക്ക് സ്വന്തമായി ബോധമോ വികാരങ്ങളോ ഇല്ല, പകരം മനുഷ്യ ഭാഷയെ ഏറ്റവും മികച്ച രീതിയിൽ അനുകരിക്കാൻ കഴിവുള്ള അതിശക്തമായ ഗണിതശാസ്ത്ര മോഡലുകളാണിവ..!







































































































