இயந்திரக் கற்றலில் (ML) ஒரு சிக்கலை வரையறுப்பது, ML நுட்பங்களைப் பயன்படுத்தி தீர்க்கப்படக்கூடிய வகையில் கையில் உள்ள பணியை உருவாக்குவதற்கான ஒரு முறையான அணுகுமுறையை உள்ளடக்கியது. தரவு சேகரிப்பு முதல் மாதிரி பயிற்சி மற்றும் மதிப்பீடு வரை முழு ML பைப்லைனுக்கும் அடித்தளம் அமைப்பதால் இந்த செயல்முறை முக்கியமானது. இந்த பதிலில், ML இல் உள்ள சிக்கலை வரையறுப்பதற்கான வழிமுறை படிகளை கோடிட்டுக் காட்டுவோம், விரிவான மற்றும் விரிவான விளக்கத்தை வழங்குவோம்.
1. குறிக்கோளை அடையாளம் காணவும்:
முதல் படி ML பிரச்சனையின் நோக்கத்தை தெளிவாக வரையறுப்பதாகும். ML மாதிரி வழங்க வேண்டிய விரும்பிய முடிவை அல்லது கணிப்பைப் புரிந்துகொள்வது இதில் அடங்கும். எடுத்துக்காட்டாக, ஸ்பேம் மின்னஞ்சல் வகைப்படுத்தல் பணியில், மின்னஞ்சல்களை ஸ்பேம் அல்லது ஸ்பேம் அல்லாதவை என துல்லியமாக வகைப்படுத்துவதே குறிக்கோள்.
2. சிக்கலை உருவாக்கவும்:
குறிக்கோள் அடையாளம் காணப்பட்டவுடன், சிக்கலை உருவாக்க வேண்டும். ML சிக்கலின் வகையைத் தீர்மானிப்பது இதில் அடங்கும், இது பின்வரும் வகைகளில் ஒன்றில் அடங்கும்:
அ. மேற்பார்வையிடப்பட்ட கற்றல்: லேபிளிடப்பட்ட தரவு இருந்தால், சிக்கலை மேற்பார்வையிடப்பட்ட கற்றல் பணியாக வடிவமைக்க முடியும். பயிற்சி தரவுத்தொகுப்பின் அடிப்படையில் உள்ளீட்டு மாறிகளின் தொகுப்பிலிருந்து வெளியீட்டு மாறியைக் கணிப்பது இதில் அடங்கும். உதாரணமாக, இருப்பிடம், அளவு மற்றும் அறைகளின் எண்ணிக்கை போன்ற அம்சங்களின் அடிப்படையில் வீட்டு விலைகளை கணித்தல்.
பி. மேற்பார்வை செய்யப்படாத கற்றல்: லேபிளிடப்படாத தரவு மட்டுமே இருந்தால், சிக்கலை மேற்பார்வை செய்யப்படாத கற்றல் பணியாக உருவாக்கலாம். முன் வரையறுக்கப்பட்ட வெளியீட்டு மாறிகள் இல்லாமல் தரவுக்குள் வடிவங்கள் அல்லது கட்டமைப்புகளைக் கண்டறிவதே இங்கு குறிக்கோளாகும். K-means போன்ற கிளஸ்டரிங் அல்காரிதம்கள், ஒரே மாதிரியான தரவுப் புள்ளிகளை ஒன்றாகக் குழுவாக்கப் பயன்படும்.
c. வலுவூட்டல் கற்றல்: வலுவூட்டல் கற்றலில், ஒரு முகவர் வெகுமதி சமிக்ஞையை அதிகரிக்க சூழலுடன் தொடர்பு கொள்ள கற்றுக்கொள்கிறார். சிக்கல் ஒரு மார்கோவ் முடிவு செயல்முறையாக (MDP) வடிவமைக்கப்பட்டுள்ளது, அங்கு முகவர் தற்போதைய நிலையின் அடிப்படையில் நடவடிக்கைகளை எடுத்து வெகுமதிகள் வடிவில் கருத்துக்களைப் பெறுகிறார். கேம்களை விளையாடுவதற்கு அல்லது ரோபோக்களைக் கட்டுப்படுத்துவதற்கு ஏஜெண்டுக்கு பயிற்சியளிக்கும் எடுத்துக்காட்டுகள் அடங்கும்.
3. உள்ளீடு மற்றும் வெளியீட்டை வரையறுக்கவும்:
அடுத்து, ML பிரச்சனைக்கான உள்ளீடு மற்றும் வெளியீடு மாறிகளை வரையறுப்பது முக்கியம். ML மாதிரியின் உள்ளீடுகளாகப் பயன்படுத்தப்படும் அம்சங்கள் அல்லது பண்புக்கூறுகள் மற்றும் மாதிரி கணிக்க வேண்டிய இலக்கு மாறி ஆகியவற்றைக் குறிப்பிடுவது இதில் அடங்கும். எடுத்துக்காட்டாக, ஒரு உணர்வு பகுப்பாய்வு பணியில், உள்ளீடு ஒரு உரை ஆவணமாக இருக்கலாம், அதே சமயம் வெளியீடு உணர்வு லேபிளாக (நேர்மறை, எதிர்மறை அல்லது நடுநிலை) இருக்கும்.
4. தரவைச் சேகரித்து முன் செயலாக்கம்:
ML இல் தரவு ஒரு முக்கிய பங்கு வகிக்கிறது, மேலும் கையில் உள்ள பிரச்சனைக்கு பொருத்தமான தரவுத்தொகுப்பை சேகரிப்பது அவசியம். இந்த மாதிரி வரிசைப்படுத்தப்படும் நிஜ உலக சூழ்நிலையைப் பிரதிபலிக்கும் தொடர்புடைய தரவைச் சேகரிப்பதை இது உள்ளடக்குகிறது. தரவு வேறுபட்டதாகவும், பிரதிநிதித்துவமாகவும் மற்றும் சாத்தியமான உள்ளீடுகள் மற்றும் வெளியீடுகளின் பரந்த அளவிலான உள்ளடக்கத்தை உள்ளடக்கியதாக இருக்க வேண்டும்.
தரவு சேகரிக்கப்பட்டதும், ML அல்காரிதம்களுக்கு பொருத்தமான வடிவமைப்பில் தரவை சுத்தம் செய்து மாற்றுவதற்கு முன்செயலாக்கப் படிகளைச் செய்ய வேண்டும். நகல்களை அகற்றுதல், விடுபட்ட மதிப்புகளைக் கையாளுதல், அம்சங்களை இயல்பாக்குதல் மற்றும் வகைப்படுத்தப்பட்ட மாறிகளை குறியாக்கம் செய்தல் ஆகியவை இதில் அடங்கும்.
5. தரவுத்தொகுப்பைப் பிரிக்கவும்:
ML மாதிரியின் செயல்திறனை மதிப்பிடுவதற்கு, தரவுத்தொகுப்பை பயிற்சி, சரிபார்ப்பு மற்றும் சோதனைத் தொகுப்புகளாகப் பிரிக்க வேண்டியது அவசியம். பயிற்சித் தொகுப்பு மாதிரியைப் பயிற்றுவிக்கப் பயன்படுகிறது, சரிபார்ப்புத் தொகுப்பு ஹைப்பர் பாராமீட்டர்களை மாற்றியமைக்க மற்றும் வெவ்வேறு மாதிரிகளை மதிப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது, மேலும் தேர்ந்தெடுக்கப்பட்ட மாதிரியின் இறுதி செயல்திறனை மதிப்பிடுவதற்கு சோதனைத் தொகுப்பு பயன்படுத்தப்படுகிறது. ஒவ்வொரு தொகுப்பிலும் பிரதிநிதி மாதிரிகளை உறுதிப்படுத்த தரவுப் பிரிப்பு கவனமாக செய்யப்பட வேண்டும்.
6. ஒரு ML அல்காரிதத்தைத் தேர்ந்தெடுக்கவும்:
சிக்கல் உருவாக்கம் மற்றும் தரவு வகையின் அடிப்படையில், பொருத்தமான ML அல்காரிதம் தேர்ந்தெடுக்கப்பட வேண்டும். முடிவு மரங்கள், ஆதரவு திசையன் இயந்திரங்கள், நரம்பியல் நெட்வொர்க்குகள் மற்றும் குழும முறைகள் போன்ற பல்வேறு வழிமுறைகள் உள்ளன. அல்காரிதத்தின் தேர்வு சிக்கலின் சிக்கலான தன்மை, கிடைக்கக்கூடிய கணக்கீட்டு வளங்கள் மற்றும் விளக்கத் தேவைகள் போன்ற காரணிகளைப் பொறுத்தது.
7. மாதிரியைப் பயிற்றுவித்து மதிப்பீடு செய்யுங்கள்:
அல்காரிதம் தேர்ந்தெடுக்கப்பட்டதும், பயிற்சி தரவுத்தொகுப்பைப் பயன்படுத்தி மாதிரி பயிற்சியளிக்கப்பட வேண்டும். பயிற்சியின் போது, மாதிரியானது தரவுகளில் உள்ள அடிப்படை வடிவங்களையும் உறவுகளையும் கற்றுக்கொள்கிறது. பயிற்சிக்குப் பிறகு, மாதிரி அதன் செயல்திறனை மதிப்பிடுவதற்கு சரிபார்ப்பு தொகுப்பைப் பயன்படுத்தி மதிப்பீடு செய்யப்படுகிறது. மாடலின் செயல்திறனை அளவிட துல்லியம், துல்லியம், நினைவுபடுத்துதல் மற்றும் F1-ஸ்கோர் போன்ற அளவீடுகள் பயன்படுத்தப்படலாம்.
8. ஃபைன் டியூன் மற்றும் ஆப்டிமைஸ்:
செயல்திறன் மதிப்பீட்டின் அடிப்படையில், மாடலை நன்றாகச் சரிசெய்து மேம்படுத்த வேண்டும். இது மாதிரியின் செயல்திறனை மேம்படுத்த கற்றல் வீதம், ஒழுங்குபடுத்துதல் அல்லது பிணைய கட்டமைப்பு போன்ற உயர் அளவுருக்களை சரிசெய்வதை உள்ளடக்குகிறது. குறுக்கு சரிபார்ப்பு மற்றும் கட்டம் தேடல் போன்ற நுட்பங்கள் உகந்த உயர் அளவுகோல்களைக் கண்டறிய பயன்படுத்தப்படலாம்.
9. சோதனை மற்றும் வரிசைப்படுத்துதல்:
மாதிரி நன்றாகச் சரி செய்யப்பட்டு, மேம்படுத்தப்பட்டவுடன், இறுதி செயல்திறன் மதிப்பீட்டைப் பெற, சோதனை தரவுத்தொகுப்பைப் பயன்படுத்தி அதைச் சோதிக்க வேண்டும். மாடல் விரும்பிய செயல்திறன் அளவுகோல்களை பூர்த்தி செய்தால், புதிய, பார்க்காத தரவுகளில் கணிப்புகளை உருவாக்க உற்பத்தி சூழலில் அதை பயன்படுத்த முடியும். மாடலின் தொடர்ச்சியான செயல்திறனை உறுதிப்படுத்த அவ்வப்போது கண்காணிப்பு மற்றும் புதுப்பித்தல் அவசியமாக இருக்கலாம்.
ML இல் ஒரு சிக்கலை வரையறுப்பது, குறிக்கோளைக் கண்டறிதல், சிக்கலை உருவாக்குதல், உள்ளீடு மற்றும் வெளியீட்டை வரையறுத்தல், தரவைச் சேகரித்தல் மற்றும் முன்கூட்டியே செயலாக்குதல், தரவுத்தொகுப்பைப் பிரித்தல், ஒரு ML வழிமுறையைத் தேர்ந்தெடுப்பது, பயிற்சி மற்றும் மாதிரியை மதிப்பீடு செய்தல், நன்றாகச் சரிசெய்தல் மற்றும் மேம்படுத்துதல், இறுதியாக மாதிரியை சோதனை செய்தல் மற்றும் வரிசைப்படுத்துதல்.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- டெக்ஸ்ட் டு ஸ்பீச் (TTS) என்றால் என்ன, அது AI உடன் எவ்வாறு செயல்படுகிறது?
- இயந்திர கற்றலில் பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரிவதில் உள்ள வரம்புகள் என்ன?
- இயந்திர கற்றல் சில உரையாடல் உதவிகளை செய்ய முடியுமா?
- டென்சர்ஃப்ளோ விளையாட்டு மைதானம் என்றால் என்ன?
- பெரிய தரவுத்தொகுப்பு உண்மையில் என்ன அர்த்தம்?
- அல்காரிதத்தின் ஹைபர்பாராமீட்டர்களின் சில எடுத்துக்காட்டுகள் யாவை?
- இசையமைத்தல் கற்றல் என்றால் என்ன?
- தேர்ந்தெடுக்கப்பட்ட இயந்திர கற்றல் அல்காரிதம் பொருத்தமானதாக இல்லாவிட்டால் என்ன செய்வது மற்றும் சரியானதைத் தேர்ந்தெடுப்பதை எவ்வாறு உறுதிப்படுத்துவது?
- ஒரு இயந்திர கற்றல் மாதிரி அதன் பயிற்சியின் போது மேற்பார்வை தேவையா?
- நியூரல் நெட்வொர்க் அடிப்படையிலான அல்காரிதம்களில் பயன்படுத்தப்படும் முக்கிய அளவுருக்கள் யாவை?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க