ML இல் சிக்கலை வரையறுப்பதற்கான பொதுவான வழிமுறை என்ன?

by Wojciech Cieslisnki / வியாழன், 24 ஆகஸ்ட் 2023 / வெளியிடப்பட்ட செயற்கை நுண்ணறிவு, EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல், அறிமுகம், இயந்திர கற்றல் என்றால் என்ன

இயந்திரக் கற்றலில் (ML) ஒரு சிக்கலை வரையறுப்பது, ML நுட்பங்களைப் பயன்படுத்தி தீர்க்கப்படக்கூடிய வகையில் கையில் உள்ள பணியை உருவாக்குவதற்கான ஒரு முறையான அணுகுமுறையை உள்ளடக்கியது. தரவு சேகரிப்பு முதல் மாதிரி பயிற்சி மற்றும் மதிப்பீடு வரை முழு ML பைப்லைனுக்கும் அடித்தளம் அமைப்பதால் இந்த செயல்முறை முக்கியமானது. இந்த பதிலில், ML இல் உள்ள சிக்கலை வரையறுப்பதற்கான வழிமுறை படிகளை கோடிட்டுக் காட்டுவோம், விரிவான மற்றும் விரிவான விளக்கத்தை வழங்குவோம்.

1. குறிக்கோளை அடையாளம் காணவும்:
முதல் படி ML பிரச்சனையின் நோக்கத்தை தெளிவாக வரையறுப்பதாகும். ML மாதிரி வழங்க வேண்டிய விரும்பிய முடிவை அல்லது கணிப்பைப் புரிந்துகொள்வது இதில் அடங்கும். எடுத்துக்காட்டாக, ஸ்பேம் மின்னஞ்சல் வகைப்படுத்தல் பணியில், மின்னஞ்சல்களை ஸ்பேம் அல்லது ஸ்பேம் அல்லாதவை என துல்லியமாக வகைப்படுத்துவதே குறிக்கோள்.

2. சிக்கலை உருவாக்கவும்:
குறிக்கோள் அடையாளம் காணப்பட்டவுடன், சிக்கலை உருவாக்க வேண்டும். ML சிக்கலின் வகையைத் தீர்மானிப்பது இதில் அடங்கும், இது பின்வரும் வகைகளில் ஒன்றில் அடங்கும்:

அ. மேற்பார்வையிடப்பட்ட கற்றல்: லேபிளிடப்பட்ட தரவு இருந்தால், சிக்கலை மேற்பார்வையிடப்பட்ட கற்றல் பணியாக வடிவமைக்க முடியும். பயிற்சி தரவுத்தொகுப்பின் அடிப்படையில் உள்ளீட்டு மாறிகளின் தொகுப்பிலிருந்து வெளியீட்டு மாறியைக் கணிப்பது இதில் அடங்கும். உதாரணமாக, இருப்பிடம், அளவு மற்றும் அறைகளின் எண்ணிக்கை போன்ற அம்சங்களின் அடிப்படையில் வீட்டு விலைகளை கணித்தல்.

பி. மேற்பார்வை செய்யப்படாத கற்றல்: லேபிளிடப்படாத தரவு மட்டுமே இருந்தால், சிக்கலை மேற்பார்வை செய்யப்படாத கற்றல் பணியாக உருவாக்கலாம். முன் வரையறுக்கப்பட்ட வெளியீட்டு மாறிகள் இல்லாமல் தரவுக்குள் வடிவங்கள் அல்லது கட்டமைப்புகளைக் கண்டறிவதே இங்கு குறிக்கோளாகும். K-means போன்ற கிளஸ்டரிங் அல்காரிதம்கள், ஒரே மாதிரியான தரவுப் புள்ளிகளை ஒன்றாகக் குழுவாக்கப் பயன்படும்.

c. வலுவூட்டல் கற்றல்: வலுவூட்டல் கற்றலில், ஒரு முகவர் வெகுமதி சமிக்ஞையை அதிகரிக்க சூழலுடன் தொடர்பு கொள்ள கற்றுக்கொள்கிறார். சிக்கல் ஒரு மார்கோவ் முடிவு செயல்முறையாக (MDP) வடிவமைக்கப்பட்டுள்ளது, அங்கு முகவர் தற்போதைய நிலையின் அடிப்படையில் நடவடிக்கைகளை எடுத்து வெகுமதிகள் வடிவில் கருத்துக்களைப் பெறுகிறார். கேம்களை விளையாடுவதற்கு அல்லது ரோபோக்களைக் கட்டுப்படுத்துவதற்கு ஏஜெண்டுக்கு பயிற்சியளிக்கும் எடுத்துக்காட்டுகள் அடங்கும்.

3. உள்ளீடு மற்றும் வெளியீட்டை வரையறுக்கவும்:
அடுத்து, ML பிரச்சனைக்கான உள்ளீடு மற்றும் வெளியீடு மாறிகளை வரையறுப்பது முக்கியம். ML மாதிரியின் உள்ளீடுகளாகப் பயன்படுத்தப்படும் அம்சங்கள் அல்லது பண்புக்கூறுகள் மற்றும் மாதிரி கணிக்க வேண்டிய இலக்கு மாறி ஆகியவற்றைக் குறிப்பிடுவது இதில் அடங்கும். எடுத்துக்காட்டாக, ஒரு உணர்வு பகுப்பாய்வு பணியில், உள்ளீடு ஒரு உரை ஆவணமாக இருக்கலாம், அதே சமயம் வெளியீடு உணர்வு லேபிளாக (நேர்மறை, எதிர்மறை அல்லது நடுநிலை) இருக்கும்.

4. தரவைச் சேகரித்து முன் செயலாக்கம்:
ML இல் தரவு ஒரு முக்கிய பங்கு வகிக்கிறது, மேலும் கையில் உள்ள பிரச்சனைக்கு பொருத்தமான தரவுத்தொகுப்பை சேகரிப்பது அவசியம். இந்த மாதிரி வரிசைப்படுத்தப்படும் நிஜ உலக சூழ்நிலையைப் பிரதிபலிக்கும் தொடர்புடைய தரவைச் சேகரிப்பதை இது உள்ளடக்குகிறது. தரவு வேறுபட்டதாகவும், பிரதிநிதித்துவமாகவும் மற்றும் சாத்தியமான உள்ளீடுகள் மற்றும் வெளியீடுகளின் பரந்த அளவிலான உள்ளடக்கத்தை உள்ளடக்கியதாக இருக்க வேண்டும்.

தரவு சேகரிக்கப்பட்டதும், ML அல்காரிதம்களுக்கு பொருத்தமான வடிவமைப்பில் தரவை சுத்தம் செய்து மாற்றுவதற்கு முன்செயலாக்கப் படிகளைச் செய்ய வேண்டும். நகல்களை அகற்றுதல், விடுபட்ட மதிப்புகளைக் கையாளுதல், அம்சங்களை இயல்பாக்குதல் மற்றும் வகைப்படுத்தப்பட்ட மாறிகளை குறியாக்கம் செய்தல் ஆகியவை இதில் அடங்கும்.

5. தரவுத்தொகுப்பைப் பிரிக்கவும்:
ML மாதிரியின் செயல்திறனை மதிப்பிடுவதற்கு, தரவுத்தொகுப்பை பயிற்சி, சரிபார்ப்பு மற்றும் சோதனைத் தொகுப்புகளாகப் பிரிக்க வேண்டியது அவசியம். பயிற்சித் தொகுப்பு மாதிரியைப் பயிற்றுவிக்கப் பயன்படுகிறது, சரிபார்ப்புத் தொகுப்பு ஹைப்பர் பாராமீட்டர்களை மாற்றியமைக்க மற்றும் வெவ்வேறு மாதிரிகளை மதிப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது, மேலும் தேர்ந்தெடுக்கப்பட்ட மாதிரியின் இறுதி செயல்திறனை மதிப்பிடுவதற்கு சோதனைத் தொகுப்பு பயன்படுத்தப்படுகிறது. ஒவ்வொரு தொகுப்பிலும் பிரதிநிதி மாதிரிகளை உறுதிப்படுத்த தரவுப் பிரிப்பு கவனமாக செய்யப்பட வேண்டும்.

6. ஒரு ML அல்காரிதத்தைத் தேர்ந்தெடுக்கவும்:
சிக்கல் உருவாக்கம் மற்றும் தரவு வகையின் அடிப்படையில், பொருத்தமான ML அல்காரிதம் தேர்ந்தெடுக்கப்பட வேண்டும். முடிவு மரங்கள், ஆதரவு திசையன் இயந்திரங்கள், நரம்பியல் நெட்வொர்க்குகள் மற்றும் குழும முறைகள் போன்ற பல்வேறு வழிமுறைகள் உள்ளன. அல்காரிதத்தின் தேர்வு சிக்கலின் சிக்கலான தன்மை, கிடைக்கக்கூடிய கணக்கீட்டு வளங்கள் மற்றும் விளக்கத் தேவைகள் போன்ற காரணிகளைப் பொறுத்தது.

7. மாதிரியைப் பயிற்றுவித்து மதிப்பீடு செய்யுங்கள்:
அல்காரிதம் தேர்ந்தெடுக்கப்பட்டதும், பயிற்சி தரவுத்தொகுப்பைப் பயன்படுத்தி மாதிரி பயிற்சியளிக்கப்பட வேண்டும். பயிற்சியின் போது, மாதிரியானது தரவுகளில் உள்ள அடிப்படை வடிவங்களையும் உறவுகளையும் கற்றுக்கொள்கிறது. பயிற்சிக்குப் பிறகு, மாதிரி அதன் செயல்திறனை மதிப்பிடுவதற்கு சரிபார்ப்பு தொகுப்பைப் பயன்படுத்தி மதிப்பீடு செய்யப்படுகிறது. மாடலின் செயல்திறனை அளவிட துல்லியம், துல்லியம், நினைவுபடுத்துதல் மற்றும் F1-ஸ்கோர் போன்ற அளவீடுகள் பயன்படுத்தப்படலாம்.

8. ஃபைன் டியூன் மற்றும் ஆப்டிமைஸ்:
செயல்திறன் மதிப்பீட்டின் அடிப்படையில், மாடலை நன்றாகச் சரிசெய்து மேம்படுத்த வேண்டும். இது மாதிரியின் செயல்திறனை மேம்படுத்த கற்றல் வீதம், ஒழுங்குபடுத்துதல் அல்லது பிணைய கட்டமைப்பு போன்ற உயர் அளவுருக்களை சரிசெய்வதை உள்ளடக்குகிறது. குறுக்கு சரிபார்ப்பு மற்றும் கட்டம் தேடல் போன்ற நுட்பங்கள் உகந்த உயர் அளவுகோல்களைக் கண்டறிய பயன்படுத்தப்படலாம்.

9. சோதனை மற்றும் வரிசைப்படுத்துதல்:
மாதிரி நன்றாகச் சரி செய்யப்பட்டு, மேம்படுத்தப்பட்டவுடன், இறுதி செயல்திறன் மதிப்பீட்டைப் பெற, சோதனை தரவுத்தொகுப்பைப் பயன்படுத்தி அதைச் சோதிக்க வேண்டும். மாடல் விரும்பிய செயல்திறன் அளவுகோல்களை பூர்த்தி செய்தால், புதிய, பார்க்காத தரவுகளில் கணிப்புகளை உருவாக்க உற்பத்தி சூழலில் அதை பயன்படுத்த முடியும். மாடலின் தொடர்ச்சியான செயல்திறனை உறுதிப்படுத்த அவ்வப்போது கண்காணிப்பு மற்றும் புதுப்பித்தல் அவசியமாக இருக்கலாம்.

ML இல் ஒரு சிக்கலை வரையறுப்பது, குறிக்கோளைக் கண்டறிதல், சிக்கலை உருவாக்குதல், உள்ளீடு மற்றும் வெளியீட்டை வரையறுத்தல், தரவைச் சேகரித்தல் மற்றும் முன்கூட்டியே செயலாக்குதல், தரவுத்தொகுப்பைப் பிரித்தல், ஒரு ML வழிமுறையைத் தேர்ந்தெடுப்பது, பயிற்சி மற்றும் மாதிரியை மதிப்பீடு செய்தல், நன்றாகச் சரிசெய்தல் மற்றும் மேம்படுத்துதல், இறுதியாக மாதிரியை சோதனை செய்தல் மற்றும் வரிசைப்படுத்துதல்.

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:

EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க

மேலும் கேள்விகள் மற்றும் பதில்கள்:

குறித்துள்ளார்: செயற்கை நுண்ணறிவு, எந்திர கற்றல், பிரச்சனை வரையறை, வலுவூட்டல் கற்றல், மேற்பார்வை கற்றல், மேற்பார்வை செய்யப்படாத கற்றல்

EITCA அகாடமி

ML இல் சிக்கலை வரையறுப்பதற்கான பொதுவான வழிமுறை என்ன?

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:

மேலும் கேள்விகள் மற்றும் பதில்கள்:

EITCA அகாடமி என்பது ஐரோப்பிய தகவல் தொழில்நுட்ப சான்றிதழ் கட்டமைப்பின் ஒரு பகுதியாகும்

EITCA அகாடமியின் தகுதி 80% EITCI DSJC மானிய ஆதரவு

EITCA அகாடமி

உங்கள் பயனர்பெயர் அல்லது மின்னஞ்சல் முகவரி மூலம் உங்கள் கணக்கிற்கு உள்நுழைக

உங்கள் விவரங்களைத் மறந்துவிட்டதா?

ஒரு கணக்கை உருவாக்க

ML இல் சிக்கலை வரையறுப்பதற்கான பொதுவான வழிமுறை என்ன?

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:

மேலும் கேள்விகள் மற்றும் பதில்கள்:

EITCA அகாடமியின் தகுதி 80% EITCI DSJC மானிய ஆதரவு