இயந்திரக் கற்றலின் சூழலில் ஒழுங்குபடுத்துதல் என்பது மாதிரிகளின் பொதுமைப்படுத்தல் செயல்திறனை மேம்படுத்துவதற்குப் பயன்படுத்தப்படும் ஒரு முக்கியமான நுட்பமாகும், குறிப்பாக உயர் பரிமாண தரவு அல்லது சிக்கலான மாதிரிகளைக் கையாளும் போது. ஒரு மாதிரியானது பயிற்சித் தரவில் உள்ள அடிப்படை வடிவங்களை மட்டுமல்ல, சத்தத்தையும் கற்றுக் கொள்ளும்போது அதிகப்படியான பொருத்தம் ஏற்படுகிறது, இதன் விளைவாக காணப்படாத தரவுகளில் மோசமான செயல்திறன் ஏற்படுகிறது. அதிகப்படியான சிக்கலான மாதிரிகளை அபராதம் விதிப்பதன் மூலம் அதிகப்படியான பொருத்தத்தைத் தடுக்க, ஒரு மாதிரிக்கு கூடுதல் தகவல் அல்லது கட்டுப்பாடுகளை ஒழுங்குபடுத்துதல் அறிமுகப்படுத்துகிறது.
முறைப்படுத்துதலின் பின்னணியில் உள்ள அடிப்படை யோசனை, மாடல் குறைக்க முயற்சிக்கும் இழப்புச் செயல்பாட்டில் ஒரு அபராத காலத்தை இணைப்பதாகும். இந்த பெனால்டி காலமானது, பயிற்சித் தரவில் இரைச்சலைப் பொருத்துவதில் இருந்து மாடலை ஊக்கப்படுத்துகிறது, இது சிக்கலின் மீது ஒரு செலவைச் சுமத்துகிறது, இது பொதுவாக மாதிரி அளவுருக்களின் அளவைக் கொண்டு அளவிடப்படுகிறது. அவ்வாறு செய்வதன் மூலம், பயிற்சித் தரவை நன்றாகப் பொருத்துவதற்கும் புதிய தரவுகளைப் பொதுமைப்படுத்துவதற்கான மாதிரியின் திறனைப் பராமரிப்பதற்கும் இடையே சமநிலையை அடைவதற்கு ஒழுங்குபடுத்துதல் உதவுகிறது.
இயந்திரக் கற்றலில் பொதுவாகப் பயன்படுத்தப்படும் பல வகையான முறைப்படுத்தல் நுட்பங்கள் உள்ளன, அவற்றில் மிகவும் பொதுவானவை எல்1 முறைப்படுத்தல், எல்2 முறைப்படுத்தல் மற்றும் கைவிடுதல். இந்த நுட்பங்கள் ஒவ்வொன்றும் அதன் சொந்த பண்புகள் மற்றும் பயன்பாடுகளைக் கொண்டுள்ளன.
1. எல்1 ஒழுங்குபடுத்துதல் (லாஸ்ஸோ பின்னடைவு): L1 முறைப்படுத்தல் இழப்பு செயல்பாட்டிற்கு குணகங்களின் அளவின் முழுமையான மதிப்புக்கு சமமான அபராதத்தை சேர்க்கிறது. கணித ரீதியாக, இதை இவ்வாறு குறிப்பிடலாம்:
எங்கே அசல் இழப்பு செயல்பாடு,
முறைப்படுத்தல் அளவுரு, மற்றும்
மாதிரி அளவுருக்கள். L1 முறைப்படுத்தலின் விளைவு என்னவென்றால், அது அரிதான மாதிரிகளை உருவாக்க முனைகிறது, அதாவது சில குணகங்களை பூஜ்ஜியத்திற்கு இயக்குகிறது, மேலும் அம்சத் தேர்வை திறம்படச் செய்கிறது. பல அம்சங்கள் பொருத்தமற்றதாக இருக்கும் உயர் பரிமாணத் தரவைக் கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும்.
2. எல்2 ஒழுங்குபடுத்துதல் (ரிட்ஜ் ரிக்ரஷன்): L2 முறைப்படுத்தல் இழப்பு செயல்பாட்டிற்கு குணகங்களின் அளவின் சதுரத்திற்கு சமமான அபராதத்தை சேர்க்கிறது. இது கணித ரீதியாக வெளிப்படுத்தப்படுகிறது:
L2 முறைப்படுத்தல் பெரிய குணகங்களை அவற்றின் வர்க்க மதிப்புகளைத் தண்டிப்பதன் மூலம் ஊக்கப்படுத்துகிறது, இது எடைகளின் சமமாக விநியோகிக்கப்படுவதற்கு வழிவகுக்கிறது. L1 போலல்லாமல், L2 முறைப்படுத்தல் அரிதான மாதிரிகளை உருவாக்காது, ஏனெனில் இது குணகங்களை சரியாக பூஜ்ஜியமாக இருக்க கட்டாயப்படுத்தாது, மாறாக அவற்றை சிறியதாக வைத்திருக்கிறது. அனைத்து அம்சங்களும் சில பொருத்தங்களைக் கொண்டிருக்கும் போது, அதிகப்படியான பொருத்தத்தைத் தவிர்ப்பதற்கு இது மிகவும் பயனுள்ளதாக இருக்கும்.
3. மீள் நிகர ஒழுங்குபடுத்தல்: எலாஸ்டிக் நெட் எல்1 மற்றும் எல்2 ரெகுலரைசேஷன் இரண்டையும் ஒருங்கிணைக்கிறது. பல தொடர்புள்ள அம்சங்கள் இருக்கும் சூழ்நிலைகளில் இது மிகவும் பயனுள்ளதாக இருக்கும். எலாஸ்டிக் நெட் பெனால்டி என்பது எல்1 மற்றும் எல்2 பெனால்டிகளின் நேரியல் கலவையாகும்:
அளவுருக்களை சரிசெய்வதன் மூலம் மற்றும்
, எலாஸ்டிக் நெட் எல்1 மற்றும் எல்2 ரெகுலரைசேஷன் ஆகிய இரண்டின் பலன்களையும் சமப்படுத்தலாம்.
4. கைவிடுதல்: டிராப்அவுட் என்பது நரம்பியல் நெட்வொர்க்குகளுக்காக வடிவமைக்கப்பட்ட ஒரு முறைப்படுத்தல் நுட்பமாகும். பயிற்சியின் போது, கைவிடுதல் தோராயமாக ஒவ்வொரு மறு செய்கையிலும் ஒரு அடுக்கில் உள்ள முனைகளின் (நியூரான்கள்) ஒரு பகுதியை பூஜ்ஜியமாக அமைக்கிறது. இது பிணையத்தை எந்த ஒரு முனையிலும் அதிகமாக நம்பியிருப்பதைத் தடுக்கிறது மேலும் மேலும் வலுவான அம்சங்களை அறிய நெட்வொர்க்கை ஊக்குவிக்கிறது. அதிக எண்ணிக்கையிலான அளவுருக்கள் காரணமாக அதிகப்படியான பொருத்தம் ஒரு பொதுவான பிரச்சினையாக இருக்கும் ஆழமான கற்றல் மாதிரிகளில் டிராப்அவுட் மிகவும் பயனுள்ளதாக இருக்கும்.
5. முன்கூட்டியே நிறுத்துதல்: பாரம்பரிய அர்த்தத்தில் முறைப்படுத்தல் நுட்பம் இல்லையென்றாலும், சரிபார்ப்புத் தொகுப்பில் செயல்திறன் குறையத் தொடங்கியவுடன், பயிற்சி செயல்முறையை நிறுத்துவதன் மூலம் அதிகப் பொருத்தத்தைத் தடுப்பதற்கான ஒரு உத்தி ஆரம்பகால நிறுத்தமாகும். மாடல் தொடர்ந்து புதுப்பிக்கப்படும் சாய்வு வம்சாவளி போன்ற மறுசெயல் முறைகளில் இது மிகவும் பயனுள்ளதாக இருக்கும்.
இயந்திரக் கற்றலில் முறைப்படுத்தல் இன்றியமையாதது, ஏனெனில் இது மாதிரிகள் அவற்றின் சிக்கலைக் கட்டுப்படுத்துவதன் மூலம் காணப்படாத தரவுகளில் சிறப்பாகச் செயல்பட அனுமதிக்கிறது. ஒழுங்குபடுத்தும் நுட்பத்தின் தேர்வு மற்றும் அதன் அளவுருக்களை சரிசெய்தல் ( L1 மற்றும் L2 க்கு, இடைநிற்றலுக்கான இடைநிற்றல் விகிதம்) முக்கியமானது மற்றும் உகந்த முடிவுகளை அடைய பெரும்பாலும் பரிசோதனை மற்றும் குறுக்கு சரிபார்ப்பு தேவைப்படுகிறது.
எடுத்துக்காட்டாக, பல அம்சங்களைக் கொண்ட தரவுத்தொகுப்பில் பயிற்சியளிக்கப்பட்ட நேரியல் பின்னடைவு மாதிரியைக் கவனியுங்கள். முறைப்படுத்தல் இல்லாமல், மாடல் சில அம்சங்களுக்கு பெரிய எடைகளை ஒதுக்கலாம், பயிற்சித் தரவை மிக நெருக்கமாகப் பொருத்துகிறது, ஆனால் அதிகப்படியான பொருத்தம் காரணமாக சோதனைத் தரவில் மோசமாகச் செயல்படுகிறது. எல்2 ஒழுங்குபடுத்தலைப் பயன்படுத்துவதன் மூலம், எடைகளை இன்னும் சமமாக விநியோகிக்க மாதிரி ஊக்குவிக்கப்படுகிறது, இது புதிய தரவுகளில் சிறந்த பொதுமைப்படுத்தலுக்கு வழிவகுக்கும்.
மற்றொரு சூழ்நிலையில், படத் தரவுகளில் பயிற்சியளிக்கப்பட்ட ஒரு நரம்பியல் நெட்வொர்க் பயிற்சிப் படங்களில் குறிப்பிட்ட வடிவங்களை மனப்பாடம் செய்வதன் மூலம் பொருத்தமாக இருக்கலாம். டிராப்-அவுட்டைப் பயன்படுத்துவதன் மூலம், வெவ்வேறு படங்களில் பயனுள்ளதாக இருக்கும் பொதுவான அம்சங்களைக் கற்றுக் கொள்ள நெட்வொர்க் நிர்பந்திக்கப்படுகிறது, பார்க்காத தரவுகளில் அதன் செயல்திறனை மேம்படுத்துகிறது.
முறைப்படுத்தல் என்பது இயந்திரக் கற்றலில் ஒரு அடிப்படைக் கருத்தாகும், இது மாதிரியின் இழப்புச் செயல்பாட்டிற்கு சிக்கலான தன்மைக்கான அபராதத்தைச் சேர்ப்பதன் மூலம் அதிகப்படியான பொருத்தத்தைத் தடுக்க உதவுகிறது. மாதிரியின் சிக்கலைக் கட்டுப்படுத்துவதன் மூலம், எல்1, எல்2, எலாஸ்டிக் நெட், டிராப்அவுட், மற்றும் சீர் ஸ்டாப்பிங் போன்ற ஒழுங்குபடுத்தும் நுட்பங்கள் புதிய தரவுகளுக்கு சிறந்த பொதுமைப்படுத்தலை செயல்படுத்துகின்றன, மேலும் அவை இயந்திர கற்றல் பயிற்சியாளரின் கருவித்தொகுப்பில் தவிர்க்க முடியாத கருவிகளாக அமைகின்றன.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- "சரியான வழிமுறையைத் தேர்ந்தெடுப்பது" பற்றி வாசிப்புப் பொருட்கள் பேசும்போது, அடிப்படையில் அனைத்து சாத்தியமான வழிமுறைகளும் ஏற்கனவே உள்ளன என்று அர்த்தமா? ஒரு குறிப்பிட்ட சிக்கலுக்கு ஒரு வழிமுறை "சரியான" ஒன்று என்பதை நாம் எப்படி அறிவது?
- இயந்திர கற்றலில் பயன்படுத்தப்படும் ஹைப்பர் அளவுருக்கள் யாவை?
- இயந்திர கற்றலுக்கான நிரலாக்கத்தின் மொழி வாட், ஜஸ்ட் பைதான்
- இயந்திர கற்றல் அறிவியல் உலகில் எவ்வாறு பயன்படுத்தப்படுகிறது?
- எந்த மெஷின் லேர்னிங் அல்காரிதத்தைப் பயன்படுத்த வேண்டும் என்பதை எப்படி முடிவு செய்வீர்கள், அதை எப்படிக் கண்டுபிடிப்பீர்கள்?
- கூட்டமைப்பு கற்றல், எட்ஜ் கம்ப்யூட்டிங் மற்றும் சாதனத்தில் இயந்திர கற்றல் ஆகியவற்றுக்கு இடையே உள்ள வேறுபாடுகள் என்ன?
- பயிற்சிக்கு முன் தரவை எவ்வாறு தயார் செய்து சுத்தம் செய்வது?
- இயந்திர கற்றல் திட்டத்தில் குறிப்பிட்ட ஆரம்ப பணிகள் மற்றும் செயல்பாடுகள் என்ன?
- ஒரு குறிப்பிட்ட இயந்திர கற்றல் உத்தி மற்றும் மாதிரியைப் பின்பற்றுவதற்கான கட்டைவிரல் விதிகள் என்ன?
- நேரியல் மாதிரியிலிருந்து ஆழ்ந்த கற்றலுக்கு மாறுவதற்கான நேரம் இது என்பதை எந்த அளவுருக்கள் குறிப்பிடுகின்றன?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க