இயந்திர கற்றல் துறையானது பல்வேறு முறைகள் மற்றும் முன்னுதாரணங்களை உள்ளடக்கியது, ஒவ்வொன்றும் வெவ்வேறு வகையான தரவு மற்றும் சிக்கல்களுக்கு ஏற்றது. இந்த முன்னுதாரணங்களில், மேற்பார்வையிடப்பட்ட மற்றும் மேற்பார்வையிடப்படாத கற்றல் மிகவும் அடிப்படையான இரண்டு.
மேற்பார்வையிடப்பட்ட கற்றல் என்பது பெயரிடப்பட்ட தரவுத்தொகுப்பில் ஒரு மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்கியது, அங்கு உள்ளீட்டுத் தரவு சரியான வெளியீட்டுடன் இணைக்கப்படுகிறது. மாதிரியானது அதன் கணிப்புகளுக்கும் உண்மையான வெளியீடுகளுக்கும் இடையிலான பிழையைக் குறைப்பதன் மூலம் வெளியீடுகளுக்கு உள்ளீடுகளை வரைபடமாக்க கற்றுக்கொள்கிறது. மறுபுறம், மேற்பார்வை செய்யப்படாத கற்றல், லேபிளிடப்படாத தரவைக் கையாள்கிறது, இதில் தரவு புள்ளிகளின் தொகுப்பிற்குள் இருக்கும் இயற்கையான கட்டமைப்பை ஊகிக்க இலக்கு உள்ளது.
மேற்பார்வையிடப்பட்ட மற்றும் மேற்பார்வையிடப்படாத கற்றல் நுட்பங்களை ஒருங்கிணைக்கும் கற்றல் வகை உள்ளது, இது பெரும்பாலும் அரை-கண்காணிப்பு கற்றல் என குறிப்பிடப்படுகிறது. இந்த அணுகுமுறை பயிற்சி செயல்பாட்டின் போது பெயரிடப்பட்ட மற்றும் பெயரிடப்படாத தரவு இரண்டையும் பயன்படுத்துகிறது. அரை-கண்காணிக்கப்பட்ட கற்றலின் பின்னணியில் உள்ள காரணம் என்னவென்றால், லேபிளிடப்படாத தரவு, சிறிய அளவிலான லேபிளிடப்பட்ட தரவுகளுடன் இணைந்து பயன்படுத்தும்போது, கற்றல் துல்லியத்தில் கணிசமான முன்னேற்றத்தை ஏற்படுத்தும். லேபிளிடப்பட்ட தரவு அரிதாகவோ அல்லது விலை உயர்ந்ததாகவோ இருக்கும் சூழ்நிலைகளில் இது மிகவும் பயனுள்ளதாக இருக்கும், ஆனால் லேபிளிடப்படாத தரவு ஏராளமாகவும் சேகரிக்க எளிதாகவும் இருக்கும்.
லேபிளிடப்படாத தரவுகளின் அடிப்படைக் கட்டமைப்பானது, லேபிளிடப்பட்ட தரவுகளுக்குப் பூர்த்திசெய்யும் மதிப்புமிக்க தகவலை வழங்க முடியும் என்ற அனுமானத்தின் அடிப்படையில் அரை-கண்காணிக்கப்பட்ட கற்றல் கணிக்கப்படுகிறது. இந்த அனுமானம் கிளஸ்டர் அனுமானம், பன்மடங்கு அனுமானம் அல்லது குறைந்த அடர்த்தி பிரிப்பு அனுமானம் போன்ற பல வடிவங்களை எடுக்கலாம். ஒரே கிளஸ்டரில் உள்ள தரவுப் புள்ளிகள் ஒரே லேபிளைக் கொண்டிருக்கக்கூடும் என்று கிளஸ்டர் அனுமானம் கூறுகிறது. பன்மடங்கு அனுமானம் உயர் பரிமாணத் தரவு மிகவும் குறைந்த பரிமாணத்தின் பன்மடங்கில் உள்ளது என்று கூறுகிறது, மேலும் இந்த பன்மடங்கைக் கற்றுக்கொள்வதே பணியாகும். குறைந்த அடர்த்தி பிரிப்பு அனுமானம், குறைந்த தரவு அடர்த்தி உள்ள பகுதியில் முடிவு எல்லை இருக்க வேண்டும் என்ற கருத்தை அடிப்படையாகக் கொண்டது.
அரை மேற்பார்வை கற்றலில் பயன்படுத்தப்படும் பொதுவான நுட்பங்களில் ஒன்று சுய பயிற்சி ஆகும். சுய பயிற்சியில், ஒரு மாதிரி ஆரம்பத்தில் பெயரிடப்பட்ட தரவுகளில் பயிற்சியளிக்கப்படுகிறது. பின்னர் அது பெயரிடப்படாத தரவுகளில் அதன் சொந்த கணிப்புகளை போலி லேபிள்களாகப் பயன்படுத்துகிறது. இந்த மாதிரியானது இந்த பெரிதாக்கப்பட்ட தரவுத்தொகுப்பில் மேலும் பயிற்சியளிக்கப்பட்டு, அதன் கணிப்புகளை மீண்டும் மீண்டும் செம்மைப்படுத்துகிறது. மற்றொரு நுட்பம் இணை பயிற்சி ஆகும், இதில் இரண்டு அல்லது அதற்கு மேற்பட்ட மாதிரிகள் ஒரே நேரத்தில் தரவின் வெவ்வேறு பார்வைகளில் பயிற்சியளிக்கப்படுகின்றன. லேபிளிடப்படாத தரவின் ஒரு பகுதியை லேபிளிடுவதற்கு ஒவ்வொரு மாதிரியும் பொறுப்பாகும், இது மற்ற மாடல்களுக்கு பயிற்சியளிக்கப் பயன்படுகிறது. இந்த முறை கற்றல் செயல்திறனை மேம்படுத்த தரவுகளின் பல பார்வைகளில் உள்ள பணிநீக்கத்தைப் பயன்படுத்துகிறது.
அரை-கண்காணிக்கப்பட்ட கற்றலில் வரைபட அடிப்படையிலான முறைகளும் பரவலாக உள்ளன. இந்த முறைகள் ஒரு வரைபடத்தை உருவாக்குகின்றன, அங்கு முனைகள் தரவு புள்ளிகளைக் குறிக்கின்றன, மேலும் விளிம்புகள் அவற்றுக்கிடையேயான ஒற்றுமையைக் குறிக்கின்றன. கற்றல் பணி பின்னர் வரைபட அடிப்படையிலான தேர்வுமுறை சிக்கலாக மறுசீரமைக்கப்படுகிறது, அங்கு வரைபட கட்டமைப்பைப் பாதுகாக்கும் போது லேபிளிடப்பட்ட முனைகளிலிருந்து லேபிள்களை லேபிள்களை பரப்புவது. இந்த நுட்பங்கள் சமூக வலைப்பின்னல்கள் அல்லது உயிரியல் நெட்வொர்க்குகள் போன்ற தரவு இயற்கையாகவே ஒரு பிணையத்தை உருவாக்கும் களங்களில் குறிப்பாக பயனுள்ளதாக இருக்கும்.
மேற்பார்வையிடப்பட்ட மற்றும் மேற்பார்வை செய்யப்படாத கற்றலை இணைப்பதற்கான மற்றொரு அணுகுமுறை பல-பணி கற்றல் ஆகும். பல-பணி கற்றலில், பல கற்றல் பணிகள் ஒரே நேரத்தில் தீர்க்கப்படுகின்றன, அதே நேரத்தில் பணிகளில் உள்ள பொதுவான தன்மைகள் மற்றும் வேறுபாடுகளைப் பயன்படுத்துகின்றன. இது தூண்டல் பரிமாற்றத்தின் ஒரு வடிவமாகக் காணலாம், அங்கு ஒரு பணியிலிருந்து பெறப்பட்ட அறிவு மற்றொன்றின் கற்றலை மேம்படுத்த உதவுகிறது. தகவல் பரிமாற்றத்தை அனுமதிக்கும் வகையில், பணிகளுக்கிடையே பகிரப்பட்ட பிரதிநிதித்துவம் அல்லது அம்சம் இடம் இருக்கும் போது பல-பணி கற்றல் மிகவும் பயனுள்ளதாக இருக்கும்.
இயற்கை மொழிச் செயலாக்கத் துறையில் (NLP) அரை-கண்காணிக்கப்பட்ட கற்றலின் நடைமுறை உதாரணம். கொடுக்கப்பட்ட உரையை நேர்மறை அல்லது எதிர்மறை என வகைப்படுத்துவதே இலக்காக இருக்கும் உணர்வுப் பகுப்பாய்வின் பணியைக் கவனியுங்கள். சென்டிமென்ட் லேபிள்களுடன் கூடிய மதிப்புரைகள் போன்ற லேபிளிடப்பட்ட தரவு வரம்பிடப்படலாம். இருப்பினும், லேபிளிடப்படாத ஏராளமான உரைகள் கிடைக்கின்றன. ஒரு அரை-கண்காணிக்கப்பட்ட கற்றல் அணுகுமுறையானது, லேபிளிடப்பட்ட தரவுகளில் ஒரு உணர்வு வகைப்படுத்தியைப் பயிற்றுவித்து, லேபிளிடப்படாத தரவின் உணர்வைக் கணிக்க அதைப் பயன்படுத்துவதை உள்ளடக்கியிருக்கும். இந்தக் கணிப்புகள் பின்னர் கூடுதல் பயிற்சித் தரவாகப் பயன்படுத்தப்பட்டு, வகைப்படுத்தியின் செயல்திறனை மேம்படுத்தும்.
மற்றொரு உதாரணத்தை பட வகைப்பாட்டில் காணலாம். பல சந்தர்ப்பங்களில், லேபிளிடப்பட்ட படங்களைப் பெறுவது உழைப்பு மிகுந்த மற்றும் விலை உயர்ந்தது, அதேசமயம் லேபிளிடப்படாத படங்கள் ஏராளமாக உள்ளன. ஆரம்ப மாதிரியைப் பயிற்றுவிப்பதற்காக லேபிளிடப்பட்ட படங்களின் சிறிய தொகுப்பைப் பயன்படுத்தி அரை-கண்காணிக்கப்பட்ட அணுகுமுறை அடங்கும். இந்த மாதிரியானது போலி லேபிள்களை உருவாக்க லேபிளிடப்படாத படங்களுக்குப் பயன்படுத்தப்படலாம், பின்னர் அவை மாதிரியை மீண்டும் பயிற்சி செய்யப் பயன்படுத்தப்படுகின்றன.
அரை-கண்காணிக்கப்பட்ட கற்றல் மற்றும் தொடர்புடைய வழிமுறைகள் மூலம் மேற்பார்வையிடப்பட்ட மற்றும் மேற்பார்வை செய்யப்படாத கற்றலின் ஒருங்கிணைப்பு இயந்திர கற்றலில் ஒரு சக்திவாய்ந்த அணுகுமுறையைக் குறிக்கிறது. இரண்டு முன்னுதாரணங்களின் பலத்தையும் மேம்படுத்துவதன் மூலம், மாதிரி செயல்திறனில் குறிப்பிடத்தக்க மேம்பாடுகளை அடைய முடியும், குறிப்பாக லேபிளிடப்பட்ட தரவு குறைவாக இருக்கும் ஆனால் லேபிளிடப்படாத தரவு ஏராளமாக இருக்கும் டொமைன்களில். இந்த அணுகுமுறை வரையறுக்கப்பட்ட தரவுகளிலிருந்து பொதுமைப்படுத்துவதற்கான மாதிரிகளின் திறனை மேம்படுத்துவது மட்டுமல்லாமல், சிக்கலான தரவுத்தொகுப்புகளின் அடிப்படை கட்டமைப்பைப் புரிந்துகொள்வதற்கான மிகவும் வலுவான கட்டமைப்பையும் வழங்குகிறது.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- "சரியான வழிமுறையைத் தேர்ந்தெடுப்பது" பற்றி வாசிப்புப் பொருட்கள் பேசும்போது, அடிப்படையில் அனைத்து சாத்தியமான வழிமுறைகளும் ஏற்கனவே உள்ளன என்று அர்த்தமா? ஒரு குறிப்பிட்ட சிக்கலுக்கு ஒரு வழிமுறை "சரியான" ஒன்று என்பதை நாம் எப்படி அறிவது?
- இயந்திர கற்றலில் பயன்படுத்தப்படும் ஹைப்பர் அளவுருக்கள் யாவை?
- இயந்திர கற்றலுக்கான நிரலாக்கத்தின் மொழி வாட், ஜஸ்ட் பைதான்
- இயந்திர கற்றல் அறிவியல் உலகில் எவ்வாறு பயன்படுத்தப்படுகிறது?
- எந்த மெஷின் லேர்னிங் அல்காரிதத்தைப் பயன்படுத்த வேண்டும் என்பதை எப்படி முடிவு செய்வீர்கள், அதை எப்படிக் கண்டுபிடிப்பீர்கள்?
- கூட்டமைப்பு கற்றல், எட்ஜ் கம்ப்யூட்டிங் மற்றும் சாதனத்தில் இயந்திர கற்றல் ஆகியவற்றுக்கு இடையே உள்ள வேறுபாடுகள் என்ன?
- பயிற்சிக்கு முன் தரவை எவ்வாறு தயார் செய்து சுத்தம் செய்வது?
- இயந்திர கற்றல் திட்டத்தில் குறிப்பிட்ட ஆரம்ப பணிகள் மற்றும் செயல்பாடுகள் என்ன?
- ஒரு குறிப்பிட்ட இயந்திர கற்றல் உத்தி மற்றும் மாதிரியைப் பின்பற்றுவதற்கான கட்டைவிரல் விதிகள் என்ன?
- நேரியல் மாதிரியிலிருந்து ஆழ்ந்த கற்றலுக்கு மாறுவதற்கான நேரம் இது என்பதை எந்த அளவுருக்கள் குறிப்பிடுகின்றன?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க