தொகுதி அளவு, சகாப்தம் மற்றும் தரவுத்தொகுப்பு அளவு ஆகியவை இயந்திரக் கற்றலில் உண்மையில் முக்கியமான அம்சங்களாகும், மேலும் அவை பொதுவாக ஹைபர்பாராமீட்டர்கள் என குறிப்பிடப்படுகின்றன. இந்த கருத்தை புரிந்து கொள்ள, ஒவ்வொரு சொல்லையும் தனித்தனியாக ஆராய்வோம்.
தொகுதி அளவு:
தொகுதி அளவு என்பது பயிற்சியின் போது மாதிரியின் எடைகள் புதுப்பிக்கப்படுவதற்கு முன் செயலாக்கப்பட்ட மாதிரிகளின் எண்ணிக்கையை வரையறுக்கும் ஒரு ஹைப்பர் பாராமீட்டர் ஆகும். கற்றல் செயல்முறையின் வேகம் மற்றும் நிலைத்தன்மையை தீர்மானிப்பதில் இது குறிப்பிடத்தக்க பங்கைக் கொண்டுள்ளது. ஒரு சிறிய தொகுதி அளவு, மாடலின் எடைக்கு கூடுதல் புதுப்பிப்புகளை அனுமதிக்கிறது, இது விரைவான ஒருங்கிணைப்புக்கு வழிவகுக்கிறது. இருப்பினும், இது கற்றல் செயல்பாட்டில் இரைச்சலையும் அறிமுகப்படுத்தலாம். மறுபுறம், ஒரு பெரிய தொகுதி அளவு சாய்வு மிகவும் நிலையான மதிப்பீடு வழங்குகிறது ஆனால் பயிற்சி செயல்முறை மெதுவாக முடியும்.
எடுத்துக்காட்டாக, ஸ்டோகாஸ்டிக் கிரேடியன்ட் டிசென்ட் (SGD) இல், 1 இன் தொகுதி அளவு தூய SGD என அழைக்கப்படுகிறது, அங்கு மாதிரியானது ஒவ்வொரு மாதிரியையும் செயலாக்கிய பிறகு அதன் எடையைப் புதுப்பிக்கிறது. மாறாக, பயிற்சி தரவுத்தொகுப்பின் அளவிற்கு சமமான ஒரு தொகுதி அளவு, தொகுதி சாய்வு வம்சாவளி என்று அழைக்கப்படுகிறது, அங்கு மாதிரியானது ஒரு சகாப்தத்திற்கு ஒரு முறை அதன் எடையை புதுப்பிக்கிறது.
சகாப்தம்:
ஒரு சகாப்தம் என்பது மற்றொரு ஹைப்பர் பாராமீட்டர் ஆகும், இது பயிற்சியின் போது நரம்பியல் நெட்வொர்க் மூலம் முழு தரவுத்தொகுப்பு முன்னும் பின்னும் அனுப்பப்படும் எண்ணிக்கையை வரையறுக்கிறது. பல சகாப்தங்களுக்கு ஒரு மாதிரியைப் பயிற்றுவிப்பது, அதன் எடையை மீண்டும் மீண்டும் சரிசெய்வதன் மூலம் தரவில் உள்ள சிக்கலான வடிவங்களைக் கற்றுக்கொள்ள அனுமதிக்கிறது. இருப்பினும், பல சகாப்தங்களுக்கான பயிற்சி அதிகப்படியான பொருத்தத்திற்கு வழிவகுக்கும், அங்கு மாதிரியானது பயிற்சித் தரவில் சிறப்பாகச் செயல்படுகிறது, ஆனால் பார்க்காத தரவைப் பொதுமைப்படுத்தத் தவறிவிடுகிறது.
உதாரணமாக, ஒரு தரவுத்தொகுப்பில் 1,000 மாதிரிகள் இருந்தால், அந்த மாதிரியானது 10 சகாப்தங்களுக்கு பயிற்சியளிக்கப்பட்டிருந்தால், பயிற்சி செயல்பாட்டின் போது மாடல் முழு தரவுத்தொகுப்பையும் 10 முறை பார்த்திருக்கிறது என்று அர்த்தம்.
தரவுத்தொகுப்பு அளவு:
தரவுத்தொகுப்பு அளவு என்பது இயந்திர கற்றல் மாதிரியைப் பயிற்றுவிப்பதற்கான மாதிரிகளின் எண்ணிக்கையைக் குறிக்கிறது. இது மாதிரியின் செயல்திறன் மற்றும் பொதுமைப்படுத்தல் திறனை நேரடியாக பாதிக்கும் ஒரு முக்கியமான காரணியாகும். ஒரு பெரிய தரவுத்தொகுப்பு அளவு பெரும்பாலும் சிறந்த மாதிரி செயல்திறனுக்கு இட்டுச் செல்கிறது, ஏனெனில் இது மாதிரியிலிருந்து கற்றுக்கொள்ள பல்வேறு எடுத்துக்காட்டுகளை வழங்குகிறது. இருப்பினும், பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரிவது கணக்கீட்டு வளங்களையும் பயிற்சிக்குத் தேவையான நேரத்தையும் அதிகரிக்கலாம்.
நடைமுறையில், தரவுத்தொகுப்பு அளவு மற்றும் மாடல் சிக்கலான தன்மை ஆகியவற்றுக்கு இடையே சமநிலையை ஏற்படுத்துவது அவசியம். வரம்புக்குட்பட்ட தரவுத்தொகுப்புகளில் இருந்து அதிகமானவற்றைப் பயன்படுத்த, தரவுப் பெருக்கம் மற்றும் முறைப்படுத்துதல் போன்ற நுட்பங்களைப் பயன்படுத்தலாம்.
தொகுதி அளவு, சகாப்தம் மற்றும் தரவுத்தொகுப்பு அளவு ஆகியவை இயந்திரக் கற்றலில் உள்ள ஹைப்பர் பாராமீட்டர்கள் ஆகும், அவை பயிற்சி செயல்முறை மற்றும் மாதிரியின் இறுதி செயல்திறனை கணிசமாக பாதிக்கின்றன. வலிமையான மற்றும் துல்லியமான இயந்திர கற்றல் மாதிரிகளை உருவாக்குவதற்கு இந்த ஹைபர்பாராமீட்டர்களை எவ்வாறு திறம்பட சரிசெய்வது என்பதைப் புரிந்துகொள்வது முக்கியம்.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- டெக்ஸ்ட் டு ஸ்பீச் (TTS) என்றால் என்ன, அது AI உடன் எவ்வாறு செயல்படுகிறது?
- இயந்திர கற்றலில் பெரிய தரவுத்தொகுப்புகளுடன் பணிபுரிவதில் உள்ள வரம்புகள் என்ன?
- இயந்திர கற்றல் சில உரையாடல் உதவிகளை செய்ய முடியுமா?
- டென்சர்ஃப்ளோ விளையாட்டு மைதானம் என்றால் என்ன?
- பெரிய தரவுத்தொகுப்பு உண்மையில் என்ன அர்த்தம்?
- அல்காரிதத்தின் ஹைபர்பாராமீட்டர்களின் சில எடுத்துக்காட்டுகள் யாவை?
- இசையமைத்தல் கற்றல் என்றால் என்ன?
- தேர்ந்தெடுக்கப்பட்ட இயந்திர கற்றல் அல்காரிதம் பொருத்தமானதாக இல்லாவிட்டால் என்ன செய்வது மற்றும் சரியானதைத் தேர்ந்தெடுப்பதை எவ்வாறு உறுதிப்படுத்துவது?
- ஒரு இயந்திர கற்றல் மாதிரி அதன் பயிற்சியின் போது மேற்பார்வை தேவையா?
- நியூரல் நெட்வொர்க் அடிப்படையிலான அல்காரிதம்களில் பயன்படுத்தப்படும் முக்கிய அளவுருக்கள் யாவை?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க