இயந்திர கற்றல் என்பது செயற்கை நுண்ணறிவின் துணைக்குழு ஆகும், இது தரவுகளிலிருந்து கற்றுக் கொள்ளும் திறன் கொண்ட அமைப்புகளை உருவாக்குதல் மற்றும் அந்தத் தரவின் அடிப்படையில் முடிவுகளை அல்லது கணிப்புகளை மேற்கொள்வதில் கவனம் செலுத்துகிறது. மெஷின் லேர்னிங்கில் அல்காரிதத்தின் தேர்வு முக்கியமானது, ஏனெனில் அந்த மாதிரியானது தரவிலிருந்து எவ்வாறு கற்றுக் கொள்ளும் மற்றும் அது காணாத தரவுகளில் எவ்வளவு திறம்பட செயல்படும் என்பதை இது தீர்மானிக்கிறது. பல வகையான இயந்திர கற்றல் அல்காரிதம்கள் உள்ளன, ஒவ்வொன்றும் வெவ்வேறு வகையான பணிகள் மற்றும் தரவு கட்டமைப்புகளுக்கு ஏற்றது. பொருத்தமான வழிமுறையைத் தேர்ந்தெடுப்பது, கையில் உள்ள சிக்கலைப் புரிந்துகொள்வது, தரவின் தன்மை மற்றும் பணியின் குறிப்பிட்ட தேவைகள் ஆகியவற்றை உள்ளடக்கியது.
இயந்திர கற்றல் அல்காரிதங்களின் வகைகள்
1. கண்காணிக்கப்படும் கற்றல் அல்காரிதம்கள்:
- இந்த வழிமுறைகள் பெயரிடப்பட்ட தரவிலிருந்து கற்றுக்கொள்கின்றன, அதாவது உள்ளீட்டுத் தரவு சரியான வெளியீட்டுடன் இணைக்கப்பட்டுள்ளது. புதிய, காணப்படாத தரவுகளுக்கான வெளியீட்டைக் கணிக்கப் பயன்படும் உள்ளீடுகளிலிருந்து வெளியீடுகளுக்கான மேப்பிங்கைக் கற்றுக்கொள்வதே குறிக்கோள்.
- எடுத்துக்காட்டுகள்:
- நேரியல் பின்னடைவு: தொடர்ச்சியான மதிப்பைக் கணிக்கப் பயன்படுகிறது. உதாரணமாக, அளவு, இருப்பிடம் மற்றும் படுக்கையறைகளின் எண்ணிக்கை போன்ற அம்சங்களின் அடிப்படையில் வீட்டின் விலைகளைக் கணித்தல்.
- லாஜிஸ்டிக் பின்னடைவு: மின்னஞ்சல் ஸ்பேமா இல்லையா என்பதை தீர்மானிப்பது போன்ற பைனரி வகைப்பாடு சிக்கல்களுக்குப் பயன்படுத்தப்படுகிறது.
- ஆதரவு திசையன் இயந்திரங்கள் (SVM): நேரியல் மற்றும் நேரியல் அல்லாத வகைப்பாடு பணிகளுக்கு பயனுள்ளதாக இருக்கும். அம்ச இடத்தில் வகுப்புகளை சிறப்பாகப் பிரிக்கும் ஹைப்பர் பிளேனைக் கண்டுபிடிப்பதன் மூலம் அவை செயல்படுகின்றன.
- முடிவு மரங்கள்: வகைப்பாடு மற்றும் பின்னடைவு பணிகளுக்கு பயன்படுத்தப்படுகிறது. அம்ச மதிப்புகளின் அடிப்படையில் தரவை கிளைகளாகப் பிரிப்பதன் மூலம் அவை மாதிரியாக இருக்கும்.
- சீரற்ற காடுகள்: பல முடிவெடுக்கும் மரங்களை உருவாக்கி மேலும் துல்லியமான மற்றும் நிலையான கணிப்பைப் பெற அவற்றை ஒன்றிணைக்கும் ஒரு குழும முறை.
- நரம்பியல் வலையமைப்புகள்: படம் மற்றும் பேச்சு அங்கீகாரம் போன்ற சிக்கலான பணிகளுக்கு குறிப்பாக பயனுள்ளதாக இருக்கும். அவை ஒன்றோடொன்று இணைக்கப்பட்ட முனைகளின் (நியூரான்கள்) அடுக்குகளைக் கொண்டிருக்கின்றன, அவை மனித மூளையால் ஈர்க்கப்பட்ட முறையில் தரவை செயலாக்குகின்றன.
2. மேற்பார்வை செய்யப்படாத கற்றல் அல்காரிதம்கள்:
- இந்த அல்காரிதம்கள் லேபிளிடப்பட்ட பதில்கள் இல்லாத தரவுகளுடன் வேலை செய்கின்றன. தரவு புள்ளிகளின் தொகுப்பிற்குள் இருக்கும் இயற்கையான கட்டமைப்பை ஊகிப்பதே இதன் நோக்கம்.
- எடுத்துக்காட்டுகள்:
- K- என்றால் கிளஸ்டரிங்: அம்ச ஒற்றுமையின் அடிப்படையில் தரவை K தனித்தனி கிளஸ்டர்களாகப் பிரிக்கிறது.
- படிநிலை கிளஸ்டரிங்: இயற்கையாகவே மரம் போன்ற கட்டமைப்பை உருவாக்கும் தரவுகளுக்குப் பயனுள்ள, கொத்துகளின் படிநிலையை உருவாக்குகிறது.
- முதன்மை உபகரண பகுப்பாய்வு (பிசிஏ): ஒரு பரிமாணக் குறைப்பு நுட்பம், தரவை முதன்மைக் கூறுகள் எனப்படும் நேரியல் தொடர்பில்லாத மாறிகளின் தொகுப்பாக மாற்றுகிறது.
- சங்க விதிகள்: பெரிய தரவுத்தளங்களில் மாறிகளுக்கு இடையே உள்ள சுவாரஸ்யமான உறவுகளைக் கண்டறியப் பயன்படுகிறது, பொதுவாக சந்தை கூடை பகுப்பாய்வில் பயன்படுத்தப்படுகிறது.
3. அரை மேற்பார்வை கற்றல் அல்காரிதம்கள்:
- இந்த வழிமுறைகள் பயிற்சிக்காக லேபிளிடப்பட்ட மற்றும் லேபிளிடப்படாத தரவு இரண்டையும் பயன்படுத்துகின்றன. பொதுவாக, ஒரு சிறிய அளவு லேபிளிடப்பட்ட தரவு மற்றும் அதிக அளவு லேபிளிடப்படாத தரவு கிடைக்கும். தரவை லேபிளிடுவது விலை உயர்ந்ததாகவோ அல்லது நேரத்தைச் செலவழிப்பதாகவோ இருக்கும்போது இது பயனுள்ளதாக இருக்கும்.
- எடுத்துக்காட்டுகள்:
- சுய பயிற்சி: லேபிளிடப்பட்ட தரவுகளில் ஒரு மாதிரியைப் பயிற்றுவித்தல், லேபிளிடப்படாத தரவுகளுக்கான லேபிள்களைக் கணித்தல், பின்னர் புதிதாக லேபிளிடப்பட்ட தரவைக் கொண்டு மாதிரியை மீண்டும் பயிற்சி செய்தல் ஆகியவை அடங்கும்.
- இணை பயிற்சி: ஒன்றுக்கொன்று லேபிளிடப்படாத தரவை மீண்டும் மீண்டும் லேபிளிடும் பல கற்றல்களைப் பயன்படுத்துகிறது.
4. வலுவூட்டல் கற்றல் அல்காரிதம்கள்:
- இந்த வழிமுறைகள் சூழலுடன் தொடர்புகொள்வதன் மூலம் கற்றுக்கொள்கின்றன. அவர்கள் வெகுமதிகள் அல்லது அபராதங்கள் வடிவில் கருத்துக்களைப் பெறுகிறார்கள் மற்றும் ஒட்டுமொத்த வெகுமதியை அதிகப்படுத்துவதை நோக்கமாகக் கொண்டுள்ளனர்.
- எடுத்துக்காட்டுகள்:
- கே-கற்றல்: ஒரு சிறந்த கொள்கையைப் பெற, கொடுக்கப்பட்ட மாநிலங்களில் செயல்களின் மதிப்பைக் கற்றுக் கொள்ளும் மாதிரி-இல்லாத அல்காரிதம்.
- ஆழமான Q-நெட்வொர்க்குகள் (DQN): உயர் பரிமாண நிலை இடைவெளிகளைக் கையாள ஆழமான நரம்பியல் நெட்வொர்க்குகளுடன் Q-கற்றலை ஒருங்கிணைக்கிறது.
- கொள்கை சாய்வு முறைகள்: நரம்பியல் நெட்வொர்க்கின் எடையை சரிசெய்வதன் மூலம் கொள்கையை நேரடியாக மேம்படுத்தவும்.
5. ஆழமான கற்றல் அல்காரிதம்கள்:
- பல அடுக்குகள் (ஆழமான கட்டமைப்புகள்) கொண்ட நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்தும் இயந்திர கற்றல் வழிமுறைகளின் துணைக்குழு. அவை பெரிய தரவுத்தொகுப்புகளில் சிக்கலான வடிவங்களைக் கற்கும் திறன் கொண்டவை.
- எடுத்துக்காட்டுகள்:
- கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள் (சிஎன்என்): முதன்மையாக படத் தரவுக்காகப் பயன்படுத்தப்படுகிறது, அவை மனித மேற்பார்வையின்றி முக்கியமான அம்சங்களைத் தானாகவே கண்டறியும்.
- தொடர்ச்சியான நரம்பியல் நெட்வொர்க்குகள் (RNNs): நேரத் தொடர் அல்லது இயல்பான மொழி செயலாக்கப் பணிகள் போன்ற தொடர் தரவுகளுக்கு ஏற்றது.
இயந்திர கற்றல் அல்காரிதத்தைத் தேர்ந்தெடுப்பது
சரியான அல்காரிதத்தைத் தேர்ந்தெடுப்பது பல பரிசீலனைகளை உள்ளடக்கியது:
1. பிரச்சனையின் தன்மை:
- பணியானது வகைப்பாடு, பின்னடைவு, கிளஸ்டரிங் அல்லது வலுவூட்டல் கற்றல் பிரச்சனையா என்பதைத் தீர்மானிக்கவும். இது பொருத்தமான அல்காரிதங்களின் வகைகளைக் குறைக்க உதவுகிறது.
2. தரவு பண்புகள்:
- தரவின் அளவு, பரிமாணம் மற்றும் கட்டமைப்பைக் கவனியுங்கள். எடுத்துக்காட்டாக, படங்கள் போன்ற உயர் பரிமாண தரவுகளுக்கு ஆழமான கற்றல் வழிமுறைகள் மிகவும் பொருத்தமானவை, அதே சமயம் லாஜிஸ்டிக் ரிக்ரஷன் போன்ற எளிய வழிமுறைகள் குறைந்த பரிமாண தரவுகளுக்கு போதுமானதாக இருக்கும்.
3. செயல்திறன் அளவீடுகள்:
– துல்லியம், துல்லியம், நினைவுபடுத்துதல், F1-மதிப்பீடு அல்லது வகைப்பாடு பணிகளுக்கான ROC வளைவின் கீழ் பகுதி போன்ற மாடலின் செயல்திறனை மதிப்பிடுவதற்குப் பயன்படுத்தப்படும் அளவீடுகளைத் தீர்மானிக்கவும்.
4. கணக்கீட்டு வளங்கள்:
- நினைவகம் மற்றும் செயலாக்க சக்தி உட்பட, கணக்கீட்டு வளங்களை கணக்கில் எடுத்துக் கொள்ளுங்கள். ஆழமான கற்றல் மாதிரிகள் போன்ற சில வழிமுறைகளுக்கு குறிப்பிடத்தக்க கணக்கீட்டு வளங்கள் தேவைப்படுகின்றன, மற்றவை முடிவு மரங்கள் போன்றவை அதிக எடை குறைந்தவை.
5. வியாக்கியானம்:
- மாதிரி விளக்கத்தின் தேவையைக் கவனியுங்கள். முடிவெடுக்கும் செயல்முறையைப் புரிந்துகொள்வது முக்கியமான பயன்பாடுகளுக்கு, ஆழமான நரம்பியல் நெட்வொர்க்குகள் போன்ற சிக்கலான மாதிரிகளை விட, முடிவு மரங்கள் அல்லது நேரியல் மாதிரிகள் போன்ற எளிமையான மாதிரிகள் விரும்பப்படலாம்.
6. அளவீடல்:
- தரவு அளவை அதிகரிப்பதன் மூலம் அல்காரிதம் அளவிட முடியுமா என்பதை மதிப்பிடவும். கே-அதாவது கிளஸ்டரிங் போன்ற அல்காரிதங்கள் பெரிய தரவுத்தொகுப்புகளுக்கு அளவிடக்கூடியவை, அதேசமயம் தரவுத்தொகுப்பு வளரும்போது மற்றவை சிரமப்படலாம்.
7. டொமைன் அறிவு:
- அம்சத் தேர்வு மற்றும் பொறியியல் பற்றிய தகவலறிந்த முடிவுகளை எடுக்க டொமைன் அறிவைப் பயன்படுத்தவும், இது தேர்ந்தெடுக்கப்பட்ட அல்காரிதத்தின் செயல்திறனை கணிசமாக பாதிக்கும்.
உதாரண காட்சிகள்
- வாடிக்கையாளர் குழப்பத்தை முன்னறிவித்தல்: இது பொதுவாக பைனரி வகைப்பாடு பிரச்சனை. லாஜிஸ்டிக் பின்னடைவு, முடிவு மரங்கள் அல்லது சீரற்ற காடுகள் போன்ற குழும முறைகள் பொருத்தமான தேர்வுகளாக இருக்கலாம். முடிவானது வியாக்கியானம் மற்றும் முன்கணிப்பு துல்லியம் ஆகியவற்றின் தேவையைப் பொறுத்தது.
- பட அங்கீகாரம்: படங்களிலிருந்து படிநிலை அம்சங்களைத் தானாகப் பிரித்தெடுக்கும் திறன் காரணமாக, ஆழமான கற்றலுக்கு, குறிப்பாக கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளுக்கு (CNNகள்) இந்தப் பிரச்சனை மிகவும் பொருத்தமானது.
- சந்தை பிரிவு: வாங்கும் நடத்தையின் அடிப்படையில் வாடிக்கையாளர்களை தனித்தனி குழுக்களாகக் கூட்டுவது இதில் அடங்கும். K-என்பது தரவுத்தொகுப்பின் அளவு மற்றும் கட்டமைப்பைப் பொறுத்து கிளஸ்டரிங் அல்லது படிநிலை கிளஸ்டரிங் பயன்படுத்தப்படலாம்.
- பங்கு விலை கணிப்பு: ARIMA மாதிரிகள் போன்ற நேரத் தொடர் பகுப்பாய்வு நுட்பங்களிலிருந்து பயனடையக்கூடிய ஒரு பின்னடைவுச் சிக்கல் அல்லது மிகவும் சிக்கலான வடிவங்களுக்கான ஆதரவு திசையன் பின்னடைவு அல்லது தொடர்ச்சியான நரம்பியல் நெட்வொர்க்குகள் (RNNகள்) போன்ற இயந்திர கற்றல் மாதிரிகள்.
ஒரு வழிமுறையைத் தேர்ந்தெடுப்பது இயந்திரக் கற்றல் பைப்லைனில் ஒரு முக்கியமான படியாகும், மேலும் சிக்கல் சூழல், தரவு பண்புகள் மற்றும் நடைமுறைக் கட்டுப்பாடுகள் பற்றிய முழுமையான புரிதலால் வழிநடத்தப்பட வேண்டும். சிறந்த முடிவுகளை அடைவதற்கு, அல்காரிதம் மற்றும் அதன் அளவுருக்களின் தேர்வுகளை நன்றாகச் சரிசெய்வதற்கு பரிசோதனை மற்றும் மறுசெயல்முறை சோதனைகள் அடிக்கடி தேவைப்படுகின்றன.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- "சரியான வழிமுறையைத் தேர்ந்தெடுப்பது" பற்றி வாசிப்புப் பொருட்கள் பேசும்போது, அடிப்படையில் அனைத்து சாத்தியமான வழிமுறைகளும் ஏற்கனவே உள்ளன என்று அர்த்தமா? ஒரு குறிப்பிட்ட சிக்கலுக்கு ஒரு வழிமுறை "சரியான" ஒன்று என்பதை நாம் எப்படி அறிவது?
- இயந்திர கற்றலில் பயன்படுத்தப்படும் ஹைப்பர் அளவுருக்கள் யாவை?
- இயந்திர கற்றலுக்கான நிரலாக்கத்தின் மொழி வாட், ஜஸ்ட் பைதான்
- இயந்திர கற்றல் அறிவியல் உலகில் எவ்வாறு பயன்படுத்தப்படுகிறது?
- எந்த மெஷின் லேர்னிங் அல்காரிதத்தைப் பயன்படுத்த வேண்டும் என்பதை எப்படி முடிவு செய்வீர்கள், அதை எப்படிக் கண்டுபிடிப்பீர்கள்?
- கூட்டமைப்பு கற்றல், எட்ஜ் கம்ப்யூட்டிங் மற்றும் சாதனத்தில் இயந்திர கற்றல் ஆகியவற்றுக்கு இடையே உள்ள வேறுபாடுகள் என்ன?
- பயிற்சிக்கு முன் தரவை எவ்வாறு தயார் செய்து சுத்தம் செய்வது?
- இயந்திர கற்றல் திட்டத்தில் குறிப்பிட்ட ஆரம்ப பணிகள் மற்றும் செயல்பாடுகள் என்ன?
- ஒரு குறிப்பிட்ட இயந்திர கற்றல் உத்தி மற்றும் மாதிரியைப் பின்பற்றுவதற்கான கட்டைவிரல் விதிகள் என்ன?
- நேரியல் மாதிரியிலிருந்து ஆழ்ந்த கற்றலுக்கு மாறுவதற்கான நேரம் இது என்பதை எந்த அளவுருக்கள் குறிப்பிடுகின்றன?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க