இயந்திரக் கற்றலின் பின்னணியில், குறிப்பாக இயந்திரக் கற்றல் திட்டத்தில் ஈடுபடும் ஆரம்பப் படிகளைப் பற்றி விவாதிக்கும் போது, ஒருவர் ஈடுபடக்கூடிய பல்வேறு வகையான செயல்பாடுகளைப் புரிந்துகொள்வது அவசியம். இந்த நடவடிக்கைகள் இயந்திர கற்றல் மாதிரிகளை உருவாக்குதல், பயிற்சி செய்தல் மற்றும் வரிசைப்படுத்துதல் ஆகியவற்றின் முதுகெலும்பாக அமைகின்றன. , மற்றும் ஒவ்வொன்றும் மூலத் தரவை செயல்படக்கூடிய நுண்ணறிவுகளாக மாற்றும் செயல்பாட்டில் ஒரு தனித்துவமான நோக்கத்திற்கு சேவை செய்கின்றன. இயந்திர கற்றல் பைப்லைனுக்குள் அவற்றின் பாத்திரங்களை தெளிவுபடுத்துவதற்கான விளக்கங்களுடன் இந்த நடவடிக்கைகளின் விரிவான பட்டியல் கீழே உள்ளது.
1. தரவு சேகரிப்பு: இது எந்த இயந்திர கற்றல் திட்டத்திலும் அடிப்படை படியாகும். தரவு சேகரிப்பு என்பது தரவுத்தளங்கள், வலை ஸ்கிராப்பிங், சென்சார் தரவு அல்லது பயனர் உருவாக்கிய உள்ளடக்கத்தை உள்ளடக்கிய பல்வேறு மூலங்களிலிருந்து மூலத் தரவைச் சேகரிப்பதை உள்ளடக்குகிறது. சேகரிக்கப்பட்ட தரவின் தரம் மற்றும் அளவு இயந்திர கற்றல் மாதிரியின் செயல்திறனை நேரடியாக பாதிக்கிறது. உதாரணமாக, ஒருவர் வீட்டின் விலையை கணிக்க ஒரு மாதிரியை உருவாக்கினால், ரியல் எஸ்டேட் பட்டியல்கள், வரலாற்று விற்பனை பதிவுகள் மற்றும் பொருளாதார குறிகாட்டிகள் ஆகியவற்றிலிருந்து தரவு சேகரிக்கப்படலாம்.
2. தரவு தயாரிப்பு: தரவு சேகரிக்கப்பட்டவுடன், அது பகுப்பாய்விற்கு தயாராக இருக்க வேண்டும். சத்தம் மற்றும் பிழைகளை அகற்ற தரவை சுத்தம் செய்தல், விடுபட்ட மதிப்புகளைக் கையாளுதல் மற்றும் தரவை பொருத்தமான வடிவமைப்பிற்கு மாற்றுதல் ஆகியவை இந்தப் படியில் அடங்கும். தரவுத் தயாரிப்பில் அம்சப் பொறியியலும் அடங்கும், அங்கு மாதிரி செயல்திறனை மேம்படுத்த ஏற்கனவே உள்ள தரவிலிருந்து புதிய அம்சங்கள் உருவாக்கப்படுகின்றன. உதாரணமாக, வாடிக்கையாளர் பரிவர்த்தனைகளின் தரவுத்தொகுப்பில், ஒரு வாடிக்கையாளரின் சராசரி பரிவர்த்தனை மதிப்பைக் குறிக்கும் அம்சத்தை ஒருவர் உருவாக்கலாம்.
3. தரவு ஆய்வு: ஆய்வு தரவு பகுப்பாய்வு (EDA) என்றும் அறியப்படுகிறது, இந்த படிநிலை வடிவங்கள், உறவுகள் மற்றும் நுண்ணறிவுகளை வெளிக்கொணர தரவை பகுப்பாய்வு செய்வதை உள்ளடக்கியது. தரவுகளின் பரவலைப் புரிந்துகொள்வதற்கும், முரண்பாடுகளைக் கண்டறிவதற்கும், தொடர்புகளைக் கண்டறிவதற்கும் தரவு காட்சிப்படுத்தல் கருவிகள் மற்றும் புள்ளியியல் நுட்பங்கள் பயன்படுத்தப்படுகின்றன. தரவு முன் செயலாக்கம் மற்றும் அம்சத் தேர்வு பற்றிய தகவலறிந்த முடிவுகளை எடுக்க இந்தச் செயல்பாடு உதவுகிறது. எடுத்துக்காட்டாக, ஹிஸ்டோகிராம்கள் அல்லது சிதறல் அடுக்குகளைத் திட்டமிடுவது, தரவுகளின் விநியோகம் மற்றும் சாத்தியமான வெளிப்புறங்களை வெளிப்படுத்தலாம்.
4. மாதிரி தேர்வு: இந்தப் படிநிலையில், கையில் உள்ள சிக்கல் மற்றும் தரவின் தன்மை ஆகியவற்றின் அடிப்படையில் பொருத்தமான இயந்திரக் கற்றல் அல்காரிதம்கள் தேர்ந்தெடுக்கப்படுகின்றன. வெவ்வேறு அல்காரிதம்கள் பலம் மற்றும் பலவீனங்களைக் கொண்டிருப்பதால், மாதிரியின் தேர்வு முக்கியமானது. வகைப்பாடு சிக்கல்களுக்கு, முடிவு மரங்கள், ஆதரவு திசையன் இயந்திரங்கள் அல்லது நரம்பியல் நெட்வொர்க்குகள் ஆகியவற்றைக் கருத்தில் கொள்ளலாம். பின்னடைவு பணிகளுக்கு, நேரியல் பின்னடைவு அல்லது சீரற்ற காடுகள் பொருத்தமானதாக இருக்கலாம். மாதிரித் தேர்வு செயல்முறையானது, தரவுக்கு மிகவும் பொருத்தமான ஒன்றைக் கண்டறிய பல மாதிரிகளை ஒப்பிடுவதை உள்ளடக்குகிறது.
5. மாதிரி பயிற்சி: ஒரு மாதிரி தேர்ந்தெடுக்கப்பட்டதும், அது தயாரிக்கப்பட்ட தரவைப் பயன்படுத்தி பயிற்சியளிக்கப்பட வேண்டும். மாதிரி பயிற்சியானது, கணிக்கப்பட்ட மற்றும் உண்மையான விளைவுகளுக்கு இடையே உள்ள பிழையைக் குறைக்க மாதிரி அளவுருக்களை சரிசெய்வதை உள்ளடக்குகிறது. இது பொதுவாக சாய்வு வம்சாவளி போன்ற தேர்வுமுறை நுட்பங்கள் மூலம் அடையப்படுகிறது. பயிற்சியின் போது, மாதிரியானது தரவுக்குள் உள்ள வடிவங்களையும் உறவுகளையும் கற்றுக்கொள்கிறது. எடுத்துக்காட்டாக, ஒரு நரம்பியல் வலையமைப்பைப் பயிற்றுவிப்பது, இழப்புச் செயல்பாட்டைக் குறைக்க நெட்வொர்க்கின் எடைகள் மற்றும் சார்புகளை சரிசெய்வதை உள்ளடக்குகிறது.
6. மாதிரி மதிப்பீடு: பயிற்சிக்குப் பிறகு, மாடலின் செயல்திறன் மதிப்பாய்வு செய்யப்பட வேண்டும், அது பார்க்காத தரவை நன்றாகப் பொதுமைப்படுத்துகிறது. பயிற்சியின் போது பயன்படுத்தப்படாத ஒரு தனி சரிபார்ப்பு அல்லது சோதனை தரவுத்தொகுப்பைப் பயன்படுத்தி இது செய்யப்படுகிறது. பொதுவான மதிப்பீட்டு அளவீடுகளில் துல்லியம், துல்லியம், ரீகால், வகைப்படுத்தல் பணிகளுக்கான F1 மதிப்பெண் மற்றும் பின்னடைவு பணிகளுக்கான சராசரி ஸ்கொயர் பிழை அல்லது R-ஸ்கொயர் ஆகியவை அடங்கும். மாதிரியை மதிப்பிடுவது, அதிகப்படியான பொருத்துதல் அல்லது பொருத்தமற்றது போன்ற சிக்கல்களை அடையாளம் காண உதவுகிறது, அங்கு மாதிரியானது பயிற்சி தரவில் மிகவும் சிறப்பாக செயல்படுகிறது, ஆனால் புதிய தரவில் மோசமாக செயல்படுகிறது அல்லது முறையே தரவின் அடிப்படை போக்குகளைப் பிடிக்கத் தவறியது.
7. மாதிரி வரிசைப்படுத்தல்: இறுதிப் படியானது, பயிற்சியளிக்கப்பட்ட மற்றும் மதிப்பிடப்பட்ட மாதிரியை உற்பத்திச் சூழலுக்குள் பயன்படுத்துவதை உள்ளடக்கியது, அங்கு அது புதிய தரவுகளில் கணிப்புகளைச் செய்யலாம். வலைப் பயன்பாட்டில் மாதிரியை ஒருங்கிணைத்தல், REST API ஆகப் பயன்படுத்துதல் அல்லது மொபைல் பயன்பாட்டில் உட்பொதித்தல் போன்ற பல்வேறு வழிகளில் வரிசைப்படுத்தல் செய்யப்படலாம். காலப்போக்கில் மாதிரி துல்லியமாக இருப்பதை உறுதிசெய்ய தொடர்ச்சியான கண்காணிப்பு அவசியம், ஏனெனில் நிஜ-உலக தரவு மாறலாம், இது மாதிரி சறுக்கலுக்கு வழிவகுக்கும்.
இந்த முக்கிய செயல்பாடுகளுக்கு அப்பால், குறிப்பிடத் தகுந்த பல சிறப்புப் பணிகள் இயந்திரக் கற்றலில் உள்ளன:
- வகைப்பாடு: கற்றறிந்த வடிவங்களின் அடிப்படையில் தரவை உள்ளிடுவதற்கு லேபிள்களை ஒதுக்குவது இந்தச் செயலில் அடங்கும். ஸ்பேம் கண்டறிதல், உணர்வு பகுப்பாய்வு மற்றும் படத்தை அறிதல் போன்ற பல்வேறு பயன்பாடுகளில் வகைப்படுத்தல் பணிகள் பரவலாக உள்ளன. எடுத்துக்காட்டாக, ஸ்பேம் கண்டறிதல் அமைப்பு, அனுப்புநர் முகவரி, மின்னஞ்சல் உள்ளடக்கம் மற்றும் மெட்டாடேட்டா போன்ற அம்சங்களின் அடிப்படையில் மின்னஞ்சல்களை ஸ்பேம் அல்லது ஸ்பேம் அல்ல என வகைப்படுத்துகிறது.
- பின்னடைவு: பின்னடைவு பணிகள் உள்ளீட்டு அம்சங்களின் அடிப்படையில் தொடர்ச்சியான வெளியீட்டு மாறியைக் கணிப்பதில் அடங்கும். இது பொதுவாக வீட்டு விலைகளைக் கணிப்பது, பங்குச் சந்தைப் போக்குகள் அல்லது விற்பனை முன்கணிப்பு போன்ற பயன்பாடுகளில் பயன்படுத்தப்படுகிறது. சுயாதீன மாறிகள் மற்றும் தொடர்ச்சியான சார்பு மாறிகளுக்கு இடையிலான உறவை மாதிரியாக்குவதே குறிக்கோள்.
- கிளஸ்டரிங்: க்ளஸ்டரிங் என்பது ஒரே மாதிரியான தரவுப் புள்ளிகளை ஒன்றாகக் குழுவாக்கப் பயன்படுத்தப்படும் மேற்பார்வை செய்யப்படாத கற்றல் நுட்பமாகும். முன் வரையறுக்கப்பட்ட லேபிள்கள் இல்லாமல் தரவுகளில் உள்ள அடிப்படை வடிவங்கள் அல்லது கட்டமைப்புகளைக் கண்டறிய இது பயனுள்ளதாக இருக்கும். க்ளஸ்டரிங் பயன்பாடுகளில் வாடிக்கையாளர் பிரிவு, பட சுருக்கம் மற்றும் ஒழுங்கின்மை கண்டறிதல் ஆகியவை அடங்கும். K-மீன்ஸ் மற்றும் படிநிலை கிளஸ்டரிங் ஆகியவை இந்தப் பணிக்கான பிரபலமான வழிமுறைகள்.
- பரிமாண குறைப்பு: இந்தச் செயல்பாடு, தரவுத்தொகுப்பில் உள்ள இன்புட் மாறிகள் அல்லது அம்சங்களின் எண்ணிக்கையைக் குறைப்பதோடு, அதன் அத்தியாவசியப் பண்புகளைப் பாதுகாக்கிறது. முதன்மை கூறு பகுப்பாய்வு (PCA) மற்றும் t-Distributed Stochastic Neighbour Embedding (t-SNE) போன்ற பரிமாணக் குறைப்பு நுட்பங்கள் மாதிரிகளை எளிமைப்படுத்தவும், கணக்கீட்டு நேரத்தைக் குறைக்கவும், பரிமாணத்தின் சாபத்தைத் தணிக்கவும் பயன்படுத்தப்படுகின்றன.
- ஒழுங்கின்மை கண்டறிதல்: ஒழுங்கின்மை கண்டறிதல் என்பது எதிர்பார்க்கப்படும் நடத்தைக்கு இணங்காத தரவுகளில் அரிதான அல்லது அசாதாரண வடிவங்களை அடையாளம் காணும் செயல்முறையாகும். மோசடி கண்டறிதல், நெட்வொர்க் பாதுகாப்பு மற்றும் தவறு கண்டறிதல் ஆகியவற்றில் இது மிகவும் பயனுள்ளதாக இருக்கும். தனிமைப்படுத்தப்பட்ட காடுகள் மற்றும் ஆட்டோஎன்கோடர்கள் போன்ற நுட்பங்கள் பெரும்பாலும் ஒழுங்கின்மை கண்டறியும் பணிகளுக்குப் பயன்படுத்தப்படுகின்றன.
- வலுவூட்டல் கற்றல்: மேற்பார்வையிடப்பட்ட மற்றும் மேற்பார்வை செய்யப்படாத கற்றல் போலல்லாமல், வலுவூட்டல் கற்றல் என்பது ஒரு சூழலுடன் தொடர்புகொள்வதன் மூலம் முடிவெடுக்கும் வரிசைகளை உருவாக்குவதற்கான பயிற்சி மாதிரிகளை உள்ளடக்கியது. மாதிரி அல்லது முகவர், வெகுமதிகள் அல்லது அபராதங்கள் வடிவில் கருத்துக்களைப் பெறுவதன் மூலம் இலக்கை அடைய கற்றுக்கொள்கிறார். வலுவூட்டல் கற்றலின் பயன்பாடுகளில் கேம் விளையாடுதல், ரோபாட்டிக்ஸ் மற்றும் தன்னாட்சி ஓட்டுதல் ஆகியவை அடங்கும்.
- இயற்கை மொழி நடைமுறைப்படுத்துதல் (NLP): NLP ஆனது கணினிகளுக்கும் மனித மொழிக்கும் இடையிலான தொடர்புடன் தொடர்புடைய பலவிதமான செயல்பாடுகளை உள்ளடக்கியது. உரை வகைப்பாடு, உணர்வு பகுப்பாய்வு, மொழி மொழிபெயர்ப்பு மற்றும் பெயரிடப்பட்ட நிறுவன அங்கீகாரம் போன்ற பணிகள் இதில் அடங்கும். NLP மாதிரிகள் பெரும்பாலும் டோக்கனைசேஷன், ஸ்டெமிங் மற்றும் BERT அல்லது GPT போன்ற முன் பயிற்சி பெற்ற மொழி மாதிரிகளின் பயன்பாடு போன்ற நுட்பங்களைப் பயன்படுத்துகின்றன.
இந்தச் செயல்பாடுகள், இயந்திரக் கற்றலுடன் பணிபுரியும் போது பயிற்சியாளர்கள் ஈடுபடும் பல்வேறு வகையான பணிகளைக் குறிக்கின்றன. ஒவ்வொரு செயல்பாட்டிற்கும் இயந்திர கற்றல் தீர்வுகளை திறம்பட வடிவமைக்க, செயல்படுத்த மற்றும் வரிசைப்படுத்த அடிப்படைக் கொள்கைகள் மற்றும் நுட்பங்களைப் பற்றிய ஆழமான புரிதல் தேவைப்படுகிறது. இந்தச் செயல்பாடுகளில் தேர்ச்சி பெறுவதன் மூலம், சிக்கலான சிக்கல்களைத் தீர்க்கவும், பல்வேறு களங்களில் புதுமைகளை இயக்கவும் இயந்திரக் கற்றலின் ஆற்றலை ஒருவர் பயன்படுத்தலாம்.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GCML கூகிள் கிளவுட் மெஷின் கற்றல்:
- ஒன்றுக்கு மேற்பட்ட மாதிரிகளைப் பயன்படுத்த முடியுமா?
- ஒரு சூழ்நிலை விளைவைப் பொறுத்து இயந்திர கற்றல் மாற்றியமைக்க முடியுமா, எந்த முறையைப் பயன்படுத்த வேண்டும்?
- நிரலாக்க பின்னணி இல்லாத ஒரு முழுமையான தொடக்கக்காரருக்கு, GUI கன்சோலைப் பயன்படுத்தி படிப்படியான முறையில் இலவச அடுக்கு/சோதனையைப் பயன்படுத்தி Google AI தளத்தில் மிகவும் அடிப்படையான செயற்கையான AI மாதிரி பயிற்சி மற்றும் வரிசைப்படுத்தலுக்கான எளிய வழி என்ன?
- GCP கன்சோலின் GUI இடைமுகம் வழியாக படிப்படியான பயிற்சியில் கூகிள் கிளவுட் AI தளத்தில் எளிய AI மாதிரியை எவ்வாறு நடைமுறை பயிற்சி செய்து பயன்படுத்துவது?
- கூகிள் கிளவுட்டில் விநியோகிக்கப்பட்ட AI மாதிரி பயிற்சியைப் பயிற்சி செய்வதற்கான எளிய, படிப்படியான நடைமுறை என்ன?
- ஆரம்பநிலைக்கு சில நடைமுறை பரிந்துரைகளுடன் ஒருவர் பணியாற்றக்கூடிய முதல் மாதிரி எது?
- வழிமுறைகளும் கணிப்புகளும் மனித தரப்பிலிருந்து வரும் உள்ளீடுகளை அடிப்படையாகக் கொண்டவையா?
- இயற்கை மொழி செயலாக்க மாதிரியை உருவாக்குவதற்கான முக்கிய தேவைகள் மற்றும் எளிமையான முறைகள் யாவை? கிடைக்கக்கூடிய கருவிகளைப் பயன்படுத்தி அத்தகைய மாதிரியை எவ்வாறு உருவாக்க முடியும்?
- இந்தக் கருவிகளைப் பயன்படுத்துவதற்கு மாதாந்திர அல்லது வருடாந்திர சந்தா தேவையா, அல்லது குறிப்பிட்ட அளவு இலவசப் பயன்பாடு உள்ளதா?
- பயிற்சி மாதிரி அளவுருக்களின் சூழலில் ஒரு சகாப்தம் என்றால் என்ன?
EITC/AI/GCML Google Cloud Machine Learning இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க