ஆதரவு திசையன் இயந்திரங்கள் (SVMs) வகைப்பாடு மற்றும் பின்னடைவு பணிகளுக்குப் பயன்படுத்தப்படும் ஒரு சக்திவாய்ந்த மேற்பார்வையிடப்பட்ட கற்றல் வழிமுறையாகும். உயர் பரிமாண இடைவெளியில் வெவ்வேறு வகுப்புகளின் தரவுப் புள்ளிகளை சிறப்பாகப் பிரிக்கும் உகந்த ஹைப்பர் பிளேனைக் கண்டறிவதே SVM இன் முதன்மை நோக்கமாகும். SVM இல் ஒரு அம்சத் தொகுப்பின் வகைப்பாடு முடிவெடுக்கும் செயல்பாட்டுடன் ஆழமாக பிணைக்கப்பட்டுள்ளது, குறிப்பாக அதன் அடையாளம், கொடுக்கப்பட்ட தரவுப் புள்ளி ஹைப்பர் பிளேனின் எந்தப் பக்கத்தில் விழுகிறது என்பதை தீர்மானிப்பதில் முக்கிய பங்கு வகிக்கிறது.
SVM இல் முடிவெடுக்கும் செயல்பாடு
ஒரு SVM க்கான முடிவு செயல்பாடு இவ்வாறு வெளிப்படுத்தப்படலாம்:
எங்கே:
- ஹைப்பர் பிளேனின் நோக்குநிலையை வரையறுக்கும் எடை திசையன் ஆகும்.
- வகைப்படுத்தப்படும் தரவு புள்ளியின் அம்ச திசையன் ஆகும்.
- ஹைப்பர் பிளேனை மாற்றும் சார்பு சொல்.
தரவு புள்ளியை வகைப்படுத்த , முடிவு செயல்பாட்டின் அடையாளம் பயன்படுத்தப்படுகிறது:
இந்த அடையாளம் தரவுப் புள்ளி இருக்கும் ஹைப்பர் பிளேனின் பக்கத்தை தீர்மானிக்கிறது.
வகைப்படுத்தலில் கையொப்பத்தின் பங்கு
முடிவு செயல்பாட்டின் அடையாளம் () தரவுப் புள்ளிக்கு ஒதுக்கப்பட்ட வகுப்பு லேபிளை நேரடியாகத் தீர்மானிக்கிறது
. இது எவ்வாறு செயல்படுகிறது என்பது இங்கே:
1. நேர்மறை அடையாளம்: என்றால் , முடிவு செயல்பாட்டின் அடையாளம் நேர்மறையானது. இதன் பொருள் தரவு புள்ளி
நேர்மறை வகுப்பு அமைந்துள்ள ஹைப்பர் பிளேனின் பக்கத்தில் உள்ளது. எனவே,
நேர்மறை வகுப்பைச் சேர்ந்ததாக வகைப்படுத்தப்பட்டுள்ளது (பொதுவாக +1 எனக் குறிக்கப்படுகிறது).
2. எதிர்மறை அடையாளம்: என்றால் , முடிவு செயல்பாட்டின் அடையாளம் எதிர்மறையானது. இது தரவு புள்ளி என்பதைக் குறிக்கிறது
எதிர்மறை வகுப்பு அமைந்துள்ள ஹைப்பர் பிளேனின் பக்கத்தில் உள்ளது. எனவே,
எதிர்மறை வகுப்பைச் சேர்ந்ததாக வகைப்படுத்தப்பட்டுள்ளது (பொதுவாக -1 எனக் குறிக்கப்படுகிறது).
3. பூஜ்யம்: அரிதான வழக்கில் எங்கே , தரவு புள்ளி
ஹைப்பர் பிளேனில் சரியாக உள்ளது. இந்த சூழ்நிலை கோட்பாட்டளவில் சாத்தியமானது ஆனால் உண்மையான மதிப்புள்ள தரவுகளின் தொடர்ச்சியான தன்மை காரணமாக நடைமுறையில் அரிதானது.
வடிவியல் விளக்கம்
SVMகள் தரவுப் புள்ளிகளை எவ்வாறு வகைப்படுத்துகின்றன என்பதைப் புரிந்துகொள்வதற்கு முடிவுச் செயல்பாட்டின் வடிவியல் விளக்கம் அவசியம். ஹைப்பர் பிளேன் வரையறுக்கப்பட்டுள்ளது இரண்டு வகுப்புகளுக்கு இடையே முடிவெடுக்கும் எல்லையாக செயல்படுகிறது. இந்த ஹைப்பர் பிளேனின் நோக்குநிலை மற்றும் நிலை ஆகியவை எடை திசையன் மூலம் தீர்மானிக்கப்படுகிறது
மற்றும் சார்பு சொல்
.
1. மார்ஜின்: விளிம்பு என்பது ஹைப்பர்பிளேன் மற்றும் ஒவ்வொரு வகுப்பிலிருந்தும் நெருங்கிய தரவுப் புள்ளிகளுக்கு இடையே உள்ள தூரம். ஹைப்பர்பிளேன் வகுப்புகளைப் பிரிப்பது மட்டுமல்லாமல், அருகிலுள்ள தரவுப் புள்ளிகளிலிருந்து சாத்தியமான மிகப்பெரிய தூரத்தில் அதைச் செய்கிறது என்பதை உறுதிப்படுத்த SVM இந்த விளிம்பை அதிகப்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது. இந்த மிக நெருக்கமான தரவு புள்ளிகள் ஆதரவு திசையன்கள் என்று அழைக்கப்படுகின்றன.
2. ஆதரவு திசையன்கள்: ஆதரவு திசையன்கள் என்பது ஹைப்பர் பிளேனுக்கு மிக அருகில் இருக்கும் தரவு புள்ளிகள். ஹைப்பர் பிளேனின் நிலை மற்றும் நோக்குநிலையை வரையறுப்பதில் அவை முக்கியமானவை. இந்த ஆதரவு திசையன்களின் நிலையில் எந்த மாற்றமும் ஹைப்பர் பிளேனை மாற்றிவிடும்.
உதாரணமாக
இரண்டு வகுப்புகளின் தரவுப் புள்ளிகளுடன் இரு பரிமாண அம்ச இடைவெளியைக் கொண்ட ஒரு எளிய உதாரணத்தைக் கவனியுங்கள். நேர்மறை வகுப்பை +1 ஆகவும், எதிர்மறை வகுப்பை -1 ஆகவும் குறிப்போம். எடை திசையன் என்று வைத்துக் கொள்வோம் மற்றும் சார்பு சொல்
.
ஒரு தரவு புள்ளிக்கு , முடிவு செயல்பாட்டை நாம் பின்வருமாறு கணக்கிடலாம்:
முதல் , முடிவு செயல்பாட்டின் அடையாளம் நேர்மறையானது, இதனால், தரவு புள்ளி
நேர்மறை வகுப்பைச் (+1) சேர்ந்ததாக வகைப்படுத்தப்பட்டுள்ளது.
மற்றொரு தரவு புள்ளிக்கு , முடிவு செயல்பாட்டை நாங்கள் கணக்கிடுகிறோம்:
மீண்டும், , எனவே அடையாளம் நேர்மறை, மற்றும்
நேர்மறை வகுப்பைச் (+1) சேர்ந்ததாக வகைப்படுத்தப்பட்டுள்ளது.
இப்போது, ஒரு தரவு புள்ளியை கவனியுங்கள் :
இந்த வழக்கில், , எனவே அடையாளம் எதிர்மறையானது, மற்றும்
எதிர்மறை வகுப்பைச் சேர்ந்தது (-1) என வகைப்படுத்தப்பட்டுள்ளது.
கணித உருவாக்கம்
SVM இன் கணித உருவாக்கம், உகந்ததைக் கண்டறிய ஒரு தேர்வுமுறை சிக்கலைத் தீர்ப்பதை உள்ளடக்கியது. மற்றும்
பயிற்சி தரவை சரியாக வகைப்படுத்தும் போது விளிம்பை அதிகப்படுத்துகிறது. தேர்வுமுறை சிக்கலை இவ்வாறு வெளிப்படுத்தலாம்:
எங்கே தரவு புள்ளியின் வகுப்பு லேபிள் ஆகும்
, மற்றும் கட்டுப்பாடு அனைத்து தரவு புள்ளிகளும் குறைந்தபட்சம் 1 விளிம்புடன் சரியாக வகைப்படுத்தப்படுவதை உறுதி செய்கிறது.
கர்னல் தந்திரம்
பல நடைமுறை பயன்பாடுகளில், அசல் அம்ச இடத்தில் தரவு நேரியல் முறையில் பிரிக்கப்படாமல் இருக்கலாம். இதை நிவர்த்தி செய்ய, கர்னல் தந்திரத்தைப் பயன்படுத்தி SVMகளை நேரியல் அல்லாத வகைப்பாட்டிற்கு நீட்டிக்க முடியும். ஒரு கர்னல் செயல்பாடு நேரியல் பிரிப்பு சாத்தியம் உள்ள உயர் பரிமாண இடைவெளியில் தரவை மறைமுகமாக வரைபடமாக்குகிறது. பொதுவாகப் பயன்படுத்தப்படும் கர்னல் செயல்பாடுகளில் பல்லுறுப்புக்கோவை கர்னல், ரேடியல் அடிப்படை செயல்பாடு (RBF) கர்னல் மற்றும் சிக்மாய்டு கர்னல் ஆகியவை அடங்கும்.
கர்னலைஸ் செய்யப்பட்ட SVM இல் உள்ள முடிவு செயல்பாடு:
எங்கே தேர்வுமுறை சிக்கலின் இரட்டை வடிவத்திலிருந்து பெறப்பட்ட லாக்ரேஞ்ச் பெருக்கிகள்.
பைதான் செயல்படுத்தல்
Python இல், `scikit-learn` நூலகம், `SVC` வகுப்பின் மூலம் SVM இன் நேரடியான செயலாக்கத்தை வழங்குகிறது. தரவுத்தொகுப்பை வகைப்படுத்த, `SVC` எவ்வாறு பயன்படுத்துவது என்பதற்கான எடுத்துக்காட்டு கீழே உள்ளது:
python from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.svm import SVC from sklearn.metrics import accuracy_score # Load the dataset iris = datasets.load_iris() X = iris.data y = iris.target # Select only two classes for binary classification X = X[y != 2] y = y[y != 2] # Split the dataset into training and testing sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Create an SVM classifier with a linear kernel clf = SVC(kernel='linear') # Train the classifier clf.fit(X_train, y_train) # Predict the class labels for the test set y_pred = clf.predict(X_test) # Calculate the accuracy of the classifier accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy * 100:.2f}%')
இந்த எடுத்துக்காட்டில், நேரியல் கர்னலுடன் SVM வகைப்படுத்தியை உருவாக்க `SVC` வகுப்பு பயன்படுத்தப்படுகிறது. வகைப்படுத்தி பயிற்சித் தொகுப்பில் பயிற்றுவிக்கப்படுகிறது, மேலும் சோதனைத் தொகுப்பில் துல்லியம் மதிப்பிடப்படுகிறது. SVM இல் ஒரு அம்சத் தொகுப்பின் வகைப்பாடு அடிப்படையில் முடிவு செயல்பாட்டின் அடையாளத்தைச் சார்ந்தது. . ஹைப்பர் பிளேனின் எந்தப் பக்கத்தில் ஒரு தரவுப் புள்ளி உள்ளது என்பதை அடையாளம் தீர்மானிக்கிறது, அதன் மூலம் அதை தொடர்புடைய வகுப்பிற்கு ஒதுக்குகிறது. முடிவெடுக்கும் செயல்பாடு, உகந்த ஹைப்பர் பிளேனைக் கண்டறிவதற்கான தேர்வுமுறை செயல்முறை மற்றும் நேரியல் அல்லாத பிரிவினையைக் கையாள கர்னல் செயல்பாடுகளின் சாத்தியமான பயன்பாடு ஆகியவை SVM களின் முக்கிய கூறுகளாகும். இந்த அம்சங்களைப் புரிந்துகொள்வது SVMகள் எவ்வாறு செயல்படுகின்றன மற்றும் பல்வேறு இயந்திர கற்றல் பணிகளில் அவற்றின் பயன்பாடு பற்றிய விரிவான பார்வையை வழங்குகிறது.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் பைத்தானுடன் EITC/AI/MLP இயந்திர கற்றல்:
- நேரியல் பின்னடைவில் உள்ள b அளவுரு (சிறந்த பொருத்தம் கோட்டின் y-இடைமறுப்பு) எவ்வாறு கணக்கிடப்படுகிறது?
- SVM இன் முடிவு எல்லையை வரையறுப்பதில் ஆதரவு திசையன்கள் என்ன பங்கு வகிக்கின்றன, பயிற்சியின் போது அவை எவ்வாறு அடையாளம் காணப்படுகின்றன?
- SVM தேர்வுமுறையின் பின்னணியில், எடை திசையன் `w` மற்றும் சார்பு `b` ஆகியவற்றின் முக்கியத்துவம் என்ன, அவை எவ்வாறு தீர்மானிக்கப்படுகின்றன?
- SVM செயலாக்கத்தில் `காட்சிப்படுத்துதல்` முறையின் நோக்கம் என்ன, அது மாதிரியின் செயல்திறனைப் புரிந்துகொள்வதற்கு எப்படி உதவுகிறது?
- SVM செயலாக்கத்தில் உள்ள `கணிப்பு` முறையானது, புதிய தரவுப் புள்ளியின் வகைப்பாட்டை எவ்வாறு தீர்மானிக்கிறது?
- இயந்திர கற்றலின் பின்னணியில் ஒரு ஆதரவு திசையன் இயந்திரத்தின் (SVM) முதன்மை நோக்கம் என்ன?
- பைத்தானில் SVM வகைப்பாட்டை செயல்படுத்த ஸ்கிகிட்-லேர்ன் போன்ற நூலகங்களை எவ்வாறு பயன்படுத்தலாம், மேலும் இதில் உள்ள முக்கிய செயல்பாடுகள் என்ன?
- SVM தேர்வுமுறையில் தடையின் முக்கியத்துவத்தை விளக்கவும் (y_i (mathbf{x}_i cdot mathbf{w} + b) geq 1).
- SVM தேர்வுமுறை சிக்கலின் நோக்கம் என்ன மற்றும் அது எப்படி கணித ரீதியாக வடிவமைக்கப்பட்டுள்ளது?
- ஆதரவு திசையன் இயந்திரங்களின் (SVM) சூழலில் ஹைப்பர் பிளேன் சமன்பாட்டின் (mathbf{x} cdot mathbf{w} + b = 0) பங்கு என்ன?
Python உடன் EITC/AI/MLP இயந்திர கற்றலில் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க