பைத்தானைப் பயன்படுத்தி இயந்திரக் கற்றலில் ஒருவரின் சொந்த K அருகிலுள்ள அண்டை நாடுகளின் (KNN) அல்காரிதத்தைப் பயன்படுத்தும் சூழலில் ரயில் மற்றும் சோதனைத் தொகுப்புகளுக்கான அகராதிகளை விரிவுபடுத்த, நாம் ஒரு முறையான அணுகுமுறையைப் பின்பற்ற வேண்டும். இந்த செயல்முறையானது, KNN அல்காரிதம் மூலம் பயன்படுத்தக்கூடிய பொருத்தமான வடிவமைப்பிற்கு எங்கள் தரவை மாற்றுவதை உள்ளடக்குகிறது.
முதலில், பைத்தானில் உள்ள அகராதிகளின் அடிப்படைக் கருத்தைப் புரிந்துகொள்வோம். அகராதி என்பது வரிசைப்படுத்தப்படாத விசை-மதிப்பு ஜோடிகளின் தொகுப்பாகும், இதில் ஒவ்வொரு விசையும் தனித்தனியாக இருக்கும். இயந்திர கற்றலின் சூழலில், தரவுத்தொகுப்புகளைக் குறிக்க அகராதிகள் பொதுவாகப் பயன்படுத்தப்படுகின்றன, அங்கு விசைகள் அம்சங்கள் அல்லது பண்புக்கூறுகளுடன் ஒத்திருக்கும், மேலும் மதிப்புகள் தொடர்புடைய தரவுப் புள்ளிகளைக் குறிக்கின்றன.
ரயில் மற்றும் சோதனைத் தொகுப்புகளுக்கான அகராதிகளை உருவாக்க, நாம் பின்வரும் படிகளைச் செய்ய வேண்டும்:
1. தரவு தயாரிப்பு: எங்கள் இயந்திர கற்றல் பணிக்கான தரவை சேகரித்து தயாரிப்பதன் மூலம் தொடங்கவும். இது பொதுவாக தரவை சுத்தம் செய்தல், விடுபட்ட மதிப்புகளைக் கையாளுதல் மற்றும் தரவை பொருத்தமான வடிவமைப்பிற்கு மாற்றுதல் ஆகியவற்றை உள்ளடக்கியது. மேற்பார்வையிடப்பட்ட கற்றல் பணிகளுக்கு இது அவசியம் என்பதால், தரவு சரியாக லேபிளிடப்பட்டதா அல்லது வகைப்படுத்தப்பட்டதா என்பதை உறுதிப்படுத்தவும்.
2. தரவுத்தொகுப்பைப் பிரித்தல்: அடுத்து, நமது தரவுத்தொகுப்பை இரண்டு பகுதிகளாகப் பிரிக்க வேண்டும்: ரயில் பெட்டி மற்றும் சோதனைத் தொகுப்பு. எங்கள் KNN அல்காரிதத்தைப் பயிற்றுவிக்க ரயில் பெட்டி பயன்படுத்தப்படும், அதே சமயம் சோதனைத் தொகுப்பு அதன் செயல்திறனை மதிப்பிடப் பயன்படுத்தப்படும். இந்த பிளவு, எங்களின் அல்காரிதம் பார்க்காத தரவை எவ்வளவு நன்றாகப் பொதுமைப்படுத்துகிறது என்பதை மதிப்பிட உதவுகிறது.
3. அம்சம் பிரித்தெடுத்தல்: தரவுத்தொகுப்பு பிரிக்கப்பட்டவுடன், தரவுகளிலிருந்து தொடர்புடைய அம்சங்களைப் பிரித்தெடுத்து அவற்றை நமது அகராதிகளில் விசைகளாக ஒதுக்க வேண்டும். எங்கள் தரவின் தன்மையைப் பொறுத்து, அம்சங்கள் எண் அல்லது வகைப்படுத்தப்பட்டதாக இருக்கலாம். எடுத்துக்காட்டாக, படங்களின் தரவுத்தொகுப்புடன் நாங்கள் பணிபுரிந்தால், வண்ண வரைபடங்கள் அல்லது அமைப்பு விளக்கங்கள் போன்ற அம்சங்களைப் பிரித்தெடுக்கலாம்.
4. மதிப்புகளை ஒதுக்குதல்: அம்சங்களை பிரித்தெடுத்த பிறகு, நமது அகராதியில் உள்ள ஒவ்வொரு விசைக்கும் தொடர்புடைய மதிப்புகளை ஒதுக்க வேண்டும். இந்த மதிப்புகள் எங்கள் தரவுத்தொகுப்பில் உள்ள உண்மையான தரவு புள்ளிகள் அல்லது நிகழ்வுகளைக் குறிக்கின்றன. ஒவ்வொரு நிகழ்வும் அதன் தொடர்புடைய அம்ச மதிப்புகளுடன் தொடர்புடையதாக இருக்க வேண்டும்.
5. ரயில் தொகுப்பு அகராதி: ரயில் தொகுப்பைக் குறிக்க அகராதியை உருவாக்கவும். இந்த அகராதியின் விசைகள் அம்சங்களாக இருக்கும், மேலும் மதிப்புகள் ரயில் தொகுப்பில் உள்ள ஒவ்வொரு நிகழ்விற்கும் தொடர்புடைய அம்ச மதிப்புகளைக் கொண்ட பட்டியல்கள் அல்லது அணிவரிசைகளாக இருக்கும். எடுத்துக்காட்டாக, எங்களிடம் இரண்டு அம்சங்கள் (வயது மற்றும் வருமானம்) மற்றும் மூன்று நிகழ்வுகள் கொண்ட தரவுத்தொகுப்பு இருந்தால், ரயில் தொகுப்பு அகராதி இப்படி இருக்கும்:
ரயில்_செட் = {'வயது': [25, 30, 35], 'வருமானம்': [50000, 60000, 70000]}
6. டெஸ்ட் செட் அகராதி: இதேபோல், சோதனைத் தொகுப்பைக் குறிக்க ஒரு அகராதியை உருவாக்கவும். இந்த அகராதியின் விசைகள் ரயில் தொகுப்பில் உள்ள அதே அம்சங்களாக இருக்கும், மேலும் மதிப்புகள் சோதனைத் தொகுப்பில் உள்ள ஒவ்வொரு நிகழ்விற்கும் தொடர்புடைய அம்ச மதிப்புகளைக் கொண்ட பட்டியல்கள் அல்லது அணிவரிசைகளாக இருக்கும். எடுத்துக்காட்டாக, எங்களிடம் இரண்டு நிகழ்வுகளைக் கொண்ட சோதனைத் தொகுப்பு இருந்தால், சோதனைத் தொகுப்பு அகராதி இப்படி இருக்கும்:
test_set = {'வயது': [40, 45], 'வருமானம்': [80000, 90000]}
7. அகராதிகளைப் பயன்படுத்துதல்: இரயில் மற்றும் சோதனைத் தொகுப்புகளுக்கான அகராதிகள் நிரப்பப்பட்டவுடன், அவற்றை நமது சொந்த KNN அல்காரிதத்திற்கு உள்ளீடுகளாகப் பயன்படுத்தலாம். சோதனைத் தொகுப்பில் உள்ள நிகழ்வுகளுக்கான கணிப்புகள் அல்லது வகைப்பாடுகளைச் செய்ய, ரயில் தொகுப்பில் உள்ள அம்ச மதிப்புகளை அல்காரிதம் பயன்படுத்தும்.
இந்தப் படிகளைப் பின்பற்றுவதன் மூலம், பைத்தானைப் பயன்படுத்தி இயந்திரக் கற்றலில் நமது சொந்த KNN அல்காரிதத்தைப் பயன்படுத்தும் சூழலில் ரயில் மற்றும் சோதனைத் தொகுப்புகளுக்கான அகராதிகளை திறம்பட உருவாக்கலாம். இந்த அகராதிகள் பயிற்சி மற்றும் எங்கள் அல்காரிதத்தின் செயல்திறனை மதிப்பிடுவதற்கான அடித்தளமாக செயல்படுகின்றன.
ரயில் மற்றும் சோதனைத் தொகுப்புகளுக்கு அகராதிகளை விரிவுபடுத்த, தரவுத்தொகுப்பைத் தயாரித்துப் பிரிக்க வேண்டும், தொடர்புடைய அம்சங்களைப் பிரித்தெடுக்க வேண்டும், அகராதிகளில் உள்ள தொடர்புடைய விசைகளுக்கு அம்ச மதிப்புகளை ஒதுக்க வேண்டும், மேலும் இந்த அகராதிகளை எங்கள் சொந்த KNN அல்காரிதத்தில் பயன்படுத்த வேண்டும்.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் சொந்த K அருகிலுள்ள அண்டை வழிமுறையைப் பயன்படுத்துதல்:
- நமது சொந்த K அருகிலுள்ள அண்டை நாடுகளின் அல்காரிதத்தின் துல்லியத்தை எவ்வாறு கணக்கிடுவது?
- ரயில் மற்றும் சோதனைத் தொகுப்புகளில் உள்ள வகுப்பைக் குறிக்கும் ஒவ்வொரு பட்டியலிலும் உள்ள கடைசி உறுப்புகளின் முக்கியத்துவம் என்ன?
- பயிற்சி மற்றும் சோதனைத் தொகுப்புகளாகப் பிரிப்பதற்கு முன் தரவுத்தொகுப்பை மாற்றுவதன் நோக்கம் என்ன?
- K அருகிலுள்ள அண்டை நாடுகளின் அல்காரிதத்தைப் பயன்படுத்துவதற்கு முன்பு தரவுத்தொகுப்பை சுத்தம் செய்வது ஏன் முக்கியம்?