கூகுள் விஷன் API ஐப் பயன்படுத்தி படங்களை லேபிளிங் செய்யும் செயல்முறையானது, ஒரு படத்தில் உள்ள பல்வேறு பொருள்கள், காட்சிகள் மற்றும் உரையைக் கண்டறிதல் மற்றும் அங்கீகாரம் ஆகியவற்றை எளிதாக்கும் பல படிகளை உள்ளடக்கியது. துல்லியமான மற்றும் திறமையான லேபிளிங் திறன்களை வழங்க இந்த சக்திவாய்ந்த கருவி மேம்பட்ட இயந்திர கற்றல் வழிமுறைகளைப் பயன்படுத்துகிறது. இந்தப் பதிலில், கூகுள் விஷன் ஏபிஐயைப் பயன்படுத்தி படங்களை லேபிளிடுவதில் உள்ள படிகளை நான் கோடிட்டுக் காட்டுகிறேன், இது ஒரு விரிவான மற்றும் செயற்கையான விளக்கத்தை அளிக்கிறது.
படி 1: Google Cloud Vision API ஐ அமைக்கவும்
தொடங்குவதற்கு, நீங்கள் Google Cloud Vision API ஐ அமைக்க வேண்டும். Google Cloud Console இல் ஒரு திட்டத்தை உருவாக்குதல், விஷன் API ஐ இயக்குதல் மற்றும் API விசையைப் பெறுதல் ஆகியவை இதில் அடங்கும். இந்த ஆரம்ப அமைவு படிகளைச் செய்ய, Google வழங்கிய ஆவணங்களைப் பின்பற்றவும்.
படி 2: உங்கள் கோரிக்கைகளை அங்கீகரிக்கவும்
நீங்கள் விஷன் API ஐ அமைத்தவுடன், உங்கள் கோரிக்கைகளை அங்கீகரிக்க வேண்டும். ஒவ்வொரு கோரிக்கையிலும் உங்கள் API விசையைச் சேர்ப்பதன் மூலம் இதைச் செய்யலாம், உங்கள் அணுகலை API அடையாளம் கண்டு அங்கீகரிக்க முடியும் என்பதை உறுதிப்படுத்துகிறது. உங்கள் பட லேபிளிங் செயல்முறையின் பாதுகாப்பையும் ஒருமைப்பாட்டையும் உறுதிப்படுத்த இந்த அங்கீகாரப் படி முக்கியமானது.
படி 3: லேபிளிங்கிற்கு ஒரு படத்தை அனுப்பவும்
அங்கீகாரத்திற்குப் பிறகு, லேபிளிங்கிற்காக நீங்கள் ஒரு படத்தை விஷன் API க்கு அனுப்பலாம். நீங்கள் படக் கோப்பை நேரடியாக வழங்கலாம் அல்லது படத்தின் பொதுவில் அணுகக்கூடிய URL ஐக் குறிப்பிடலாம். விஷன் API ஆனது JPEG, PNG மற்றும் GIF போன்ற பல்வேறு பட வடிவங்களை ஆதரிக்கிறது. வெற்றிகரமான செயலாக்கத்திற்கு படத்தின் அளவு 4 மெகாபிக்சல்களுக்கு (4 மில்லியன் பிக்சல்கள்) மிகாமல் இருக்க வேண்டும் என்பதைக் கவனத்தில் கொள்ள வேண்டும்.
படி 4: படத்தை பகுப்பாய்வு செய்யுங்கள்
படம் விஷன் ஏபிஐக்கு அனுப்பப்பட்டதும், அடுத்த கட்டமாக அதை பகுப்பாய்வு செய்ய வேண்டும். API ஆனது லேபிள் கண்டறிதல், உரை கண்டறிதல், முகம் கண்டறிதல் மற்றும் பலவற்றை உள்ளடக்கிய பரந்த அளவிலான பட பகுப்பாய்வு விருப்பங்களை வழங்குகிறது. இந்த வழக்கில், லேபிள் கண்டறிதலில் நாங்கள் கவனம் செலுத்துகிறோம், இதில் படத்தில் உள்ள பொருள்கள் மற்றும் காட்சிகளை அடையாளம் கண்டு விவரிப்பது அடங்கும்.
படி 5: கண்டறியப்பட்ட லேபிள்களை மீட்டெடுக்கவும்
பகுப்பாய்வு முடிந்ததும், விஷன் ஏபிஐ பதிலில் இருந்து கண்டறியப்பட்ட லேபிள்களை நீங்கள் மீட்டெடுக்கலாம். லேபிள்கள் படத்தில் அங்கீகரிக்கப்பட்ட பொருள்கள் அல்லது காட்சிகளைக் குறிக்கும். ஒவ்வொரு லேபிளுக்கும் ஒரு விளக்கமும் அதனுடன் தொடர்புடைய நம்பிக்கை மதிப்பெண்ணும் இருக்கும். விளக்கம் அங்கீகரிக்கப்பட்ட பொருள் அல்லது காட்சியின் உரைப் பிரதிநிதித்துவத்தை வழங்குகிறது, அதே நேரத்தில் நம்பிக்கை மதிப்பெண் கண்டறிதலில் உறுதியின் அளவைக் குறிக்கிறது.
படி 6: லேபிள்களைப் பயன்படுத்தவும்
நீங்கள் லேபிள்களை மீட்டெடுத்தவுடன், உங்கள் பயன்பாட்டின் தேவைகளுக்கு ஏற்ப பல்வேறு வழிகளில் அவற்றைப் பயன்படுத்தலாம். எடுத்துக்காட்டாக, தரவுத்தளத்தில் படங்களை வகைப்படுத்தவும் ஒழுங்கமைக்கவும், தேடல் செயல்பாட்டை மேம்படுத்தவும் அல்லது பட வகைப்பாடு பணிகளுக்கான மெட்டாடேட்டாவை உருவாக்கவும் லேபிள்களைப் பயன்படுத்தலாம். லேபிள்கள் படங்களின் உள்ளடக்கத்தைப் பற்றிய மதிப்புமிக்க நுண்ணறிவுகளை வழங்குகின்றன, அர்த்தமுள்ள தகவலைப் பிரித்தெடுக்கவும், உங்கள் பட செயலாக்க பணிப்பாய்வுகளை மேம்படுத்தவும் உதவுகிறது.
Google Vision API ஐப் பயன்படுத்தி படங்களை லேபிளிங் செய்யும் செயல்முறையானது API ஐ அமைப்பது, கோரிக்கைகளை அங்கீகரிப்பது, லேபிளிங்கிற்கான படத்தை அனுப்புதல், படத்தை பகுப்பாய்வு செய்தல், கண்டறியப்பட்ட லேபிள்களை மீட்டெடுப்பது மற்றும் உங்கள் பயன்பாட்டின் தேவைகளுக்கு ஏற்ப அவற்றைப் பயன்படுத்துதல் ஆகியவை அடங்கும். இந்த சக்திவாய்ந்த கருவி துல்லியமான மற்றும் திறமையான பட லேபிளிங்கை வழங்க இயந்திர கற்றலின் திறன்களைப் பயன்படுத்துகிறது, பட பகுப்பாய்வு மற்றும் புரிதலுக்கான பரந்த அளவிலான சாத்தியங்களைத் திறக்கிறது.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் EITC/AI/GVAPI கூகிள் விஷன் API:
- கூகுள் விஷன் ஏபிஐயில் பொருள் அங்கீகாரத்திற்கான சில முன் வரையறுக்கப்பட்ட வகைகள் யாவை?
- கூகுள் விஷன் ஏபிஐ முக அங்கீகாரத்தை இயக்குமா?
- "draw_vertices" செயல்பாட்டைப் பயன்படுத்தி பொருள் எல்லைகளை வரையும்போது காட்சி உரையை படத்தில் எவ்வாறு சேர்க்கலாம்?
- வழங்கப்பட்ட குறியீட்டில் உள்ள "draw.line" முறையின் அளவுருக்கள் என்ன, அவை செங்குத்து மதிப்புகளுக்கு இடையே கோடுகளை வரைய எப்படிப் பயன்படுத்தப்படுகின்றன?
- பைத்தானில் பொருள் எல்லைகளை வரைய தலையணை நூலகத்தை எவ்வாறு பயன்படுத்தலாம்?
- வழங்கப்பட்ட குறியீட்டில் "draw_vertices" செயல்பாட்டின் நோக்கம் என்ன?
- ஒரு படத்தில் உள்ள வடிவங்கள் மற்றும் பொருட்களைப் புரிந்துகொள்ள Google Vision API எவ்வாறு உதவும்?
- API ஆல் பரிந்துரைக்கப்பட்ட பார்வைக்கு ஒத்த படங்களை பயனர்கள் எவ்வாறு ஆராயலாம்?
- கூகுள் விஷன் ஏபிஐயின் வலை கண்டறிதல் அம்சத்தின் மறுமொழி பொருளில் வழங்கப்பட்டுள்ள பல்வேறு கூறுகள் யாவை?
- பதிவேற்றப்பட்ட படங்களுக்கு குறிச்சொற்களை உருவாக்க இணைய கண்டறிதல் அம்சம் எவ்வாறு உதவுகிறது?
EITC/AI/GVAPI Google Vision API இல் கூடுதல் கேள்விகள் மற்றும் பதில்களைக் காண்க