Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, API இன் ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR) திறன்களைப் பயன்படுத்துவதை உள்ளடக்கிய தொடர்ச்சியான படிகளைப் பின்பற்றலாம். கூகுள் விஷன் ஏபிஐயில் உள்ள OCR தொழில்நுட்பம் கையெழுத்து உட்பட படங்களிலிருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கிறது. காட்சித் தரவுகளில் உள்ள உரைத் தகவலைப் பகுப்பாய்வு செய்து புரிந்து கொள்ள வேண்டிய பயன்பாடுகளில் இந்த செயல்பாடு மிகவும் பயனுள்ளதாக இருக்கும்.
முதலில், Google Vision API உடன் பணிபுரிய தேவையான சூழலை நீங்கள் அமைக்க வேண்டும். இது Google Cloud Console இல் ஒரு திட்டத்தை உருவாக்குதல், Vision API ஐ இயக்குதல் மற்றும் API விசை அல்லது சேவை கணக்கு விசை போன்ற தேவையான அங்கீகார நற்சான்றிதழ்களைப் பெறுதல் ஆகியவை அடங்கும்.
உங்கள் சூழல் அமைக்கப்பட்டதும், படக் கோப்பில் OCR ஐச் செய்ய, Vision API இன் `asyncBatchAnnotateFiles` முறையைப் பயன்படுத்தலாம். இந்த முறையானது செயலாக்கத்திற்கான படக் கோப்புகளின் பட்டியலை அனுப்பவும் மற்றும் முடிவுகளை ஒத்திசைவற்ற முறையில் பெறவும் உங்களை அனுமதிக்கிறது. மாற்றாக, படங்களின் பட்டியலை நேரடியாகச் செயலாக்க `asyncBatchAnnotateImages` முறையைப் பயன்படுத்தலாம்.
ஒரு படத்திலிருந்து உரையைப் பிரித்தெடுக்க, நீங்கள் `AnnotateImageRequest` பொருளின் நிகழ்வை உருவாக்கி, தேவையான அம்சங்களைக் குறிப்பிட வேண்டும். இந்த வழக்கில், நீங்கள் படத்திலிருந்து உரையைப் பிரித்தெடுக்க விரும்புகிறீர்கள் என்பதைக் குறிக்க `TEXT_DETECTION` அம்சத்தை அமைக்க வேண்டும். OCR இன் துல்லியத்தை மேம்படுத்த, மொழி குறிப்பு போன்ற கூடுதல் அளவுருக்களையும் நீங்கள் குறிப்பிடலாம்.
அடுத்து, நீங்கள் படக் கோப்பை அடிப்படை64-குறியீடு செய்யப்பட்ட சரத்தில் குறியாக்கம் செய்ய வேண்டும் மற்றும் குறியிடப்பட்ட படத் தரவைப் பயன்படுத்தி `படம்' பொருளின் நிகழ்வை உருவாக்க வேண்டும். இந்த `இமேஜ்` ஆப்ஜெக்ட்டை முன்பு உருவாக்கப்பட்ட `அன்னோடேட் இமேஜ் ரிக்வெஸ்ட்` ஆப்ஜெக்ட்டில் சேர்க்க வேண்டும்.
கோரிக்கையை அமைத்த பிறகு, நீங்கள் தேர்ந்தெடுத்த அணுகுமுறையைப் பொறுத்து `batchAnnotateImages` அல்லது `batchAnnotateFiles` முறையைப் பயன்படுத்தி விஷன் API க்கு அனுப்பலாம். API படத்தைச் செயலாக்கி, பிரித்தெடுக்கப்பட்ட உரையைக் கொண்ட பதிலை வழங்கும்.
பதிலில் இருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, நீங்கள் `AnnotateImageResponse` பொருளின் `textAnnotations' புலத்தில் மீண்டும் மீண்டும் செய்யலாம். இந்தப் புலத்தில் `EntityAnnotation` ஆப்ஜெக்ட்களின் பட்டியல் உள்ளது, ஒவ்வொன்றும் படத்தில் கண்டறியப்பட்ட உரை உறுப்பைக் குறிக்கும். ஒவ்வொரு `EntityAnnotation` பொருளின் `விளக்கம்` புலத்தில் பிரித்தெடுக்கப்பட்ட உரை உள்ளது.
Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை எவ்வாறு அணுகுவது என்பதை விளக்கும் பைத்தானில் உள்ள ஒரு எடுத்துக்காட்டு குறியீடு துணுக்கு இங்கே உள்ளது:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
இந்த எடுத்துக்காட்டில், `extract_text_from_image` செயல்பாடு ஒரு படக் கோப்பிற்கான பாதையை உள்ளீடாக எடுத்துக்கொண்டு, Vision API க்கு கோரிக்கையை அனுப்ப Google Cloud Vision கிளையன்ட் லைப்ரரியைப் பயன்படுத்துகிறது. பிரித்தெடுக்கப்பட்ட உரை பின்னர் அச்சிடப்படுகிறது.
Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, நீங்கள் சூழலை அமைக்க வேண்டும், விரும்பிய அம்சங்களுடன் `AnnotateImageRequest' பொருளை உருவாக்க வேண்டும், படக் கோப்பை குறியாக்கம் செய்ய வேண்டும், கோரிக்கையை API க்கு அனுப்ப வேண்டும் மற்றும் பிரித்தெடுக்கப்பட்ட உரையை மீட்டெடுக்க வேண்டும் பதிலில் இருந்து. விஷன் ஏபிஐயின் OCR திறன்கள் கையெழுத்து உட்பட படங்களிலிருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கிறது.
தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் கையெழுத்தில் இருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கும்:
- Google Vision API ஐப் பயன்படுத்தி சிக்கலான ஆவணங்களிலிருந்து உரையைப் பிரித்தெடுக்கும்போது என்ன வரம்புகள் ஏற்படலாம்?
- கூகுள் விஷன் API இன் உரை விளக்கத்தில் நம்பிக்கை நிலைகளின் முக்கியத்துவம் என்ன?
- கூகுள் விஷன் API எவ்வாறு கையால் எழுதப்பட்ட குறிப்புகளிலிருந்து உரையை துல்லியமாக அடையாளம் கண்டு பிரித்தெடுக்க முடியும்?
- கையால் எழுதப்பட்ட படங்களிலிருந்து உரையைக் கண்டறிந்து பிரித்தெடுப்பதில் உள்ள சவால்கள் என்ன?
- கூகுள் விஷன் கையெழுத்தை அடையாளம் காண முடியுமா?