Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை எவ்வாறு அணுகலாம்?

by EITCA அகாடமி / புதன்கிழமை, 27 டிசம்பர் 2023 / வெளியிடப்பட்ட செயற்கை நுண்ணறிவு, EITC/AI/GVAPI கூகிள் விஷன் API, காட்சி தரவில் உரையைப் புரிந்துகொள்வது, கையெழுத்தில் இருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கும், தேர்வு ஆய்வு

Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, API இன் ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR) திறன்களைப் பயன்படுத்துவதை உள்ளடக்கிய தொடர்ச்சியான படிகளைப் பின்பற்றலாம். கூகுள் விஷன் ஏபிஐயில் உள்ள OCR தொழில்நுட்பம் கையெழுத்து உட்பட படங்களிலிருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கிறது. காட்சித் தரவுகளில் உள்ள உரைத் தகவலைப் பகுப்பாய்வு செய்து புரிந்து கொள்ள வேண்டிய பயன்பாடுகளில் இந்த செயல்பாடு மிகவும் பயனுள்ளதாக இருக்கும்.

முதலில், Google Vision API உடன் பணிபுரிய தேவையான சூழலை நீங்கள் அமைக்க வேண்டும். இது Google Cloud Console இல் ஒரு திட்டத்தை உருவாக்குதல், Vision API ஐ இயக்குதல் மற்றும் API விசை அல்லது சேவை கணக்கு விசை போன்ற தேவையான அங்கீகார நற்சான்றிதழ்களைப் பெறுதல் ஆகியவை அடங்கும்.

உங்கள் சூழல் அமைக்கப்பட்டதும், படக் கோப்பில் OCR ஐச் செய்ய, Vision API இன் `asyncBatchAnnotateFiles` முறையைப் பயன்படுத்தலாம். இந்த முறையானது செயலாக்கத்திற்கான படக் கோப்புகளின் பட்டியலை அனுப்பவும் மற்றும் முடிவுகளை ஒத்திசைவற்ற முறையில் பெறவும் உங்களை அனுமதிக்கிறது. மாற்றாக, படங்களின் பட்டியலை நேரடியாகச் செயலாக்க `asyncBatchAnnotateImages` முறையைப் பயன்படுத்தலாம்.

ஒரு படத்திலிருந்து உரையைப் பிரித்தெடுக்க, நீங்கள் `AnnotateImageRequest` பொருளின் நிகழ்வை உருவாக்கி, தேவையான அம்சங்களைக் குறிப்பிட வேண்டும். இந்த வழக்கில், நீங்கள் படத்திலிருந்து உரையைப் பிரித்தெடுக்க விரும்புகிறீர்கள் என்பதைக் குறிக்க `TEXT_DETECTION` அம்சத்தை அமைக்க வேண்டும். OCR இன் துல்லியத்தை மேம்படுத்த, மொழி குறிப்பு போன்ற கூடுதல் அளவுருக்களையும் நீங்கள் குறிப்பிடலாம்.

அடுத்து, நீங்கள் படக் கோப்பை அடிப்படை64-குறியீடு செய்யப்பட்ட சரத்தில் குறியாக்கம் செய்ய வேண்டும் மற்றும் குறியிடப்பட்ட படத் தரவைப் பயன்படுத்தி `படம்' பொருளின் நிகழ்வை உருவாக்க வேண்டும். இந்த `இமேஜ்` ஆப்ஜெக்ட்டை முன்பு உருவாக்கப்பட்ட `அன்னோடேட் இமேஜ் ரிக்வெஸ்ட்` ஆப்ஜெக்ட்டில் சேர்க்க வேண்டும்.

கோரிக்கையை அமைத்த பிறகு, நீங்கள் தேர்ந்தெடுத்த அணுகுமுறையைப் பொறுத்து `batchAnnotateImages` அல்லது `batchAnnotateFiles` முறையைப் பயன்படுத்தி விஷன் API க்கு அனுப்பலாம். API படத்தைச் செயலாக்கி, பிரித்தெடுக்கப்பட்ட உரையைக் கொண்ட பதிலை வழங்கும்.

பதிலில் இருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, நீங்கள் `AnnotateImageResponse` பொருளின் `textAnnotations' புலத்தில் மீண்டும் மீண்டும் செய்யலாம். இந்தப் புலத்தில் `EntityAnnotation` ஆப்ஜெக்ட்களின் பட்டியல் உள்ளது, ஒவ்வொன்றும் படத்தில் கண்டறியப்பட்ட உரை உறுப்பைக் குறிக்கும். ஒவ்வொரு `EntityAnnotation` பொருளின் `விளக்கம்` புலத்தில் பிரித்தெடுக்கப்பட்ட உரை உள்ளது.

Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை எவ்வாறு அணுகுவது என்பதை விளக்கும் பைத்தானில் உள்ள ஒரு எடுத்துக்காட்டு குறியீடு துணுக்கு இங்கே உள்ளது:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

இந்த எடுத்துக்காட்டில், `extract_text_from_image` செயல்பாடு ஒரு படக் கோப்பிற்கான பாதையை உள்ளீடாக எடுத்துக்கொண்டு, Vision API க்கு கோரிக்கையை அனுப்ப Google Cloud Vision கிளையன்ட் லைப்ரரியைப் பயன்படுத்துகிறது. பிரித்தெடுக்கப்பட்ட உரை பின்னர் அச்சிடப்படுகிறது.

Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை அணுக, நீங்கள் சூழலை அமைக்க வேண்டும், விரும்பிய அம்சங்களுடன் `AnnotateImageRequest' பொருளை உருவாக்க வேண்டும், படக் கோப்பை குறியாக்கம் செய்ய வேண்டும், கோரிக்கையை API க்கு அனுப்ப வேண்டும் மற்றும் பிரித்தெடுக்கப்பட்ட உரையை மீட்டெடுக்க வேண்டும் பதிலில் இருந்து. விஷன் ஏபிஐயின் OCR திறன்கள் கையெழுத்து உட்பட படங்களிலிருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கிறது.

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் கையெழுத்தில் இருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கும்:

மேலும் கேள்விகள் மற்றும் பதில்கள்:

குறித்துள்ளார்: செயற்கை நுண்ணறிவு, Google Cloud Vision API, படம் நடைமுறைப்படுத்துவதற்கு, ஓசிஆர், ஆப்டிகல் கேரக்டர் அங்கீகாரம், உரை பிரித்தெடுத்தல்

EITCA அகாடமி

Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை எவ்வாறு அணுகலாம்?

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் கையெழுத்தில் இருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கும்:

மேலும் கேள்விகள் மற்றும் பதில்கள்:

EITCA அகாடமி என்பது ஐரோப்பிய தகவல் தொழில்நுட்ப சான்றிதழ் கட்டமைப்பின் ஒரு பகுதியாகும்

EITCA அகாடமியின் தகுதி 80% EITCI DSJC மானிய ஆதரவு

EITCA அகாடமி

உங்கள் பயனர்பெயர் அல்லது மின்னஞ்சல் முகவரி மூலம் உங்கள் கணக்கிற்கு உள்நுழைக

உங்கள் விவரங்களைத் மறந்துவிட்டதா?

ஒரு கணக்கை உருவாக்க

Google Vision API ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து பிரித்தெடுக்கப்பட்ட உரையை எவ்வாறு அணுகலாம்?

தொடர்பான பிற சமீபத்திய கேள்விகள் மற்றும் பதில்கள் கையெழுத்தில் இருந்து உரையைக் கண்டறிந்து பிரித்தெடுக்கும்:

மேலும் கேள்விகள் மற்றும் பதில்கள்:

EITCA அகாடமியின் தகுதி 80% EITCI DSJC மானிய ஆதரவு