विज़ुअल डेटा में टेक्स्ट को समझने और छवियों से टेक्स्ट का पता लगाने और निकालने के लिए Google विज़न एपीआई के संदर्भ में फ़ाइल पथों के बजाय छवि यूआरएल को संभालने के लिए "detect_text" फ़ंक्शन को संशोधित करने के लिए, हमें मौजूदा कोड में कुछ समायोजन करने की आवश्यकता है। यह संशोधन हमें छवि यूआरएल को सीधे फ़ंक्शन में इनपुट करने की अनुमति देगा, जिससे एपीआई छवियों को संसाधित करने और टेक्स्ट निकालने में सक्षम हो जाएगा।
सबसे पहले, हमें मौजूदा "detect_text" फ़ंक्शन की संरचना को समझने की आवश्यकता है। आमतौर पर, फ़ंक्शन एक फ़ाइल पथ को इनपुट पैरामीटर के रूप में लेता है और छवि से निकाले गए टेक्स्ट को लौटाता है। कोड कुछ इस तरह दिख सकता है:
python def detect_text(file_path): # Code to load the image from the file path # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
छवि यूआरएल को संभालने के लिए इस फ़ंक्शन को संशोधित करने के लिए, हमें आवश्यक परिवर्तनों को शामिल करने की आवश्यकता है। यहां फ़ंक्शन का एक अद्यतन संस्करण है:
python import requests from PIL import Image from io import BytesIO def detect_text(image_url): # Download the image from the URL response = requests.get(image_url) image = Image.open(BytesIO(response.content)) # Code to call the Google Vision API and process the image # Code to extract and return the text from the processed image return extracted_text
संशोधित कोड में, हम दिए गए यूआरएल से छवि डाउनलोड करने के लिए `अनुरोध` लाइब्रेरी का उपयोग करते हैं। PIL (पायथन इमेजिंग लाइब्रेरी) मॉड्यूल से `Image.open` विधि का उपयोग आगे की प्रक्रिया के लिए छवि को खोलने के लिए किया जाता है।
एक बार छवि लोड हो जाने के बाद, हम Google विज़न एपीआई को कॉल करने और टेक्स्ट निकालने के लिए छवि को संसाधित करने के लिए आगे बढ़ सकते हैं। इस चरण के लिए विशिष्ट कोड एपीआई कार्यान्वयन और उपयोग की जा रही प्रोग्रामिंग भाषा के आधार पर भिन्न हो सकता है। हालाँकि, सामान्य दृष्टिकोण में छवि डेटा का उपयोग करके एपीआई अनुरोध करना और एक प्रतिक्रिया प्राप्त करना शामिल है जिसमें निकाला गया पाठ शामिल है।
अंत में, हम फ़ंक्शन से निकाले गए टेक्स्ट को आउटपुट के रूप में लौटाते हैं।
यहां संशोधित फ़ंक्शन का एक उदाहरण उपयोग दिया गया है:
python image_url = "https://example.com/image.jpg" extracted_text = detect_text(image_url) print(extracted_text)
इस उदाहरण में, हम `डिटेक्ट_टेक्स्ट` फ़ंक्शन के इनपुट के रूप में छवि यूआरएल प्रदान करते हैं, जो फिर छवि को डाउनलोड करता है, Google विज़न एपीआई का उपयोग करके इसे संसाधित करता है, और निकाले गए टेक्स्ट को वापस करता है।
फ़ाइल पथों के बजाय छवि यूआरएल को संभालने के लिए "डिटेक्ट_टेक्स्ट" फ़ंक्शन को संशोधित करने के लिए, हमें उस कोड को शामिल करने की आवश्यकता है जो दिए गए यूआरएल से छवि को डाउनलोड करता है और फिर Google विज़न एपीआई का उपयोग करके इसे संसाधित करता है। ये समायोजन करके, हम इनपुट के रूप में छवि यूआरएल का उपयोग करके छवियों से पाठ को प्रभावी ढंग से निकाल सकते हैं।
संबंधित अन्य हालिया प्रश्न और उत्तर छवि से पाठ का पता लगाना और निकालना:
- पाठ निष्कर्षण के लिए Google Vision API का उपयोग करने के कुछ संभावित अनुप्रयोग क्या हैं?
- हम पांडा लाइब्रेरी का उपयोग करके निकाले गए पाठ को अधिक पठनीय कैसे बना सकते हैं?
- किसी छवि से टेक्स्ट निकालने के लिए Google Vision API का उपयोग करने में क्या चरण शामिल हैं?
- हम छवियों से टेक्स्ट का पता लगाने और निकालने के लिए Google विज़न एपीआई का उपयोग कैसे कर सकते हैं?