पायथन और विज़न एपीआई का उपयोग करके छवियों से प्रोग्रामेटिक रूप से लेबल निकालने के लिए, आप Google क्लाउड विज़न एपीआई की शक्तिशाली क्षमताओं का लाभ उठा सकते हैं। विज़न एपीआई लेबल पहचान सहित छवि विश्लेषण सुविधाओं का एक व्यापक सेट प्रदान करता है, जो आपको छवियों से लेबल को स्वचालित रूप से पहचानने और निकालने की अनुमति देता है।
आरंभ करने के लिए, आपको एक Google क्लाउड प्रोजेक्ट स्थापित करना होगा और विज़न एपीआई को सक्षम करना होगा। एक बार जब आप ऐसा कर लेते हैं, तो आप निम्न आदेश चलाकर आवश्यक पायथन लाइब्रेरी स्थापित कर सकते हैं:
python pip install google-cloud-vision
इसके बाद, आपको विज़न एपीआई तक पहुंचने के लिए अपने एप्लिकेशन को प्रमाणित करना होगा। आप एक सेवा खाता कुंजी बनाकर और कुंजी फ़ाइल के पथ को इंगित करने के लिए `GOOGLE_APPLICATION_CREDENTIALS` पर्यावरण चर सेट करके ऐसा कर सकते हैं। यह निम्नलिखित कोड का उपयोग करके किया जा सकता है:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
अब, आप छवियों से प्रोग्रामेटिक रूप से लेबल निकालने के लिए विज़न एपीआई का उपयोग कर सकते हैं। निम्नलिखित कोड स्निपेट दर्शाता है कि यह कैसे करना है:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
इस कोड में, हम पहले `google.cloud.vision` लाइब्रेरी से `ImageAnnotatorClient` क्लास का एक उदाहरण बनाते हैं। फिर हम छवि फ़ाइल को पढ़ते हैं, फ़ाइल सामग्री से एक `छवि` ऑब्जेक्ट बनाते हैं, और इसे लेबल का पता लगाने के लिए विज़न एपीआई को भेजते हैं। एपीआई प्रतिक्रिया में लेबल एनोटेशन की एक सूची होती है, जिसमें से हम लेबल का विवरण निकालते हैं।
अब आप जिस छवि फ़ाइल का विश्लेषण करना चाहते हैं उसका पथ पास करके `extract_labels` फ़ंक्शन को कॉल कर सकते हैं। यह छवि से निकाले गए लेबलों की एक सूची लौटाएगा।
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
यह छवि से निकाले गए लेबल को आउटपुट करेगा।
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
विज़न एपीआई छवियों का विश्लेषण करने और वस्तुओं, दृश्यों और अन्य दृश्य सुविधाओं की पहचान करने के लिए उन्नत मशीन लर्निंग मॉडल का उपयोग करता है। यह लेबल की एक विस्तृत श्रृंखला का सटीक रूप से पता लगा सकता है, जिससे यह छवि वर्गीकरण, सामग्री मॉडरेशन और दृश्य खोज जैसे विभिन्न अनुप्रयोगों के लिए एक मूल्यवान उपकरण बन जाता है।
पायथन और विज़न एपीआई का उपयोग करके छवियों से प्रोग्रामेटिक रूप से लेबल निकालने के लिए, आपको एक Google क्लाउड प्रोजेक्ट सेट करना होगा, विज़न एपीआई को सक्षम करना होगा, आवश्यक पायथन लाइब्रेरी स्थापित करना होगा, अपने एप्लिकेशन को प्रमाणित करना होगा और फिर लेबल का पता लगाने के लिए विज़न एपीआई का उपयोग करना होगा। इमेजिस। निकाले गए लेबल का उपयोग आगे के विश्लेषण के लिए या छवि सामग्री की समझ को बढ़ाने के लिए किया जा सकता है।
संबंधित अन्य हालिया प्रश्न और उत्तर EITC/AI/GVAPI Google विज़न एपीआई:
- Google Vision API में ऑब्जेक्ट पहचान के लिए कुछ पूर्वनिर्धारित श्रेणियां क्या हैं?
- क्या Google Vision API चेहरे की पहचान सक्षम करता है?
- "Draw_vertices" फ़ंक्शन का उपयोग करके ऑब्जेक्ट बॉर्डर बनाते समय डिस्प्ले टेक्स्ट को छवि में कैसे जोड़ा जा सकता है?
- दिए गए कोड में "draw.line" विधि के पैरामीटर क्या हैं, और शीर्ष मानों के बीच रेखाएँ खींचने के लिए उनका उपयोग कैसे किया जाता है?
- पायथन में ऑब्जेक्ट बॉर्डर खींचने के लिए पिलो लाइब्रेरी का उपयोग कैसे किया जा सकता है?
- प्रदत्त कोड में "draw_vertices" फ़ंक्शन का उद्देश्य क्या है?
- Google Vision API किसी छवि में आकृतियों और वस्तुओं को समझने में कैसे मदद कर सकता है?
- उपयोगकर्ता एपीआई द्वारा अनुशंसित दृश्यमान समान छवियों का पता कैसे लगा सकते हैं?
- Google विज़न एपीआई के वेब डिटेक्शन फ़ीचर के रिस्पॉन्स ऑब्जेक्ट में कौन से विभिन्न तत्व उपलब्ध कराए गए हैं?
- वेब डिटेक्शन सुविधा अपलोड की गई छवियों के लिए टैग बनाने में कैसे सहायता करती है?
EITC/AI/GVAPI Google Vision API में अधिक प्रश्न और उत्तर देखें