मशीन लर्निंग मॉडल को प्रशिक्षित करने की प्रक्रिया में इसे बड़ी मात्रा में डेटा के संपर्क में लाना शामिल है ताकि यह प्रत्येक परिदृश्य के लिए स्पष्ट रूप से प्रोग्राम किए बिना पैटर्न सीखने और भविष्यवाणियां या निर्णय लेने में सक्षम हो सके। प्रशिक्षण चरण के दौरान, मशीन लर्निंग मॉडल पुनरावृत्तियों की एक श्रृंखला से गुजरता है जहां यह त्रुटियों को कम करने और दिए गए कार्य पर अपने प्रदर्शन में सुधार करने के लिए अपने आंतरिक मापदंडों को समायोजित करता है।
प्रशिक्षण के दौरान पर्यवेक्षण से तात्पर्य मॉडल की सीखने की प्रक्रिया को निर्देशित करने के लिए आवश्यक मानवीय हस्तक्षेप के स्तर से है। उपयोग की जा रही मशीन लर्निंग एल्गोरिदम के प्रकार, कार्य की जटिलता और प्रशिक्षण के लिए प्रदान किए गए डेटा की गुणवत्ता के आधार पर पर्यवेक्षण की आवश्यकता भिन्न हो सकती है।
पर्यवेक्षित शिक्षण में, जो एक प्रकार की मशीन लर्निंग है जहां मॉडल को लेबल किए गए डेटा पर प्रशिक्षित किया जाता है, पर्यवेक्षण आवश्यक है। लेबल किए गए डेटा का मतलब है कि प्रत्येक इनपुट डेटा बिंदु को सही आउटपुट के साथ जोड़ा जाता है, जिससे मॉडल को इनपुट और आउटपुट के बीच मैपिंग सीखने की अनुमति मिलती है। पर्यवेक्षित प्रशिक्षण के दौरान, प्रशिक्षण डेटा के लिए सही लेबल प्रदान करने, मॉडल की भविष्यवाणियों का मूल्यांकन करने और प्रतिक्रिया के आधार पर मॉडल के मापदंडों को समायोजित करने के लिए मानव पर्यवेक्षण की आवश्यकता होती है।
उदाहरण के लिए, पर्यवेक्षित छवि पहचान कार्य में, यदि लक्ष्य बिल्लियों और कुत्तों की छवियों को वर्गीकृत करने के लिए एक मॉडल को प्रशिक्षित करना है, तो एक मानव पर्यवेक्षक को प्रत्येक छवि को बिल्ली या कुत्ते के रूप में लेबल करने की आवश्यकता होगी। फिर मॉडल इन लेबल किए गए उदाहरणों से नई, अनदेखी छवियों पर भविष्यवाणियां करना सीखेगा। पर्यवेक्षक मॉडल की भविष्यवाणियों का मूल्यांकन करेगा और इसकी सटीकता में सुधार के लिए प्रतिक्रिया प्रदान करेगा।
दूसरी ओर, अप्रशिक्षित शिक्षण एल्गोरिदम को प्रशिक्षण के लिए लेबल किए गए डेटा की आवश्यकता नहीं होती है। ये एल्गोरिदम स्पष्ट मार्गदर्शन के बिना इनपुट डेटा से पैटर्न और संरचना सीखते हैं। बिना पर्यवेक्षित शिक्षण का उपयोग अक्सर क्लस्टरिंग, विसंगति का पता लगाने और आयामीता में कमी जैसे कार्यों के लिए किया जाता है। बिना पर्यवेक्षित शिक्षण में, मशीन प्रशिक्षण के दौरान मानव पर्यवेक्षण की आवश्यकता के बिना स्वतंत्र रूप से सीख सकती है।
अर्ध-पर्यवेक्षित शिक्षण एक मिश्रित दृष्टिकोण है जो पर्यवेक्षित और गैर-पर्यवेक्षित शिक्षण दोनों के तत्वों को जोड़ता है। इस दृष्टिकोण में, मॉडल को लेबल किए गए और बिना लेबल वाले डेटा के संयोजन पर प्रशिक्षित किया जाता है। लेबल किया गया डेटा सीखने की प्रक्रिया को निर्देशित करने के लिए कुछ पर्यवेक्षण प्रदान करता है, जबकि बिना लेबल वाला डेटा मॉडल को डेटा में अतिरिक्त पैटर्न और संबंधों की खोज करने की अनुमति देता है।
सुदृढीकरण सीखना मशीन लर्निंग का एक और प्रतिमान है जहां एक एजेंट पर्यावरण के साथ बातचीत करके क्रमिक निर्णय लेना सीखता है। सुदृढीकरण सीखने में, एजेंट को उसके कार्यों के आधार पर पुरस्कार या दंड के रूप में प्रतिक्रिया प्राप्त होती है। एजेंट परीक्षण और त्रुटि के माध्यम से समय के साथ अपने संचयी इनाम को अधिकतम करना सीखता है। जबकि सुदृढीकरण सीखने को पारंपरिक अर्थों में स्पष्ट पर्यवेक्षण की आवश्यकता नहीं होती है, पुरस्कार संरचना को डिजाइन करने, सीखने के उद्देश्यों को निर्धारित करने या सीखने की प्रक्रिया को ठीक करने के लिए मानव पर्यवेक्षण की आवश्यकता हो सकती है।
मशीन लर्निंग प्रशिक्षण के दौरान पर्यवेक्षण की आवश्यकता उपयोग किए जा रहे शिक्षण प्रतिमान, लेबल किए गए डेटा की उपलब्धता और कार्य की जटिलता पर निर्भर करती है। पर्यवेक्षित शिक्षण को लेबल किए गए डेटा प्रदान करने और मॉडल के प्रदर्शन का मूल्यांकन करने के लिए मानव पर्यवेक्षण की आवश्यकता होती है। बिना पर्यवेक्षित शिक्षण के लिए पर्यवेक्षण की आवश्यकता नहीं होती है, क्योंकि मॉडल बिना लेबल वाले डेटा से स्वतंत्र रूप से सीखता है। अर्ध-पर्यवेक्षित शिक्षण पर्यवेक्षित और गैर-पर्यवेक्षित शिक्षण दोनों के तत्वों को जोड़ता है, जबकि सुदृढीकरण सीखने में पर्यावरण के साथ बातचीत के माध्यम से सीखना शामिल होता है।
संबंधित अन्य हालिया प्रश्न और उत्तर EITC/AI/GCML Google क्लाउड मशीन लर्निंग:
- टेक्स्ट टू स्पीच (टीटीएस) क्या है और यह एआई के साथ कैसे काम करता है?
- मशीन लर्निंग में बड़े डेटासेट के साथ काम करने में क्या सीमाएँ हैं?
- क्या मशीन लर्निंग कुछ संवादात्मक सहायता कर सकती है?
- TensorFlow खेल का मैदान क्या है?
- बड़े डेटासेट का वास्तव में क्या मतलब है?
- एल्गोरिदम के हाइपरपैरामीटर के कुछ उदाहरण क्या हैं?
- एन्सेम्बल लर्निंग क्या है?
- यदि चुनी गई मशीन लर्निंग एल्गोरिदम उपयुक्त नहीं है तो क्या होगा और कोई यह कैसे सुनिश्चित कर सकता है कि सही का चयन किया जाए?
- तंत्रिका नेटवर्क आधारित एल्गोरिदम में उपयोग किए जाने वाले प्रमुख पैरामीटर क्या हैं?
- टेंसरबोर्ड क्या है?
EITC/AI/GCML Google क्लाउड मशीन लर्निंग में अधिक प्रश्न और उत्तर देखें