कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन) को सबसे पहले कंप्यूटर विज़न के क्षेत्र में छवि पहचान के उद्देश्य से डिजाइन किया गया था। ये नेटवर्क एक विशेष प्रकार के कृत्रिम तंत्रिका नेटवर्क हैं जो दृश्य डेटा का विश्लेषण करने में अत्यधिक प्रभावी साबित हुए हैं। सीएनएन का विकास ऐसे मॉडल बनाने की आवश्यकता से प्रेरित था जो छवियों को सटीक रूप से वर्गीकृत और वर्गीकृत कर सके, और इस डोमेन में उनकी सफलता ने ऑब्जेक्ट डिटेक्शन, छवि विभाजन और यहां तक कि प्राकृतिक भाषा प्रसंस्करण जैसे विभिन्न अन्य अनुप्रयोगों में उनके व्यापक उपयोग को जन्म दिया है।
सीएनएन मानव मस्तिष्क में दृश्य कॉर्टेक्स की संरचना और कार्यक्षमता से प्रेरित होते हैं। विज़ुअल कॉर्टेक्स की तरह, सीएनएन में परस्पर जुड़े न्यूरॉन्स की कई परतें होती हैं जो इनपुट डेटा के विभिन्न पहलुओं को संसाधित करती हैं। सीएनएन का मुख्य नवाचार छवियों से प्रासंगिक सुविधाओं को स्वचालित रूप से सीखने और निकालने की उनकी क्षमता में निहित है, जिससे मैन्युअल फीचर इंजीनियरिंग की आवश्यकता समाप्त हो जाती है। यह संकेंद्रित परतों के उपयोग के माध्यम से प्राप्त किया जाता है, जो विभिन्न दृश्य पैटर्न और विशेषताओं, जैसे कि किनारों, कोनों और बनावट का पता लगाने के लिए इनपुट छवि पर फ़िल्टर लागू करता है।
सीएनएन में पहली सफलता यान लेकन एट अल द्वारा लेनेट-5 आर्किटेक्चर की शुरूआत के साथ आई। 1998 में। LeNet-5 को विशेष रूप से हस्तलिखित अंक पहचान के लिए डिज़ाइन किया गया था और इसने MNIST डेटासेट पर उल्लेखनीय प्रदर्शन हासिल किया, जो छवि पहचान एल्गोरिदम के मूल्यांकन के लिए व्यापक रूप से उपयोग किया जाने वाला एक बेंचमार्क डेटासेट है। LeNet-5 ने छवियों से पदानुक्रमित विशेषताओं को कैप्चर करने में CNN की शक्ति का प्रदर्शन किया, जिससे स्केल, रोटेशन और अनुवाद में भिन्नता की उपस्थिति में भी सटीक वर्गीकरण सक्षम हो गया।
तब से, सीएनएन महत्वपूर्ण रूप से विकसित हुए हैं, गहरे और अधिक जटिल आर्किटेक्चर विकसित किए गए हैं। एक उल्लेखनीय प्रगति एलेक्स क्रिज़ेव्स्की और अन्य द्वारा एलेक्सनेट वास्तुकला की शुरूआत थी। 2012 में एलेक्सनेट ने पिछले तरीकों की तुलना में काफी कम त्रुटि दर के साथ इमेजनेट लार्ज स्केल विजुअल रिकग्निशन चैलेंज (आईएलएसवीआरसी) जीतकर छवि वर्गीकरण में एक सफलता हासिल की। इस सफलता ने छवि पहचान कार्यों में सीएनएन को व्यापक रूप से अपनाने का मार्ग प्रशस्त किया।
सीएनएन को अन्य कंप्यूटर विज़न कार्यों में भी सफलतापूर्वक लागू किया गया है। उदाहरण के लिए, ऑब्जेक्ट डिटेक्शन में, सीएनएन को एक छवि के भीतर ऑब्जेक्ट को स्थानीयकृत और वर्गीकृत करने के लिए अतिरिक्त परतों के साथ जोड़ा जा सकता है। रॉस गिर्शिक एट अल द्वारा पेश किया गया प्रसिद्ध क्षेत्र-आधारित कन्वोल्यूशनल न्यूरल नेटवर्क (आर-सीएनएन)। 2014 में ऐसी वास्तुकला का एक उदाहरण है। आर-सीएनएन ने फीचर निष्कर्षण के लिए सीएनएन की शक्ति का लाभ उठाकर और इसे क्षेत्र प्रस्ताव विधियों के साथ जोड़कर ऑब्जेक्ट डिटेक्शन बेंचमार्क पर अत्याधुनिक परिणाम प्राप्त किए।
कन्वेन्शनल न्यूरल नेटवर्क को सबसे पहले कंप्यूटर विज़न के क्षेत्र में छवि पहचान कार्यों के लिए डिज़ाइन किया गया था। उन्होंने मैन्युअल फीचर इंजीनियरिंग की आवश्यकता को समाप्त करते हुए, छवियों से स्वचालित रूप से प्रासंगिक सुविधाओं को सीखकर क्षेत्र में क्रांति ला दी है। सीएनएन के विकास से छवि वर्गीकरण, ऑब्जेक्ट डिटेक्शन और विभिन्न अन्य कंप्यूटर विज़न कार्यों में महत्वपूर्ण प्रगति हुई है।
संबंधित अन्य हालिया प्रश्न और उत्तर EITC/AI/ADL एडवांस्ड डीप लर्निंग:
- हमें मशीन लर्निंग में अनुकूलन लागू करने की आवश्यकता क्यों है?
- ओवरफिटिंग कब होती है?
- क्या कनवल्शनल न्यूरल नेटवर्क समय के साथ कनवल्शन को शामिल करके अनुक्रमिक डेटा को संभाल सकते हैं, जैसा कि कनवल्शनल सीक्वेंस टू सीक्वेंस मॉडल में उपयोग किया जाता है?
- क्या जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) जेनरेटर और डिस्क्रिमिनेटर के विचार पर भरोसा करते हैं?