Machine Learning Models In Hindi




Machine Learning Models In Hindi

दोस्तों आजकल Technology के क्षेत्र में इतनी बढ़ोतरी हो चुकी है कि आपके OK Google बोलने पर ही गूगल असिस्टेंट Active हो जाता है. यानी कि आप गूगल असिस्टेंट से बात कर सकते हैं, आप Google assistant से कोई भी सवाल पूछ सकते हैं और कोई भी जानकारी प्राप्त कर सकते हैं. तो यह सब machine learning के अंतर्गत आता है. आजकल Technology के बढ़ते दौर में कई सारी ऐसी खोज हो चुकी है जो कि Impossible को Possible में संभव कर दे रही है. तो ऐसी एक खोज Machine learning भी है जिसने कि हमारी जिंदगी में जुड़कर अहम भूमिका निभाई है. आज के समय में लोगों को लिखना पसंद नहीं है बल्कि बोलना पसंद है. तो लोग कोई भी सर्च बोलकर ही करते हैं ना कि लिखकर तो बोलने की इस संभावना को Machine learning की ही सहायता से बनाया गया है. चलिए बिना देर करें इस Topic पर चर्चा करते हैं. इस पोस्ट में आप मशीन लर्निंग क्या है और कैसे काम करता है और इसके फायदे पूरा पढ़ सकते हैं.

मशीन लर्निंग क्या है – What is Machine learning in Hindi -

मशीन लर्निंग मॉडल को प्रशिक्षण प्रक्रिया के आउटपुट के गणितीय प्रतिनिधित्व के रूप में परिभाषित किया गया है. मशीन लर्निंग विभिन्न एल्गोरिदम का अध्ययन है जो अनुभव और पुराने डेटा के माध्यम से स्वचालित रूप से सुधार कर सकता है और मॉडल का निर्माण कर सकता है. मशीन लर्निंग मॉडल पिछले अनुभव या डेटा के आधार पर पैटर्न या व्यवहार को पहचानने के लिए डिज़ाइन किए गए कंप्यूटर सॉफ़्टवेयर के समान है. लर्निंग एल्गोरिदम प्रशिक्षण डेटा के भीतर पैटर्न की खोज करता है, और यह एक एमएल मॉडल को आउटपुट करता है जो इन पैटर्न को कैप्चर करता है और नए डेटा पर भविष्यवाणियां करता है.

आइए एमएल मॉडल के एक उदाहरण को समझते हैं जहां हम चेहरे के भावों के आधार पर उपयोगकर्ता की भावनाओं को पहचानने के लिए एक ऐप बना रहे हैं. इसलिए, मशीन लर्निंग मॉडल द्वारा इस तरह का ऐप बनाना संभव है, जहां हम एक मॉडल को विभिन्न भावनाओं के साथ चेहरों की छवियों को फीड करके प्रशिक्षित करेंगे. जब भी इस ऐप का उपयोग उपयोगकर्ता के मूड को निर्धारित करने के लिए किया जाता है, तो यह सभी खिलाए गए डेटा को पढ़ता है और फिर किसी भी उपयोगकर्ता के मूड को निर्धारित करता है. इसलिए, सरल शब्दों में, हम कह सकते हैं कि मशीन लर्निंग मॉडल किसी चीज़ या प्रक्रिया का सरलीकृत प्रतिनिधित्व है. इस विषय में, हम विभिन्न मशीन लर्निंग मॉडल और उनकी तकनीकों और एल्गोरिदम पर चर्चा करेंगे.

मशीन लर्निंग क्या है ?

यंत्र अधिगम कंप्यूटर प्रोग्रामिंग की एक ऐसी तकनीक है जिसमें किसी कंप्यूटर प्रोग्राम को इस तरह से डिजाइन किया जाता है की वह प्रोग्राम खुद से नई नई चीजों को सीख सकें और जरूरत पड़ने पर खुद से कोई डिसीजन ले सके.” कंप्यूटर फील्ड की इसी तकनीक को मशीन लर्निंग कहा जाता है. चूंकि मशीन लर्निंग का अर्थ ही होता है मशीन को सीखना या मशीन सीख रहा है. इसमें किसी भी आवेदन या Software को इस तरीके से डेवलप किया जाता है कि उसके प्रोग्राम में बिना किसी तरह का हस्तक्षेप किए हुए नई चीज़ों को Learn कर सकता है और समय आने पर उस डाटा से जुड़ी जानकारी को Predict कर सकता है या Output दे सकता है. मशीन लर्निंग की परिभाषा, परिभाषिक रूप में Machine Learning एक ऐसा अनुप्रयोग है जो सिस्टम को स्पष्ट रूप से बिना प्रोग्राम किए खुद ब खुद सीखने और खुद में सुधार करने की क्षमता प्रदान करती है.

मशीन लर्निंग कैसे काम करता है?

मशीन लर्निंग एल्गोरिदम को डाटा देकर एक मॉडल बनाया जाता है और इस एल्गोरिदम में जब कोई इनपुट आता है तो उसी बनाए गए मॉडल के अनुसार आउटपुट को प्रोवाइड करता है. इसको समझने के लिए आप यूट्यूब का उदाहरण ले सकते है क्योंकि जिसमें अगर आप किसी Topic से जुड़ी चीजों को सर्च करते है या वीडियो देखते है तो उसी के अनुसार आपके यूट्यूब के होमपेज पर वीडियो दिखाईं देंगे. एक तरीके से यूट्यूब आपको आपकी पसंद के हिसाब से वीडियो आपके होमपेज पर दिखाता है. अब ये तो यूट्यूब का कोई Employee नहीं करेगा क्योंकि इसके तो करोड़ों यूज़र है और इसके लिए ना जाने कितने Employee की जरुरत पड़ेगी. ऐसे Task को करने के लिए मशीन लर्निंग का ही इस्तेमाल किया जाता है जो आपके होमपेज को कस्टमाइज़ करता है और आपके ही Searches और एक्टिविटी के अनुसार आपको वीडियो Suggest करता है.

मशीन लर्निंग मॉडल क्या है?

मशीन लर्निंग मॉडल को एक प्रोग्राम के रूप में समझा जा सकता है जिसे नए डेटा के भीतर पैटर्न खोजने और भविष्यवाणियां करने के लिए प्रशिक्षित किया गया है. इन मॉडलों को गणितीय फ़ंक्शन के रूप में दर्शाया जाता है जो इनपुट डेटा के रूप में अनुरोध लेता है, इनपुट डेटा पर भविष्यवाणियां करता है, और फिर प्रतिक्रिया में आउटपुट प्रदान करता है. सबसे पहले, इन मॉडलों को डेटा के एक सेट पर प्रशिक्षित किया जाता है, और फिर उन्हें डेटा पर तर्क करने, फ़ीड डेटा से पैटर्न निकालने और उन डेटा से सीखने के लिए एक एल्गोरिदम प्रदान किया जाता है. एक बार जब ये मॉडल प्रशिक्षित हो जाते हैं, तो इनका उपयोग अनदेखी डेटासेट की भविष्यवाणी करने के लिए किया जा सकता है.

विभिन्न व्यावसायिक लक्ष्यों और डेटा सेट के आधार पर विभिन्न प्रकार के मशीन लर्निंग मॉडल उपलब्ध हैं.

मशीन लर्निंग मॉडल का वर्गीकरण -

विभिन्न व्यावसायिक लक्ष्यों और डेटा सेटों के आधार पर, एल्गोरिदम के लिए तीन शिक्षण मॉडल हैं. प्रत्येक मशीन लर्निंग एल्गोरिदम तीन मॉडलों में से एक में बस जाता है:-

  • पर्यवेक्षित अध्ययन

  • अनुपयोगी शिक्षा

  • सुदृढीकरण सीखना

पर्यवेक्षित शिक्षण को आगे दो श्रेणियों में विभाजित किया गया है:-

  • वर्गीकरण

  • वापसी

अनुपयोगी शिक्षण को भी निम्न श्रेणियों में विभाजित किया गया है:-

  • क्लस्टरिंग

  • एसोसिएशन नियम

  • आयामी कमी

1. पर्यवेक्षित मशीन लर्निंग मॉडल ?

सुपरवाइज्ड लर्निंग यह समझने के लिए सबसे सरल मशीन लर्निंग मॉडल है जिसमें इनपुट डेटा को प्रशिक्षण डेटा कहा जाता है और आउटपुट के रूप में एक ज्ञात लेबल या परिणाम होता है. तो, यह इनपुट-आउटपुट जोड़े के सिद्धांत पर काम करता है. इसके लिए एक फ़ंक्शन बनाने की आवश्यकता होती है जिसे प्रशिक्षण डेटा सेट का उपयोग करके प्रशिक्षित किया जा सकता है, और फिर इसे अज्ञात डेटा पर लागू किया जाता है और कुछ भविष्य कहनेवाला प्रदर्शन करता है. पर्यवेक्षित शिक्षण कार्य-आधारित है और लेबल किए गए डेटा सेट पर परीक्षण किया जाता है. हम साधारण वास्तविक जीवन की समस्याओं पर पर्यवेक्षित शिक्षण मॉडल लागू कर सकते हैं. उदाहरण के लिए, हमारे पास उम्र और ऊंचाई वाला डेटासेट है; फिर, हम व्यक्ति की उम्र के आधार पर उसकी ऊंचाई का अनुमान लगाने के लिए एक पर्यवेक्षित शिक्षण मॉडल बना सकते हैं. पर्यवेक्षित शिक्षण मॉडल को आगे दो श्रेणियों में वर्गीकृत किया गया है:-

वापसी

प्रतिगमन समस्याओं में, आउटपुट एक सतत चर है. आमतौर पर इस्तेमाल किए जाने वाले कुछ रिग्रेशन मॉडल इस प्रकार हैं: -

क) रैखिक प्रतिगमन

रैखिक प्रतिगमन सबसे सरल मशीन लर्निंग मॉडल है जिसमें हम एक या अधिक इनपुट चर का उपयोग करके एक आउटपुट चर की भविष्यवाणी करने का प्रयास करते हैं. रैखिक प्रतिगमन का प्रतिनिधित्व एक रैखिक समीकरण है, जो उन इनपुट मानों के सेट के लिए इनपुट मानों (x) और अनुमानित आउटपुट (y) के एक सेट को जोड़ता है. इसे एक पंक्ति के रूप में दर्शाया गया है: -

Y = bx+ c.

लीनियर रिग्रेशन मॉडल का मुख्य उद्देश्य सबसे अच्छी फिट लाइन ढूंढना है जो डेटा पॉइंट्स के लिए सबसे उपयुक्त हो. रैखिक प्रतिगमन को कई रैखिक प्रतिगमन (सर्वश्रेष्ठ फिट का एक विमान खोजें) और बहुपद प्रतिगमन (सर्वश्रेष्ठ फिट वक्र खोजें) तक बढ़ाया गया है.

बी) निर्णय वृक्ष

निर्णय वृक्ष लोकप्रिय मशीन लर्निंग मॉडल हैं जिनका उपयोग प्रतिगमन और वर्गीकरण समस्याओं दोनों के लिए किया जा सकता है. एक निर्णय वृक्ष अपने संभावित परिणामों और परिणामों के साथ-साथ निर्णयों की एक पेड़ जैसी संरचना का उपयोग करता है. इसमें, प्रत्येक आंतरिक नोड का उपयोग किसी विशेषता पर परीक्षण का प्रतिनिधित्व करने के लिए किया जाता है; प्रत्येक शाखा परीक्षण के परिणाम का प्रतिनिधित्व करने के लिए प्रयोग किया जाता है. निर्णय वृक्ष में जितने अधिक नोड होंगे, परिणाम उतना ही सटीक होगा. निर्णय वृक्षों का लाभ यह है कि वे सहज और कार्यान्वित करने में आसान होते हैं, लेकिन उनमें सटीकता की कमी होती है. निर्णय पेड़ों का व्यापक रूप से संचालन अनुसंधान में उपयोग किया जाता है, विशेष रूप से निर्णय विश्लेषण, रणनीतिक योजना और मुख्य रूप से मशीन सीखने में.

ग) यादृच्छिक वन

रैंडम फ़ॉरेस्ट एक सामूहिक सीखने की विधि है, जिसमें बड़ी संख्या में निर्णय वृक्ष होते हैं. यादृच्छिक वन में प्रत्येक निर्णय वृक्ष एक परिणाम की भविष्यवाणी करता है, और अधिकांश मतों के साथ भविष्यवाणी को परिणाम माना जाता है. एक यादृच्छिक वन मॉडल का उपयोग प्रतिगमन और वर्गीकरण समस्याओं दोनों के लिए किया जा सकता है. वर्गीकरण कार्य के लिए, यादृच्छिक वन का परिणाम अधिकांश मतों से लिया जाता है. जबकि प्रतिगमन कार्य में, परिणाम प्रत्येक पेड़ द्वारा उत्पन्न भविष्यवाणियों के माध्य या औसत से लिया जाता है.

घ) तंत्रिका नेटवर्क

तंत्रिका नेटवर्क मशीन सीखने का सबसेट है और इसे कृत्रिम तंत्रिका नेटवर्क के रूप में भी जाना जाता है. तंत्रिका नेटवर्क कृत्रिम न्यूरॉन्स से बने होते हैं और इस तरह से डिज़ाइन किए जाते हैं जो मानव मस्तिष्क संरचना और कार्य के समान होते हैं. प्रत्येक कृत्रिम न्यूरॉन एक तंत्रिका नेटवर्क में कई अन्य न्यूरॉन्स से जुड़ता है, और ऐसे लाखों जुड़े हुए न्यूरॉन्स एक परिष्कृत संज्ञानात्मक संरचना बनाते हैं. तंत्रिका नेटवर्क में एक बहुपरत संरचना होती है, जिसमें एक इनपुट परत, एक या अधिक छिपी हुई परतें और एक आउटपुट परत होती है. चूंकि प्रत्येक न्यूरॉन दूसरे न्यूरॉन से जुड़ा होता है, यह डेटा को एक परत से दूसरी परत के न्यूरॉन में स्थानांतरित करता है. अंत में, डेटा तंत्रिका नेटवर्क की अंतिम परत या आउटपुट परत तक पहुंचता है और आउटपुट उत्पन्न करता है. तंत्रिका नेटवर्क अपनी सटीकता सीखने और सुधारने के लिए प्रशिक्षण डेटा पर निर्भर करते हैं. हालांकि, एक पूरी तरह से प्रशिक्षित और सटीक तंत्रिका नेटवर्क डेटा को जल्दी से क्लस्टर कर सकता है और एक शक्तिशाली मशीन लर्निंग और एआई टूल बन सकता है. सबसे प्रसिद्ध तंत्रिका नेटवर्क में से एक Google का खोज एल्गोरिथम है.

वर्गीकरण

वर्गीकरण मॉडल दूसरे प्रकार की पर्यवेक्षित शिक्षण तकनीकें हैं, जिनका उपयोग श्रेणीबद्ध रूप में प्रेक्षित मूल्यों से निष्कर्ष निकालने के लिए किया जाता है. उदाहरण के लिए, वर्गीकरण मॉडल यह पहचान सकता है कि ईमेल स्पैम है या नहीं; एक खरीदार उत्पाद खरीदेगा या नहीं, आदि. वर्गीकरण एल्गोरिदम का उपयोग दो वर्गों की भविष्यवाणी करने और आउटपुट को विभिन्न समूहों में वर्गीकृत करने के लिए किया जाता है. वर्गीकरण में, एक क्लासिफायरियर मॉडल डिज़ाइन किया गया है जो डेटासेट को विभिन्न श्रेणियों में वर्गीकृत करता है, और प्रत्येक श्रेणी को एक लेबल दिया जाता है.

मशीन लर्निंग में दो प्रकार के वर्गीकरण हैं: -

बाइनरी वर्गीकरण: यदि समस्या में केवल दो संभावित वर्ग हैं, जिन्हें बाइनरी क्लासिफायरियर कहा जाता है. उदाहरण के लिए, बिल्ली या कुत्ता, हाँ या नहीं, बहु-वर्ग वर्गीकरण: यदि समस्या में दो से अधिक संभावित वर्ग हैं, तो यह एक बहु-वर्ग वर्गीकरण है.

कुछ लोकप्रिय वर्गीकरण एल्गोरिदम नीचे दिए गए हैं: -

लॉजिस्टिक रिग्रेशन

मशीन लर्निंग में वर्गीकरण समस्याओं को हल करने के लिए लॉजिस्टिक रिग्रेशन का उपयोग किया जाता है. वे रैखिक प्रतिगमन के समान हैं लेकिन श्रेणीबद्ध चर की भविष्यवाणी करने के लिए उपयोग किए जाते हैं. यह हां या नहीं, 0 या 1, सही या गलत, आदि में आउटपुट की भविष्यवाणी कर सकता है. हालांकि, सटीक मान देने के बजाय, यह 0 और 1 के बीच संभाव्य मान प्रदान करता है.

समर्थन वेक्टर मशीन

सपोर्ट वेक्टर मशीन या एसवीएम लोकप्रिय मशीन लर्निंग एल्गोरिदम है, जो व्यापक रूप से वर्गीकरण और प्रतिगमन कार्यों के लिए उपयोग किया जाता है. हालांकि, विशेष रूप से, इसका उपयोग वर्गीकरण समस्याओं को हल करने के लिए किया जाता है. एसवीएम का मुख्य उद्देश्य एन-डायमेंशनल स्पेस में सर्वोत्तम निर्णय सीमाओं को खोजना है, जो डेटा बिंदुओं को कक्षाओं में अलग कर सकता है, और सर्वोत्तम निर्णय सीमा को हाइपरप्लेन के रूप में जाना जाता है. SVM हाइपरप्लेन को खोजने के लिए चरम वेक्टर का चयन करता है, और इन वैक्टर को सपोर्ट वैक्टर के रूप में जाना जाता है.

भोले बेयस

Naïve Bayes मशीन लर्निंग में इस्तेमाल किया जाने वाला एक और लोकप्रिय वर्गीकरण एल्गोरिथम है. इसे इसलिए कहा जाता है क्योंकि यह बेयस प्रमेय पर आधारित है और सुविधाओं के बीच भोले (स्वतंत्र) धारणा का अनुसरण करता है जो इस प्रकार है: मशीन लर्निंग मॉडल प्रत्येक भोले बेयस क्लासिफायरियर मानता है कि एक विशिष्ट चर का मान किसी अन्य चर/विशेषता से स्वतंत्र है. उदाहरण के लिए, यदि किसी फल को रंग, आकार और स्वाद के आधार पर वर्गीकृत करने की आवश्यकता है. तो पीला, अंडाकार और मीठा आम के रूप में पहचाना जाएगा. यहां प्रत्येक विशेषता अन्य सुविधाओं से स्वतंत्र है.

अनुपयोगी मशीन लर्निंग मॉडल

अनसुपरवाइज्ड मशीन लर्निंग मॉडल पर्यवेक्षित शिक्षण के विपरीत सीखने की प्रक्रिया को लागू करते हैं, जिसका अर्थ है कि यह मॉडल को बिना लेबल वाले प्रशिक्षण डेटासेट से सीखने में सक्षम बनाता है. लेबल रहित डेटासेट के आधार पर, मॉडल आउटपुट की भविष्यवाणी करता है. बिना पर्यवेक्षित शिक्षण का उपयोग करते हुए, मॉडल बिना किसी पर्यवेक्षण के डेटासेट से छिपे हुए पैटर्न को सीखता है. अनसुपरवाइज्ड लर्निंग मॉडल मुख्य रूप से तीन कार्यों को करने के लिए उपयोग किए जाते हैं, जो इस प्रकार हैं:-

क्लस्टरिंग

क्लस्टरिंग एक गैर-पर्यवेक्षित शिक्षण तकनीक है जिसमें समानता और अंतर के आधार पर डेटा बिंदुओं को अलग-अलग समूहों में क्लस्टर करना या टटोलना शामिल है. सबसे अधिक समानता वाली वस्तुएँ एक ही समूह में रहती हैं, और उनमें अन्य समूहों से बहुत कम या बहुत कम समानताएँ होती हैं. क्लस्टरिंग एल्गोरिदम का व्यापक रूप से विभिन्न कार्यों जैसे छवि विभाजन, सांख्यिकीय डेटा विश्लेषण, बाजार विभाजन आदि में उपयोग किया जा सकता है. आमतौर पर इस्तेमाल किए जाने वाले कुछ क्लस्टरिंग एल्गोरिदम K- साधन क्लस्टरिंग, पदानुक्रमित क्लस्टरिंग, DBSCAN, आदि हैं.

एसोसिएशन नियम सीखना

एसोसिएशन रूल लर्निंग एक अनुपयोगी शिक्षण तकनीक है, जो एक बड़े डेटासेट के भीतर चर के बीच दिलचस्प संबंध ढूंढती है. इस लर्निंग एल्गोरिथम का मुख्य उद्देश्य एक डेटा आइटम की दूसरे डेटा आइटम पर निर्भरता का पता लगाना और उसके अनुसार उन वेरिएबल्स को मैप करना है ताकि यह अधिकतम लाभ उत्पन्न कर सके. यह एल्गोरिथ्म मुख्य रूप से मार्केट बास्केट विश्लेषण, वेब उपयोग खनन, निरंतर उत्पादन आदि में लागू होता है. एसोसिएशन रूल लर्निंग के कुछ लोकप्रिय एल्गोरिदम एप्रियोरी एल्गोरिथम, एक्लैट, एफपी-ग्रोथ एल्गोरिथम हैं.

आयामी कमी

डेटासेट में मौजूद सुविधाओं/चरों की संख्या को डेटासेट की डाइमेंशन के रूप में जाना जाता है, और डाइमेंशन को कम करने के लिए इस्तेमाल की जाने वाली तकनीक को डाइमेंशन कम करने की तकनीक के रूप में जाना जाता है. हालांकि अधिक डेटा अधिक सटीक परिणाम प्रदान करता है, यह मॉडल/एल्गोरिदम के प्रदर्शन को भी प्रभावित कर सकता है, जैसे कि ओवरफिटिंग मुद्दे. ऐसे मामलों में, आयामीता में कमी तकनीकों का उपयोग किया जाता है. "यह उच्च आयामों वाले डेटासेट को कम आयाम वाले डेटासेट में परिवर्तित करने की एक प्रक्रिया है जो सुनिश्चित करता है कि यह समान जानकारी प्रदान करता है." पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस), सिंगुलर वैल्यू डीकंपोजिशन आदि जैसे विभिन्न आयामी कमी के तरीके.

प्रशिक्षण मशीन लर्निंग मॉडल ?

एक बार मशीन लर्निंग मॉडल बन जाने के बाद, उचित परिणाम प्राप्त करने के लिए इसे प्रशिक्षित किया जाता है. मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए, किसी को बड़ी मात्रा में पूर्व-संसाधित डेटा की आवश्यकता होती है. यहां पूर्व-संसाधित डेटा का अर्थ है संरचित रूप में कम अशक्त मूल्यों के साथ डेटा, आदि. यदि हम पूर्व-संसाधित डेटा प्रदान नहीं करते हैं, तो इस बात की बहुत अधिक संभावना है कि हमारा मॉडल बहुत खराब प्रदर्शन कर सकता है.

मशीन लर्निंग मॉडल क्या है?

मशीन लर्निंग मॉडल एक फाइल है जिसे कुछ प्रकार के पैटर्न को पहचानने के लिए प्रशिक्षित किया गया है. आप डेटा के एक सेट पर एक मॉडल को प्रशिक्षित करते हैं, इसे एक एल्गोरिथम प्रदान करते हैं जिसका उपयोग वह तर्क करने और उन डेटा से सीखने के लिए कर सकता है. एक बार जब आप मॉडल को प्रशिक्षित कर लेते हैं, तो आप इसका उपयोग उस डेटा पर तर्क करने के लिए कर सकते हैं जिसे उसने पहले नहीं देखा है, और उन डेटा के बारे में भविष्यवाणियां कर सकते हैं. उदाहरण के लिए, मान लें कि आप एक ऐसा एप्लिकेशन बनाना चाहते हैं जो उपयोगकर्ता की भावनाओं को उनके चेहरे के भावों के आधार पर पहचान सके. आप एक मॉडल को चेहरों की छवियों के साथ प्रदान करके प्रशिक्षित कर सकते हैं, जिनमें से प्रत्येक को एक निश्चित भावना के साथ टैग किया गया है, और फिर आप उस मॉडल का उपयोग किसी ऐसे एप्लिकेशन में कर सकते हैं जो किसी भी उपयोगकर्ता की भावना को पहचान सके. ऐसे एप्लिकेशन के उदाहरण के लिए इमोजी 8 का नमूना देखें.

मशीन लर्निंग का उपयोग कब करें ?

अच्छे मशीन लर्निंग परिदृश्यों में अक्सर निम्नलिखित सामान्य गुण होते हैं. उनमें एक दोहराया निर्णय या मूल्यांकन शामिल होता है जिसे आप स्वचालित करना चाहते हैं और लगातार परिणाम की आवश्यकता होती है. किसी निर्णय के पीछे के समाधान या मानदंड का स्पष्ट रूप से वर्णन करना कठिन या असंभव है. आपने डेटा, या मौजूदा उदाहरणों को लेबल किया है जहां आप स्थिति का वर्णन कर सकते हैं और इसे सही परिणाम पर मैप कर सकते हैं. विंडोज मशीन लर्निंग अपने मॉडलों के लिए ओपन न्यूरल नेटवर्क एक्सचेंज (ओएनएनएक्स) प्रारूप का उपयोग करता है. आप एक पूर्व-प्रशिक्षित मॉडल डाउनलोड कर सकते हैं, या आप अपने स्वयं के मॉडल को प्रशिक्षित कर सकते हैं. अधिक जानकारी के लिए Windows ML के लिए ONNX मॉडल प्राप्त करें देखें.

मशीन लर्निंग में "मॉडल" क्या है

मशीन लर्निंग में एक "मॉडल" डेटा पर चलने वाले मशीन लर्निंग एल्गोरिदम का आउटपुट है. एक मॉडल मशीन लर्निंग एल्गोरिथम द्वारा सीखी गई बातों का प्रतिनिधित्व करता है. मॉडल "चीज" है जिसे प्रशिक्षण डेटा पर मशीन लर्निंग एल्गोरिदम चलाने के बाद सहेजा जाता है और भविष्यवाणी करने के लिए आवश्यक नियमों, संख्याओं और किसी भी अन्य एल्गोरिदम-विशिष्ट डेटा संरचनाओं का प्रतिनिधित्व करता है.

कुछ उदाहरण इसे स्पष्ट कर सकते हैं:-

रैखिक प्रतिगमन एल्गोरिथ्म एक मॉडल में परिणाम देता है जिसमें विशिष्ट मूल्यों के साथ गुणांक के वेक्टर शामिल होते हैं.

डिसीजन ट्री एल्गोरिथम एक मॉडल में परिणत होता है जिसमें विशिष्ट मूल्यों के साथ अगर-तब बयानों का एक ट्री शामिल होता है.

तंत्रिका नेटवर्क / बैकप्रोपेगेशन / ग्रेडिएंट डिसेंट एल्गोरिदम एक साथ एक मॉडल में परिणत होते हैं जिसमें विशिष्ट मूल्यों के साथ वैक्टर या भार के मैट्रिस के साथ एक ग्राफ संरचना शामिल होती है.

एक मशीन लर्निंग मॉडल एक शुरुआत के लिए अधिक चुनौतीपूर्ण है क्योंकि कंप्यूटर विज्ञान में अन्य एल्गोरिदम के साथ एक स्पष्ट सादृश्य नहीं है.

उदाहरण के लिए, सॉर्टिंग एल्गोरिदम का सॉर्ट किया गया सूची आउटपुट वास्तव में एक मॉडल नहीं है.

मशीन लर्निंग मॉडल को "प्रोग्राम" के रूप में सोचना सबसे अच्छा सादृश्य है. मशीन लर्निंग मॉडल "प्रोग्राम" में डेटा और भविष्यवाणी करने के लिए डेटा का उपयोग करने की प्रक्रिया दोनों शामिल हैं. उदाहरण के लिए, रैखिक प्रतिगमन एल्गोरिथ्म और परिणामी मॉडल पर विचार करें. मॉडल में गुणांक (डेटा) का एक वेक्टर शामिल होता है जिसे भविष्यवाणी (पूर्वानुमान प्रक्रिया) बनाने के लिए इनपुट के रूप में लिए गए नए डेटा की एक पंक्ति के साथ गुणा और सारांशित किया जाता है. हम बाद में उपयोग के लिए मशीन लर्निंग मॉडल के लिए डेटा सहेजते हैं. हम अक्सर मशीन लर्निंग लाइब्रेरी द्वारा प्रदान किए गए मशीन लर्निंग मॉडल के लिए भविष्यवाणी प्रक्रिया का उपयोग करते हैं. कभी-कभी हम अपने आवेदन के हिस्से के रूप में भविष्यवाणी प्रक्रिया को स्वयं लागू कर सकते हैं. यह अक्सर करना आसान होता है क्योंकि अधिकांश भविष्यवाणी प्रक्रियाएं काफी सरल होती हैं.

मशीन लर्निंग स्वचालित प्रोग्रामिंग है -

हम वास्तव में केवल "मॉडल" सीखने वाली मशीन चाहते हैं और "एल्गोरिदम" केवल वह मार्ग है जिसका हम मॉडल प्राप्त करने के लिए अनुसरण करते हैं. मशीन लर्निंग तकनीकों का उपयोग उन समस्याओं के लिए किया जाता है जिन्हें अन्य तरीकों से कुशलतापूर्वक या प्रभावी ढंग से हल नहीं किया जा सकता है. उदाहरण के लिए, यदि हमें ईमेल को स्पैम के रूप में वर्गीकृत करने की आवश्यकता है या स्पैम के रूप में नहीं, तो हमें ऐसा करने के लिए एक सॉफ़्टवेयर प्रोग्राम की आवश्यकता है. हम बैठ सकते हैं, मैन्युअल रूप से एक टन ईमेल की समीक्षा कर सकते हैं, और इस कार्य को करने के लिए if-statement लिख सकते हैं. लोगों ने कोशिश की है. यह पता चला है कि यह दृष्टिकोण धीमा, नाजुक और बहुत प्रभावी नहीं है.

इसके बजाय, हम इस समस्या को हल करने के लिए मशीन लर्निंग तकनीकों का उपयोग कर सकते हैं. विशेष रूप से, Naive Bayes जैसा एल्गोरिथ्म ईमेल संदेशों को स्पैम के रूप में वर्गीकृत करना सीख सकता है, ईमेल के ऐतिहासिक उदाहरणों के बड़े डेटासेट से स्पैम नहीं. हम "बेवकूफ बेयस" नहीं चाहते हैं. हम चाहते हैं कि Naive Bayes जो मॉडल देता है वह यह है कि हम ईमेल को वर्गीकृत करने के लिए उपयोग कर सकते हैं (संभावनाओं के वैक्टर और उनका उपयोग करने के लिए भविष्यवाणी एल्गोरिथ्म). हम मॉडल चाहते हैं, न कि मॉडल बनाने के लिए इस्तेमाल किया जाने वाला एल्गोरिदम. इस अर्थ में, मशीन लर्निंग मॉडल हमारी समस्या को हल करने के लिए मशीन लर्निंग एल्गोरिदम द्वारा स्वचालित रूप से लिखा या बनाया या सीखा गया एक प्रोग्राम है. डेवलपर्स के रूप में, हम कृत्रिम बुद्धिमत्ता के अर्थ में मशीन लर्निंग एल्गोरिदम द्वारा किए गए "सीखने" में कम रुचि रखते हैं. हम सीखने की प्रक्रियाओं का अनुकरण करने की परवाह नहीं करते हैं. कुछ लोग हो सकते हैं, और यह दिलचस्प है, लेकिन इसलिए हम मशीन लर्निंग एल्गोरिदम का उपयोग नहीं कर रहे हैं. इसके बजाय, हम मशीन लर्निंग एल्गोरिदम द्वारा प्रदान की जाने वाली स्वचालित प्रोग्रामिंग क्षमता में अधिक रुचि रखते हैं. हम चाहते हैं कि एक प्रभावी मॉडल कुशलतापूर्वक बनाया जाए जिसे हम अपने सॉफ्टवेयर प्रोजेक्ट में शामिल कर सकें. मशीन लर्निंग एल्गोरिदम स्वचालित प्रोग्रामिंग करते हैं और मशीन लर्निंग मॉडल हमारे लिए बनाए गए प्रोग्राम हैं.

मशीन लर्निंग मॉडल क्या है?

मशीन लर्निंग मॉडल एक एल्गोरिदम की अभिव्यक्ति है जो पैटर्न खोजने या भविष्यवाणियां करने के लिए डेटा के पहाड़ों के माध्यम से मिलती है. डेटा से प्रेरित, मशीन लर्निंग (एमएल) मॉडल कृत्रिम बुद्धिमत्ता के गणितीय इंजन हैं. उदाहरण के लिए, कंप्यूटर दृष्टि के लिए एक एमएल मॉडल रीयल-टाइम वीडियो में कारों और पैदल चलने वालों की पहचान करने में सक्षम हो सकता है. प्राकृतिक भाषा प्रसंस्करण के लिए शब्दों और वाक्यों का अनुवाद किया जा सकता है. हुड के तहत, एक मशीन लर्निंग मॉडल वस्तुओं और एक दूसरे के साथ उनके संबंधों का गणितीय प्रतिनिधित्व है. वस्तुएं सोशल नेटवर्किंग पोस्ट पर "पसंद" से लेकर प्रयोगशाला प्रयोग में अणुओं तक कुछ भी हो सकती हैं.

मशीन लर्निंग मॉडल और एल्गोरिदम के बीच अंतर -

शुरुआती लोगों के बीच सबसे भ्रमित करने वाले प्रश्नों में से एक यह है कि क्या मशीन लर्निंग मॉडल हैं, और एल्गोरिदम समान हैं? क्योंकि मशीन लर्निंग और डेटा साइंस में विभिन्न मामलों में, इन दो शब्दों का परस्पर उपयोग किया जाता है. इस प्रश्न का उत्तर नहीं है, और मशीन लर्निंग मॉडल एल्गोरिथम के समान नहीं है. एक सरल तरीके से, एक एमएल एल्गोरिदम एक प्रक्रिया या विधि की तरह है जो डेटा से पैटर्न खोजने और मॉडल उत्पन्न करने के लिए चलता है. वहीं, मशीन लर्निंग मॉडल एक कंप्यूटर प्रोग्राम की तरह होता है जो आउटपुट उत्पन्न करता है या भविष्यवाणियां करता है. अधिक विशेष रूप से, जब हम डेटा के साथ एल्गोरिदम को प्रशिक्षित करते हैं, तो यह एक मॉडल बन जाता है.

सबसे अच्छा मॉडल कैसे चुनें?

उपरोक्त खंड में, हमने विभिन्न मशीन लर्निंग मॉडल और एल्गोरिदम पर चर्चा की है. लेकिन एक सबसे भ्रमित करने वाला सवाल जो किसी भी शुरुआत करने वाले के लिए उठ सकता है कि "मुझे कौन सा मॉडल चुनना चाहिए?". तो, इसका उत्तर यह है कि यह मुख्य रूप से व्यावसायिक आवश्यकता या परियोजना की आवश्यकता पर निर्भर करता है. इसके अलावा, यह संबंधित विशेषताओं, उपलब्ध डेटासेट की मात्रा, सुविधाओं की संख्या, जटिलता आदि पर भी निर्भर करता है. हालांकि, व्यवहार में, यह अनुशंसा की जाती है कि हम हमेशा सबसे सरल मॉडल से शुरू करें जिसे विशेष पर लागू किया जा सकता है. समस्या और फिर धीरे-धीरे जटिलता को बढ़ाएं और पैरामीटर ट्यूनिंग और क्रॉस-वेलिडेशन की मदद से सटीकता का परीक्षण करें.