लॉजिस्टिक रिग्रेशन: मॉडल और तरीके

विषयसूची:

लॉजिस्टिक रिग्रेशन: मॉडल और तरीके
लॉजिस्टिक रिग्रेशन: मॉडल और तरीके
Anonim

लॉजिस्टिक रिग्रेशन और विभेदक विश्लेषण के तरीकों का उपयोग तब किया जाता है जब लक्षित श्रेणियों द्वारा उत्तरदाताओं को स्पष्ट रूप से अलग करना आवश्यक होता है। इस मामले में, समूहों को स्वयं एक एकल-संस्करण पैरामीटर के स्तरों द्वारा दर्शाया जाता है। आइए लॉजिस्टिक रिग्रेशन मॉडल पर करीब से नज़र डालें और पता करें कि इसकी आवश्यकता क्यों है।

संभार तन्त्र परावर्तन
संभार तन्त्र परावर्तन

सामान्य जानकारी

एक समस्या का एक उदाहरण जिसमें लॉजिस्टिक रिग्रेशन का उपयोग किया जाता है, उत्तरदाताओं का उन समूहों में वर्गीकरण है जो सरसों खरीदते हैं और नहीं खरीदते हैं। भेदभाव सामाजिक-जनसांख्यिकीय विशेषताओं के अनुसार किया जाता है। इनमें शामिल हैं, विशेष रूप से, उम्र, लिंग, रिश्तेदारों की संख्या, आय, आदि। संचालन में, भेदभाव मानदंड और एक चर हैं। उत्तरार्द्ध लक्ष्य श्रेणियों को एन्कोड करता है, जिसमें वास्तव में, उत्तरदाताओं को विभाजित किया जाना चाहिए।

बारीकियां

यह कहा जाना चाहिए कि जिन मामलों में लॉजिस्टिक रिग्रेशन लागू किया जाता है, वे भेदभावपूर्ण विश्लेषण की तुलना में बहुत संकीर्ण हैं। इस संबंध में, बाद के उपयोग को भेदभाव की एक सार्वभौमिक विधि के रूप में माना जाता हैअधिक पसंदीदा। इसके अलावा, विशेषज्ञ भेदभावपूर्ण विश्लेषण के साथ वर्गीकरण अध्ययन शुरू करने की सलाह देते हैं। और केवल परिणामों के बारे में अनिश्चितता के मामले में, आप लॉजिस्टिक रिग्रेशन का उपयोग कर सकते हैं। यह आवश्यकता कई कारकों के कारण है। लॉजिस्टिक रिग्रेशन का उपयोग तब किया जाता है जब स्वतंत्र और आश्रित चर के प्रकार की स्पष्ट समझ हो। तदनुसार, 3 संभावित प्रक्रियाओं में से एक का चयन किया जाता है। विभेदक विश्लेषण में, शोधकर्ता हमेशा एक स्थिर ऑपरेशन से निपटता है। इसमें किसी भी प्रकार के पैमाने के साथ एक आश्रित और कई स्वतंत्र श्रेणीबद्ध चर शामिल हैं।

दृश्य

एक सांख्यिकीय अध्ययन का कार्य जो लॉजिस्टिक रिग्रेशन का उपयोग करता है, यह संभावना निर्धारित करना है कि एक विशेष प्रतिवादी को एक विशेष समूह को सौंपा जाएगा। कुछ मापदंडों के अनुसार भेदभाव किया जाता है। व्यवहार में, एक या अधिक स्वतंत्र कारकों के मूल्यों के अनुसार, उत्तरदाताओं को दो समूहों में वर्गीकृत करना संभव है। इस मामले में, बाइनरी लॉजिस्टिक रिग्रेशन होता है। इसके अलावा, निर्दिष्ट मापदंडों का उपयोग दो से अधिक के समूहों में विभाजित करते समय किया जा सकता है। ऐसी स्थिति में मल्टीनोमियल लॉजिस्टिक रिग्रेशन होता है। परिणामी समूह एकल चर के स्तरों में व्यक्त किए जाते हैं।

संभार तन्त्र परावर्तन
संभार तन्त्र परावर्तन

उदाहरण

मान लें कि उत्तरदाताओं के पास इस सवाल के जवाब हैं कि क्या वे मास्को के उपनगरीय इलाके में एक भूमि भूखंड खरीदने के प्रस्ताव में रुचि रखते हैं। विकल्प "नहीं" हैंऔर हां। यह पता लगाना आवश्यक है कि संभावित खरीदारों के निर्णय पर किन कारकों का प्रमुख प्रभाव पड़ता है। ऐसा करने के लिए, उत्तरदाताओं से क्षेत्र के बुनियादी ढांचे, राजधानी की दूरी, साइट के क्षेत्र, आवासीय भवन की उपस्थिति / अनुपस्थिति आदि के बारे में प्रश्न पूछे जाते हैं। बाइनरी रिग्रेशन का उपयोग करके, वितरित करना संभव है उत्तरदाताओं को दो समूहों में पहले में वे लोग शामिल होंगे जो अधिग्रहण में रुचि रखते हैं - संभावित खरीदार, और दूसरा, क्रमशः, जो इस तरह के प्रस्ताव में रुचि नहीं रखते हैं। प्रत्येक प्रतिवादी के लिए, इसके अलावा, एक या किसी अन्य श्रेणी को सौंपे जाने की संभावना की गणना की जाएगी।

तुलनात्मक विशेषताएं

उपरोक्त दो विकल्पों में अंतर समूहों की अलग-अलग संख्या और आश्रित और स्वतंत्र चर के प्रकार का है। बाइनरी रिग्रेशन में, उदाहरण के लिए, एक या अधिक स्वतंत्र स्थितियों पर एक द्विबीजपत्री कारक की निर्भरता का अध्ययन किया जाता है। इसके अलावा, उत्तरार्द्ध में किसी भी प्रकार का पैमाना हो सकता है। बहुपद प्रतिगमन को इस वर्गीकरण विकल्प का एक रूपांतर माना जाता है। इसमें 2 से अधिक समूह आश्रित चर के हैं। स्वतंत्र कारकों में या तो एक क्रमिक या नाममात्र का पैमाना होना चाहिए।

एसपीएसएस में लॉजिस्टिक रिग्रेशन

सांख्यिकीय पैकेज 11-12 में विश्लेषण का एक नया संस्करण पेश किया गया - क्रमिक। इस पद्धति का उपयोग तब किया जाता है जब आश्रित कारक एक ही नाम (क्रमिक) पैमाने से संबंधित होता है। इस मामले में, एक विशिष्ट प्रकार के स्वतंत्र चर का चयन किया जाता है। वे या तो सामान्य या नाममात्र होना चाहिए। कई श्रेणियों में वर्गीकरण को सबसे अधिक माना जाता हैसार्वभौमिक। इस पद्धति का उपयोग उन सभी अध्ययनों में किया जा सकता है जो लॉजिस्टिक रिग्रेशन का उपयोग करते हैं। हालांकि, एक मॉडल की गुणवत्ता में सुधार करने का एकमात्र तरीका तीनों तकनीकों का उपयोग करना है।

पर्याप्तता गुणवत्ता जांच और लॉजिस्टिक रिग्रेशन
पर्याप्तता गुणवत्ता जांच और लॉजिस्टिक रिग्रेशन

साधारण वर्गीकरण

यह कहा जाना चाहिए कि पहले सांख्यिकीय पैकेज में क्रमिक पैमाने के साथ आश्रित कारकों के लिए विशेष विश्लेषण करने की कोई विशिष्ट संभावना नहीं थी। 2 से अधिक समूहों वाले सभी चर के लिए, बहुराष्ट्रीय संस्करण का उपयोग किया गया था। अपेक्षाकृत हाल ही में पेश किए गए क्रमिक विश्लेषण में कई विशेषताएं हैं। वे पैमाने की बारीकियों को ध्यान में रखते हैं। इस बीच, शिक्षण सहायता में, क्रमिक लॉजिस्टिक प्रतिगमन को अक्सर एक अलग तकनीक के रूप में नहीं माना जाता है। यह निम्नलिखित के कारण है: बहुपद पर क्रमिक विश्लेषण का कोई महत्वपूर्ण लाभ नहीं है। शोधकर्ता बाद वाले का उपयोग क्रमिक और नाममात्र आश्रित चर दोनों की उपस्थिति में कर सकता है। इसी समय, वर्गीकरण प्रक्रियाएं स्वयं एक दूसरे से लगभग भिन्न नहीं होती हैं। इसका मतलब है कि क्रमिक विश्लेषण करने से कोई कठिनाई नहीं होगी।

विश्लेषण विकल्प

आइए एक साधारण मामले पर विचार करें - बाइनरी रिग्रेशन। मान लीजिए, विपणन अनुसंधान की प्रक्रिया में, एक निश्चित महानगरीय विश्वविद्यालय के स्नातकों की मांग का आकलन किया जाता है। प्रश्नावली में उत्तरदाताओं से प्रश्न पूछे गए, जिनमें शामिल हैं:

  1. क्या आप नौकरीपेशा हैं? (क्यूएल)।
  2. स्नातक वर्ष दर्ज करें (क्यू 21)।
  3. औसत क्या हैस्नातक स्कोर (औसत)।
  4. लिंग (क्यू22)।

लॉजिस्टिक रिग्रेशन स्वतंत्र कारकों के औसत, क्यू 21 और क्यू 22 के वैरिएबल ql पर प्रभाव का मूल्यांकन करेगा। सीधे शब्दों में कहें, विश्लेषण का उद्देश्य क्षेत्र, स्नातक के वर्ष और जीपीए के बारे में जानकारी के आधार पर स्नातकों के संभावित रोजगार का निर्धारण करना होगा।

लॉजिस्टिक सिग्मॉइड रिग्रेशन इंडिकेटर
लॉजिस्टिक सिग्मॉइड रिग्रेशन इंडिकेटर

लॉजिस्टिक रिग्रेशन

बाइनरी रिग्रेशन का उपयोग करके पैरामीटर सेट करने के लिए, एनालिसिस►रिग्रेशन►बाइनरी लॉजिस्टिक मेनू का उपयोग करें। लॉजिस्टिक रिग्रेशन विंडो में, बाईं ओर उपलब्ध चर की सूची से आश्रित कारक का चयन करें। यह क्यूएल है। इस वेरिएबल को डिपेंडेंट फील्ड में रखा जाना चाहिए। उसके बाद, कोवरिएट्स प्लॉट में स्वतंत्र कारकों को पेश करना आवश्यक है - क्यू 21, क्यू 22, औसत। फिर आपको यह चुनना होगा कि उन्हें अपने विश्लेषण में कैसे शामिल किया जाए। यदि स्वतंत्र कारकों की संख्या 2 से अधिक है, तो सभी चर के एक साथ परिचय की विधि, जो डिफ़ॉल्ट रूप से सेट की गई है, का उपयोग किया जाता है, लेकिन चरण दर चरण। सबसे लोकप्रिय तरीका बैकवर्ड:एलआर है। चयन करें बटन का उपयोग करके, आप अध्ययन में सभी उत्तरदाताओं को नहीं, बल्कि केवल एक विशिष्ट लक्ष्य श्रेणी को शामिल कर सकते हैं।

श्रेणीबद्ध चर परिभाषित करें

श्रेणीबद्ध बटन का उपयोग तब किया जाना चाहिए जब स्वतंत्र चर में से एक 2 से अधिक श्रेणियों के साथ नाममात्र का हो। इस स्थिति में, श्रेणीबद्ध चर परिभाषित करें विंडो में, केवल इस तरह के एक पैरामीटर को श्रेणीबद्ध सहसंयोजक अनुभाग पर रखा गया है। इस उदाहरण में, ऐसा कोई चर नहीं है। उसके बाद, ड्रॉप-डाउन सूची में कंट्रास्ट इस प्रकार हैविचलन आइटम का चयन करें और बदलें बटन दबाएं। परिणामस्वरूप, प्रत्येक नाममात्र कारक से कई आश्रित चर बनेंगे। उनकी संख्या प्रारंभिक स्थिति की श्रेणियों की संख्या से मेल खाती है।

नए चर सहेजें

अध्ययन के मुख्य डायलॉग बॉक्स में सेव बटन का उपयोग करके नए मापदंडों का निर्माण निर्धारित किया जाता है। उनमें प्रतिगमन प्रक्रिया में परिकलित संकेतक शामिल होंगे। विशेष रूप से, आप वेरिएबल बना सकते हैं जो परिभाषित करते हैं:

  1. एक विशिष्ट वर्गीकरण श्रेणी (समूह सदस्यता) से संबंधित।
  2. प्रत्येक अध्ययन समूह (संभावनाएं) के लिए एक उत्तरदाता को नियुक्त करने की प्रायिकता।

विकल्प बटन का उपयोग करते समय शोधकर्ता को कोई महत्वपूर्ण विकल्प नहीं मिलता है। तदनुसार, इसे अनदेखा किया जा सकता है। "ओके" बटन पर क्लिक करने के बाद, विश्लेषण के परिणाम मुख्य विंडो में प्रदर्शित होंगे।

लॉजिस्टिक रिग्रेशन गुणांक
लॉजिस्टिक रिग्रेशन गुणांक

पर्याप्तता और लॉजिस्टिक रिग्रेशन के लिए गुणवत्ता जांच

मॉडल गुणांक तालिका के सर्वग्राही परीक्षण पर विचार करें। यह मॉडल के सन्निकटन की गुणवत्ता के विश्लेषण के परिणाम प्रदर्शित करता है। इस तथ्य के कारण कि चरण-दर-चरण विकल्प सेट किया गया था, आपको अंतिम चरण (चरण 2) के परिणामों को देखने की आवश्यकता है। एक सकारात्मक परिणाम पर विचार किया जाएगा यदि उच्च स्तर के महत्व पर अगले चरण में जाने पर ची-स्क्वायर संकेतक में वृद्धि पाई जाती है (Sig. < 0.05)। मॉडल लाइन में मॉडल की गुणवत्ता का मूल्यांकन किया जाता है। यदि एक नकारात्मक मूल्य प्राप्त किया जाता है, लेकिन इसे मॉडल की समग्र उच्च भौतिकता के साथ महत्वपूर्ण नहीं माना जाता है, तो अंतिमव्यावहारिक रूप से उपयुक्त माना जा सकता है।

टेबल्स

मॉडल सारांश कुल विचरण सूचकांक का अनुमान लगाना संभव बनाता है, जो कि निर्मित मॉडल (आर स्क्वायर इंडेक्स) द्वारा वर्णित है। Nagelker मान का उपयोग करने की अनुशंसा की जाती है। Nagelkerke R Square पैरामीटर को एक सकारात्मक संकेतक माना जा सकता है यदि यह 0.50 से ऊपर है। उसके बाद, वर्गीकरण के परिणामों का मूल्यांकन किया जाता है, जिसमें अध्ययन के तहत एक या दूसरी श्रेणी से संबंधित होने के वास्तविक संकेतकों की तुलना प्रतिगमन मॉडल के आधार पर पूर्वानुमानित संकेतकों से की जाती है। इसके लिए वर्गीकरण तालिका का उपयोग किया जाता है। यह हमें विचाराधीन प्रत्येक समूह के लिए भेदभाव की शुद्धता के बारे में निष्कर्ष निकालने की भी अनुमति देता है।

लॉजिस्टिक रिग्रेशन मॉडल
लॉजिस्टिक रिग्रेशन मॉडल

निम्न तालिका विश्लेषण में दर्ज किए गए स्वतंत्र कारकों के सांख्यिकीय महत्व के साथ-साथ प्रत्येक गैर-मानक लॉजिस्टिक प्रतिगमन गुणांक का पता लगाने का अवसर प्रदान करती है। इन संकेतकों के आधार पर, नमूने में प्रत्येक प्रतिवादी के किसी विशेष समूह से संबंधित होने की भविष्यवाणी करना संभव है। सहेजें बटन का उपयोग करके, आप नए चर दर्ज कर सकते हैं। उनमें एक विशेष वर्गीकरण श्रेणी (पूर्वानुमानित श्रेणी) से संबंधित जानकारी और इन समूहों में शामिल होने की संभावना (पूर्वानुमानित संभावनाएं सदस्यता) के बारे में जानकारी होगी। "ओके" पर क्लिक करने के बाद, गणना के परिणाम मल्टीनोमियल लॉजिस्टिक रिग्रेशन की मुख्य विंडो में दिखाई देंगे।

पहली तालिका, जिसमें शोधकर्ता के लिए महत्वपूर्ण संकेतक शामिल हैं, मॉडल फिटिंग सूचना है। उच्च स्तर का सांख्यिकीय महत्व उच्च गुणवत्ता का संकेत देगा औरव्यावहारिक समस्याओं को हल करने में मॉडल का उपयोग करने की उपयुक्तता। एक अन्य महत्वपूर्ण तालिका छद्म आर-स्क्वायर है। यह आपको निर्भर कारक में कुल भिन्नता के अनुपात का अनुमान लगाने की अनुमति देता है, जो विश्लेषण के लिए चुने गए स्वतंत्र चर द्वारा निर्धारित किया जाता है। संभावना अनुपात परीक्षण तालिका के अनुसार, हम बाद के सांख्यिकीय महत्व के बारे में निष्कर्ष निकाल सकते हैं। पैरामीटर अनुमान गैर-मानकीकृत गुणांक दर्शाते हैं। इनका उपयोग समीकरण के निर्माण में किया जाता है। इसके अलावा, चर के प्रत्येक संयोजन के लिए, आश्रित कारक पर उनके प्रभाव का सांख्यिकीय महत्व निर्धारित किया गया था। इस बीच, विपणन अनुसंधान में, उत्तरदाताओं को व्यक्तिगत रूप से नहीं, बल्कि लक्ष्य समूह के हिस्से के रूप में श्रेणी के आधार पर अलग करना आवश्यक हो जाता है। इसके लिए, प्रेक्षित और पूर्वानुमानित फ़्रीक्वेंसी तालिका का उपयोग किया जाता है।

व्यावहारिक अनुप्रयोग

व्यापारियों के काम में विश्लेषण की मानी गई पद्धति का व्यापक रूप से उपयोग किया जाता है। 1991 में, लॉजिस्टिक सिग्मॉइड रिग्रेशन इंडिकेटर विकसित किया गया था। यह "अधिक गरम" होने से पहले संभावित कीमतों की भविष्यवाणी करने के लिए उपयोग में आसान और प्रभावी उपकरण है। संकेतक को चार्ट पर दो समानांतर रेखाओं द्वारा गठित चैनल के रूप में दिखाया गया है। वे प्रवृत्ति से समान रूप से दूरी पर हैं। कॉरिडोर की चौड़ाई पूरी तरह से समय सीमा पर निर्भर करेगी। मुद्रा जोड़े से लेकर कीमती धातुओं तक - लगभग सभी संपत्तियों के साथ काम करते समय संकेतक का उपयोग किया जाता है।

एसपीएसएस में लॉजिस्टिक रिग्रेशन
एसपीएसएस में लॉजिस्टिक रिग्रेशन

व्यवहार में, उपकरण का उपयोग करने के लिए 2 प्रमुख रणनीतियां विकसित की गई हैं: ब्रेकआउट के लिए औरएक मोड़ के लिए। बाद के मामले में, व्यापारी चैनल के भीतर मूल्य परिवर्तन की गतिशीलता पर ध्यान केंद्रित करेगा। जैसे ही मूल्य समर्थन या प्रतिरोध रेखा के करीब पहुंचता है, इस संभावना पर दांव लगाया जाता है कि आंदोलन विपरीत दिशा में शुरू होगा। अगर कीमत ऊपरी सीमा के करीब आती है, तो आप संपत्ति से छुटकारा पा सकते हैं। अगर यह निचली सीमा पर है, तो आपको खरीदारी के बारे में सोचना चाहिए। ब्रेकआउट रणनीति में ऑर्डर का उपयोग शामिल है। वे अपेक्षाकृत कम दूरी पर सीमा के बाहर स्थापित होते हैं। यह ध्यान में रखते हुए कि कुछ मामलों में कीमत थोड़े समय के लिए उनका उल्लंघन करती है, आपको इसे सुरक्षित खेलना चाहिए और स्टॉप लॉस सेट करना चाहिए। उसी समय, निश्चित रूप से, चुनी हुई रणनीति की परवाह किए बिना, व्यापारी को उस स्थिति को समझने और मूल्यांकन करने की आवश्यकता होती है जो बाजार में यथासंभव शांति से उत्पन्न हुई है।

निष्कर्ष

इस प्रकार, लॉजिस्टिक रिग्रेशन का उपयोग आपको दिए गए मापदंडों के अनुसार उत्तरदाताओं को जल्दी और आसानी से श्रेणियों में वर्गीकृत करने की अनुमति देता है। विश्लेषण करते समय, आप किसी विशेष विधि का उपयोग कर सकते हैं। विशेष रूप से, बहुराष्ट्रीय प्रतिगमन सार्वभौमिक है। हालांकि, विशेषज्ञ संयोजन में ऊपर वर्णित सभी विधियों का उपयोग करने की सलाह देते हैं। यह इस तथ्य के कारण है कि इस मामले में मॉडल की गुणवत्ता काफी अधिक होगी। यह, बदले में, इसके अनुप्रयोग की सीमा का विस्तार करेगा।

सिफारिश की: