आँकड़ों में परिकल्पना परीक्षण एक आवश्यक प्रक्रिया है। एक परिकल्पना परीक्षण यह निर्धारित करने के लिए दो परस्पर अनन्य कथनों का मूल्यांकन करता है कि कौन सा कथन नमूना डेटा द्वारा सबसे अच्छा समर्थित है। जब किसी निष्कर्ष को सांख्यिकीय रूप से महत्वपूर्ण कहा जाता है, तो यह एक परिकल्पना परीक्षण के कारण होता है।
सत्यापन के तरीके
सांख्यिकीय परिकल्पना के परीक्षण के तरीके सांख्यिकीय विश्लेषण के तरीके हैं। आम तौर पर, आंकड़ों के दो सेट की तुलना की जाती है, या एक नमूना डेटा सेट की तुलना एक आदर्श मॉडल से सिंथेटिक डेटा सेट से की जाती है। डेटा की व्याख्या इस तरह से की जानी चाहिए कि नए अर्थ जोड़े जा सकें। आप अंतिम परिणाम की एक निश्चित संरचना मानकर और धारणा की पुष्टि या अस्वीकार करने के लिए सांख्यिकीय विधियों का उपयोग करके उनकी व्याख्या कर सकते हैं। धारणा को एक परिकल्पना कहा जाता है, और इस उद्देश्य के लिए उपयोग किए जाने वाले सांख्यिकीय परीक्षणों को सांख्यिकीय परिकल्पना कहा जाता है।
H0 और H1 परिकल्पना
दो मुख्य हैंपरिकल्पनाओं के सांख्यिकीय परीक्षण की अवधारणाएँ - तथाकथित "मुख्य, या अशक्त परिकल्पना" और "वैकल्पिक परिकल्पना"। उन्हें नेमन-पियर्सन परिकल्पना भी कहा जाता है। सांख्यिकीय परीक्षण धारणा को शून्य परिकल्पना, मुख्य परिकल्पना या संक्षेप में H0 कहा जाता है। इसे अक्सर डिफ़ॉल्ट धारणा या इस धारणा के रूप में जाना जाता है कि कुछ भी नहीं बदला है। एक परीक्षण धारणा उल्लंघन को अक्सर पहली परिकल्पना, वैकल्पिक परिकल्पना या H1 के रूप में जाना जाता है। H1 किसी अन्य परिकल्पना के लिए आशुलिपि है, क्योंकि हम इसके बारे में केवल इतना जानते हैं कि H0 डेटा को खारिज किया जा सकता है।
शून्य परिकल्पना को अस्वीकार या अस्वीकार करने से पहले, परीक्षा परिणाम की व्याख्या की जानी चाहिए। एक तुलना को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है यदि डेटासेट के बीच संबंध थ्रेशोल्ड प्रायिकता - महत्व के स्तर के अनुसार अशक्त परिकल्पना के कार्यान्वयन की संभावना नहीं है। सांख्यिकीय परिकल्पना परीक्षण के लिए अच्छाई-की-फिट मानदंड भी हैं। यह परिकल्पना परीक्षण मानदंड का नाम है, जो अज्ञात वितरण के कथित कानून से जुड़ा है। यह अनुभवजन्य और सैद्धांतिक वितरण के बीच विसंगति का एक संख्यात्मक उपाय है।
सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए प्रक्रिया और मानदंड
सबसे आम परिकल्पना चयन विधियाँ या तो अकाइक सूचना मानदंड या बायेसियन गुणांक पर आधारित हैं। सांख्यिकीय परिकल्पना परीक्षण, अनुमान और बायेसियन अनुमान दोनों में एक महत्वपूर्ण तकनीक है, हालांकि दोनों प्रकारों में उल्लेखनीय अंतर हैं। सांख्यिकीय परिकल्पना परीक्षणएक प्रक्रिया को परिभाषित करें जो गलत डिफ़ॉल्ट या शून्य परिकल्पना पर गलत तरीके से निर्णय लेने की संभावना को नियंत्रित करती है। प्रक्रिया इस बात पर आधारित है कि इसके काम करने की कितनी संभावना है। गलत निर्णय लेने की यह संभावना यह असंभवता है कि शून्य परिकल्पना सत्य है और कोई विशेष वैकल्पिक परिकल्पना मौजूद नहीं है। परीक्षण यह नहीं दिखा सकता कि यह सही है या गलत।
निर्णय सिद्धांत के वैकल्पिक तरीके
निर्णय सिद्धांत के वैकल्पिक तरीके मौजूद हैं, जिसमें शून्य और पहली परिकल्पना को अधिक समान स्तर पर माना जाता है। अन्य निर्णय लेने के दृष्टिकोण, जैसे कि बायेसियन सिद्धांत, एकल शून्य परिकल्पना पर ध्यान केंद्रित करने के बजाय सभी संभावनाओं में खराब निर्णयों के परिणामों को संतुलित करने का प्रयास करते हैं। कौन सी परिकल्पना सही है, यह तय करने के लिए कई अन्य दृष्टिकोण डेटा पर आधारित हैं, उनमें से किसमें वांछित गुण हैं। लेकिन विज्ञान के कई क्षेत्रों में डेटा विश्लेषण के लिए परिकल्पना परीक्षण प्रमुख दृष्टिकोण है।
सांख्यिकीय परिकल्पना का परीक्षण
जब भी परिणामों का एक सेट दूसरे सेट से भिन्न होता है, तो किसी को सांख्यिकीय परिकल्पना परीक्षण या सांख्यिकीय परिकल्पना परीक्षण पर भरोसा करना चाहिए। उनकी व्याख्या के लिए पी-मानों और महत्वपूर्ण मूल्यों की उचित समझ की आवश्यकता होती है। यह समझना भी महत्वपूर्ण है कि, महत्व के स्तर की परवाह किए बिना, परीक्षणों में अभी भी त्रुटियां हो सकती हैं। इसलिए, निष्कर्ष सही नहीं हो सकता है।
परीक्षण प्रक्रिया में शामिल हैंएकाधिक चरण:
- अनुसंधान के लिए एक प्रारंभिक परिकल्पना बनाई जा रही है।
- प्रासंगिक शून्य और वैकल्पिक परिकल्पनाओं का संकेत दिया गया है।
- परीक्षण में नमूने के बारे में सांख्यिकीय मान्यताओं की व्याख्या करता है।
- यह निर्धारित करना कि कौन सा परीक्षण उपयुक्त है।
- महत्व स्तर और प्रायिकता सीमा का चयन करें जिसके नीचे शून्य परिकल्पना अस्वीकृत हो जाएगी।
- शून्य परिकल्पना परीक्षण आँकड़ों का वितरण उन संभावित मूल्यों को दर्शाता है जिन पर शून्य परिकल्पना अस्वीकृत होती है।
- गणना चल रही है।
- एक विकल्प के पक्ष में शून्य परिकल्पना को अस्वीकार या स्वीकार करने का निर्णय लिया जाता है।
एक विकल्प है जो p-मान का उपयोग करता है।
महत्व परीक्षण
शुद्ध डेटा व्याख्या के बिना किसी व्यावहारिक उपयोग का नहीं है। आंकड़ों में, जब डेटा के बारे में प्रश्न पूछने और परिणामों की व्याख्या करने की बात आती है, तो उत्तरों की सटीकता या संभावना सुनिश्चित करने के लिए सांख्यिकीय विधियों का उपयोग किया जाता है। सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय, विधियों के इस वर्ग को सांख्यिकीय परीक्षण या महत्व परीक्षण कहा जाता है। "परिकल्पना" शब्द वैज्ञानिक तरीकों की याद दिलाता है, जहां परिकल्पनाओं और सिद्धांतों की जांच की जाती है। आँकड़ों में, एक परिकल्पना परीक्षण के परिणामस्वरूप दी गई धारणा दी गई मात्रा होती है। यह आपको यह व्याख्या करने की अनुमति देता है कि क्या कोई धारणा सही है या उल्लंघन किया गया है।
परीक्षणों की सांख्यिकीय व्याख्या
परिकल्पना परीक्षणयह निर्धारित करने के लिए उपयोग किया जाता है कि कौन से शोध परिणाम महत्व के पूर्व निर्धारित स्तर के लिए शून्य परिकल्पना को अस्वीकार कर देंगे। एक सांख्यिकीय परिकल्पना परीक्षण के परिणामों की व्याख्या की जानी चाहिए ताकि उस पर काम जारी रह सके। सांख्यिकीय परिकल्पना परीक्षण मानदंड के दो सामान्य रूप हैं। ये पी-वैल्यू और क्रिटिकल वैल्यू हैं। चयनित मानदंड के आधार पर, प्राप्त परिणामों की अलग-अलग व्याख्या की जानी चाहिए।
पी-वैल्यू क्या है
पी-वैल्यू की व्याख्या करते समय आउटपुट को सांख्यिकीय रूप से महत्वपूर्ण बताया गया है। वास्तव में, इस सूचक का अर्थ है त्रुटि की संभावना यदि शून्य परिकल्पना को खारिज कर दिया जाता है। दूसरे शब्दों में, इसका उपयोग उस मूल्य को नाम देने के लिए किया जा सकता है जिसका उपयोग किसी परीक्षा परिणाम की व्याख्या या मात्रा निर्धारित करने के लिए किया जा सकता है, और शून्य परिकल्पना को अस्वीकार करने में त्रुटि की संभावना का निर्धारण करने के लिए किया जा सकता है। उदाहरण के लिए, आप डेटा के नमूने पर एक सामान्यता परीक्षण कर सकते हैं और पा सकते हैं कि इसके बाहर होने की संभावना बहुत कम है। हालांकि, शून्य परिकल्पना को अस्वीकार करने की आवश्यकता नहीं है। एक सांख्यिकीय परिकल्पना परीक्षण एक पी-मान लौटा सकता है। यह p के मान की तुलना एक पूर्व निर्धारित थ्रेशोल्ड मान से किया जाता है जिसे महत्व स्तर कहा जाता है।
महत्व का स्तर
महत्व का स्तर अक्सर ग्रीक लोअरकेस अक्षर "अल्फा" के साथ लिखा जाता है। अल्फा के लिए इस्तेमाल किया जाने वाला सामान्य मूल्य 5% या 0.05 है। एक छोटा अल्फा मान शून्य परिकल्पना की अधिक विश्वसनीय व्याख्या का सुझाव देता है। पी-मान की तुलना से की जाती हैपूर्व-चयनित अल्फा मान। परिणाम सांख्यिकीय रूप से महत्वपूर्ण है यदि पी-मान अल्फा से कम है। महत्व स्तर को एक से घटाकर उलटा किया जा सकता है। यह देखे गए नमूना डेटा को देखते हुए परिकल्पना के विश्वास स्तर को निर्धारित करने के लिए किया जाता है। सांख्यिकीय परिकल्पनाओं के परीक्षण की इस पद्धति का उपयोग करते समय, P-मान संभाव्य है। इसका मतलब यह है कि एक सांख्यिकीय परीक्षण के परिणाम की व्याख्या करने की प्रक्रिया में, कोई नहीं जानता कि क्या सही है या गलत।
सांख्यिकीय परिकल्पना परीक्षण सिद्धांत
अशक्त परिकल्पना को अस्वीकार करने का अर्थ है कि पर्याप्त सांख्यिकीय प्रमाण हैं कि यह संभव दिखता है। अन्यथा, इसका मतलब है कि इसे अस्वीकार करने के लिए पर्याप्त आंकड़े नहीं हैं। अशक्त परिकल्पना को अस्वीकार करने और स्वीकार करने के द्विभाजन के संदर्भ में कोई सांख्यिकीय परीक्षणों के बारे में सोच सकता है। शून्य परिकल्पना के सांख्यिकीय परीक्षण का खतरा यह है कि यदि स्वीकार किया जाता है, तो यह सच हो सकता है। इसके बजाय, यह कहना अधिक सही होगा कि शून्य परिकल्पना को अस्वीकार नहीं किया गया है क्योंकि इसे अस्वीकार करने के लिए पर्याप्त सांख्यिकीय प्रमाण नहीं हैं।
यह पल अक्सर नौसिखियों को भ्रमित करता है। ऐसे मामले में, अपने आप को यह याद दिलाना महत्वपूर्ण है कि परिणाम संभाव्य है और शून्य परिकल्पना को स्वीकार करने पर भी त्रुटि की एक छोटी सी संभावना है।
सच या गलत शून्य परिकल्पना
p के मान की व्याख्या का अर्थ यह नहीं है कि शून्यपरिकल्पना सत्य है या असत्य। इसका मतलब यह है कि अनुभवजन्य डेटा और चुने हुए सांख्यिकीय परीक्षण के आधार पर सांख्यिकीय महत्व के एक निश्चित स्तर पर शून्य परिकल्पना को अस्वीकार या अस्वीकार करने का विकल्प बनाया गया है। इसलिए, पी-मान को सांख्यिकीय परीक्षणों में अंतर्निहित पूर्व निर्धारित धारणा के तहत दिए गए डेटा की संभावना के रूप में माना जा सकता है। पी-वैल्यू एक माप है कि यदि शून्य परिकल्पना सत्य है तो डेटा नमूना कितनी संभावना है।
महत्वपूर्ण मूल्यों की व्याख्या
कुछ परीक्षण वापस नहीं आते हैं। इसके बजाय, वे महत्वपूर्ण मानों की सूची लौटा सकते हैं। इस तरह के अध्ययन के परिणामों की इसी तरह व्याख्या की जाती है। महत्व के पूर्व निर्धारित स्तर के साथ एकल पी-मान की तुलना करने के बजाय, परीक्षण आंकड़े की तुलना एक महत्वपूर्ण मूल्य से की जाती है। यदि यह कम हो जाता है, तो इसका मतलब है कि शून्य परिकल्पना को अस्वीकार करना संभव नहीं था। यदि इससे अधिक या बराबर हो तो शून्य परिकल्पना को अस्वीकृत कर देना चाहिए। सांख्यिकीय परिकल्पना परीक्षण एल्गोरिथ्म का अर्थ और उसके परिणाम की व्याख्या p-मान के समान है। चुना गया महत्व का स्तर डेटा दिए गए आधार परीक्षण धारणा को अस्वीकार या अस्वीकार करने का एक संभावित निर्णय है।
सांख्यिकीय परीक्षणों में त्रुटियां
सांख्यिकीय परिकल्पना परीक्षण की व्याख्या संभाव्य है। सांख्यिकीय परिकल्पनाओं के परीक्षण का कार्य सत्य या असत्य कथन का पता लगाना नहीं है। परीक्षण साक्ष्य गलत हो सकता है। उदाहरण के लिए, यदि अल्फ़ा 5% था, तो इसका अर्थ है कि अधिकांश भाग के लिए 20 में से 1शून्य परिकल्पना गलती से अस्वीकृत हो जाएगी। या यह डेटा नमूने में सांख्यिकीय शोर के कारण नहीं होगा। इस बिंदु को देखते हुए, एक छोटा पी मान जिस पर शून्य परिकल्पना को अस्वीकार करने का मतलब यह हो सकता है कि यह गलत है या कोई त्रुटि हुई है। यदि इस प्रकार की त्रुटि की जाती है, तो परिणाम को गलत सकारात्मक कहा जाता है। और ऐसी त्रुटि सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय पहली तरह की त्रुटि है। दूसरी ओर, यदि पी-मान शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त बड़ा है, तो इसका मतलब यह हो सकता है कि यह सच है। या सही नहीं है, और कुछ असंभावित घटना घटी जिसके कारण त्रुटि हुई। इस प्रकार की त्रुटि को गलत नकारात्मक कहा जाता है।
त्रुटियों की संभावना
सांख्यिकीय परिकल्पनाओं का परीक्षण करते समय, इनमें से किसी भी प्रकार की त्रुटि होने की संभावना बनी रहती है। गलत डेटा या गलत निष्कर्ष की काफी संभावना है। आदर्श रूप से, एक महत्व स्तर चुना जाना चाहिए जो इनमें से किसी एक त्रुटि की संभावना को कम करता है। उदाहरण के लिए, शून्य परिकल्पनाओं के सांख्यिकीय परीक्षण का महत्व बहुत कम हो सकता है। हालांकि महत्व स्तर जैसे 0.05 और 0.01 विज्ञान के कई क्षेत्रों में आम हैं, सबसे अधिक इस्तेमाल किया जाने वाला महत्व स्तर 310^-7, या 0.0000003 है। इसे अक्सर "5-सिग्मा" कहा जाता है। इसका मतलब यह है कि निष्कर्ष यादृच्छिक था जिसमें प्रयोगों के 3.5 मिलियन स्वतंत्र दोहराव में से 1 की संभावना थी। सांख्यिकीय परिकल्पनाओं के परीक्षण के उदाहरणों में अक्सर ऐसी त्रुटियां होती हैं। यही कारण है कि स्वतंत्र परिणाम होना भी जरूरी है।सत्यापन।
सांख्यिकीय सत्यापन का उपयोग करने के उदाहरण
व्यवहार में परिकल्पना परीक्षण के कई सामान्य उदाहरण हैं। सबसे लोकप्रिय में से एक "चाय चखने" के रूप में जाना जाता है। बॉयोमीट्रिक्स के संस्थापक रॉबर्ट फिशर के एक सहयोगी डॉ. म्यूरियल ब्रिस्टल ने यह सुनिश्चित करने में सक्षम होने का दावा किया कि क्या इसे पहले एक कप चाय या दूध में जोड़ा गया था। फिशर ने उसे यादृच्छिक रूप से आठ कप (प्रत्येक किस्म के चार) देने की पेशकश की। परीक्षण आँकड़ा सरल था: एक कप चुनने में सफलताओं की संख्या गिनना। महत्वपूर्ण क्षेत्र 4 में से एकमात्र सफलता थी, संभवतः सामान्य संभाव्यता मानदंड (< 5%; 1 में 70 1.4%) के आधार पर। फिशर ने तर्क दिया कि एक वैकल्पिक परिकल्पना की आवश्यकता नहीं है। महिला ने प्रत्येक कप की सही पहचान की, जिसे सांख्यिकीय रूप से महत्वपूर्ण परिणाम माना गया। इस अनुभव ने फिशर की पुस्तक सांख्यिकीय विधियों के शोधकर्ताओं के लिए प्रेरित किया।
प्रतिवादी उदाहरण
सांख्यिकीय परीक्षण प्रक्रिया एक आपराधिक अदालत से तुलनीय है जहां प्रतिवादी को दोषी साबित होने तक निर्दोष माना जाता है। अभियोजक प्रतिवादी के अपराध को साबित करने की कोशिश करता है। आरोप के लिए पर्याप्त सबूत होने पर ही प्रतिवादी को दोषी पाया जा सकता है। प्रक्रिया की शुरुआत में, दो परिकल्पनाएँ हैं: "प्रतिवादी दोषी नहीं है" और "प्रतिवादी दोषी है।" निर्दोषता की परिकल्पना को केवल तभी खारिज किया जा सकता है जब त्रुटि की संभावना बहुत कम हो क्योंकि कोई निर्दोष प्रतिवादी को दोषी नहीं ठहराना चाहता। इस तरह की त्रुटि को टाइप I त्रुटि कहा जाता है, और इसकी घटनाशायद ही कभी नियंत्रित। इस असममित व्यवहार के परिणामस्वरूप, टाइप II त्रुटि, यानी अपराधी को बरी करना, अधिक सामान्य है।
आंकड़े बड़ी मात्रा में डेटा का विश्लेषण करते समय उपयोगी होते हैं। यह परिकल्पना के परीक्षण पर समान रूप से लागू होता है, जो किसी भी वैज्ञानिक सिद्धांत के मौजूद न होने पर भी निष्कर्षों को सही ठहरा सकता है। चाय चखने के उदाहरण में, यह "स्पष्ट" था कि चाय में दूध डालने या दूध में चाय डालने में कोई अंतर नहीं था।
परिकल्पना परीक्षण के वास्तविक व्यावहारिक अनुप्रयोग में शामिल हैं:
- परीक्षण करना कि क्या पुरुषों को महिलाओं की तुलना में अधिक बुरे सपने आते हैं;
- दस्तावेज़ एट्रिब्यूशन;
- पूर्णिमा के व्यवहार पर प्रभाव का आकलन करना;
- उस सीमा का निर्धारण करना जिसमें चमगादड़ एक प्रतिध्वनि का उपयोग करके कीट का पता लगा सकता है;
- धूम्रपान छोड़ने का सबसे अच्छा साधन चुनना;
- जांचना कि क्या बम्पर स्टिकर कार मालिक के व्यवहार को दर्शाते हैं।
सांख्यिकीय परिकल्पना परीक्षण सामान्य रूप से और सांख्यिकीय अनुमान में आँकड़ों में एक महत्वपूर्ण भूमिका निभाता है। मूल्य परीक्षण का उपयोग वैज्ञानिक पद्धति के मूल में अनुमानित मूल्य और प्रयोगात्मक परिणाम की पारंपरिक तुलना के प्रतिस्थापन के रूप में किया जाता है। जब एक सिद्धांत केवल एक रिश्ते के संकेत की भविष्यवाणी करने में सक्षम होता है, तो निर्देशित परिकल्पना परीक्षणों को इस तरह से कॉन्फ़िगर किया जा सकता है कि केवल एक सांख्यिकीय रूप से महत्वपूर्ण परिणाम सिद्धांत का समर्थन करता है। मूल्यांकन सिद्धांत का यह रूप सबसे कठोर हैपरिकल्पना परीक्षण के प्रयोग की आलोचना।