सांख्यिकीय जानकारी: संग्रह, प्रसंस्करण, विश्लेषण

2024 लेखक: Angel Austin | [email protected]. अंतिम बार संशोधित: 2023-12-17 05:27

सांख्यिकी के इतिहास में, माप के स्तरों की एक वर्गीकरण बनाने के लिए विभिन्न प्रयास किए गए हैं। साइकोफिजिसिस्ट स्टेनली स्मिथ स्टीवंस ने नाममात्र, क्रमिक, अंतराल और आनुपातिक पैमानों को परिभाषित किया।

नाममात्र माप में मूल्यों के बीच रैंक का कोई महत्वपूर्ण क्रम नहीं है और किसी भी एक-से-एक रूपांतरण की अनुमति देता है।

नियमित आयामों में लगातार मूल्यों के बीच सटीक अंतर होता है, लेकिन उन मूल्यों का एक विशिष्ट क्रम होता है और किसी भी आदेश-संरक्षण परिवर्तन की अनुमति देता है।

अंतराल माप में बिंदुओं के बीच सार्थक दूरी होती है, लेकिन शून्य मान मनमाना होता है (जैसा कि सेल्सियस या फ़ारेनहाइट में देशांतर और तापमान माप के मामले में) और किसी भी रैखिक परिवर्तन की अनुमति देता है।

अनुपात आयामों में सार्थक शून्य मान और विभिन्न आयामों के बीच की दूरी दोनों हैं, और किसी भी स्केलिंग परिवर्तन की अनुमति देते हैं।

सूचना का चर और वर्गीकरण

क्योंकि चरकेवल नाममात्र या क्रमिक माप के अनुरूप ही संख्यात्मक रूप से मापा नहीं जा सकता है, और कभी-कभी श्रेणीबद्ध चर के रूप में समूहीकृत किया जाता है। अनुपात और अंतराल माप को मात्रात्मक चर के रूप में वर्गीकृत किया जाता है, जो कि उनकी संख्यात्मक प्रकृति के कारण असतत या निरंतर हो सकता है। इस तरह के भेद अक्सर कंप्यूटर विज्ञान में डेटा प्रकार से शिथिल रूप से संबंधित होते हैं, क्योंकि द्विबीजपत्री श्रेणीबद्ध चर को बूलियन मानों द्वारा दर्शाया जा सकता है, एक अभिन्न डेटा प्रकार में मनमानी पूर्णांक के साथ बहुपत्नी श्रेणीबद्ध चर, और वास्तविक घटकों के साथ निरंतर चर जिसमें फ्लोटिंग पॉइंट गणना शामिल है। लेकिन सांख्यिकीय सूचना डेटा प्रकारों का प्रदर्शन इस बात पर निर्भर करता है कि किस वर्गीकरण को लागू किया गया है।

अन्य वर्गीकरण

सांख्यिकीय डेटा (सूचना) के अन्य वर्गीकरण भी बनाए गए हैं। उदाहरण के लिए, मोस्टेलर और टुके ने ग्रेड, रैंक, गिने गए शेयरों, गणनाओं, राशियों और शेष राशि के बीच अंतर किया। नेल्डर ने एक समय में निरंतर गणना, निरंतर अनुपात, गणनाओं का सहसंबंध, और डेटा संचार करने के स्पष्ट तरीकों का वर्णन किया। इन सभी वर्गीकरण विधियों का उपयोग सांख्यिकीय जानकारी के संग्रह में किया जाता है।

समस्याएं

विभिन्न माप (संग्रह) प्रक्रियाओं के माध्यम से प्राप्त आंकड़ों के लिए विभिन्न प्रकार की सांख्यिकीय विधियों को लागू करना उचित है या नहीं, यह प्रश्न चर के रूपांतरण और प्रश्नों की सटीक व्याख्या से संबंधित मुद्दों से जटिल है।अनुसंधान। डेटा और जो वर्णन करता है उसके बीच संबंध केवल इस तथ्य को दर्शाता है कि कुछ प्रकार के सांख्यिकीय बयानों में सत्य मान हो सकते हैं जो कुछ परिवर्तनों के तहत अपरिवर्तनीय नहीं हैं। परिवर्तन पर विचार करने योग्य है या नहीं यह उस प्रश्न पर निर्भर करता है जिसका आप उत्तर देने का प्रयास कर रहे हैं।

डेटा प्रकार क्या है

डेटा प्रकार एक चर की शब्दार्थ सामग्री का एक मूलभूत घटक है और यह नियंत्रित करता है कि चर का वर्णन करने के लिए किस प्रकार के संभाव्यता वितरण का तार्किक रूप से उपयोग किया जा सकता है, उस पर अनुमत संचालन, प्रतिगमन विश्लेषण का प्रकार इसका अनुमान लगाने के लिए उपयोग किया जाता है, आदि। डेटा प्रकार की अवधारणा माप स्तर की अवधारणा पर समान है, लेकिन अधिक विशिष्ट - उदाहरण के लिए, डेटा गणना के लिए गैर-ऋणात्मक वास्तविक मानों की तुलना में एक अलग वितरण (पॉइसन या द्विपद) की आवश्यकता होती है, लेकिन दोनों एक ही के अंतर्गत आते हैं माप का स्तर (गुणांक पैमाना)।

तराजू

सांख्यिकीय सूचनाओं को संसाधित करने के लिए माप स्तरों की एक वर्गीकरण बनाने के लिए कई प्रयास किए गए हैं। साइकोफिजिसिस्ट स्टेनली स्मिथ स्टीवंस ने नाममात्र, क्रमिक, अंतराल और आनुपातिक पैमानों को परिभाषित किया। नाममात्र माप में मूल्यों के बीच रैंक का एक महत्वपूर्ण क्रम नहीं होता है और किसी भी एक-से-एक रूपांतरण की अनुमति देता है। साधारण मापन में क्रमिक मानों के बीच सटीक अंतर होता है, लेकिन उन मानों के महत्वपूर्ण क्रम में अंतर होता है, और अनुमति देते हैंकोई भी आदेश-संरक्षण परिवर्तन। अंतराल माप में माप के बीच सार्थक दूरी होती है, लेकिन शून्य मान मनमाना होता है (जैसा कि देशांतर और तापमान माप के मामले में सेल्सियस या फ़ारेनहाइट में होता है) और किसी भी रैखिक परिवर्तन की अनुमति देता है। अनुपात आयामों में एक सार्थक शून्य मान और विभिन्न परिभाषित आयामों के बीच की दूरी दोनों हैं, और किसी भी स्केलिंग परिवर्तन के लिए अनुमति देते हैं।

डेटा जिसे एकल संख्या का उपयोग करके वर्णित नहीं किया जा सकता है, उसे अक्सर वास्तविक यादृच्छिक चर के यादृच्छिक वैक्टर में शामिल किया जाता है, हालांकि उन्हें स्वयं संसाधित करने की प्रवृत्ति बढ़ रही है। ऐसे उदाहरणों पर नीचे चर्चा की जाएगी।

यादृच्छिक वैक्टर

व्यक्तिगत तत्व सहसंबद्ध हो भी सकते हैं और नहीं भी। सहसंबद्ध यादृच्छिक वैक्टर का वर्णन करने के लिए उपयोग किए जाने वाले वितरण के उदाहरण बहुभिन्नरूपी सामान्य वितरण और बहुभिन्नरूपी टी-वितरण हैं। सामान्य तौर पर, किसी भी तत्व के बीच मनमाने ढंग से सहसंबंध हो सकते हैं, हालांकि यह अक्सर एक निश्चित आकार से ऊपर असहनीय हो जाता है, जिससे संबंधित घटकों पर अतिरिक्त बाधाओं की आवश्यकता होती है।

रैंडम मैट्रिसेस

यादृच्छिक मैट्रिक्स को रैखिक रूप से व्यवस्थित किया जा सकता है और यादृच्छिक वैक्टर के रूप में माना जा सकता है, हालांकि यह विभिन्न तत्वों के बीच सहसंबंधों का प्रतिनिधित्व करने का एक प्रभावी तरीका नहीं हो सकता है। कुछ संभाव्यता वितरण विशेष रूप से यादृच्छिक मैट्रिक्स के लिए डिज़ाइन किए गए हैं, जैसे कि सामान्य मैट्रिक्सवितरण और विशार्ट वितरण।

यादृच्छिक अनुक्रम

कभी-कभी उन्हें यादृच्छिक वैक्टर के समान माना जाता है, लेकिन अन्य मामलों में यह शब्द विशेष रूप से उन मामलों पर लागू होता है जहां प्रत्येक यादृच्छिक चर केवल पास के चर के साथ सहसंबंधित होता है (जैसा कि मार्कोव मॉडल में)। यह बायेसियन नेटवर्क का एक विशेष मामला है और इसका उपयोग बहुत लंबे अनुक्रमों के लिए किया जाता है, जैसे कि जीन चेन या लंबे टेक्स्ट दस्तावेज़। कई मॉडल विशेष रूप से ऐसे अनुक्रमों के लिए डिज़ाइन किए गए हैं, जैसे छिपे हुए मार्कोव अनुक्रम।

यादृच्छिक प्रक्रियाएं

वे यादृच्छिक अनुक्रमों के समान हैं, लेकिन केवल तभी जब अनुक्रम की लंबाई अनिश्चित या अनंत हो, और अनुक्रम में तत्वों को एक-एक करके संसाधित किया जाता है। यह अक्सर डेटा के लिए उपयोग किया जाता है जिसे समय श्रृंखला के रूप में वर्णित किया जा सकता है। यह सच है, उदाहरण के लिए, अगले दिन शेयर की कीमत।

निष्कर्ष

सांख्यिकीय जानकारी का विश्लेषण पूरी तरह से इसके संग्रह की गुणवत्ता पर निर्भर करता है। उत्तरार्द्ध, बदले में, इसके वर्गीकरण की संभावनाओं से दृढ़ता से संबंधित है। बेशक, सांख्यिकीय जानकारी के कई प्रकार के वर्गीकरण हैं, जो पाठक इस लेख को पढ़ते समय स्वयं देख सकते हैं। फिर भी, प्रभावी उपकरणों की उपस्थिति और गणित की एक अच्छी कमान, साथ ही समाजशास्त्र के क्षेत्र में ज्ञान, अपना काम करेंगे, जिससे आप त्रुटि के लिए महत्वपूर्ण सुधार के बिना कोई भी सर्वेक्षण या अध्ययन कर सकते हैं। प्रपत्र में सांख्यिकीय जानकारी के स्रोतसौभाग्य से, लोगों, संगठनों और समाजशास्त्र के अन्य विषयों का प्रतिनिधित्व बहुत अधिक मात्रा में किया जाता है। और एक सच्चे खोजकर्ता के रास्ते में कोई कठिनाई नहीं आ सकती।