गणितीय सांख्यिकी एक पद्धति है जो आपको अनिश्चित परिस्थितियों में सूचित निर्णय लेने की अनुमति देती है। डेटा एकत्र करने और व्यवस्थित करने के तरीकों का अध्ययन, बड़े पैमाने पर यादृच्छिकता के साथ प्रयोगों और प्रयोगों के अंतिम परिणामों को संसाधित करना, और किसी भी पैटर्न की खोज करना गणित की यह शाखा है। गणितीय आँकड़ों की बुनियादी अवधारणाओं पर विचार करें।
संभाव्यता सिद्धांत के साथ अंतर
गणितीय आँकड़ों की विधियाँ संभाव्यता सिद्धांत के साथ घनिष्ठ रूप से प्रतिच्छेद करती हैं। गणित की दोनों शाखाएँ अनेक यादृच्छिक परिघटनाओं का अध्ययन करती हैं। दो विषय सीमा प्रमेयों से जुड़े हुए हैं। हालाँकि, इन विज्ञानों में एक बड़ा अंतर है। यदि संभाव्यता सिद्धांत गणितीय मॉडल के आधार पर वास्तविक दुनिया में एक प्रक्रिया की विशेषताओं को निर्धारित करता है, तो गणितीय आंकड़े इसके विपरीत करते हैं - यह मॉडल के गुणों को सेट करता हैदेखी गई जानकारी के आधार पर।
कदम
गणितीय आँकड़ों का अनुप्रयोग केवल यादृच्छिक घटनाओं या प्रक्रियाओं के संबंध में किया जा सकता है, या बल्कि, उनके अवलोकन से प्राप्त आंकड़ों के लिए किया जा सकता है। और यह कई चरणों में होता है। सबसे पहले, प्रयोगों और प्रयोगों का डेटा कुछ प्रसंस्करण से गुजरता है। उन्हें स्पष्टता और विश्लेषण में आसानी के लिए आदेश दिया गया है। फिर देखी गई यादृच्छिक प्रक्रिया के आवश्यक मापदंडों का सटीक या अनुमानित अनुमान लगाया जाता है। वे हो सकते हैं:
- एक घटना की संभावना का आकलन (इसकी संभावना शुरू में अज्ञात है);
- एक अनिश्चित वितरण समारोह के व्यवहार का अध्ययन;
- उम्मीद का अनुमान;
- विचरण अनुमान
- आदि.
तीसरा चरण विश्लेषण से पहले निर्धारित किसी भी परिकल्पना का सत्यापन है, अर्थात, इस प्रश्न का उत्तर प्राप्त करना कि प्रयोगों के परिणाम सैद्धांतिक गणना के अनुरूप कैसे हैं। वास्तव में, यह गणितीय सांख्यिकी का मुख्य चरण है। एक उदाहरण यह विचार करना होगा कि क्या किसी प्रेक्षित यादृच्छिक प्रक्रिया का व्यवहार सामान्य वितरण के भीतर है।
जनसंख्या
गणितीय आँकड़ों की बुनियादी अवधारणाओं में सामान्य और नमूना आबादी शामिल हैं। यह अनुशासन कुछ संपत्ति के संबंध में कुछ वस्तुओं के एक समूह के अध्ययन से संबंधित है। एक उदाहरण टैक्सी ड्राइवर का काम है।इन यादृच्छिक चरों पर विचार करें:
- ग्राहकों का भार या संख्या: प्रतिदिन, दोपहर के भोजन से पहले, दोपहर के भोजन के बाद,…;
- यात्रा का औसत समय;
- आने वाले आवेदनों की संख्या या शहर के जिलों से उनका लगाव और भी बहुत कुछ।
यह भी ध्यान देने योग्य है कि समान यादृच्छिक प्रक्रियाओं के एक सेट का अध्ययन करना संभव है, जो एक यादृच्छिक चर भी होगा जिसे देखा जा सकता है।
इसलिए, गणितीय आँकड़ों के तरीकों में, अध्ययन के तहत वस्तुओं का पूरा सेट या किसी वस्तु पर समान परिस्थितियों में किए गए विभिन्न अवलोकनों के परिणामों को सामान्य जनसंख्या कहा जाता है। दूसरे शब्दों में, गणितीय रूप से अधिक सख्ती से, यह एक यादृच्छिक चर है जिसे प्राथमिक घटनाओं के स्थान में परिभाषित किया गया है, जिसमें उपसमुच्चय के एक वर्ग को निर्दिष्ट किया गया है, जिसके तत्वों की एक ज्ञात संभावना है।
नमूना आबादी
ऐसे मामले होते हैं जब किसी कारण (लागत, समय) के लिए प्रत्येक वस्तु का अध्ययन करने के लिए निरंतर अध्ययन करना असंभव या अव्यवहारिक होता है। उदाहरण के लिए, सीलबंद जाम के प्रत्येक जार को उसकी गुणवत्ता की जांच के लिए खोलना एक संदिग्ध निर्णय है, और एक घन मीटर में प्रत्येक वायु अणु के प्रक्षेपवक्र का अनुमान लगाने की कोशिश करना असंभव है। ऐसे मामलों में, चयनात्मक अवलोकन की विधि का उपयोग किया जाता है: सामान्य आबादी से एक निश्चित संख्या में वस्तुओं का चयन (आमतौर पर यादृच्छिक रूप से) किया जाता है, और उनका विश्लेषण किया जाता है।
ये अवधारणाएं पहली बार में जटिल लग सकती हैं। इसलिए, विषय को पूरी तरह से समझने के लिए, आपको V. E. Gmurman द्वारा पाठ्यपुस्तक "संभाव्यता सिद्धांत और गणितीय सांख्यिकी" का अध्ययन करने की आवश्यकता है। इस प्रकार, एक नमूना सेट या नमूना सामान्य सेट से यादृच्छिक रूप से चयनित वस्तुओं की एक श्रृंखला है। सख्त गणितीय शब्दों में, यह स्वतंत्र, समान रूप से वितरित यादृच्छिक चर का एक क्रम है, जिनमें से प्रत्येक के लिए वितरण सामान्य यादृच्छिक चर के संकेत के साथ मेल खाता है।
बुनियादी अवधारणा
आइए गणितीय आँकड़ों की कई अन्य बुनियादी अवधारणाओं पर संक्षेप में विचार करें। सामान्य जनसंख्या या नमूने में वस्तुओं की संख्या को आयतन कहा जाता है। प्रयोग के दौरान प्राप्त होने वाले नमूना मूल्यों को नमूना प्राप्ति कहा जाता है। एक नमूने के आधार पर सामान्य जनसंख्या के अनुमान के विश्वसनीय होने के लिए, एक तथाकथित प्रतिनिधि या प्रतिनिधि नमूना होना महत्वपूर्ण है। इसका मतलब है कि नमूना पूरी तरह से जनसंख्या का प्रतिनिधित्व करना चाहिए। यह तभी प्राप्त किया जा सकता है जब जनसंख्या के सभी तत्वों के नमूने में होने की समान संभावना हो।
नमूने रिटर्न और नॉन-रिटर्न के बीच अंतर करते हैं। पहले मामले में, नमूने की सामग्री में, दोहराए गए तत्व को सामान्य सेट में वापस कर दिया जाता है, दूसरे मामले में, ऐसा नहीं होता है। आमतौर पर, व्यवहार में, प्रतिस्थापन के बिना नमूने का उपयोग किया जाता है। यह भी ध्यान दिया जाना चाहिए कि सामान्य जनसंख्या का आकार हमेशा नमूने के आकार से काफी अधिक होता है। अस्तित्वनमूना प्रक्रिया के लिए कई विकल्प:
- सरल - आइटम बेतरतीब ढंग से एक बार में चुने जाते हैं;
- typed - सामान्य जनसंख्या को प्रकारों में विभाजित किया जाता है, और प्रत्येक से एक विकल्प बनाया जाता है; एक उदाहरण निवासियों का सर्वेक्षण है: पुरुष और महिलाएं अलग-अलग;
- यांत्रिक - उदाहरण के लिए, प्रत्येक 10वें तत्व का चयन करें;
- धारावाहिक - चयन तत्वों की श्रृंखला में किया जाता है।
सांख्यिकीय वितरण
गमरमैन के अनुसार, वैज्ञानिक दुनिया में, विशेष रूप से इसके व्यावहारिक भाग में, संभाव्यता सिद्धांत और गणितीय सांख्यिकी अत्यंत महत्वपूर्ण विषय हैं। नमूने के सांख्यिकीय वितरण पर विचार करें।
मान लीजिए कि हमारे पास छात्रों का एक समूह है, जिनकी गणित में परीक्षा हुई थी। परिणामस्वरूप, हमारे पास अनुमानों का एक सेट है: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - यह हमारी प्राथमिक सांख्यिकीय सामग्री है।
सबसे पहले, हमें इसे क्रमबद्ध करना होगा, या एक रैंकिंग ऑपरेशन करना होगा: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - और इस प्रकार एक भिन्न श्रृंखला प्राप्त करना। प्रत्येक आकलन की पुनरावृत्ति की संख्या को मूल्यांकन आवृत्ति कहा जाता है, और नमूना आकार के अनुपात को सापेक्ष आवृत्ति कहा जाता है। आइए नमूने के सांख्यिकीय वितरण की एक तालिका बनाएं, या केवल एक सांख्यिकीय श्रृंखला बनाएं:
एकमैं | 1 | 2 | 3 | 4 | 5 |
पमैं | 1 | 1 | 2 | 4 | 3 |
या
एकमैं | 1 | 2 | 3 | 4 | 5 |
पमैं | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
चलो एक यादृच्छिक चर है जिस पर हम प्रयोगों की एक श्रृंखला आयोजित करेंगे और देखेंगे कि यह चर क्या मूल्य लेता है। मान लीजिए उसने एक 1 - m1 बार मान लिया; a2 - m2 बार, आदि। इस नमूने का आकार m1 + … + mk=m होगा। समुच्चय ai, जहां i 1 से k तक भिन्न होता है, एक सांख्यिकीय श्रृंखला है।
अंतराल वितरण
वीई गमुरमैन की पुस्तक "प्रायिकता सिद्धांत और गणितीय सांख्यिकी" में एक अंतराल सांख्यिकीय श्रृंखला भी प्रस्तुत की गई है। इसका संकलन तब संभव है जब अध्ययन के तहत फीचर का मूल्य एक निश्चित अंतराल में निरंतर हो, और मूल्यों की संख्या बड़ी हो। छात्रों के एक समूह पर विचार करें, या बल्कि, उनकी ऊंचाई: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - कुल 30 छात्र। जाहिर है, किसी व्यक्ति की ऊंचाई एक निरंतर मूल्य है। हमें अंतराल चरण को परिभाषित करने की आवश्यकता है। इसके लिए स्टर्गेस सूत्र का प्रयोग किया जाता है।
ज= | अधिकतम - न्यूनतम | = | 190 - 156 | = | 33 | = | 5, 59 |
1+लॉग2म | 1+लॉग230 | 5, 9 |
इस प्रकार, 6 का मान अंतराल के आकार के रूप में लिया जा सकता है। यह भी कहा जाना चाहिए कि मान 1+log2m का सूत्र हैअंतराल की संख्या निर्धारित करना (बेशक, गोलाई के साथ)। इस प्रकार, सूत्रों के अनुसार, 6 अंतराल प्राप्त होते हैं, जिनमें से प्रत्येक का आकार 6 होता है। और प्रारंभिक अंतराल का पहला मान सूत्र द्वारा निर्धारित संख्या होगी: न्यूनतम - एच / 2=156 - 6/2=153. आइए एक सारणी बनाते हैं जिसमें अंतराल होंगे और उन छात्रों की संख्या होगी जिनकी वृद्धि एक निश्चित अंतराल के भीतर गिर गई।
एच | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
पी | 2 | 5 | 3 | 9 | 8 | 3 |
पी | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
बेशक, यह सब नहीं है, क्योंकि गणितीय आँकड़ों में बहुत अधिक सूत्र हैं। हमने केवल कुछ बुनियादी अवधारणाओं पर विचार किया है।
वितरण कार्यक्रम
गणितीय आँकड़ों की बुनियादी अवधारणाओं में वितरण का एक चित्रमय प्रतिनिधित्व भी शामिल है, जो स्पष्टता से अलग है। रेखांकन दो प्रकार के होते हैं: बहुभुज और हिस्टोग्राम। पहले का उपयोग असतत सांख्यिकीय श्रृंखला के लिए किया जाता है। और निरंतर वितरण के लिए, क्रमशः दूसरा।