समय श्रृंखला का विश्लेषण और पूर्वानुमान

विषयसूची:

समय श्रृंखला का विश्लेषण और पूर्वानुमान
समय श्रृंखला का विश्लेषण और पूर्वानुमान
Anonim

कई वर्षों से, लोगों ने मौसम की स्थिति, आर्थिक और राजनीतिक घटनाओं और खेल के परिणामों की भविष्यवाणी की है, हाल ही में इस व्यापक सूची को क्रिप्टोकरेंसी के साथ भर दिया गया है। बहुमुखी घटनाओं की भविष्यवाणी करने के लिए, पूर्वानुमान विकसित करने के कई तरीके हैं। उदाहरण के लिए, अंतर्ज्ञान, विशेषज्ञ राय, पारंपरिक आंकड़ों के साथ तुलना करने के लिए पिछले परिणामों का उपयोग करना, और समय श्रृंखला पूर्वानुमान उनमें से एक है, जबकि अनुप्रयोगों की एक विस्तृत श्रृंखला के साथ सबसे आधुनिक और सटीक प्रकार के पूर्वानुमान हैं।

समय श्रृंखला विधि

समय श्रृंखला विधि
समय श्रृंखला विधि

एक समय श्रृंखला (टीएस) विधि एक डेटासेट है जो समय की अवधि में जानकारी एकत्र करती है। इस प्रकार को निकालने के लिए विशेष तरीके हैं:

  • रैखिक और गैर-रैखिक;
  • पैरामीट्रिक और गैर-पैरामीट्रिक;
  • एक आयामी और बहुआयामी।

पूर्वानुमान का समयसीरीज अपने साथ आज की चुनौतियों का सामना करने के लिए क्षमताओं का एक अनूठा सेट लेकर आई है। मॉडलिंग डेटा परिवर्तन के पीछे प्रेरक शक्ति को स्थापित करने के लिए सीखने पर निर्भर करता है। प्रक्रिया लंबी अवधि के रुझानों, मौसमी प्रभावों, या अनियमित उतार-चढ़ाव से आती है जो टीएस की विशेषता है और अन्य प्रकार के विश्लेषण में नहीं देखी जाती है।

मशीन लर्निंग कंप्यूटर विज्ञान की एक शाखा है जहां एल्गोरिदम को डेटा से संकलित किया जाता है और इसमें कृत्रिम तंत्रिका नेटवर्क, गहन शिक्षण, एसोसिएशन नियम, निर्णय पेड़, सुदृढीकरण सीखने और बायेसियन नेटवर्क शामिल होते हैं। विभिन्न प्रकार के एल्गोरिदम समस्याओं को हल करने के लिए विकल्प प्रदान करते हैं, और डेटा इनपुट, गति और परिणामों की सटीकता के संदर्भ में प्रत्येक की अपनी आवश्यकताएं और ट्रेड-ऑफ होते हैं। ये, अंतिम भविष्यवाणियों की सटीकता के साथ, तब भारित होंगे जब उपयोगकर्ता यह तय करेगा कि अध्ययन के तहत स्थिति के लिए कौन सा एल्गोरिदम सबसे अच्छा काम करेगा।

समय श्रृंखला पूर्वानुमान सांख्यिकी के क्षेत्र से उधार लेता है, लेकिन समस्या मॉडलिंग के लिए नए दृष्टिकोण देता है। मशीन लर्निंग और टाइम सीरीज़ की मुख्य समस्या एक ही है - पहले से ज्ञात डेटा के आधार पर नए परिणामों की भविष्यवाणी करना।

भविष्य कहनेवाला मॉडल का लक्ष्य

भविष्य कहनेवाला मॉडल का उद्देश्य
भविष्य कहनेवाला मॉडल का उद्देश्य

TS नियमित अंतराल पर एकत्र किए गए डेटा बिंदुओं का एक समूह है। उनका विश्लेषण दीर्घकालिक प्रवृत्ति निर्धारित करने, भविष्य की भविष्यवाणी करने या किसी अन्य प्रकार के विश्लेषण करने के लिए किया जाता है। 2 चीजें हैं जो TS को सामान्य प्रतिगमन समस्या से अलग बनाती हैं:

  1. वे समय पर निर्भर करते हैं। इसलिएएक रेखीय प्रतीपगमन मॉडल की मूल धारणा कि प्रेक्षण स्वतंत्र हैं, इस मामले में मान्य नहीं है।
  2. बढ़ती या घटती प्रवृत्ति के साथ, अधिकांश TS में किसी न किसी प्रकार की मौसमी होती है, अर्थात परिवर्तन जो एक निश्चित अवधि के लिए विशिष्ट होते हैं।

एक समय श्रृंखला पूर्वानुमान मॉडल का लक्ष्य मांग पर सटीक पूर्वानुमान देना है। समय श्रृंखला में स्वतंत्र चर और लक्ष्य पर निर्भर चर के रूप में समय (t) होता है। ज्यादातर मामलों में, पूर्वानुमान एक विशिष्ट परिणाम होता है, उदाहरण के लिए, एक घर का बिक्री मूल्य, प्रतियोगिता का खेल परिणाम, स्टॉक एक्सचेंज पर व्यापार के परिणाम। भविष्यवाणी माध्यिका और माध्य का प्रतिनिधित्व करती है और इसमें 80-95% की सीमा में विश्वास के स्तर को व्यक्त करने वाला एक विश्वास अंतराल शामिल होता है। जब उन्हें नियमित अंतराल पर दर्ज किया जाता है, तो प्रक्रियाओं को समय श्रृंखला कहा जाता है और दो तरीकों से व्यक्त किया जाता है:

  • एक समय सूचकांक के साथ एक-आयामी जो एक अंतर्निहित क्रम बनाता है;
  • दो आयामों वाला एक सेट: एक स्वतंत्र चर के साथ समय और दूसरा आश्रित चर।

एप्लाइड मशीन लर्निंग में फीचर बनाना सबसे महत्वपूर्ण और समय लेने वाले कार्यों में से एक है। हालांकि, समय श्रृंखला पूर्वानुमान कम से कम पारंपरिक अर्थों में सुविधाओं का निर्माण नहीं करता है। यह विशेष रूप से तब सच होता है जब आप परिणाम की भविष्यवाणी कई कदम आगे करना चाहते हैं, न कि केवल अगले मान के बारे में।

इसका मतलब यह नहीं है कि सुविधाएँ पूरी तरह से अक्षम हैं। उनका उपयोग केवल निम्नलिखित कारणों से सावधानी के साथ किया जाना चाहिए:

  1. अस्पष्ट भविष्य क्या वास्तविकमान इन सुविधाओं के लिए होंगे।
  2. यदि वस्तुएं पूर्वानुमेय हैं और उनमें कुछ पैटर्न हैं, तो आप उनमें से प्रत्येक के लिए एक भविष्य कहनेवाला मॉडल बना सकते हैं।

हालांकि, इस बात से अवगत रहें कि सुविधाओं के रूप में भविष्य कहनेवाला मूल्यों का उपयोग लक्ष्य चर में त्रुटि का प्रसार करेगा और त्रुटियों या पक्षपाती भविष्यवाणियों को जन्म देगा।

समय श्रृंखला घटक

समय श्रृंखला घटक
समय श्रृंखला घटक

प्रवृत्ति तब होती है जब समय के साथ श्रृंखला बढ़ती है, घटती है या स्थिर स्तर पर रहती है, इसलिए इसे एक फ़ंक्शन के रूप में लिया जाता है। मौसमी एक समय श्रृंखला की एक संपत्ति को संदर्भित करता है जो आवधिक पैटर्न प्रदर्शित करता है जो निरंतर आवृत्ति (एम) पर दोहराता है, उदाहरण के लिए, एम=12 का अर्थ है कि पैटर्न हर बारह महीने में दोहराता है।

मौसम के समान डमी चर को बाइनरी फ़ंक्शन के रूप में जोड़ा जा सकता है। उदाहरण के लिए, आप छुट्टियों, विशेष आयोजनों, मार्केटिंग अभियानों को ध्यान में रख सकते हैं, भले ही मूल्य विदेशी हो या नहीं। हालाँकि, आपको यह याद रखने की आवश्यकता है कि इन चरों के कुछ निश्चित पैटर्न होने चाहिए। हालांकि, भविष्य की अवधि के लिए भी दिनों की संख्या की गणना आसानी से की जा सकती है और विशेष रूप से वित्तीय क्षेत्र में समय श्रृंखला पूर्वानुमान को प्रभावित कर सकती है।

साइकिल ऐसे मौसम हैं जो एक निश्चित दर पर नहीं होते हैं। उदाहरण के लिए, कनाडा लिंक्स की वार्षिक प्रजनन विशेषताएँ मौसमी और चक्रीय पैटर्न को दर्शाती हैं। वे नियमित अंतराल पर दोहराते नहीं हैं और आवृत्ति 1 (m=1) होने पर भी हो सकती है।

पिछड़े हुए मान -एक चर के अंतराल मूल्यों को भविष्यवक्ताओं के रूप में शामिल किया जा सकता है। कुछ मॉडल, जैसे ARIMA, वेक्टर ऑटोरेग्रेशन (VAR), या ऑटोरेग्रेसिव न्यूरल नेटवर्क्स (NNAR), इस तरह से काम करते हैं।

समय श्रृंखला विश्लेषण और पूर्वानुमान के लिए, उनके व्यवहार, पैटर्न को समझने और उपयुक्त मॉडल का चयन करने में सक्षम होने के लिए, ब्याज के चर के घटक बहुत महत्वपूर्ण हैं।

डेटा सेट विशेषताएँ

डेटासेट गुण
डेटासेट गुण

आप मशीन लर्निंग मॉडल में हजारों, लाखों और अरबों डेटा पॉइंट दर्ज करने के आदी हो सकते हैं, लेकिन समय श्रृंखला के लिए इसकी आवश्यकता नहीं है। वास्तव में, आवृत्ति और चर के प्रकार के आधार पर छोटे और मध्यम टीएस के साथ काम करना संभव है, और यह विधि का नुकसान नहीं है। इसके अलावा, वास्तव में इस दृष्टिकोण के कई फायदे हैं:

  1. जानकारी के ऐसे सेट घरेलू कंप्यूटर की क्षमताओं के अनुरूप होंगे।
  2. कुछ मामलों में, केवल एक नमूना नहीं, बल्कि संपूर्ण डेटा सेट का उपयोग करके समय श्रृंखला विश्लेषण और पूर्वानुमान करें।
  3. TS लंबाई ऐसे ग्राफ़ बनाने के लिए उपयोगी है जिनका विश्लेषण किया जा सकता है। यह एक बहुत ही महत्वपूर्ण बिंदु है क्योंकि प्रोग्रामर विश्लेषण चरण में ग्राफिक्स पर भरोसा करते हैं। इसका मतलब यह नहीं है कि वे बड़ी समय श्रृंखला के साथ काम नहीं करते हैं, लेकिन शुरू में उन्हें छोटे टीएस को संभालने में सक्षम होना चाहिए।
  4. कोई भी डेटासेट जिसमें समय से संबंधित फ़ील्ड हो, समय श्रृंखला विश्लेषण और पूर्वानुमान से लाभ उठा सकता है। हालाँकि, यदि प्रोग्रामर के पास डेटा का एक बड़ा सेट है, तो DB (TSDB)अधिक उपयुक्त हो सकता है।

इनमें से कुछ सेट टाइमस्टैम्प, सिस्टम लॉग और वित्तीय डेटा के साथ रिकॉर्ड किए गए इवेंट से आते हैं। चूंकि TSDB मूल रूप से समय श्रृंखला के साथ काम करता है, इसलिए इस तकनीक को बड़े पैमाने के डेटासेट पर लागू करने का यह एक शानदार अवसर है।

मशीन लर्निंग

मशीन लर्निंग (एमएल) पारंपरिक समय श्रृंखला पूर्वानुमान विधियों से बेहतर प्रदर्शन कर सकता है। टीएस डेटा पर अधिक शास्त्रीय सांख्यिकीय विधियों के लिए मशीन सीखने के तरीकों की तुलना में बहुत सारे अध्ययन हैं। तंत्रिका नेटवर्क उन तकनीकों में से एक हैं जिन पर व्यापक रूप से शोध किया गया है और टीएस दृष्टिकोण लागू करते हैं। मशीन सीखने के तरीके समय श्रृंखला के आधार पर डेटा संग्रह के लिए रैंकिंग का नेतृत्व करते हैं। ये सेट प्रभावी साबित हुए हैं, M3 या कागल के मुकाबले शुद्ध TS सेट से बेहतर प्रदर्शन करते हैं।

MO की अपनी विशिष्ट समस्याएं हैं। डेटासेट से सुविधाओं का विकास करना या नए भविष्यवाणियां बनाना इसके लिए एक महत्वपूर्ण कदम है और यह प्रदर्शन पर बहुत बड़ा प्रभाव डाल सकता है और टीएस डेटा की प्रवृत्ति और मौसमी मुद्दों को संबोधित करने का एक आवश्यक तरीका हो सकता है। साथ ही, कुछ मॉडलों में समस्या होती है कि वे डेटा को कितनी अच्छी तरह फिट करते हैं, और यदि वे नहीं करते हैं, तो वे मुख्य प्रवृत्ति से चूक सकते हैं।

टाइम सीरीज़ और मशीन लर्निंग दृष्टिकोण एक-दूसरे से अलग-थलग नहीं होने चाहिए। प्रत्येक दृष्टिकोण के लाभ देने के लिए उन्हें एक साथ जोड़ा जा सकता है। पूर्वानुमान के तरीके और समय श्रृंखला विश्लेषण डेटा को प्रवृत्ति और मौसमी डेटा में विघटित करने में अच्छे हैं।तत्व इस विश्लेषण को तब एक एमएल मॉडल के इनपुट के रूप में इस्तेमाल किया जा सकता है, जिसके एल्गोरिदम में ट्रेंडिंग और मौसमी जानकारी होती है, जो दोनों दुनिया के सर्वश्रेष्ठ प्रदान करती है।

समस्या कथन को समझना

उदाहरण के लिए, एक नई हाई-स्पीड रेल सेवा पर यात्रियों की संख्या के पूर्वानुमान से संबंधित टीएस पर विचार करें। उदाहरण के लिए, आपके पास 2 साल का डेटा (अगस्त 2016 - सितंबर 2018) है और इस डेटा के साथ आपको अगले 7 महीनों के लिए यात्रियों की संख्या की भविष्यवाणी करने की आवश्यकता है, जिसमें प्रति घंटा स्तर पर 2 साल का डेटा (2016-2018) है। यात्रा करने वाले यात्रियों की संख्या, और भविष्य में उनकी संख्या का अनुमान लगाना आवश्यक है।

समय श्रृंखला के साथ पूर्वानुमान के लिए डेटासेट का सबसेट:

  1. सिमुलेशन के लिए एक ट्रेन और परीक्षण फ़ाइल बनाना।
  2. पहले 14 महीने (अगस्त 2016 - अक्टूबर 2017) प्रशिक्षण डेटा के रूप में उपयोग किए जाते हैं, और अगले 2 महीने (नवंबर 2017 - दिसंबर 2017) परीक्षण डेटा हैं।
  3. डेटासेट को दैनिक आधार पर एकत्रित करें।
डेटा सेट एकत्रीकरण
डेटा सेट एकत्रीकरण

डेटा विज़ुअलाइज़ेशन यह देखने के लिए करें कि यह समय के साथ कैसे बदलता है।

डेटा विज़ुअलाइज़ेशन
डेटा विज़ुअलाइज़ेशन

भोले दृष्टिकोण निर्माण विधि

इस मामले में TS भविष्यवाणी के लिए उपयोग की जाने वाली लाइब्रेरी statsmodels है। इनमें से किसी भी दृष्टिकोण को लागू करने से पहले इसे स्थापित किया जाना चाहिए। शायद statsmodels पहले से ही Python वातावरण में स्थापित है, लेकिन यह विधियों का समर्थन नहीं करता हैभविष्यवाणी, इसलिए आपको इसे रिपॉजिटरी से क्लोन करना होगा और इसे स्रोत से इंस्टॉल करना होगा।

अनुक्रमण
अनुक्रमण

इस उदाहरण के लिए, इसका मतलब है कि सिक्का यात्रा की कीमतें शुरू से ही और पूरी अवधि के दौरान स्थिर हैं। यह विधि मानती है कि अगला अपेक्षित बिंदु पिछले देखे गए बिंदु के बराबर है और इसे Naive दृष्टिकोण कहा जाता है।

भोली विधि
भोली विधि

अब परीक्षण डेटासेट पर मॉडल की सटीकता का परीक्षण करने के लिए मानक विचलन की गणना करें। आरएमएसई मूल्य और उपरोक्त ग्राफ से, हम यह निष्कर्ष निकाल सकते हैं कि Naive उच्च अस्थिरता विकल्पों के लिए उपयुक्त नहीं है, लेकिन स्थिर लोगों के लिए उपयोग किया जाता है।

साधारण मध्यम शैली

विधि को प्रदर्शित करने के लिए, एक चार्ट तैयार किया जाता है, यह मानते हुए कि वाई-अक्ष कीमत का प्रतिनिधित्व करता है और एक्स-अक्ष समय (दिनों) का प्रतिनिधित्व करता है।

सरल मध्यम शैली
सरल मध्यम शैली

इससे हम यह निष्कर्ष निकाल सकते हैं कि कीमत एक छोटे से मार्जिन के साथ बेतरतीब ढंग से बढ़ती और घटती है, ताकि औसत मूल्य स्थिर रहे। इस मामले में, आप पिछले सभी दिनों के औसत के समान, अगली अवधि की कीमत का अनुमान लगा सकते हैं।

पूर्व में देखे गए बिंदुओं के अपेक्षित औसत के साथ पूर्वानुमान लगाने की यह विधि सरल औसत विधि कहलाती है।

इस मामले में, पहले से ज्ञात मूल्यों को लिया जाता है, औसत की गणना की जाती है और अगले मूल्य के रूप में लिया जाता है। बेशक, यह सटीक नहीं होगा, लेकिन यह बहुत करीब है, और ऐसी स्थितियां हैं जहां यह विधि सबसे अच्छा काम करती है।

सरल माध्यमतरीका
सरल माध्यमतरीका

ग्राफ़ पर प्रदर्शित परिणामों के आधार पर, यह विधि सबसे अच्छा काम करती है जब प्रत्येक समय अवधि में औसत मान स्थिर रहता है। हालांकि भोली विधि औसत से बेहतर है, लेकिन सभी डेटासेट के लिए नहीं। प्रत्येक मॉडल को चरणबद्ध तरीके से आज़माने की अनुशंसा की जाती है और देखें कि यह परिणाम में सुधार करता है या नहीं।

मूविंग एवरेज मॉडल

मूविंग एवरेज मॉडल
मूविंग एवरेज मॉडल

इस चार्ट के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि अतीत में कीमतों में व्यापक अंतर से कई गुना वृद्धि हुई है, लेकिन अब स्थिर हैं। पिछली औसत पद्धति का उपयोग करने के लिए, आपको पिछले सभी डेटा का औसत लेना होगा। प्रारंभिक अवधि की कीमतें अगली अवधि के पूर्वानुमान को दृढ़ता से प्रभावित करेंगी। इसलिए, साधारण औसत पर सुधार के रूप में, केवल पिछले कुछ समय के लिए कीमतों का औसत लें।

इस पूर्वानुमान तकनीक को चलती औसत तकनीक कहा जाता है, जिसे कभी-कभी "एन" आकार "चलती खिड़की" के रूप में जाना जाता है। एक साधारण मॉडल का उपयोग करते हुए, TS में अगले मान की भविष्यवाणी विधि की सटीकता की जांच करने के लिए की जाती है। स्पष्ट रूप से Naive इस डेटा सेट के लिए औसत और मूविंग एवरेज दोनों से बेहतर प्रदर्शन करता है।

सरल एक्सपोनेंशियल स्मूथिंग की विधि द्वारा पूर्वानुमान का एक प्रकार है। चलती औसत पद्धति में, पिछले "एन" अवलोकन समान रूप से भारित होते हैं। इस मामले में, आप ऐसी परिस्थितियों का सामना कर सकते हैं जहां प्रत्येक अतीत 'एन' अपने तरीके से पूर्वानुमान को प्रभावित करता है। यह भिन्नता, जो पिछले अवलोकनों को अलग तरह से भारित करती है, विधि कहलाती हैभारित चलती औसत।

पैटर्न का एक्सट्रपलेशन

समय श्रृंखला पूर्वानुमान एल्गोरिदम पर विचार करने के लिए आवश्यक सबसे महत्वपूर्ण गुणों में से एक प्रशिक्षण डेटा डोमेन के बाहर पैटर्न को एक्सट्रपलेशन करने की क्षमता है। कई एमएल एल्गोरिदम में यह क्षमता नहीं होती है क्योंकि वे एक ऐसे क्षेत्र तक सीमित होते हैं जो प्रशिक्षण डेटा द्वारा परिभाषित किया जाता है। इसलिए, वे TS के लिए उपयुक्त नहीं हैं, जिसका उद्देश्य भविष्य में परिणाम को प्रोजेक्ट करना है।

TS एल्गोरिथम की एक अन्य महत्वपूर्ण संपत्ति विश्वास अंतराल प्राप्त करने की संभावना है। हालांकि यह TS मॉडल के लिए डिफ़ॉल्ट गुण है, अधिकांश ML मॉडल में यह क्षमता नहीं है क्योंकि वे सभी सांख्यिकीय वितरण पर आधारित नहीं हैं।

ऐसा मत सोचो कि TS की भविष्यवाणी करने के लिए केवल सरल सांख्यिकीय विधियों का उपयोग किया जाता है। ऐसा बिल्कुल नहीं है। कई जटिल दृष्टिकोण हैं जो विशेष मामलों में बहुत उपयोगी हो सकते हैं। जनरलाइज्ड ऑटोरेग्रेसिव कंडीशनल हेटेरोसिडैस्टिसिटी (गार्च), बायेसियन और वीएआर उनमें से कुछ ही हैं।

ऐसे न्यूरल नेटवर्क मॉडल भी हैं जिन्हें टाइम सीरीज़ पर लागू किया जा सकता है जो लैगिंग प्रेडिक्टर्स का उपयोग करते हैं और न्यूरल नेटवर्क ऑटोरेग्रेशन (एनएनएआर) जैसी सुविधाओं को संभाल सकते हैं। जटिल सीखने से उधार ली गई समय श्रृंखला मॉडल भी हैं, विशेष रूप से आवर्तक तंत्रिका नेटवर्क परिवार में, जैसे कि LSTM और GRU नेटवर्क।

अनुमान मेट्रिक्स और अवशिष्ट निदान

सबसे आम भविष्यवाणी मेट्रिक्स हैंrms का अर्थ है, जिसका उपयोग कई लोग प्रतिगमन समस्याओं को हल करते समय करते हैं:

  • एमएपीई क्योंकि यह पैमाने पर स्वतंत्र है और प्रतिशत के रूप में त्रुटि के वास्तविक मूल्यों के अनुपात का प्रतिनिधित्व करता है;
  • MASE, जो दर्शाता है कि भोले-भाले औसत पूर्वानुमान की तुलना में भविष्यवाणी कितना अच्छा प्रदर्शन कर रही है।

एक बार पूर्वानुमान पद्धति को अपनाने के बाद, यह मूल्यांकन करना महत्वपूर्ण है कि यह मॉडल को कितनी अच्छी तरह से कैप्चर करने में सक्षम है। हालांकि मूल्यांकन मेट्रिक्स यह निर्धारित करने में मदद करते हैं कि मूल्य वास्तविक मूल्यों के कितने करीब हैं, वे यह मूल्यांकन नहीं करते हैं कि मॉडल टीएस में फिट बैठता है या नहीं। इसका मूल्यांकन करने के लिए बचा हुआ एक अच्छा तरीका है। चूंकि प्रोग्रामर टीएस पैटर्न को लागू करने की कोशिश कर रहा है, इसलिए वह "सफेद शोर" की तरह व्यवहार करने के लिए त्रुटियों की अपेक्षा कर सकता है क्योंकि वे कुछ ऐसी चीज का प्रतिनिधित्व करते हैं जिसे मॉडल द्वारा कब्जा नहीं किया जा सकता है।

"सफेद शोर" में निम्नलिखित गुण होने चाहिए:

  1. असंबद्ध अवशेष (एसीएफ=0)
  2. अवशिष्ट शून्य माध्य (निष्पक्ष) और निरंतर विचरण के साथ एक सामान्य वितरण का पालन करते हैं।
  3. यदि दोनों में से कोई भी गुण गायब है, तो मॉडल में सुधार की गुंजाइश है।
  4. टी-टेस्ट का उपयोग करके शून्य माध्य संपत्ति का आसानी से परीक्षण किया जा सकता है।
  5. सामान्यता और निरंतर विचरण के गुणों को अवशेषों के हिस्टोग्राम या एक उपयुक्त अविभाज्य सामान्यता परीक्षण का उपयोग करके नियंत्रित किया जाता है।

अरिमा मॉडल

ARIMA - ऑटोरेग्रेसिव इंटीग्रेटेड मूविंग-औसत मॉडल, टीएस पूर्वानुमान में उपयोग की जाने वाली सबसे लोकप्रिय विधियों में से एक है, मुख्य रूप सेउच्च गुणवत्ता वाले मॉडल बनाने के लिए डेटा ऑटोसहसंबंध के माध्यम से।

एआरआईएमए गुणांक का मूल्यांकन करते समय, मुख्य धारणा यह है कि डेटा स्थिर है। इसका मतलब है कि प्रवृत्ति और मौसमी भिन्नता को प्रभावित नहीं कर सकते हैं। अनुमानित मूल्यों के साथ वास्तविक मूल्यों के समय की साजिश की तुलना करके मॉडल की गुणवत्ता का आकलन किया जा सकता है। यदि दोनों वक्र करीब हैं, तो यह माना जा सकता है कि मॉडल विश्लेषण किए गए मामले में फिट बैठता है। इसे किसी भी प्रवृत्ति और मौसमी, यदि कोई हो, का खुलासा करना चाहिए।

अवशेषों का विश्लेषण तब दिखाना चाहिए कि क्या मॉडल फिट बैठता है: यादृच्छिक अवशिष्ट का मतलब है कि यह सटीक है। पैरामीटर्स (0, 1, 1) के साथ ARIMA को फ़िट करने से घातीय स्मूथिंग के समान परिणाम मिलेंगे, और पैरामीटर (0, 2, 2) का उपयोग करने से डबल एक्सपोनेंशियल स्मूथिंग परिणाम मिलेंगे।

SQL सर्वर में समय श्रृंखला एल्गोरिदम
SQL सर्वर में समय श्रृंखला एल्गोरिदम

आप एक्सेल में एआरआईएमए सेटिंग्स एक्सेस कर सकते हैं:

  1. एक्सेल प्रारंभ करें।
  2. टूलबार पर एक्स्ट्रा लार्ज माइनर ढूंढें।
  3. रिबन पर, ड्रॉप-डाउन मेनू से ARIMA चुनें।

अरिमा मॉडल क्षमताओं का सारांश:

  1. ARIMA - ऑटोरेग्रेसिव इंटीग्रेटेड मूविंग एवरेज।
  2. समय श्रृंखला विश्लेषण में प्रयुक्त पूर्वानुमान मॉडल।
  3. एआरआईएमए पैरामीटर सिंटैक्स: एआरआईएमए (पी, डी, क्यू) जहां पी=ऑटोरेग्रेसिव शब्दों की संख्या, डी=मौसमी मतभेदों की संख्या, और क्यू=चलती औसत शर्तों की संख्या।

एसक्यूएल सर्वर में एल्गोरिदम

क्रॉस प्रेडिक्शन करना महत्वपूर्ण में से एक हैवित्तीय कार्यों की भविष्यवाणी में समय श्रृंखला की विशेषताएं। यदि दो संबंधित श्रृंखलाओं का उपयोग किया जाता है, तो परिणामी मॉडल का उपयोग दूसरों के व्यवहार के आधार पर एक श्रृंखला के परिणामों की भविष्यवाणी करने के लिए किया जा सकता है।

SQL Server 2008 में सीखने और उपयोग करने के लिए शक्तिशाली नई टाइम सीरीज़ सुविधाएँ हैं। टूल में आसानी से TS डेटा एक्सेस किया जा सकता है, एल्गोरिथम फ़ंक्शन के अनुकरण और पुनरुत्पादन के लिए उपयोग में आसान इंटरफ़ेस, और सर्वर-साइड DMX क्वेरीज़ के लिंक के साथ एक स्पष्टीकरण विंडो ताकि आप समझ सकें कि अंदर क्या चल रहा है।

बाजार समय श्रृंखला एक व्यापक क्षेत्र है जिसमें गहन शिक्षण मॉडल और एल्गोरिदम लागू किए जा सकते हैं। बैंक, ब्रोकर और फंड अब सूचकांकों, विनिमय दरों, फ्यूचर्स, क्रिप्टोकरेंसी की कीमतों, सरकारी शेयरों और अन्य के लिए विश्लेषण और पूर्वानुमान की तैनाती के साथ प्रयोग कर रहे हैं।

समय श्रृंखला पूर्वानुमान में, तंत्रिका नेटवर्क बाजारों की संरचनाओं और प्रवृत्तियों का अध्ययन करके पूर्वानुमेय पैटर्न ढूंढता है और व्यापारियों को सलाह देता है। ये नेटवर्क अप्रत्याशित चोटियों, गिरने, प्रवृत्ति में बदलाव और स्तर में बदलाव जैसी विसंगतियों का पता लगाने में भी मदद कर सकते हैं। वित्तीय पूर्वानुमानों के लिए कई कृत्रिम बुद्धिमत्ता मॉडल का उपयोग किया जाता है।

सिफारिश की: