Wednesday 14 February 2018

सामान्यीकृत - autoregressive चलती - औसत - मॉडल


एन्हांस्ड पीडीएफ (344 केबी) टाइम श्रृंखला मॉडल अक्सर नॉनस्टाइनरी प्रभाव को जोड़कर बनाया जाता है जैसे स्टॉस्टिक प्रक्रियाओं के साथ रुझान जो कि स्थिर होने के लिए माना जाता है यद्यपि अंतर्निहित प्रक्रिया की कार्यक्षमता वांछनीय गुणों या सांख्यिकीय अनुमानकों की वैधता सुनिश्चित करने के लिए आम तौर पर महत्वपूर्ण होती है, वहां कई बार श्रृंखला के मॉडल होते हैं जिसके लिए यह अधिकारिता अभी तक सिद्ध नहीं हुई है। एक प्रमुख बाधा यह है कि सबसे अधिक इस्तेमाल किए गए तरीकों में एक्स 3 सी 6 - इरेडिएबिलिटी, एक ऐसी स्थिति है जिसे असतत-मूल्यवान अवलोकन-संचालित मॉडल के महत्वपूर्ण वर्ग के लिए उल्लंघन किया जा सकता है। हम सामान्यीकृत आटोएरेजिव मूविंग एवरेज (गारमा) मॉडल के क्लास के लिए (कठोर) कार्यक्षमता दिखाते हैं, जो गिनती, द्विआधारी या अन्य असतत-महत्वपूर्ण आंकड़ों के लिए एआरएमए मॉडल का लचीला एनालॉग प्रदान करता है। हम इसे दो दृष्टिकोणों से करते हैं सबसे पहले, हम ऐसी परिस्थितियां दिखाते हैं जिसके तहत गारमा मॉडल के पास एक अद्वितीय स्थिर वितरण होता है (इसलिए उस वितरण में प्रारंभ होने पर कड़ाई से स्थिर)। यह परिणाम संभावित तौर पर गारमा मॉडल के लिए अधिकतम संभावना आवेदकों की स्थिरता और असिमटोटिक सामान्यता दिखाने के लिए नींव बनाता है। चूंकि इन निष्कर्ष तत्काल नहीं हैं, फिर भी, हम एक दूसरे दृष्टिकोण भी लेते हैं। हम गारमा मॉडल के घबराहट वाले संस्करण की निपुणता और अबाधिकता दिखाते हैं, जो इस तथ्य का उपयोग करता है कि घबराहट मॉडल एक्स 3 सी 6 - इरेडीजियबल है और तुरंत मतलब, अंतरालदार सहवासियों और घबराहट की प्रक्रिया के अन्य कार्यों का लगातार अनुमान लगाता है। हम गड़बड़ी और मूल प्रक्रियाओं को बताते हैं कि उलझा हुआ मॉडल उपज पैरामीटर अनुमान जो मूल मॉडल के उन लोगों के करीब हैं। प्रोजेक्ट यूक्लिड में पहली बार उपलब्ध सूचनाएं दिनांक: 8 अगस्त 2011 इस दस्तावेज़ को स्थायी लिंक projecteuclid. orgeuclid. ejs1312818919 डिजिटल ऑब्जेक्ट पहचानकर्ता doi: 10.121411-ईजेएस 627 वुडर्ड, डॉन बी मैट्ससन, डेविड एस हेंडरसन, शेन जी। सामान्यीकृत आटोरेग्रेशिक चलती औसत मॉडल इलेक्ट्रॉन। जे। आंकड़ा 5 (2011), 800--828 डोई: 10.121411-EJS627। projecteuclid. orgeuclid. ejs1312818919। संदर्भ उद्धरण संदर्भ 1 बेंजामिन, एम। ए। रिग्बी, आर ए और स्टैसिनोपोलोस, डी। एम। (2003)। सामान्यकृत आटोमैसेजिव चलती औसत मॉडल जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल असोसिएशन 98 214x2013223। 2 बिलिंग्सली, पी। (1 99 5) संभावना और उपाय तीसरा संस्करण विले, न्यूयॉर्क। मैथैटेटिकल रिव्यू (मैथ्ससीनेट): एमआर 1324786 3 बुगरोल, पी। और पिकार्ड, एन (1 99 2)। सामान्यीकृत आटोरेग्रेसिव प्रक्रियाओं की कड़ी ताकत संभाव्यता के इतिहास 20 1714x20131730.4 ब्रॉकवेल, पी। जे। और डेविस, आर ए (1991)। टाइम सीरीज़: थ्योरी एंड मेथड्स दूसरा संस्करण स्प्रिंगर-वेरलाग, न्यूयॉर्क। मैथैटैटिकल समीक्षाएं (मैथ्ससीनेट): एमआर 10 9 5 9 5 9 5 चैन, के एस और लेडोलटर, जे। (1 99 5)। मोंटे कार्लो समय श्रृंखला मॉडल के लिए आकलन आकलन शामिल है। जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन 90 242x2013252.6 कॉक्स, डी.आर. (1 9 81)। समय श्रृंखला का सांख्यिकीय विश्लेषण: कुछ हालिया घटनाएं सांख्यिकी के स्कैंडिनेवियाई जर्नल 8 93x2013115.मेटैमेटिकल रिव्यू (मैथ्ससीनेट): एमआर 623586 7 डेविस, आर। ए। डन्स्मुइर, डब्ल्यू। टी। एम। और स्ट्रीट, एस बी (2003)। पॉसों की गणना के लिए अवलोकन-संचालित मॉडल बायोमेट्रिका 90 777x2013790.8 डर्बिइन, जे और कोपमैन, एस जे। (2000)। शास्त्रीय और बायेसीयन दोनों दृष्टिकोणों से राज्य अंतरिक्ष मॉडल पर आधारित गैर-गाऊसी टिप्पणियों का समय श्रृंखला विश्लेषण। जर्नल ऑफ़ द रॉयल स्टेटिस्टिअल सोसाइटी, सीरीज बी 62 3x201356.9 फेरलैंड, आर। लाटौर, ए और ओराइची, डी। (2006)। पूर्णांक-मूल्य शोध प्रक्रिया जर्नल ऑफ़ टाइम सीरीज़ विश्लेषण 27 923x2013942.10 फ़ोकियानोस, के। रबबेक, ए। और तॉजोहेम, डी। (200 9)। पॉसों का आत्मसात। अमेरिकी सांख्यिकी संघ की जर्नल 104 1430x20131439.11 फ़ोकियानोस, के। और तोजोस्टेम, डी (2010)। नॉनलाइनियर पॉसॉन ऑटोरियेशन के फ़ोकियानोस, www2.ucy. ac. cyfokianos से अनुरोध पर उपलब्ध कराया गया। 12 फ़ोकियानोस, के। और तोजोस्टेम, डी। (2011)। लॉग-रैखिक पॉसॉन ऑटोरियेशन मल्टीवीएट विश्लेषण की जर्नल 102 563x2013578.13 हायरर, एम (2008)। अनंत-आयामी स्टोचस्टिक प्रक्रियाओं के लिए एरगोडिक सिद्धांत ओबरवॉल्च रिपोर्ट 5 4, 2815x20132874 14 हायरर, एम। और मैटिंग, जे सी (2006)। 2 डी नेवीर-स्टोक्स के समीकरणों की असभ्यता, स्टेचैस्टिक मजबूरन के साथ। गणित के इतिहास 164 993x20131032.15 जंग, आर सी। कुकुक, एम। और लिसनफेल्ड, आर (2006)। गणना डेटा का समय श्रृंखला: मॉडलिंग, अनुमान और निदान कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण 51 2350x20132364.मेटैमेटिकल रिव्यू (मैथ्ससीनेट): एमआर 2307505 16 एलएक्सई 9ऑन, एल एफ। और त्सई, सी। (1 99 8)। मार्कोव प्रतिगमन समय श्रृंखला मॉडल के लिए मॉडल पर्याप्तता का आकलन बॉयोमीट्रिक्स 54 1165x20131175.17 ली, डब्ल्यू के। (1994)। सामान्यीकृत रैखिक मॉडल पर आधारित समय श्रृंखला मॉडल: कुछ और परिणाम। बॉयोमीट्रिक्स 50 506x2013511। 18 मेट्ससन, डी। एस। मैक्लीन, एम. डब्ल्यू। वुडर्ड, डी। बी और हेंडरसन, एस जी (2011)। आपातकालीन चिकित्सा सेवा का पूर्वानुमान कॉल आगमन दर। एप्लाइड आंकड़े के इतिहास 5 1379x20131406.19 मीित्ज़, एम। और सिकॉनन, पी (2008)। मार्क और एसीडी मॉडल के लिए आवेदनों के साथ मार्कोव मॉडल के एक वर्ग के क्षणों की क्षयता, मिश्रण और अस्तित्व। इकोनॉमेट्रिक थ्योरी 24 1291x20131320.20 मेयन, एस पी और ट्वीडी, आर एल (1993)। मार्कोव चेन और स्टोचस्टिक स्थिरता स्प्रिंगर-वेरलाग, लंदन। मैथैटेटिकल रिव्यू (मैथ्ससीनेट): एमआर 128760 9 21 रॉबर्ट्स, जी ओ और रोसेन्थल, जे एस (2004)। जनरल स्टेट स्पेस मार्कोव चेन और एमसीएमसी एल्गोरिदम। संभावना सर्वेक्षण 1 20x201371.22 तलामन्टेस, जे। बेहताता, एस और ज़ेंडर, सी। एस। (2007)। कैर्न काउंटी, कैलिफ़ोर्निया में घाटी बुखार डेटा के सांख्यिकीय मॉडलिंग इंटरनेशनल जर्नल ऑफ बायमेटेयरोलॉजी 51 307x2013313। 23 थोरिसन, एच। (1 99 5)। संभावना सिद्धांत में युग्मन विधि सांख्यिकी स्कैंडिनेवियाई जर्नल 22 15 9x2013182.मेटैमेटिकल रिव्यू (मैथ्ससीनेट): एमआर 1 33 9 74 9 24 टीवेडी, आर एल (1988)। बिना अप्रामाणिकता मान्यताओं के साथ मार्कोव श्रृंखला के लिए अपरिवर्तनीय उपाय एप्लाइड संभाव्यता 25 के जर्नल 275x2013285.25 ज़ेजर, एस। एल। (1 88) गणना के समय श्रृंखला के लिए एक प्रतिगमन मॉडल। बायोमेत्र्रिका 75 621x2013629.26 ज़ेजर, एस एल। और ककिश, बी। (1 8 88)। समय श्रृंखला के लिए मार्कोव प्रतिगमन मॉडल: एक अर्ध-संभावना दृष्टिकोण बॉयोमेट्रिक्स 44 1019x20131031. सामान्यीकृत आटोएरेजिव मूविंग औसत मॉडल नोट: हमेशा अपने संदर्भों की समीक्षा करें और उपयोग करने से पहले आवश्यक सुधार करें। नाम, पूंजीकरण, और तिथियों पर ध्यान दें अमेरिकन स्टैटिस्टिकल एसोसिएशन के जर्नल का विवरण: द जर्नल ऑफ़ द अमेरिकन स्टेटीटिकल एसोसिएशन (जेसा) को लंबे समय तक सांख्यिकीय विज्ञान के प्रमुख पत्रिका माना गया है। विज्ञान उद्धरण सूचकांक ने बताया कि 1991-2001 में गणितीय विज्ञान में जसा सबसे उच्च उद्धृत पत्रिका थी, 16,457 उद्धरणों के साथ, अगले सबसे उच्च उद्धृत पत्रिकाओं की तुलना में 50 से अधिक अधिक। जेएसए में आलेख, सांख्यिकीय, सामाजिक, शारीरिक, इंजीनियरिंग, और स्वास्थ्य विज्ञान में सांख्यिकीय अनुप्रयोगों, सिद्धांतों और तरीकों पर और सांख्यिकीय शिक्षा के नए तरीकों पर ध्यान केंद्रित करते हैं। कवरेज: 1 9 22-2011 (वॉल्यूम 18, संख्या 137 - वॉल्यूम 106, संख्या 496) चलती दीवार जेएसटीओआर में उपलब्ध पिछले अंक और एक पत्रिका के सबसे हाल ही में प्रकाशित मुद्दे के बीच की अवधि दर्शाती है। चलती दीवारें आम तौर पर वर्षों में प्रदर्शित होती हैं। दुर्लभ उदाहरणों में, एक प्रकाशक ने शून्य चलती दीवार के लिए चुना है, इसलिए उनके वर्तमान मुद्दों प्रकाशन के तुरंत बाद जेएसटीओआर में उपलब्ध हैं। नोट: चलती दीवार की गणना में, चालू वर्ष की गणना नहीं की जाती है। उदाहरण के लिए, अगर चालू वर्ष 2008 है और एक पत्रिका में 5 साल की चलती दीवार है, तो वर्ष 2002 के लेख उपलब्ध हैं। चलती हुई दीवार से जुड़ी शर्तें तय की दीवारें: संग्रह में जोड़े जाने वाले नए संस्करणों के साथ पत्रिकाएं अवशोषित: पत्रिकाओं जो एक और शीर्षक के साथ संयुक्त हैं पूर्ण: पत्रिकाओं जिन्हें अब प्रकाशित नहीं किया गया है या जिन्हें अन्य शीर्षक के साथ जोड़ दिया गया है। विषय: विज्ञान गणित, सांख्यिकी संग्रह: गणित सांख्यिकी लिगेसी संग्रह, गणित सांख्यिकी संग्रह, कला विज्ञान मैं संग्रह, कॉर्पोरेट के लिए लाभ पहुंच पहल संग्रह पूर्वावलोकन उपलब्ध नहीं सामान्यीकृत आटोरेग्रेसिव चल औसत (गारमा) मॉडल का एक वर्ग विकसित किया गया है जो कि अशांत गॉसियन गैर-गाऊसी समय श्रृंखला डेटा के लिए एक लचीली अवलोकन-संचालित मॉडल के लिए ARMA समय श्रृंखला मॉडल निर्भर चर को प्रक्रिया के पिछले इतिहास को देखते हुए एक सशर्त घातीय परिवार वितरण माना जाता है। मॉडल आकलन को एक वेटिवेटिव रीक्वाइटेड कम स्क्वायर एल्गोरिथम का उपयोग करके किया जाता है। मॉडल की विशिष्टता और सीमांत क्षणों सहित, या तो मोंटे कार्लो सिमुलेशन का उपयोग स्पष्ट रूप से या जांच की जाती है। अन्य मॉडलों के लिए गार्मा मॉडल का संबंध दिखाया गया है, जिसमें ज़ीर और ककिश के आत्मकेंद्रित मॉडल, ली के चलते औसत मॉडल और reparameterized सामान्यीकृत आटोमैसेजिव सशर्त हेरोसेसेस्सास्टिक गार्च मॉडल (इसके चौथे सीमांत पल के लिए सूत्र प्रदान नहीं किया गया है) । यह मॉडल गार्मा मॉडल के आवेदन से प्रदर्शित किया जाता है जिसमें पॉलीयोमाइलाइटिस की गणना के एक प्रसिद्ध समय श्रृंखला डेटासेट के लिए नकारात्मक द्विपदीय सशर्त वितरण होता है। पृष्ठ थंबनेल सामान्यीकृत मौसमी ऑटोरेग्रेसिव एकीकृत मूविंग औसत मॉडल, मलेरिया के लिए आवेदन के साथ समय के आंकड़े कम केस नंबर एफिलिएशन इंटरनेशनल वाटर मैनेजमेंट इंस्टीट्यूट, कोलंबो, श्रीलंका, एपिडेमियोलॉजी और सार्वजनिक स्वास्थ्य विभाग, स्विस ट्रॉपिकल और पब्लिक हेल्थ इंस्टीट्यूट, बासेल, स्विटजरलैंड, बासेल, यूनिवर्सिटी ऑफ बासेल, स्विट्जरलैंड एफिलिएशन इंटरनेशनल वाटर मैनेजमेंट इंस्टीट्यूट, दक्षिण एशिया, पटनाचु, आंध्र प्रदेश, भारत के लिए उप-क्षेत्रीय कार्यालय, एपिडेमियोलॉजी और सार्वजनिक स्वास्थ्य विभाग, स्विस ट्रॉपिकल और पब्लिक हेल्थ इंस्टीट्यूट, बासेल, स्विटज़रलैंड, बेसिल, बेसल विश्वविद्यालय, मलेरिया के लिए आवेदन के साथ गिनती डेटा के लिए स्विट्जरलैंड सामान्यीकृत मौसमी ऑटोरेग्रेसिव एकीकृत मूविंग औसत मॉडल लो केस के साथ टाइम सीरीज़ ओलिवियर जेटी ब्रिट, प्रियांनी एच। अमेरासिंघे, पेनेलोप वाउनाटोवो परिचय मलेरिया उन्मूलन की ओर नए सिरे से ड्राइव के साथ, बेहतर निगरानी उपकरणों की आवश्यकता है जबकि समय श्रृंखला विश्लेषण निगरानी, ​​पूर्वानुमान और हस्तक्षेप के प्रभाव को मापने के लिए एक महत्वपूर्ण उपकरण है, आमतौर पर इस्तेमाल की जाने वाली गाऊसी विधियों के अनुमानों में गलतियों की संभावना होती है जब मामला कम होता है। इसलिए, गिनती डेटा के लिए उपयुक्त सांख्यिकीय विधियां आवश्यक हैं, विशेष रूप से एकीकरण और पूर्व-उन्मूलन चरणों के दौरान। गैर-गाऊसी, गैर स्थिर और गौण आंकड़ों के मौसमी समय श्रृंखला के पारस्परिक अवलोकन-आधारित मॉडलिंग के लिए सामान्यीकृत ऑटोरेग्रेसिव मूविंग एवरल (गार्मा) मॉडल को सामान्यीकृत मौसमी ऑटोरेग्रेसिव एकीकृत चलती औसत (जीएसआरआईएमए) मॉडल को श्रीलंका में एक जिले में मासिक मलेरिया मामले समय श्रृंखला के लिए लागू किया गया था, जहां हालिया सालों में मलेरिया नाटकीय रूप से कम हो गया है। मलेरिया श्रृंखला में मतलब, अस्थिर विचरण और ऋतु में दीर्घकालिक परिवर्तन दिखाए गए थे। नकारात्मक-द्विपद बायिसियन मॉडलों को उपयुक्त बनाने के बाद, एक जीसरिमा और एक गरिमा नियतात्मक मौसम दोनों मॉडल को अलग-अलग मानदंडों के आधार पर चुना गया था। पोस्टर पूर्वानुमानित वितरण से संकेत मिलता है कि नकारात्मक-द्विपद मॉडल ने गाऊसी मॉडल की तुलना में बेहतर भविष्यवाणियां प्रदान की हैं, खासकर जब मायने रखता है कम। जी (एस) एआरआईएएए मॉडल श्रृंखला में स्वत: पारस्परिक संबंध हासिल करने में सक्षम थे। निष्कर्ष जी (एस) एआरआईएमए मॉडल विशेष रूप से मलेरिया उन्मूलन की ओर ड्राइव में उपयोगी हो सकते हैं, क्योंकि एपिसोड की गणना श्रृंखला अक्सर मौसमी और गैर-स्थिर होती है, खासकर जब नियंत्रण बढ़ जाता है। हालाँकि इमारत और फिटिंग गसरिमा मॉडल श्रमसाध्य हैं, वे गॉसियन तरीकों की तुलना में अधिक यथार्थवादी भविष्यवाणी वितरण प्रदान कर सकते हैं और अधिक महत्वपूर्ण हो सकते हैं जब गणना कम हो जाती है। प्रशस्ति पत्र: ब्रिट ओजेटी, अमरसिंघ पीएच, वौआत्सू पी (2013) मलेरिया के लिए आवेदन के साथ गणना डेटा के लिए सामान्यीकृत मौसमी ऑटोरेग्रेसिव एकीकृत मूविंग औसत मॉडल निम्न केस नंबर के साथ समय श्रृंखला। PLoS ONE 8 (6): e65761 doi: 10.1371journal. pone.0065761 संपादक: क्लाइव शिफ, जॉन्स हॉपकिन्स विश्वविद्यालय, संयुक्त राज्य अमेरिका प्राप्त: 25 जनवरी, 2013 स्वीकृत: 29 अप्रैल 2013 प्रकाशित: 13 जून 2013 कॉपीराइट: 2013 ब्रिट एट अल यह क्रिएटिव कॉमन्स एट्रिब्यूशन लाइसेंस की शर्तों के तहत वितरित एक खुला-एक्सेस लेख है, जो किसी भी माध्यम में अप्रतिबंधित उपयोग, वितरण और प्रजनन की अनुमति देता है, बशर्ते मूल लेखक और स्रोत श्रेय दिया जाता है। वित्तपोषण: इस अध्ययन को राष्ट्रीय समुद्री और वायुमंडलीय प्रशासन (एनओएए), नेशनल साइंस फाउंडेशन (एनएसएफ़), पर्यावरण संरक्षण एजेंसी (ईपीए) और इलेक्ट्रिक पावर रिसर्च इंस्टीट्यूट (ईपीआरआई) के जरिए जलवायु परिवर्तनशीलता और मानव स्वास्थ्य पर संयुक्त कार्यक्रम के माध्यम से वित्त पोषित किया गया। फंडर्स का अध्ययन डिजाइन, डेटा संग्रह और विश्लेषण, पन्द्वल को प्रकाशित करने, या तैयार करने के निर्णय में कोई भूमिका नहीं थी। प्रतिस्पर्धात्मक हित: लेखकों ने घोषित किया है कि कोई प्रतिस्पर्धात्मक रुचियां मौजूद नहीं हैं। परिचय मलेरिया के पूर्वानुमान मॉडल के उपयोग में रूचि बढ़ रही है, ताकि नैदानिक ​​और सार्वजनिक स्वास्थ्य सेवाओं को रणनीतिक तौर पर रोकथाम और नियंत्रण उपायों को लागू किया जा सके। 1 5. श्रीलंका में स्वास्थ्य मंत्रालय के मलेरिया अभियान विरोधी निदेशालय ने मलेरिया की भविष्यवाणी प्रणाली का परीक्षण किया है जो गुणात्मक मौसमी आटोरेडिसेज का उपयोग करता है। एकीकृत चलती औसत (एसआरआईआईएमए) मॉडल, जो मानते हैं कि लघुगणक रूप से परिवर्तित मासिक मलेरिया मामले की गिनती लगभग गाऊसी वितरित होती है। संक्रामक रोगों की भविष्यवाणी मॉडलिंग में इस तरह के दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है। 6. 7. श्रीलंका में मलेरिया मौसमी और अस्थिर है और तीव्र और अस्थायी रूप से दोनों में तीव्रता में आता है। 8. मलेरिया एक प्रमुख सार्वजनिक स्वास्थ्य समस्या थी, जहां तक ​​9 घटनाएं सन 2000 में कमी शुरू हुई। 2007 में श्रीलंका ने पूर्व-उन्मूलन चरण में प्रवेश किया और 2011 में उन्मूलन के चरण में प्रगति की। मलेरिया की गणना (जैसे लॉगरिदमिक परिवर्तन) के बॉक्स-कॉक्स वर्ग परिवर्तन लगभग गाऊसी वितरित डेटा प्राप्त कर सकते हैं, हालांकि, कम उम्मीद वाले माध्य के साथ टिप्पणियों के लिए सन्निकटन कम है। इसके अलावा, कम गणना डेटा में शून्य भी शामिल हो सकते हैं, जो बॉक्स - कॉक्स परिवर्तन का उपयोग करने योग्य नहीं है इस समस्या पर काबू पाने के लिए, डेटा में एक छोटी सी स्थिरता जोड़ दी जा सकती है। परिवर्तित डेटा के साथ गाऊसी मॉडलिंग के परिणामस्वरूप गलत पूर्वानुमान वितरण हो सकते हैं। यह समस्याग्रस्त है, खासकर जब हाल के मासिक मामले की गणना कम हो जाती है, जो उन्मूलन के उन्नत चरण में देशों में मामला बनती है 3. मॉडल जो मलेरिया की गिनती डेटा के लिए नकारात्मक द्विपदीय वितरण मानते हैं अधिक उपयुक्त हो सकते हैं 13 15. हालांकि , नकारात्मक बाइनोमियल मॉडल जो कि एक सारिमा संरचना को शामिल करते हैं, अभी तक उपलब्ध नहीं हैं। बेंजामिन और सहकर्मियों ने सामान्यीकृत रैखिक आटोमैसेजिव चलती औसत (गारमा) के मॉडल के लिए ढांचा प्रदान किया है, और पॉसों के लिए मॉडलों, और दूसरों के बीच नकारात्मक व्युत्पन्न आंकड़ों पर चर्चा की है। गार्मा मॉडल अवलोकन-संचालित मॉडल हैं जो अवलोकनों में पीछे की निर्भरता के लिए अनुमति देते हैं। वैकल्पिक रूप से, पैरामीटर-प्रेरित मॉडल (भी) अव्यक्त चर में निर्भरता की अनुमति देता है 17 20। गार्मा मॉडल अनुमान लगाने में आसान है और भविष्यवाणी सरल है, जबकि पैरामीटर चालित मॉडल 21 की व्याख्या करना आसान है। 22. जंग और सहयोगियों ने पाया कि दोनों प्रकार के मॉडल इसी तरह प्रदर्शन करते हैं। गार्मा मॉडल, डाटा डिस्ट्रीब्यूशन के माध्य पैरामीटर के रूपांतरण के लिए भविष्यवाणियों और एआरएमए घटकों से संबंधित होते हैं, लिंक फंक्शन के माध्यम से। एक लॉग लिंक फ़ंक्शन यह सुनिश्चित करता है कि सकारात्मक वास्तविक संख्याओं के डोमेन पर विवश हो। कोवारेटियों के रूप में इस्तेमाल किए गए लंबित टिप्पणियों को, इसलिए, लॉगरिदमिक रूप से परिवर्तित भी किया जाना चाहिए, जो शून्य के मूल्य के साथ टिप्पणियों के लिए संभव नहीं है इस समस्या को दरकिनार करने के लिए, ज़ेजर और ककिश 24, डेटा के लिए एक छोटे से स्थिरांक जोड़कर चर्चा करते हैं, या तो सभी डेटा के लिए या केवल शून्य तक। ग्रुन्वाल्ड और सहकर्मियों 25 एक पहचान लिंक समारोह के साथ एक सशर्त रैखिक आटोमैसेजिव (CLAR) मॉडल पर विचार करते हैं। एक सकारात्मक सुनिश्चित करने के लिए पैरामीटर पैरामीटर पर डाल सकते हैं गार्मा मॉडल का एक प्रकार, एक सामान्यीकृत रैखिक आटोमैसेजिव चलती औसत (GLARMA) मॉडल, डेविस और उनके साथियों 22 द्वारा प्रस्तुत किया गया है। Heinen 26 आटोमैरेसिज सशर्त पॉसॉन (एसीपी) मॉडलों के तरीकों के साथ प्रस्तावित करता है जो डेटा के सीमांत वितरण में और अधिक फैलाव के लिए अनुमति देते हैं। ऑटो सहसंबद्ध त्रुटि संरचना के साथ पॉसॉन मॉडल का एक और वर्ग द्विपदीय पतला उपयोग करता है, और उन्हें पूर्णांक-मूल्यवान आटोरेजिगेस (आईएनएआर) मॉडल कहा जाता है 27. आईएनएआर मॉडल सैद्धांतिक रूप से औसत (INMA) और INARMA मॉडलों को बढ़ने के लिए बढ़ाया जा सकता है 28. 29. लेकिन ये नहीं हैं आसानी से लागू 30 एक वैकल्पिक पैरामीटर-संचालित मॉडलिंग दृष्टिकोण, एक लॉगरिदमिक लिंक फंक्शन 31 का उपयोग करते हुए औसत संरचना में पेश किए गए समय विशिष्ट यादृच्छिक प्रभावों पर एक आटोमैरेसिव प्रक्रिया को ग्रहण करता है। ऐसा एक मॉडल को कभी-कभी एक स्टेचैस्टेटिक आटोरेसेंसेव अर्थ (एसएएम) मॉडल 23 कहा जाता है और अक्सर इसे बेयसियन अस्थायी और स्थैतिक-अस्थायी मॉडलिंग 15. 21. 32 36 ऊपर चर्चा किए गए मॉडल में से, गार्मा फ्रेमवर्क एक आटोमैरेसिव एंडर हिलिंग औसत संरचना के साथ गिनती डेटा मॉडलिंग के लिए सबसे लचीला प्रतीत होता है। बेंजामिन और सहकर्मी 16 एक मौसमी प्रवृत्ति के साथ पोलियो के मामलों की एक समय श्रृंखला के लिए एक स्थिर गार्मा मॉडल लागू करते हैं, एक वार्षिक और अर्द्ध-वार्षिक चक्र के मिश्रण के साथ एक सिनेकासाइन समारोह का उपयोग करते हुए। हालांकि, अगर मौसमी घटक को स्टोचस्टिक माना जाता है, तो बेंजामिन और सहकर्मियों द्वारा प्रस्तुत गारमा मॉडल उचित नहीं है। साथ ही, मलेरिया मामलों सहित कई बार गिनती की संख्या श्रृंखला, स्थिर नहीं है। यहां, गार्मा को सामान्यीकृत गुणकारी मौसमी ऑटोरेग्रेसिव एकीकृत चलती औसत (जीएसआरआईआईएमए) मॉडल के एक वर्ग के लिए बढ़ाया गया था, गाऊसी के वितरित डाटा के लिए सैरिमा मॉडल के समान। जीएसआरआईएमए मॉडल की श्रेणी में सामान्यीकृत ऑटोरेग्रेसिव एकीकृत चलती औसत (गरिमा) मॉडल शामिल हैं मॉडल फिट पूर्ण Bayesian अनुमान का उपयोग किया गया था। श्रीलंका के नकली और वास्तविक मलेरिया मामले की गिनती के आंकड़ों का इस्तेमाल करते हुए पीछे की भविष्यवाणियों के वितरण पर ग़लत वितरणिक मान्यताओं का प्रभाव दिखाया गया था। सॉफ़्टवेयर कोड समर्थित जानकारी के रूप में प्रदान किया गया है। मॉडल तैयार करना एक नकारात्मक द्विपदीय वितरण से उत्पन्न होने वाली लम्बाई के गिनती डेटा की एक समय श्रृंखला होना चाहिए और नकारात्मक द्विपदीय वितरण का सीमित रूप, यह है। पॉसों वितरण है मॉडल लिखा जा सकता है: जहां एक लिंक फ़ंक्शन है, तथा । एक बैकशिफ्ट ऑपरेटर है (नोट करें कि)। गुणांक का एक सदिश है जिसके लिए एक अवरोधक गुणक (आमतौर पर लिया जाता है) और समय पर निर्भर कॉरपोरेट गार्मा फ्रेमवर्क में, गिनती डेटा को लॉगरिदमिक या एक पहचान कड़ी समारोह के माध्यम से तैयार किया जा सकता है, जो श्रृंखला के लिए सबसे अधिक उपयुक्त है। लॉगरिदमिक लिंक के तहत मूल्य शून्य के साथ टिप्पणियों के लघुगणक को लेने की समस्या से बचने के लिए, ज़ेजर और ककिश 24 जैसे परिवर्तन का प्रस्ताव है। अब से ज़क़्क्यू 1 कहा जाता है। ज़ेजर और ककिश 24 भी एक वैकल्पिक विधि का सुझाव देते हैं, जिसे अब से ज़क़्क्यू 2 कहा जाता है, जो कि मॉडल के संस्करण में अनुवादित होता है: एक पहचान के तहत, प्रतिबंध सकारात्मक होने के लिए आवश्यक हो सकता है डेटा और मॉडल पैरामीटर के आधार पर उपरोक्त मॉडल को सीजनियत (एस) और डिफरेंसिंग (आई) घटकों को निम्न प्रकार से जोड़कर एनालॉग में बढ़ाया जा सकता है: इस अवधि की अवधि (वार्षिक चक्र के साथ मासिक डेटा के लिए) कहां है, । । । और ऊपर के रूप में हैं परिशिष्ट S1 में नकारात्मक द्विपद और लॉग लिंक फ़ंक्शन और ZQ1 रूपांतरण के साथ मॉडल दिए गए हैं डेटा के वितरण पर लिंक फ़ंक्शन पसंद और डेटा रूपांतरणों के प्रभाव का प्रभाव भी परिशिष्ट S1 में मूल्यांकन किया जाता है। बेंजामिन और सहकर्मियों 16 को दोहराव वाले भारित कम से कम चौराहों और असीमपेटिक परिणामों पर आधार अनुमान के माध्यम से अधिकतम संभावना अनुमान लगाना। इस पत्र में, मॉडल का निर्माण Bayesian ढांचे में किया गया था। Bayesian अनुमान में, सभी मॉडल पैरामीटरों को पूर्व वितरण की आवश्यकता है। एक कमजोर रूप से स्थिर मॉडल माना जाता था और इसलिए, जोन्स 37 द्वारा प्रदान किए गए एल्गोरिदम का उपयोग करके स्वत: सहसंबंध और चलते हुए औसत मापदंडों को बाधित किया गया था। इस उद्देश्य के लिए, संभावना में आटोमैरेजिव और चलते हुए औसत मापदंडों को पुनर्मूल्यांकन किया गया था और नए वितरण पर पूर्व वितरण को अपनाया गया था parameterization। उदाहरण के लिए, गैर-मौसमी आटोमैसेजिव मापदंडों के संदर्भ में reparameterized थे । और कहां । निम्नलिखित पूर्व वितरण ग्रहण किया गया था: जहां का पूर्णांक हिस्सा अर्थ है इसके अलावा आगे चुने हुए चुने हुए थे और। पहली टिप्पणियों के लिए, भविष्यवक्ता पैमाने पर अवशेष (जैसे एक लघुगणक लिंक समारोह के मामले में) को शून्य पर सेट किया गया था। एक प्रतिबन्ध मतलब खुद पर रखा जा सकता है, यह तब होता है जब पहचान लिंक का उपयोग किया जाता है जीएसआरआईएमएए मॉडल का अनुमान लगाया गया था कि बेयसियन सॉफ्टवेयर प्रोग्राम फ्री, जेएजीएस 38 का इस्तेमाल किया जा रहा है। जो मार्कोव श्रृंखला मोंटे कार्लो (एमसीएमसी) सिमुलेशन पद्धति को रोजगार देता है। आर सॉफ़्टवेयर के भीतर जेएजीएएस का उपयोग करने के लिए लिखे गए कोड के उदाहरण, लॉगरिदमिक लिंक फंक्शन और ज़ीक्यू 1 रूपांतरण के साथ नकारात्मक द्विपद जीसरिमा मॉडल के लिए, सहायक जानकारी के रूप में उपलब्ध कराई गई हैं अतिरिक्त फाइल एस 1 देखें। इन मॉडलों की क्षमता के लिए अनुमानित डेटा श्रृंखला का अनुमान जीएसआरीमा संरचना के साथ संक्षिप्त परिशिष्ट एस 1 में किया गया है। गारमा मॉडल पैरामीटर का आकलन करते समय लिंक फंक्शन और डेटा रूपांतरण का (गलत) प्रभाव का आकलन और परिशिष्ट S1 में वर्णित है। मलेरिया के लिए आवेदन टाइम सीरीज़ विश्लेषण यह खंड श्रीलंका (ग्यारहवीं 1) में गम्पाहा जिले में 1 9 722005 की अवधि के लिए मासिक मलेरिया मामले की गिनती के लिए आवेदन करने वाला एक जीसरिमा मॉडल का एक उदाहरण प्रदान करता है, जो कि कॉरिएट (चित्रा 1 बी) के रूप में वर्षा होती है। विश्लेषण की संहिता अतिरिक्त फाइल एस 2 में सहायक जानकारी के रूप में प्रदान की जाती है। मलेरिया पॉजिटिव खून फिल्मों की रिकॉर्डियां सरकारी स्वास्थ्य सुविधाओं द्वारा मासिक रिपोर्ट की गईं और श्रीलंका के एंटी मलेरिया कैम्पेन (एएमसी) द्वारा एकत्रित की गईं। बारिश वर्षा की कॉलम की मासिक जिले की औसत ऊंचाई थी, जो मासिक द्वीप-विस्तृत वर्षा सतहों से ली गई थी। यह वर्षा सतहों द्वीप के 342 स्टेशनों द्वारा एकत्र वर्षा रिकॉर्डों के स्थानिक प्रक्षेपन द्वारा उत्पन्न की गई थी। डेटा का पिछला काम 8 में पहले वर्णित किया गया था। 408 महीनों के समय श्रृंखला में शून्य मलेरिया मामलों के साथ तीन महीने होते थे: अक्टूबर 1 9 82, और मार्च और अगस्त 2005. गौसी सेरीमा मॉडल द्वारा वर्षा में थोड़ा सुधार मलेरिया का अनुमान लगाया गया जिसमें लारिडामिमिक रूप से मलेरिया मामले के आंकड़े तीन चार महीने आगे 2 चित्रा 1 चित्रा 1. समय के साथ गम्पाहा जिले में मासिक मलेरिया मामले और वर्षा। पैनल ए दिखाता है कि मासिक मलेरिया मामले की गणना और पैनल बी में मासिक बार दिखाई देता है प्रारंभिक फ्रीक्वेंस्टिस्ट गाऊसी सरमिना मॉडल पहचान क्योंकि एमईसीसी एल्गोरिदम का उपयोग करने के लिए बायेशियन मॉडल फिट है, कम्प्यूटेशनलली महंगी है, प्रारंभिक मॉडल की पहचान, एसआरआईएमए पैरामीटरों को चुनने के लिए, पी। घ। q पी डी और क्यू गौसी सीमांत त्रुटियों के साथ समय श्रृंखला के लिए विकसित मानक (वारंवारवादी) उपकरणों का उपयोग किया जाता था, जो कि कई संभव एमसीएमसी मॉडलों को तैयार करने के बजाय। मलेरिया समय श्रृंखला (चित्रा 1) के दृश्य विश्लेषण ने औसत स्तर में एक दीर्घकालिक (अंतर वार्षिक) परिवर्तन की उपस्थिति, एक अस्थिर विचरण (जो कि मतलब से बढ़ता दिखाई देता है), और गुणात्मक ऋतु (का आकार) का पता लगाया मौसमी प्रभाव औसत के लिए आनुपातिक है)। इस प्रकार, प्रारंभिक गाऊसी विश्लेषण के लिए, डेटा को फिट बॉक्स-कॉक्स परिवर्तन का उपयोग करके बदल दिया गया था। 39. भिन्नता को स्थिर करने के लिए, मौसमी प्रभाव को जोड़ने के लिए, और डेटा को सामान्य रूप से 40 वितरित करने के लिए। बॉक्स में प्रवृत्ति - कॉक्स परिवर्तित श्रृंखला को एक स्टेचैस्टिक प्रवृत्ति के रूप में माना जाता था, जो कि (प्रथम ऑर्डर) अंतर स्थिर था संवर्धित डिकी फुलर टेस्ट 41 को 15 के अंतराल के क्रम में यूनिट रूट की उपस्थिति का पता लगाने के लिए उपयोग किया गया था, यह आकलन करने के लिए कि श्रृंखला को एकीकृत (अलग-अलग) होना चाहिए। गौसीय सरमिना मॉडल और एआरआईएए मॉडल, एक दूसरे क्रम हार्मोनिक मौसमी घटक के साथ, एक इकाई रूट की उपस्थिति के कारण डी 1 के साथ दोनों, (सॉफ्टवेयर के रूप में) लगातार सॉफ्टवेयर पैकेज आँकड़ों से जुड़े थे, और मॉडलों का मूल्यांकन ऑक्केस सूचना मानदंड (एआईसी) के आधार पर किया गया था। )। द्वितीय ऑर्डर हार्मोनिक्स (यानी दो साइन और कोसाइन जोड़े) का उपयोग करके मौसमी प्रभाव के लिए मैट्रिक्स को दिया जाता है। ए (समय स्वतंत्र) अवरोधन शामिल नहीं था क्योंकि इंटरसेप्ट पहले ऑर्डर डिस्क्रिप्शन के बाद समीकरण से बाहर निकल जाता है। GSARIMA मॉडल चयन चार SARIMA मॉडल और दो ARIMA मॉडल के Bayesian नकारात्मक द्विपद संस्करण, प्रारंभिक विश्लेषण में पहचान की दूसरी व्यवस्था harmonics के साथ, एक लघुगणक लिंक समारोह और ZQ1 परिवर्तन का उपयोग करते हुए, untransformed डेटा पर जेएजीएस में लागू किया गया। चूंकि शून्य संख्याओं के साथ केवल तीन टिप्पणियां थीं, परिणाम ZQ1 के लिए रूपांतरण स्थिरता के विकल्प के प्रति संवेदनशील नहीं होंगे और यह सी 1 पर सेट किया गया था। इसके अलावा, पहचान लिंक वाले संस्करणों को माना जाता था। दो मानदंडों के आधार पर मॉडल का मूल्यांकन किया गया पहला विचलन सूचना मानदंड (डीआईसी) था, जिसे पहली टिप्पणियों पर सशर्त डेवियन के पश्च वितरण के माध्य के रूप में गणना की गई थी (तुलना में मॉडल की अधिकतम संख्या के बराबर), प्रभावी अनुमानित पैरामीटर की संख्या के साथ संवर्धित फिटिंग को रोकने के लिए दंड के रूप में कम डीआईसी वाले मॉडल को बेहतर फिट माना जाता है एक दूसरे मानदंड को निर्धारित मूल्यों (एमएआरई) की औसत पूर्ण रिश्तेदार त्रुटि के रूप में परिभाषित किया गया था: मारिया। जहां असतत समय अंतराल पर मलेरिया मामलों की फिट संख्या है। और एफ और एल विचाराधीन अवधि के क्रमशः पहले और अंतिम असतत समय अंतराल हैं। मार्स पूरी श्रृंखला (एफ 1, एल एन 408), और समय की दूसरी छमाही (च 205, एल 408) के लिए पूरी श्रृंखला के लिए फिट होने पर पूरी श्रृंखला (पहली टिप्पणियों को छोड़कर) के लिए गणना की गई थी। , जब मॉडल केवल समय श्रृंखला के पहले छमाही में लगे थे चूंकि प्रत्येक फिट डेटा बिंदु पर अनुमानित (पश्चकथा) अनुमानित वितरण को छोड़ दिया गया था, बाद के वितरण के मध्य में इसके लिए लिया गया था। मारिया मतलब निरपेक्ष प्रतिशत त्रुटि (एमएपीई) के समान है, जो श्रृंखला के लिए लागू होती है, जिसके लिए विचरण माध्य 40 पर निर्भर होता है। हालांकि, क्योंकि हर एक के बराबर या उससे बड़ा है, इस वजह से बड़े मूल्यों के कारण समस्याओं को रोकता है छोटी संख्याओं को विभाजित करके और मैप 5 की एक बड़ी आलोचना करके। मरीन आंकड़े में फिटिंग को रोकने के लिए एक अंतर्निहित जुर्माना नहीं है, लेकिन मारिये के समान मूल्य वाले मॉडल के बीच, कम से कम मापदंडों वाले मॉडल को प्राथमिकता दी जाती है । डीएसी के विपरीत, मारिया का अनुमान मॉडल में अलग-अलग वितरण अवधारणाओं के साथ तुलनीय है। 1,000 की पुनरावृत्तियों में जलने सहित प्रत्येक 11,000 पुनरावृत्तियों के तीन मार्कोव श्रृंखलाओं के साथ मॉडल चलाए गए थे कन्वर्जेंस का आकलन गेलमैन-रुबिन अभिसरण आंकड़ों (अनुमानित पैरामीटर पर) के भूखंडों का अध्ययन करके किया गया था, जैसा कि ब्रूक्स और गेलमैन 42 द्वारा संशोधित किया गया था। अवशिष्ट विश्लेषण यह जानने के लिए कि क्या चयनित मॉडल और उनके अंतर्निहित वितरण डेटा में भिन्नता के योग्य हैं, पर्याप्त रूप से ब्याज का है। यदि इन मॉडलों का इस्तेमाल असतत समय अंतराल (इस मामले में, एक महीने) में मलेरिया के मामलों का अनुमान लगाने के लिए किया जाता है, तो न केवल ब्याज के पीछे के भविष्यवाणियों के वितरण का अनुमान है, बल्कि पूरे वितरण भी। आइए संचयी पोस्टिरीयर भविष्य कहनेवाला वितरण समारोह का होना। कम पूंछ अवशिष्ट संभावना। अर्थात् मनाया गया डेटा पर गणना की गई संचयी पोस्टिरीयर पूर्वानुमानित वितरण का मूल्य। जिसे संभाव्यता अभिन्न परिवर्तन भी कहा जाता है, प्रत्येक माह के लिए गणना की जा सकती है ब्याज के सभी महीनों के लिए एक संचयी वितरण समारोह मॉडल की उपयुक्तता के विश्लेषण के लिए अंतर्निहित वितरण सहित ग्रहण करने की अनुमति देता है। अगर मॉडल उचित रूप से डेटा में फिट बैठता है, तो शेष संभावनाओं के मूल्य (सी-आर प्लॉट) का संचयी वितरण समारोह, संभाव्यता-संभाव्यता साजिश के समान मूल और बिंदु (1,1) के बीच लगभग सीधे विकर्ण रेखा का पालन करेगा। उदाहरण के लिए, जब मॉडल उचित रूप से फिट होता है, तो अवलोकन के 50 में 0.5 के एक संबद्ध अवशिष्ट संभावना मान होता है। सी-आर प्लॉट के बारे में अधिक जानकारी को सहायक जानकारी के रूप में दी गई है अतिरिक्त फ़ाइल S3 देखें सहायक जानकारी में भी एक उदाहरण दिया गया है जहां सी-आर प्लॉट का उपयोग पॉसॉन गरिमा (1,1,0) संरचना के साथ समय श्रृंखला में लगाए जाने वाले मॉडल की उपयुक्तता का आकलन करने के लिए किया जाता है, अतिरिक्त फ़ाइल एस 4 देखें इस प्रकार, एक मॉडल फिटिंग और पीछे के वितरण प्राप्त करने के बाद, प्रत्येक अवलोकन के लिए गणना की गई थी। इस तथ्य के कारण कि नकारात्मक द्विपदीय मॉडल के लिए संचयी वितरण समारोह असतत है, अंतराल में समान वितरण से एक यादृच्छिक मूल्य को रेखांकित करके अवशिष्ट संभाव्यता मूल्य को यादृच्छिक रूप से याद किया गया था। डन और स्माइथ 43 द्वारा एक प्रक्रिया का पालन करना। इस वितरण से 30,000 नमूनों के साथ अनुमान लगाया गया था। इस प्रक्रिया को बिन्यामीन और सहकारियों ने 16 असतत गारमा मॉडल के लिए समर्थन किया है। संपूर्ण मलेरिया मामले की समय सीमा पर और पिछले 50 टिप्पणियों के साथ, जहां मामला संख्या अपेक्षाकृत कम था, दोनों चयनित मॉडलों की उपयुक्तता (यादृच्छिक) अवशिष्ट संभावना मानों के संचयी वितरण कार्यों के भूखंडों से तुलना की गई थी। शेष स्व-पारस्परिक संबंध के लिए समय श्रृंखला मॉडल अवशेषों का परीक्षण करना मानक अभ्यास है। हालांकि, मानक उपकरण लगभग गाऊसी वितरित डेटा अनुमान लगाते हैं। इसलिए, यादृच्छिक अवशिष्ट संभावना मान सामान्यीकृत यादृच्छिक मात्रा में शेष अवशेषों में परिवर्तित किए गए थे। शून्य मतलब और एकता के विचरण के साथ सामान्य वितरण की मात्रात्मक कार्य (व्युत्क्रम संचयी वितरण समारोह) का उपयोग करना। रूपांतरण से पहले, शून्य के यादृच्छिक अवशिष्ट संभावनाएं (जब पश्चवर्ती पूर्वानुमानित वितरण समारोह के सभी 30,000 नमूनों को मनाया गया मूल्य से ऊपर रखा गया था) को 0.00001 के लिए निर्धारित किया गया था और एक के बेतरतीब अवशिष्ट संभावना मान (जब पश्चवर्ती पूर्वानुमानित वितरण समारोह से सभी 30,000 नमूने थे मनाया मूल्य के नीचे) 0.99999 पर सेट कर रहे थे। सामान्यकृत यादृच्छिक मात्रा में शेष अवशेषों का विश्लेषण किया गया था शेष स्वचालन के लिए Ljung-Box 44 परीक्षा और आंशिक आत्मिकरण और आंशिक autocorrelation कार्यों के दृश्य विश्लेषण। परिणाम और चर्चा गाऊसी सरिमा मॉडल की पहचान के उद्देश्य के लिए, एक बॉक्स-कॉक्स परिवर्तन को मलेरिया मामले गिनती समय श्रृंखला के लिए उपयुक्त द्वारा पहचाना गया था। फिट बॉक्स-कॉक्स मापदंडों में 0.249 की शक्ति थी और यह देखते हुए कि श्रृंखला में शून्य गणनाओं के साथ टिप्पणियां शामिल थीं, रूपांतरण के पहले प्रत्येक अवलोकन में 0.0251 का निरंतर जोड़ा गया था। मूल श्रृंखला के लिए मनाए जाने के अनुसार, औसत स्तर में दीर्घकालिक परिवर्तन की उपस्थिति रूपांतरणित समय श्रृंखला (चित्रा S1) में स्पष्ट थी। यद्यपि औसत स्तर में परिवर्तन संभवतः मलेरिया नियंत्रण प्रयासों, परजीवी के विकास और सदिश प्रतिरोध आदि से संबंधित हो सकता है। ऐसे गोपनीय आंकड़ों को यहाँ नहीं माना गया है। संवर्धित डिकी फुलर टेस्ट ने बॉक्स-कॉक्स बदलने वाली श्रृंखला में यूनिट-रूट (पी 0.14) की उपस्थिति का समर्थन किया और श्रृंखला अलग थी। अलग-अलग श्रृंखला के ऑटो सहसंबंध समारोह (एसीएफ) (चित्रा 2) और आंशिक ऑटो सहसंबंध समारोह (पीएसीएफ) (चित्रा एस 3) के भूखंडों ने तीन और बारह महीनों के समय में महत्वपूर्ण (आंशिक) ऑटो सहसंबंध दिखाया। बॉक्स-कॉक्स परिवर्तित श्रृंखला के प्रारंभिक विश्लेषण के आधार पर, चार गाऊसी सरिमा मॉडल और दो गॉसियन एआरआईएएमए मॉडलों को क्रमशः एआईसी (तालिका 1) के आधार पर, दूसरे आदेश हार्मोनिक्स (एसओएच) के साथ शुरू किया गया था। एआरआईएएमए-एसओएच मॉडल में एसआरआईएमए मॉडल की तुलना में कम (बेहतर) एआईसी था। ARIMA-SOH models including rainfall as a covariate had a slightly lower AIC than ARIMA-SOH models without rainfall. However, for the SARIMA models, the inverse was true. Table 3. Parameter estimates (mean and 95 credible interval) of selected negative binomial models. Despite the model having a higher (worse) DIC than the model, the out of sample MARE of the model was 5.7 per cent better than the out of sample MARE of the model, and required less than half the number of fitted parameters. This indicates that the model was probably over-fitting the data, describing the random error rather than the underlying process. The model was selected for further analysis. Figure 2 illustrates posterior predictive distributions for the last 12 months of the series by the model and those by a (Bayesian) Gaussian model on Box-Cox transformed data, when fitted to the entire data set. Differences in the posterior predictive distributions between the two models are apparent with the Gaussian model predictive distributions having longer right tails. Figure 2. Posterior predictive distributions for the last 12 months of the Gampaha malaria case count series. In each panel, representing each a month in the last year of the series, the black and the red lines are the outline histogram of the density of the posterior predictive distribution of the negative binomial model and a (Bayesian) Gaussian model on Box-Cox transformed data, respectively. Models were fitted to the entire data set. In each panel, the observed case count is represented by a blue dot. The C-R plot of the negative binomial model fit was compared to that of a (Bayesian) Gaussian on Box-Cox transformed data in Figure 3. The C-R plot on the entire series (Figure 3A ) is not entirely satisfactory for either model. For the Gaussian . the posterior predictive distribution appears to be platykurtic (for values of the residual probability below 0.5, there are too few observations, and for values above 0.5, there are too many). For the negative binomial model, for randomized residual probability values below about 0.5, cumulatively fewer observations had these values than the posterior density distributions had indicated. Therefore, on average, the part of the posterior density distributions below the median was spread out too much to the left. The lower boundaries of credibility intervals of the distributions were thus on average too low. For the values above 0.5, the cumulative distribution function followed the diagonal. Figure 3B compares both models for the last 50 months of the series only, where numbers of monthly cases were smaller than 35. For these low numbers, the negative binomial model was much more appropriate. Figure 3. Cumulative distribution function of randomized cumulative probabilities. The black line represents the cumulative distribution function of randomized cumulative probabilities of the model on monthly numbers of malaria cases in Gampaha, Sri Lanka. The red line represents the cumulative distribution function of randomized residual probabilities of the Gaussian model on Box-Cox transformed data. The light grey diagonal line (cumulative distribution equals randomized probability) represents on average appropriate predictive distributions. Dotted lines represent 95 confidence boundaries for proportions equalling probability. A . for the last 392 months in the series. B . for the last fifty months in the series. Figure 4 shows the normal Q-Q plot for the normalized randomized quantile residuals of the model, for which the distribution is slightly leptokurtic. A plot of these normalized randomized quantile residuals against time (Figure S4 ) appears a random scatter at first sight, but upon closer inspection, extreme residuals occur more often during periods with stronger relative changes. This is because the residuals, . are positively correlated with a relative change in malaria cases, with linear regression line . (Figure 5 ). Figure 4. Normal Q-Q plot of normalized randomized quantile residuals of the selected model. Figure 5. Plot of normalized randomized quantile residuals of the model against the logarithm of relative change. Monthly malaria case counts were logarithmically transformed after adding one. Then for each month, the difference between this value and the value for the previous month was taken. The diagonal is the fitted regression line. The fact that this line does not go through the origin but has a (small but significant plt0.05) positive intercept is another indication that the posterior distributions have, on average, too much mass to the left, and therefore, on average, overestimate the residuals. Figure 6 shows a plot of the autocorrelation function of the normalized randomized quantile residuals of the model. There is no indication of significant autocorrelation in the residuals, which was confirmed by the Ljung-Box test 44. The Ljung-Box statistic was 19.8 based on 24 lags, which was not significant (p 0.65) because the quantile corresponding to the 95 th percentile of a chi-squared distribution with 23 degrees freedom (24 degrees minus one fitted ARMA parameter) is 35.17. The Ljung-Box test is valid under these mild conditions of non-normality, although for stronger non-normality, the Ljung-Box test is not robust and tends to reject the null hypothesis of no autocorrelation too quickly 45 . Figure 6. Plot of the autocorrelation function of normalized randomized quantile residuals of the selected model. Conclusions To model a series of monthly counts of new malaria episodes in a district in Sri Lanka, GSARIMA models and GARIMA models with a deterministic seasonality component were developed. GSARIMA and GARIMA models are an extension of the class of GARMA models 16. and are suitable for parsimonious modelling of non-stationary seasonal time series of (over dispersed) count data with negative binomial conditional distribution. Models were presented with a choice of identity link function or logarithmic link function, and for the latter models, with a choice between two transformation methods to deal with zero value observations and using a threshold parameter. When a count time series has many observations of zero, both transformation methods and several threshold parameters should be explored in order to find the best fitting model. Bayesian GSARIMA and GARIMA models were applied to malaria case count time series data from Gampaha District in Sri Lanka. Both a GSARIMA and a GARIMA model with a deterministic seasonality component were selected, based on different criteria. The GARIMA model with deterministic seasonality showed a lower DIC, but the GSARIMA model had a lower mean absolute relative error on out of sample data, and needed fewer parameters. Bayesian modelling allowed for analysis of the posterior predictive distributions. The performance of the selected negative binomial model was compared with that of a Gaussian version of the model on Box-Cox transformed data. These distributions did not perfectly mirror the distribution of the residuals for either model. This is possibly an indication that the assumptions about the underlying distributions were not entirely appropriate for either case. However, analysis of the residuals showed that the posterior predictive distributions were much better for the negative binomial GSARIMA model than for its Gaussian version on transformed data when counts were low. Both models could account for autocorrelation in the data, but the negative binomial model had an 8 better MARE than the Gaussian version on transformed data (0.388 vs 0.423). The fact that the cumulative distribution functions do not perfectly match the diagonal in Figure 3A indicates that there is room for improvement, through modelling a more complex autocorrelation structure ( e. g. through time varying SARIMA parameters) and through the inclusion of covariates. It is also possible that assuming an underlying negative binomial distribution is not entirely appropriate. In the latter case, the DIC, which was based on this assumption, has less value than the MARE for comparison between models. Apart from the fact that the MARE does not depend on the assumption of a true underlying distribution, it is easier to for malaria control staff to interpret. G(S)ARIMA models may be particularly useful in the drive towards malaria elimination, but could also be applied to other fields. Although building and fitting Bayesian GSARIMA models is laborious, they may provide more realistic prediction distributions for time series of counts than do Gaussian methods on transformed data, especially when counts are low. Supporting Information

No comments:

Post a Comment