Wednesday, 2 August 2017

Jmp Glidande Medelvärde


Introduktion till ARIMA nonseasonal models. ARIMA p, d, q prognos Equation ARIMA-modeller är i teorin den vanligaste klassen av modeller för prognoser för en tidsserie som kan göras stationär genom differentiering om det behövs, kanske i samband med olinjära transformationer Till exempel loggning eller avflöde om det behövs En slumpmässig variabel som är en tidsserie är stillastående om dess statistiska egenskaper är konstanta över tid En stationär serie har ingen trend, dess variationer runt dess medelvärde har en konstant amplitud och det vinklar på ett konsekvent sätt Dvs dess kortsiktiga slumpmässiga tidsmönster ser alltid ut i statistisk mening. Det sistnämnda tillståndet betyder att dess autokorrelationsrelationer med sina egna tidigare avvikelser från medelvärdet förblir konstanta över tiden, eller likvärdigt, att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna form kan ses som vanligt som en kombination av signal och brus, och signalen om en är uppenbar kan vara en patt ingen snabb eller långsam medelåterföring eller sinusformad oscillation eller snabb växling i tecken och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som ett filter som försöker skilja signalen från bruset och signalen är då extrapoleras till framtiden för att erhålla prognoser. ARIMA-prognosen för en stationär tidsserie är en linjär dvs regressionstypsekvation där prediktorerna består av lags av den beroende variabeln och eller lags av prognosfel som är. Predicted value of Y En konstant och eller en vägd summa av en eller flera nya värden av Y och eller en vägd summa av en eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y är det en ren självregressiv självregresserad modell, Vilket bara är ett speciellt fall av en regressionsmodell och som kan utrustas med standard regressionsprogramvara. Till exempel är en första-ordningsautegressiv AR 1-modell för Y en enkel regressionsmodell där den oberoende variabeln i s bara Y fördröjt med en period LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Om några av prediktorerna lags av felen är en ARIMA-modell det inte en linjär regressionsmodell eftersom det inte finns något sätt att ange den senaste periodens fel Som en oberoende variabel måste felen beräknas under en period då modellen är monterad på data. Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellens förutsägelser inte är linjära funktioner hos Koefficienter trots att de är linjära funktioner i tidigare data Således måste koefficienter i ARIMA-modeller som innehåller fördröjda fel uppskattas genom olinjära optimeringsmetoder bergklättring snarare än genom att bara lösa ett system av ekvationer. Akronymet ARIMA står för auto-regressivt integrerat Flyttande medelvärden för den stationära serien i prognosen ekvationen kallas autoregressiva termer, lags av prognosfel kallas glidande medelvärden och en tidsserie som behöver Skilja sig från att bli stationär sägs vara en integrerad version av en stationär serie Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En nonseasonal ARIMA-modell är klassad som en ARIMA p, d, q modell, where. p är antalet autoregressiva termer. d är antalet icke-säsongsskillnader som behövs för stationaritet, ochqq är antalet fördröjda prognosfel i prediksionsekvationen. Prognosekvationen är konstruerad enligt följande Först, låt y beteckna d: n skillnaden i Y vilket betyder. Notera att den andra skillnaden i Y d2 fallet inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden som är Den diskreta analogen av ett andra derivat, dvs den lokala accelerationen i serien snarare än den lokala trenden. Med avseende på y är den generella prognosekvationen här. De rörliga genomsnittsparametrarna s definieras så att deras tecken är negativa i ekvationen Uation, enligt konventionen introducerad av Box och Jenkins Några författare och programvara inklusive R-programmeringsspråket definierar dem så att de har plustecken i stället När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention Din programvara använder när du läser utmatningen Vanligtvis anges parametrarna av AR 1, AR 2, och MA 1, MA 2 etc. För att identifiera lämplig ARIMA-modell för Y börjar du med att bestämma ordningen för differentiering d behöver att stationera serierna och ta bort säsongens bruttoegenskaper, kanske i kombination med en variansstabiliserande transformation som loggning eller deflatering. Om du slutar vid denna punkt och förutsäger att den olika serien är konstant har du bara utrustat en slumpmässig promenad eller slumpmässig trendmodell Dock kan den stationära serien fortfarande ha autokorrelerade fel, vilket tyder på att ett antal AR-termer p 1 och eller några nummer MA-termer q 1 också behövs I prognosekvationen. Processen att bestämma värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt i anteckningarna vars länkar finns högst upp på den här sidan, men en förhandsgranskning av vissa av de typer av icke-säsongsmässiga ARIMA-modeller som vanligtvis förekommer anges nedan. ARIMA 1,0,0 första ordningens autoregressiva modell om serien är stationär och autokorrelerad, kanske det kan förutsägas som ett flertal av sitt eget tidigare värde plus en Konstant Prognosekvationen i detta fall är vilken som Y är regresserad i sig fördröjd med en period. Detta är en ARIMA 1,0,0 konstant modell Om medelvärdet av Y är noll, skulle den konstanta termen inte inkluderas. Om lutningen koefficienten 1 är positiv och mindre än 1 i storleksordningen måste den vara mindre än 1 i storleksordningen om Y är stillastående, beskriver modellen medelåterkallande beteende där nästa period s-värde bör förutses vara 1 gånger så långt bort från medelvärdet som Denna period s värde om 1 är negativ, det Förutspår medelåterkallande beteende med teckenväxling, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om det ligger över medelvärdet i denna period. I en andraordningsautoregressiv modell ARIMA 2,0,0 skulle det finnas en Y t-2 termen till höger, och så vidare. Beroende på tecken och storheter på koefficienterna kan en ARIMA 2,0,0 modell beskriva ett system vars genomsnittliga reversering sker på ett sinusformigt oscillerande sätt, som rörelsen av en massa på en fjäder som utsätts för slumpmässiga shocks. ARIMA 0,1,0 slumpmässig promenad Om serien Y inte är stationär är den enklaste möjliga modellen för den en slumpmässig promenadmodell, som kan betraktas som ett begränsande fall av en AR 1-modell där den autoregressiva koefficienten är lika med 1, dvs en serie med oändligt långsam medelvärde. Förutsägningsekvationen för denna modell kan skrivas som. Om den konstanta termen är den genomsnittliga perioden för periodändring, dvs den långsiktiga Drift i Y Denna modell kan monteras som en icke-avlyssning Gressmodell där den första skillnaden i Y är den beroende variabeln Eftersom den endast innehåller en icke-sekundär skillnad och en konstant term, klassificeras den som en ARIMA 0,1,0-modell med konstant. Den slumpmässiga promenad-utan-driftmodellen skulle vara en ARIMA 0,1,0-modell utan konstant. ARIMA 1,1,0-differensierad första ordningens autoregressiv modell Om felen i en slumpmässig promenadmodell är autokorrelerad kanske problemet kan lösas genom att lägga en lag av den beroende variabeln till Prediksionsekvationen - dvs genom att regressera den första skillnaden i Y i sig själv fördröjd med en period. Detta skulle ge följande förutsägelsekvation. Det kan omordnas till. Detta är en första-orders autregressiv modell med en ordning av icke-säsongsskillnader och en konstant term - en ARIMA 1,1,0 modell. ARIMA 0,1,1 utan konstant enkel exponentiell utjämning En annan strategi för korrigering av autokorrelerade fel i en slumpmässig promenadmodell föreslås av den enkla exponentiella utjämningsmodellen. Kom ihåg att för vissa icke-stationära tidsserier, t ex de som uppvisar bullriga fluktuationer runt ett långsamt varierande medelvärde, utförs slumpmässiga gångmodellen inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, snarare än att ta den senaste observationen som prognosen för nästa observation , är det bättre att använda ett genomsnitt av de senaste få observationerna för att filtrera bort bruset och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägat glidande medelvärde av tidigare värden för att uppnå denna effekt. Förutsättningsekvationen för enkel exponentiell utjämningsmodell kan skrivas i ett antal matematiskt ekvivalenta former, varav en är den så kallade felkorrigeringsformen, där den föregående prognosen justeras i riktning mot det fel som det gjorde. Eftersom e t-1 Y t - 1 - t-1 per definition kan detta skrivas om som vilken är en ARIMA 0,1,1-utan konstant prognosförening med 1 1 - Det betyder att du kan passa en enkel exponentiell smoo sak genom att specificera den som en ARIMA 0,1,1 modell utan konstant, och den uppskattade MA 1-koefficienten motsvarar 1-minus-alfa i SES-formeln. Minns att i SES-modellen är medelåldern för data i 1- periodprognoser är 1 vilket innebär att de tenderar att ligga bakom trender eller vändpunkter med cirka 1 perioder. Det följer att den genomsnittliga åldern för data i de 1-prognoser framöver av en ARIMA 0,1,1 utan konstant modell är 1 1 - 1 Så, till exempel, om 1 0 8 är medelåldern 5 När 1 närmar sig 1 blir ARIMA 0,1,1 utan konstant modell ett mycket långsiktigt glidande medelvärde, och När 1 närmar sig 0 blir det en slumpmässig promenad utan driftmodell. Vad är det bästa sättet att korrigera för autokorrelation som lägger till AR-termer eller adderar MA-termer I de tidigare två modellerna som diskuterats ovan, problemet med autokorrelerade fel i en slumpmässig promenadmodell fixades på två olika sätt genom att lägga till ett fördröjt värde av den olika serien till ekvationen eller lägga till ett fördröjt värde för foreca st fel Vilket tillvägagångssätt är bäst En tumregel för denna situation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst av Lägga till en MA-term I affärs - och ekonomiska tidsserier uppstår negativ autokorrelation ofta som en artefakt av differentiering. I allmänhet minskar differentieringen positiv autokorrelation och kan till och med orsaka en växling från positiv till negativ autokorrelation. Således är ARIMA 0,1,1-modellen i vilken skillnad åtföljs av en MA-term, används oftare än en ARIMA 1,1,0-modell. ARIMA 0,1,1 med konstant enkel exponentiell utjämning med tillväxt Genom att implementera SES-modellen som en ARIMA-modell får du faktiskt lite flexibilitet För det första får den uppskattade MA 1-koefficienten vara negativ, vilket motsvarar en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren Sec Du har möjlighet att inkludera en konstant term i ARIMA-modellen om du vill, för att uppskatta en genomsnittlig icke-nollutveckling. ARIMA 0,1,1-modellen med konstant har förutsägelsesekvationen. En-tiden framåt prognoser från denna modell är kvalitativt lik SES-modellen, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje vars lutning är lika med mu snarare än en horisontell linje. ARIMA 0,2,1 eller 0, 2,2 utan konstant linjär exponentiell utjämning Linjära exponentiella utjämningsmodeller är ARIMA-modeller som använder två icke-säsongsskillnader i samband med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig självfördröjt med två perioder, men snarare är det den första skillnaden i den första skillnaden - förändringen i förändringen av Y vid perioden t Således är den andra skillnaden hos Y vid period t lika med Y t-Y t-1-Y t-1-Y t-2 Y t - 2Y t-1 Y t-2 En andra skillnad på en diskret funktion är analog s till ett andra derivat av en kontinuerlig funktion, mäter accelerationen eller krökningen i funktionen vid en given tidpunkt. ARIMA 0,2,2-modellen utan konstant förutspår att den andra skillnaden i serien motsvarar en linjär funktion av den sista två prognosfel. som kan omordnas som. där 1 och 2 är MA 1 och MA 2-koefficienterna Detta är en generell linjär exponentiell utjämningsmodell som är väsentligen densamma som Holt s-modellen och Brown s-modellen är ett speciellt fall. Det använder exponentiellt vägt Glidande medelvärden för att uppskatta både en lokal nivå och en lokal trend i serien. De långsiktiga prognoserna från denna modell konvergerar till en rak linje vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA 1,1,2 utan Konstant dämpad trend linjär exponentiell utjämning. Denna modell illustreras i de bifogade bilderna på ARIMA-modellerna. Det extrapolerar den lokala trenden i slutet av serien men plattar ut på längre prognoshorisonter för att introducera en konservatismens övning, en övning som har empiriskt stöd Se artikeln om Varför den dämpade trenden fungerar av Gardner och McKenzie och Golden Rule-artikeln från Armstrong et al för detaljer. Det är vanligtvis lämpligt att hålla sig till modeller där minst en av p Och q är inte större än 1, dvs försök inte passa en modell som ARIMA 2,1,2, eftersom det här sannolikt kommer att leda till överfitting och commonfactorproblem som diskuteras närmare i noterna på matematiska struktur av ARIMA-modeller. Spreadsheet implementation ARIMA-modeller som de som beskrivs ovan är enkla att implementera på ett kalkylblad. Förutsägningsekvationen är helt enkelt en linjär ekvation som refererar till tidigare värden av ursprungliga tidsserier och tidigare värden på felen. Således kan du ställa in ett ARIMA prognosräkningsblad genom att lagra data i kolumn A, prognosformeln i kolumn B och feldata minus prognoser i kolumn C Prognosformeln i en typisk cell i kolumn B skulle helt enkelt vara en linjär uttryck n hänvisar till värden i föregående rader av kolumnerna A och C multiplicerat med lämpliga AR - eller MA-koefficienter lagrade i cellerna någon annanstans på kalkylbladet. Förtroendeintervall popuplistan låter dig ställa konfidensnivå för prognosförtroendeband. Dialogerna för säsongsbetonade utjämningsmodeller inkluderar en period per säsong för att ställa in antal perioder under en säsong Begränsa popuplistan låter dig ange vilken typ av begränsning du vill genomdriva på utjämningsvikterna under passningen. Begränsningarna är exemplar dialogrutan så att du kan för att ställa in begränsningar för individuella utjämningsvikter Varje utjämningsvikt kan vara Bounded Fixed eller Unconstrained som bestäms av popupmenyns inställning bredvid viktens namn. När värdena anges för fasta eller avgränsade vikter kan värdena vara positiva eller negativa reella tal. Exemplet som visas här har nivån vikt fastställd till ett värde av 0 3 och trendvikten begränsad av 0 1 och 0 8 I detta fall är värdet av e Trendvikt får röra sig inom intervallet 0 1 till 0 8 medan Nivåvikt hålls vid 0 3 Observera att du kan ange alla utjämningsvikter i förväg genom att använda dessa anpassade begränsningar. I så fall skulle ingen av vikterna vara uppskattad från data, även om prognoser och restvärden fortfarande skulle beräknas. När du klickar på Estimate visas resultaten av passformen i stället för dialogrutan. Modellen för enkel exponentiell utjämning är. Utjämningsekvationen L tyt 1 L t -1 definieras i Villkor för en enda utjämningsvikt Denna modell motsvarar en ARIMA 0, 1, 1-modell där. Jag kan erbjuda ett par strategier här. Jag tror att båda är effektivare att Summation-operatören du använder för närvarande, jag kan inte säga att de är den mest effektiva möjliga though.1 Använd sumfunktionen på en matris. Detta utnyttjar hastigheten på matrisoperationen Subscriptionen av kolumnen Nuvarande i denna formel är en matris av radnumren från början av det glidande medelfönstret till de nuvarande radnummer Min prenumeration av kolumnen på detta sätt JMP returnerar en matris och sumfunktionen är relativt effektiv över en matris. En ännu snabbare väg är dock att beräkna detta glidande medelvärde över två kolumner. Den första kolumnen behåller helt enkelt en rörlig summa genom att lägga till värdet av ström i en rad till värdet av rullande summa i föregående rad och sedan subtrahera värdet av strömmen från raden i början av fönstret. Här är formeln för Moving Sum. Sedan är det enkelt att ha en kolumn som delar Moving Sum av Moving Avg Window. I m bifogar en datatabell som visar båda dessa metoder I datatabellen är Moving Avg-fönstret ett datatabellvariabelt. För att se effektiviteten för den andra metoden i denna datatabell kan du vilja att undertrycka utvärderingen av kolumnen Moving Avg x först. Jag kan erbjuda ett par strategier här. Jag tror att båda är effektivare att Summation-operatören du använder för närvarande, jag kan inte säga att de är mest effektiva du gh.1 Använd sumfunktionen på en matris. Detta utnyttjar hastigheten på matrisoperationen Subscripten av Aktuell kolumn i denna formel är en matris av radnumren från början av det glidande medelfönstret till det aktuella radnumret Min prenumeration av kolumnen på detta sätt JMP returnerar en matris och sumfunktionen är relativt effektiv över en matris. En ännu snabbare väg är dock att beräkna detta glidande medelvärde över två kolumner. Den första kolumnen behåller helt enkelt en rörlig summa genom att lägga till värdet av Aktuellt i en rad till värdet av rullande summa i föregående rad och sedan subtrahera värdet av strömmen från raden i början av fönstret. Här är formeln för Moving Sum. Then är det enkelt att ha en kolumn som delar Moving Sum av Moving Avg Window. I m bifogar en datatabell som visar båda dessa metoder I datatabellen är Moving Avg Window ett datatabellvariabelt. För att se effektiviteten hos den andra metoden i denna datatabell kanske du vill undertrycka e utvärdering av kolumnen Flyttande medel x först.

No comments:

Post a Comment