Wednesday, 11 October 2017

Autoregressiv Til Moving Average


Autoregressive Integrert Flytende Gjennomsnitt - ARIMA. DEFINITION av Autoregressive Integrert Flytende Gjennomsnitt - ARIMA. A Statistisk Analysemodell som bruker tidsseriedata for å forutsi fremtidige trender Det er en form for regresjonsanalyse som forsøker å forutsi fremtidige bevegelser langs tilsynelatende tilfeldig gang tatt av aksjer og finansmarkedet ved å undersøke forskjellene mellom verdiene i serien i stedet for å bruke de faktiske dataværdiene. Lags av de forskjellige seriene refereres til som autoregressive og lags innenfor prognostiserte data refereres til som bevegelige gjennomsnitt. BREAKING DOWN Autoregressive Integrated Moving Average - ARIMA. Dette modelltypen er generelt referert til som ARIMA p, d, q, med heltallene som refererer til de autoregressive integrerte og bevegelige gjennomsnittsdelene av datasettet, henholdsvis ARIMA-modellering kan ta hensyn til trender, sesongmessige sykluser, feil og ikke-stationære aspekter av et datasett når du lager prognoser. Innføring i ARIMA ikke-sasonlige modeller. ARIMA p, d, q forec asting equation ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres for å være stasjonær ved differensiering om nødvendig, kanskje i forbindelse med ikke-lineære transformasjoner som for eksempel logging eller deflatering, om nødvendig. En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstante over tid En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude, og den svinger på en konsistent måte, dvs. at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand Den sistnevnte tilstanden betyr at dets autokorrelasjoner korrelasjoner med sine egne tidligere avvik fra middelet forblir konstant over tid, eller tilsvarende at dets strømspektrum forblir konstant over tid En tilfeldig variabel av denne skjemaet kan ses som vanlig som en kombinasjon av signal og støy, og signalet hvis det er tydelig, kan være et mønster av rask eller langsom, gjennomsnittlig reversering eller sinusformet oscillat ion eller rask veksling i skilt, og det kan også ha en sesongkomponent. En ARIMA-modell kan ses som et filter som forsøker å skille signalet fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA prognose likning for en stasjonær tidsserie er en lineær ie regresjonstype likning der prediktorene består av lags av den avhengige variabelen og eller lagrer prognosefeilene som er. Predittverdien av Y er en konstant og eller en vektet sum av en eller nyere verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene bare består av forsinkede verdier av Y, er det en ren autoregressiv selvregressert modell, som bare er et spesielt tilfelle av en regresjonsmodell og som kunne være utstyrt med standard regresjonsprogramvare. For eksempel er en første-ordre autoregressiv AR 1-modell for Y en enkel regresjonsmodell der den uavhengige variabelen bare er Y forsinket med en periode LAG Y, 1 i Statgraphics eller Y LAG1 i RegressIt Hvis noen av prediktorene ligger på feilene, er en ARIMA-modell ikke en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere siste periode s-feil som en uavhengig variabel, feilene må beregnes i en periode til - periodebasis når modellen er montert på dataene Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellens spådommer ikke er lineære funksjoner av koeffisientene, selv om de er lineære funksjoner fra tidligere data. Så koeffisienter i ARIMA-modeller som inneholder forsinkede feil, må estimeres ved ikke-lineære optimaliseringsmetoder bakkeklatring i stedet for bare å løse et system av ligninger. Akronymet ARIMA står for automatisk regressiv integrert flytende gjennomsnitt Lags av den stationære serien i prognosekvasjonen kalles autoregressive Vilkår, lags av prognosen feilene kalles flytte gjennomsnittlige vilkår, og en tidsserie som må differensieres for å bli gjort stasjonær, sies å være en ikke revet versjon av en stasjonær serie Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En ikke-sasonlig ARIMA-modell er klassifisert som en ARIMA p, d, q-modell, hvor. p er Antall autoregressive termer. d er antall ikke-soneforskjeller som trengs for stasjonar, og Q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y angi forskjellen på Y noe som betyr. Merk at den andre forskjellen på Y d2-saken ikke er forskjellen fra 2 perioder siden. Det er først den forskjellen som er den første forskjellen som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjon av serien i stedet for sin lokale trend. Med hensyn til y er den generelle prognosekvasjonen her. De bevegelige gjennomsnittlige parametrene s er definert slik at deres tegn er negative i ligningen, etter konvensjonen innført av Box og Jen kins Noen forfattere og programvare, inkludert programmeringsspråket R, definerer dem slik at de har pluss tegn i stedet Når de faktiske tallene er plugget inn i ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren bruker når du leser utgangen Ofte er parameterne betegnet av AR 1, AR 2, og MA 1, MA 2 osv. For å identifisere den riktige ARIMA modellen for Y begynner du ved å bestemme rekkefølgen av differensiering d som trenger å stasjonære serien og fjerne bruttoegenskapene av sesongmessighet, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating Hvis du stopper på dette punktet og forutser at differensierte serier er konstante, har du bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stationære serien kan likevel fortsatt har autokorrelerte feil, noe som tyder på at et eller annet antall AR-termer p 1 og eller noen nummer MA-termer q 1 også er nødvendig i prognosekvasjonen. Prosessen med å bestemme t e-verdier av p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt i notatene hvis koblinger er øverst på denne siden, men en forhåndsvisning av noen av de typer ikke-sasonlige ARIMA-modellene som er vanligst opptatt er gitt nedenfor. ARIMA 1,0,0 førsteordens autoregressive modell hvis serien er stasjonær og autokorrelert, kanskje den kan forutses som et flertall av sin egen tidligere verdi, pluss en konstant Forutsigelsesligningen i dette tilfellet er. som er Y regressert i seg selv forsinket med en periode Dette er en ARIMA 1,0,0 konstant modell Hvis gjennomsnittet av Y er null, vil ikke den konstante termen bli inkludert. Hvis hellingskoeffisienten 1 er positiv og mindre enn 1 i størrelsen må den være mindre enn 1 i størrelsesorden hvis Y er stasjonær, beskriver modellen gjennomsnittsreferanseadferd hvor neste periode s-verdi skal anslås å være 1 ganger så langt unna gjennomsnittet som denne periodens verdi Hvis 1 er negativ, det forutser atferdsmessig oppførsel med skifteveksling s, det vil si at det også forutsier at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet i denne perioden. I en andre-ordens autoregressiv modell ARIMA 2,0,0 ville det være et Y t-2-uttrykk til høyre og så videre. Avhengig av tegn og størrelser på koeffisientene, kunne en ARIMA 2,0,0 modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelse av en masse på en fjær som er utsatt for tilfeldig shocks. ARIMA 0,1,0 tilfeldig tur Hvis serien Y ikke er stasjonær, er den enkleste modellen for den en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR 1-modell der den autoregressive koeffisienten er lik 1, det vil si en serie med uendelig sakte, gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som: hvor konstant sikt er den gjennomsnittlige perioden til periode-endringen, dvs. den langsiktige driften i Y Denne modellen kunne monteres som en ikke-intercept regresjonsmodell der den første forskjellen i Y er d ependent variabel Siden den bare inneholder en nonseasonal forskjell og en konstant term, er den klassifisert som en ARIMA 0,1,0 modell med konstant. Den tilfeldige-walk-uten-drift modellen ville være en ARIMA 0,1,0 modell uten konstant. ARIMA 1,1,0 differensierte førsteordens autoregressive modell Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligningen - dvs. ved å regresse den første forskjellen i Y i seg selv forsinket med en periode Dette ville gi følgende prediksjonsligning. Som kan omarrangeres til. Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-sesongforskjeller og en konstant term, dvs. en ARIMA 1,1,0 modell. ARIMA 0,1,1 uten konstant enkel eksponensiell utjevning En annen strategi for korrigering av autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier, for eksempel de som viser støyende flamme tuations rundt et sakte varierende middel, vil den tilfeldige turmodellen ikke utføre så vel som et glidende gjennomsnitt av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for den enkle eksponensielle utjevningsmodellen kan skrives inn i en rekke matematisk ekvivalente former hvorav den ene er den såkalte feilkorreksjonsformen, der den forrige prognosen er justert i retning av feilen som den gjorde. Fordi e t-1 Y t-1 - t-1 per definisjon, Dette kan skrives om som en ARIMA 0,1,1-uten-konstant prognosekvasjon med 1 1 - Dette betyr at du kan passe en enkel eksponensiell utjevning ved å spesifisere den som en ARIMA 0,1,1 modell uten con stant, og den estimerte MA 1-koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i de 1-fremadsprogede prognosene 1 som betyr at de vil ha tilbøyelighet til å ligge bak trender eller vendepunkter med ca 1 perioder Det følger at gjennomsnittsalderen for dataene i 1-periode fremover prognosene for en ARIMA 0,1,1-uten-konstant modell er 1 1 - 1 For eksempel hvis 1 0 8, gjennomsnittlig alder er 5 Når 1 nærmer seg 1, blir den ARIMA 0,1,1-uten-konstante modellen et veldig langsiktig glidende gjennomsnitt, og når 1 nærmer seg 0 blir det en tilfeldig tur uten drift model. What er den beste måten å korrigere for autokorrelasjon legge til AR-vilkår eller legge til MA-vilkår I de to foregående modellene ble problemet med autokorrelerte feil i en tilfeldig turmodell løst på to forskjellige måter ved å legge til en forsinket verdi av differenced serie til ligningen eller legge til en forsinket verdi av prognosen feil Hvilken tilnærming er best En tommelfingerregel for denne s ituation, som vil bli diskutert mer detaljert senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk i modellen og negativ autokorrelasjon er vanligvis best behandlet ved å legge til en MA-term. I forretnings - og økonomiske tidsserier, ofte negativ autokorrelasjon oppstår som en artefakt av differensiering Generelt reduserer differensiering positiv autokorrelasjon og kan til og med føre til en bryter fra positiv til negativ autokorrelasjon. ARIMA 0,1,1-modellen, der differensieringen er ledsaget av en MA-term, brukes hyppigere enn en ARIMA 1,1,0 modell. ARIMA 0,1,1 med konstant enkel eksponensiell utjevning med vekst Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk en viss fleksibilitet. Først og fremst er den estimerte MA 1-koeffisienten tillatt å være negativ dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren. For det andre har du muligheten til å inkludere en konstant term i t han ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null-trend. ARIMA 0,1,1-modellen med konstant har prediksjonsligningen. En-periode-prognosene fra denne modellen er kvalitativt lik SES modell, bortsett fra at bane av de langsiktige prognosene typisk er en skrå linje hvis helling er lik mu i stedet for en horisontal linje. ARIMA 0,2,1 eller 0,2,2 uten konstant lineær eksponensiell utjevning Lineære eksponensielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-sekundære forskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og selve forsinket av to perioder, men det er den første forskjellen i den første forskjellen - forandringen - i-forandringen av Y ved periode t Således er den andre forskjellen på Y ved periode t lik Y t-Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2Y t-1 Y t -2 En annen forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon som den måler res akselerasjonen eller krumningen i funksjonen på et gitt tidspunkt. ARIMA 0,2,2-modellen uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av de to siste prognosefeilene. som kan omarrangeres som. hvor 1 og 2 er MA 1 og MA 2-koeffisientene Dette er en generell lineær eksponensiell utjevningsmodell som i det vesentlige er den samme som Holt s-modellen, og Brown s-modellen er et spesielt tilfelle. Det bruker eksponentielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien De langsiktige prognosene fra denne modellen konvergerer til en rett linje, hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA 1,1,2 uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modellene. Det ekstrapolerer den lokale trenden i slutten av serien, men flater den ut på lengre prognoshorisonter for å introdusere et konservatismedokument, en praksis som har empirisk støtte Se artikkelen om Why the Damped Trend fungerer av Gardner og McKenzie og Golden Rule-artikkelen av Armstrong et al for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q ikke er større enn 1, det vil si ikke prøv å passe på en modell som ARIMA 2,1,2, da dette sannsynligvis vil føre til overfitting og fellesfaktorproblemer som diskuteres mer detaljert i notatene om den matematiske strukturen til ARIMA-modeller. Spreadsheet implementering ARIMA-modeller slik som beskrevet ovenfor er enkle å implementere på et regneark. Forutsigelsesligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B og feildataene minus prognosene i kolonne C Forutsigelsesformelen i en typisk celle i kolonne B ville rett og slett være et lineært uttrykk som refererer til verdier i de foregående radene i kolonne A og C , multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. RIMA står for autoregressive integrerte bevegelige gjennomsnittsmodeller Univariate single vector ARIMA er en prognose-teknikk som projiserer fremtidens verdier av en serie basert helt på egen treghet. Den viktigste søknad er innen korttidsprognoser som krever minst 40 historiske datapunkter. Det fungerer best når dataene dine viser et stabilt eller konsistent mønster over tid med et minimum av avvikere. Noen ganger kalt Box-Jenkins etter de opprinnelige forfattere, er ARIMA vanligvis overlegen til eksponensielle utjevningsteknikker når dataene er rimelig lange og korrelasjonen mellom tidligere observasjoner er stabil Hvis dataene er korte eller svært volatile, kan noen utjevningsmetode utføre bedre Hvis du ikke har minst 38 datapunkter, bør du vurdere noen andre metode enn ARIMA. Det første trinnet i å anvende ARIMA metodikk er å sjekke for stasjonar Stasjonar imp ligner at serien forblir på et forholdsvis konstant nivå over tid Hvis en trend eksisterer, som i de fleste økonomiske eller forretningsmessige applikasjoner, er dataene dine ikke stasjonære. Dataene skal også vise en konstant variasjon i svingningene over tid. Dette er lett å se med en serier som er tungt sesongbestemte og vokser i raskere takt. I et slikt tilfelle vil oppturer og nedturer i sesongmessigheten bli mer dramatisk over tid Uten disse stasjonære forholdene blir oppfylt, kan mange av beregningene knyttet til prosessen ikke beregnes. Hvis en grafisk tegning av dataene indikerer ikke-stationaritet, da skal du differensiere serien. Differensiering er en utmerket måte å transformere en ikke-stationær serie til en stasjonær en. Dette gjøres ved å trekke observasjonen i den nåværende perioden fra den forrige Hvis denne transformasjonen bare gjøres en gang til en serie, sier du at dataene først er differensiert. Denne prosessen eliminerer i hovedsak trenden hvis serien din vokser på en fairl y konstant rente Hvis den vokser i økende grad, kan du bruke samme prosedyre og forskjell dataene igjen. Dataene dine vil da bli annerledes forskjellig. Autokorrelasjoner er numeriske verdier som angir hvordan en dataserie er relatert til seg selv over tid Nærmere bestemt måler det hvor sterkt dataværdier ved et spesifisert antall perioder fra hverandre er korrelert til hverandre over tid Antallet perioder fra hverandre kalles vanligvis lag For For eksempel måler en autokorrelasjon ved lag 1 hvordan verdier 1 periode fra hverandre er korrelert til hverandre gjennom serien. En autokorrelasjon ved lag 2 måler hvordan dataene to perioder fra hverandre er korrelert gjennom serien. Autokorrelasjoner kan variere fra 1 til -1 En verdi nær 1 indikerer en høy positiv korrelasjon, mens en verdi nær -1 innebærer en høy negativ korrelasjon. Disse tiltakene blir oftest evaluert gjennom grafiske tomter kalt korrelagrammer. Et korrelagram plotter autokorrelasjonsverdiene for en gitt serie på forskjellige lag. Dette kalles for autokorrelasjonsfunksjon og er svært viktig i ARIMA-metoden. ARIMA-metodikken forsøker å beskrive bevegelsene i en stasjonære tidsserier som en funksjon av det som kalles autoregressive og bevegelige gjennomsnittsparametre. Disse kalles AR-parametere autoregessive og MA-parametere som beveger gjennomsnitt. En AR-modell med kun 1 parameter kan skrives som. som X t tidsserier under undersøkelse. A 1 den autoregressive parameteren for rekkefølge 1.X t-1 tidsserien forsinket 1 periode. E t feilperioden for modellen. Dette betyr bare at en gitt verdi X t kan forklares med en funksjon av sin tidligere verdi, X t - 1, pluss noe uforklarlig tilfeldig feil, E t Hvis den estimerte verdien av A 1 var 30, ville dagens verdi av serien være relatert til 30 av verdien 1 periode siden Selvfølgelig kunne serien være relatert til mer enn bare en siste verdi For eksempel. X t A 1 X t-1 A 2 X t-2 E t. Dette indikerer at dagens verdi av serien er en kombinasjon av de to umiddelbart foregående verdiene, X t-1 og X t - 2, pluss noen tilfeldig feil E t Vår modell er nå en autoregressiv modell av ordre 2.Moving Aver aldersmodeller. En annen type Box-Jenkins-modell kalles en bevegelig gjennomsnittsmodell. Selv om disse modellene ser veldig ut som AR-modellen, er konseptet bak dem ganske forskjellige. Flytte gjennomsnittlige parametere relaterer seg til hva som skjer i periode t bare til tilfeldige feilene som forekom i tidligere tidsperioder, dvs. E t-1, E t-2, osv. i stedet for til X t-1, X t-2, Xt-3 som i de autoregressive tilnærmingene. En flytende gjennomsnittsmodell med en MA-term kan skrives som følger. Betegnelsen B 1 kalles en MA i rekkefølge 1 Det negative tegnet foran parameteren brukes kun for konvensjon og skrives vanligvis ut automatisk ved de fleste dataprogrammer. Ovennevnte modell sier bare at en gitt verdi av X t er direkte relatert til den tilfeldige feilen i den foregående perioden, E t-1, og til dagens feilperiode, E t Som i tilfelle av autoregressive modeller kan de bevegelige gjennomsnittlige modellene utvides til høyere ordningsstrukturer som dekker forskjellige kombinasjoner og beveger gjennomsnittlig lengde. ARIMA metodikk als o lar modeller bygges som inneholder både autoregressive og bevegelige gjennomsnittsparametre sammen Disse modellene blir ofte referert til som blandede modeller Selv om dette gir et mer komplisert prognoseverktøy, kan strukturen faktisk simulere serien bedre og gi en mer nøyaktig prognose. Rene modeller innebærer at strukturen kun består av AR - eller MA-parametere - ikke begge. Modeller utviklet av denne tilnærmingen kalles vanligvis ARIMA-modeller fordi de bruker en kombinasjon av autoregressiv AR, integrasjon I - refererer til omvendt prosess av differensiering for å produsere prognosen, og beveger gjennomsnittlig MA-operasjoner En ARIMA-modell er vanligvis angitt som ARIMA p, d, q Dette representerer rekkefølgen på de autoregressive komponentene p, antall differensoperatører d og den høyeste rekkefølgen av den bevegelige gjennomsnittlige termen For eksempel ARIMA 2, 1,1 betyr at du har en andre ordre autoregressiv modell med en første ordre som beveger gjennomsnittlig komponent hvis serie er forskjellig påc e for å indusere stasjonar. Picking the Right Specification. Hovedproblemet i klassiske Box-Jenkins prøver å bestemme hvilken ARIMA-spesifikasjon som skal brukes - hvor mange AR - og MA-parametere som skal inkluderes. Dette er hvor mye Box-Jenkings 1976 var viet til Identifikasjonsprosessen Det avhenger av grafisk og numerisk vurdering av prøveautokorrelasjonen og delvise autokorrelasjonsfunksjoner Vel for de grunnleggende modellene er oppgaven ikke for vanskelig Hver har autokorrelasjonsfunksjoner som ser på en bestemt måte Men når du går opp i kompleksitet , mønstrene er ikke så lett oppdaget For å gjøre saken vanskeligere representerer dataene bare en prøve av den underliggende prosessen Dette betyr at prøvefeilutjevningsmidler, målefeil mm kan forvride den teoretiske identifikasjonsprosessen Det er derfor tradisjonell ARIMA-modellering er en kunst heller enn en vitenskap.

No comments:

Post a Comment