Capitolul 6. Econometria serii temporale

6.1. Modele de serii temporale staționare și nestaționare, identificarea lor

Să luăm în considerare seria temporală X(t). Lăsați seria temporală să ia mai întâi valori numerice. Acesta poate fi, de exemplu, prețul unei pâini dintr-un magazin din apropiere sau cursul de schimb dolar-ruble la cel mai apropiat birou de schimb valutar. De obicei, în comportamentul unei serii de timp sunt identificate două tendințe principale - o tendință și fluctuațiile periodice.

În acest caz, tendința este înțeleasă ca dependența de timp a unui tip liniar, pătratic sau de alt tip, care este relevată printr-una sau alta metodă de netezire (de exemplu, netezire exponențială) sau prin calcul, în special, folosind metoda celor mai mici pătrate. . Cu alte cuvinte, o tendință este tendința principală a unei serii de timp, curățată de aleatoriu.

Seria temporală oscilează de obicei în jurul unei tendințe, abaterile de la tendință fiind adesea corecte. Adesea, acest lucru se datorează unei frecvențe naturale sau desemnate, cum ar fi sezonieră sau săptămânală, lunară sau trimestrială (de exemplu, conform programelor de plată a salariilor și impozitelor). Uneori, prezența periodicității și cu atât mai mult cauzele acesteia sunt neclare, iar sarcina econometricianului este să afle dacă există într-adevăr o periodicitate.

Metodele elementare de estimare a caracteristicilor seriilor de timp sunt de obicei considerate suficient de detaliat în cursurile „Teoriei generale a statisticii” (a se vedea, de exemplu, manuale), deci nu este nevoie să le analizăm în detaliu aici. (Cu toate acestea, unele metode moderne de estimare a duratei perioadei și a componentei periodice în sine vor fi discutate mai jos.)

Caracteristicile seriilor temporale. Pentru un studiu mai detaliat al seriilor temporale se folosesc modele probabilistic-statistice. În același timp, seria temporală X(t) considerat ca un proces aleator (cu timp discret) principalele caracteristici sunt asteptarea matematica X(t), adică

dispersie X(t), adică

și funcția de autocorelare serii de timp X(t)

acestea. funcția a două variabile, egal cu coeficientul corelații între două valori ale serii de timp X(t)și X(e).

În cercetarea teoretică și aplicată, sunt luate în considerare o gamă largă de modele de serie de timp. Selectați mai întâi staționar modele. Au funcții de distribuție comună pentru orice număr de momente k, și, prin urmare, toate caracteristicile seriei de timp enumerate mai sus nu se schimba in timp. În special, media și varianța sunt constante, funcția de autocorelare depinde doar de diferență t-s. Se numesc serii temporale care nu sunt staţionare nestaționare.

Modele de regresie liniară cu reziduuri homoscedastice și heteroscedastice, independente și autocorelate. După cum se poate observa din cele de mai sus, principalul lucru este „curățarea” seriilor temporale de abaterile aleatorii, adică. evaluare așteptări matematice. Spre deosebire de modelele de regresie mai simple discutate în capitolul 5, modelele mai complexe apar în mod natural. De exemplu, variația poate depinde de timp. Astfel de modele sunt numite heteroscedastice, iar cele în care nu există dependență de timp sunt numite homoscedastice. (Mai precis, acești termeni se pot referi nu numai la variabila „timp”, ci și la alte variabile.)

Mai mult, în capitolul 5, sa presupus că erorile sunt independente unele de altele. În ceea ce privește acest capitol, aceasta ar însemna că funcția de autocorelare ar trebui să fie degenerată - egală cu 1 dacă argumentele sunt egale și 0 dacă nu sunt. Este clar că acest lucru nu este întotdeauna cazul pentru seriale în timp real. Dacă cursul natural al modificărilor în procesul observat este suficient de rapid în comparație cu intervalul dintre observațiile succesive, atunci ne putem aștepta la „decolorarea” autocorelației și obținerea de reziduuri aproape independente, în caz contrar reziduurile vor fi autocorelate.

Identificarea modelului. Identificarea modelului este de obicei înțeleasă ca dezvăluirea structurii lor și a parametrilor de estimare. Întrucât structura este și un parametru, deși unul nenumeric (vezi Capitolul 8), vorbim despre una dintre sarcinile tipice ale econometriei - estimarea parametrilor.

Problema de estimare este cel mai ușor de rezolvat pentru modele liniare (din punct de vedere al parametrilor) cu reziduuri independente homoscedastice. Restaurarea dependențelor în serii de timp poate fi efectuată pe baza metodelor celor mai mici pătrate și modulele minime discutate în Capitolul 5 al modelelor de regresie liniară (pe parametri). Rezultatele asociate cu estimarea setului necesar de regresori pot fi transferate în cazul seriilor de timp; în special, este ușor de obținut distribuția geometrică limitativă a estimării gradului unui polinom trigonometric.

Totuși, un transfer atât de simplu nu poate fi făcut într-o situație mai generală. Deci, de exemplu, în cazul unei serii temporale cu reziduuri heteroscedastice și autocorelate, puteți utiliza din nou abordarea generală a metodei celor mai mici pătrate, dar sistemul de ecuații al metodei celor mai mici pătrate și, firește, soluția acestuia va fi diferită. . Formulele din punct de vedere algebrei matriceale menționate în capitolul 5 vor fi diferite. Prin urmare, metoda în cauză se numește „ cele mai mici pătrate generalizate(OMNK)" (vezi, de exemplu,).

Cometariu. După cum sa observat în capitolul 5, cel mai simplu model al metodei celor mai mici pătrate permite generalizări foarte îndepărtate, în special în domeniul sistemelor de ecuații econometrice simultane pentru serii de timp. Pentru a înțelege teoria și algoritmii relevanți, sunt necesare cunoștințe profesionale despre algebra matriceală. Așadar, îi trimitem pe cei interesați la literatura de specialitate privind sistemele de ecuații econometrice și direct pe serii de timp, în care există mult interes pentru teoria spectrală, i.e. separând semnalul de zgomot şi descompunându-l în armonici. Subliniem încă o dată că în spatele fiecărui capitol această carte există o arie mare de cercetare științifică și aplicată, destul de demnă de a-i dedica mult efort. Totuși, din cauza volumului limitat al cărții, suntem nevoiți să facem prezentarea concisă.

Anterior

INTRODUCERE

Modelele existente de serii de timp sunt utilizate pe scară largă în procesul de studiu a dinamicii fenomenelor reale de natură variată. Ele sunt adesea utilizate în studiile dinamicii fluxurilor de mărfuri și pasageri, stocurile de mărfuri și depozite, procesele de migrare, analize. procese chimice, modelând diverse evenimente naturale. Modelele serii cronologice sunt utilizate cel mai activ în analiză piețele financiare, atunci când se evaluează modificări ale indicatorilor financiari, se prognozează prețurile pentru diverse bunuri, prețurile acțiunilor, ratele cursului de schimb etc.

O gamă largă de procese sociale și naturale reale poate fi reprezentată de obicei printr-un set de valori succesive ale indicatorului estimat y 1 , y 2 ,..., y t ,..., y T, care sunt fixate în anumite momente. t=1,2,.. .T, deci intervalul (t, t+1) este constant. Setul specificat de valori pentru t , t=1,2,... se numește de obicei o serie temporală (serie temporală). O astfel de serie este un proces în timp discret.

Modificări ale valorilor lui y t în timp în viata reala apar de obicei sub influența oricăror cauze, factori. Totuși, diversitatea lor, complexitatea măsurării, incertitudinea în ipotezele despre existența relațiilor cu variabila y complică foarte mult justificarea și construirea unui „adecvat” pentru descrierea procesului y t , t=1,2,... model econometric multifactorial de tip clasic. Prin urmare, se presupune adesea că influența combinată a acestor factori formează modele interne în raport cu procesul y t .

Această ipoteză are ca scop utilizarea modelelor econometrice dintr-o anumită clasă de modele de serie de timp pentru a descrie procesele în timp real.

MODELE STANȚIONARE SERIE DE CRONOLOGICĂ

Caracteristici ale seriilor de timp staționare și teste pentru staționaritate

Toate modelele serii temporale au o proprietate comună, care se bazează pe ipoteza unei dependențe semnificative a valorii curente a nivelului indicatorului y t de istoria acestuia. Cu alte cuvinte, nivelul indicatorului y t este generat de valorile y t-1 , y t-2 ,... pe baza regularităților caracteristice acestei serii de timp.

Această ipoteză este exprimată prin ecuația generală:

y t = f(y t-1 , y t-2 , …) + t (1.1)

unde t este eroarea modelului la momentul t.

Aici, funcția f reflectă natura relațiilor care există în seria temporală considerată y t , t=1,2,... Selectarea cu succes a funcției f determină un grad ridicat de aproximare a părții „deterministe” drepte a expresia (1.1) la valorile reale ale seriei. Gradul acestei aproximări este de obicei caracterizat de estimări și proprietăți de eroare ale seriei t, t=1,2,... în acest caz ne referim, în primul rând, la varianța minimă, corespondența cu zgomotul alb etc.

Pentru o gamă largă de procese, funcția f are vedere liniară. De exemplu,

y t = a 1 y t-1 + a n y t-n + t .

Modelele liniare ale serii de timp sunt utilizate, de regulă, pentru a descrie procesele staționare, în timp ce procesele staționare de ordinul doi sunt înțelese. Pentru un proces staționar de ordinul al n-lea, valorile tuturor momentelor sale de ordinul lui n și mai jos pe toate intervalele de timp incluse în intervalul t=1,2,..., T sunt constante. Procesele strict staționare se disting prin faptul că momentele lor de toate ordinele sunt constante. Din cele de mai sus rezultă că pentru oricare două intervale de timp (T 1 , T 2) și (T 3 , T 4) pentru un proces staționar de ordinul doi la t, trebuie îndeplinite următoarele condiții:

egalitatea așteptărilor matematice;

Egalitatea varianțelor;

Egalitatea coeficienților de autocorelație de un ordin.

Matematic, aceste condiții sunt exprimate prin relațiile:


unde - estimări ale așteptărilor matematice;

D 1 (y), D 2 (y) - estimări ale variațiilor;

Estimări ale coeficienților de autocorelație de ordinul i ai procesului y t pe intervalele 1 și respectiv 2;

Valoarea medie a procesului (estimarea așteptărilor matematice) pe intervalul (1,T);

D(y) - estimarea dispersiei procesului pe intervalul (1,T).

Într-un studiu real al seriilor de timp staționare, egalitățile (1.2)-(1.4) sunt considerate în sens statistic. Acest lucru dă motive să se afirme că, chiar și cu o corespondență incompletă, ipoteza constanței așteptării matematice a procesului y t poate fi acceptată dacă valorile și un anumit criteriu statistic sunt îndeplinite.

Sunt utilizate diverse teste pentru a verifica dacă seria temporală y t, t=1,2,... este în concordanță cu procesul staționar și că sunt îndeplinite condițiile (1.2)-(1.4). Dacă rezultatele unuia dintre ele nu fac posibilă afirmarea adevărului sau falsității ipotezei prezentate, atunci poate fi necesar să se utilizeze mai multe teste pentru a testa aceeași condiție.

Întregul set de teste pentru staționaritatea seriilor de timp poate fi împărțit în trei grupuri principale: teste neparametrice, semiparametrice și parametrice.

Testele neparametrice nu avansează nicio informație despre legea distribuției seriei de timp testate, parametrii acesteia. Ele se bazează pe studiul relației dintre succesiunea valorilor care o formează, vă permit să identificați prezența sau absența modelelor în durata și (sau) alternarea seriei lor, formate, de exemplu, din secvențe. a unităţilor populaţiei cu aceleasi semne, schimbarea indicatoarelor pentru aceste unitati etc.

Testele semiparametrice folosesc ipoteze relativ slabe cu privire la natura distribuției valorilor seriilor temporale. Ei reflectă proprietăți generale funcții de distribuție a incrementelor de valori ale seriei - simetrie, locația cuantilelor.

Când se utilizează metodele acestui grup, estimările parametrilor de distribuție sunt estimate prin statistici de ordine: media peste mediană, abaterea standard - pe intervalul nivelurilor seriei etc.

Testele parametrice sunt utilizate în baza unor ipoteze relativ stricte cu privire la legea distribuției seriei de timp și a parametrilor acesteia. Aceste teste fac posibilă aprecierea gradului de aproximare a caracteristicilor empirice (observate) ale distribuției seriilor temporale la nivelurile teoretice calculate.

Acest grad de aproximare face posibilă acceptarea sau respingerea ipotezei că proprietățile seriei considerate corespund unui proces staționar.

Introducere………………………………………………………………….2

1. Principalele sarcini ale analizei seriilor temporale…………….4

2. Analiza serii cronologice…………………………………………….9

11

2.3 Modele de serii temporale staționare și identificarea lor…13

2.3.2. Modele de ordine medie mobile q (modele MA(q))….17

Concluzie…………………………………………………………………21

Literatură………………………………………………………..23

Introducere

LA anul trecutîn literatura econometrică se acordă multă atenţie studiului seriei de dinamică a indicatorilor de timp. O varietate de sarcini de fond ale analizei economice necesită utilizarea datelor statistice care caracterizează procesele economice studiate și desfășurate în timp sub formă de serii cronologice. În același timp, aceleași serii cronologice sunt adesea folosite pentru a rezolva diferite probleme de fond.

Nu întotdeauna valorile seriei temporale se formează numai sub influența oricăror factori. Se întâmplă adesea ca dezvoltarea unui anumit proces să se datoreze legilor sale interne, iar abaterile de la un proces determinist sunt cauzate de erori de măsurare sau fluctuații aleatorii. De un interes deosebit sunt procesele care sunt în modul „tranzițional”, adică. procese care sunt în esență „staționare” dar prezintă proprietățile unei serii temporale nestaționare pe intervalul de timp studiat, ceea ce se explică prin condițiile inițiale departe de regimul staționar. În situațiile în care seria temporală se formează sub influența unui anumit set de factori aleatori și nealeatori, analiza serii temporale individuale, atât rezultante, cât și factori, este de mare importanță. Acest lucru este necesar pentru identificarea corectă a modelelor care sunt construite pe baza informațiilor despre procesele studiate (autoregresii vectoriale, modele de corectare a erorilor, modele dinamice cu întârzieri distribuite etc.).

La analiza seriilor temporale, atenția principală este acordată studiului, descrierii și/sau modelării structurii acestora. Scopul unor astfel de studii, de regulă, este mai larg decât simpla modelare a studiului proceselor relevante. Modelul construit este de obicei folosit pentru a extrapola sau prezice o serie de timp, iar apoi calitatea prognozei poate servi ca un criteriu util atunci când alegeți dintre mai multe modele alternative. Construirea unor modele de serie bune este necesară și pentru alte aplicații, cum ar fi ajustarea sezonieră și netezirea. În final, modelele construite pot fi utilizate pentru modelarea statistică a serii lungi de observații în studiul sistemelor mari, pentru care seria temporală este considerată ca informație de intrare.

Datorită prezenței erorilor în măsurarea indicatorilor economici, prezenței unor fluctuații aleatorii inerente sistemelor observate, abordarea probabilistic-statistică este utilizată pe scară largă în studiul seriilor temporale. În cadrul acestei abordări, seria temporală observată este înțeleasă ca realizarea unui proces aleatoriu. În același timp, se presupune implicit că seria temporală are o structură care o deosebește de o secvență de variabile aleatoare, deci observațiile nu sunt un set de valori numerice complet independente. (Unele elemente ale structurii seriei pot fi uneori identificate deja pe baza unei analize vizuale simple a graficului seriei. Acest lucru se aplică, de exemplu, unor componente ale seriei cum ar fi tendința și ciclurile.) De obicei, se presupune că structura seria poate fi descrisă de un model care conține un număr mic de parametri în comparație cu numărul de observații, acest lucru este practic important atunci când se utilizează modelul pentru prognoză. Exemple de astfel de modele sunt modele de autoregresie, medie mobilă și combinațiile acestora - modelele AR(p), MA(q), ARMA(p, q), ARIMA(p, k, q).

La construirea modelelor de relaţii pe termen lung este necesar să se ţină cont de faptul că seria macroeconomică analizată are sau nu o tendinţă stocastică (nedeterministă). Cu alte cuvinte, este necesar să se decidă dacă fiecare dintre seriile luate în considerare aparține clasei de serii care sunt staționare în raport cu o serie de tendință deterministă (sau pur și simplu staționară) - serie TS (tendință staționară), sau clasei de serie care au o tendință stocastică (poate împreună cu o tendință deterministă) și care conduc la o serie staționară (sau staționară în raport cu o tendință deterministă) numai printr-o diferențiere unică sau de k-ori a seriei - seria DS (diferență staționară). Diferența fundamentală dintre aceste două clase de serii este că, în cazul seriei TS, scăderea tendinței deterministe corespunzătoare din serie duce la rând staționar, în timp ce în cazul unei serii DS, scăderea componentei deterministe a seriei lasă seria nestaționară din cauza prezenței unei tendințe stocastice în ea.

Capitolul 1. Principalele sarcini ale analizei seriilor temporale.

Diferențele fundamentale dintre o serie de timp și o secvență de observații care formează un eșantion aleatoriu sunt următoarele:

în primul rând, spre deosebire de elementele unui eșantion aleatoriu, membrii seriei temporale nu sunt independenți;

în al doilea rând, membrii seriei temporale nu sunt neapărat distribuiți în mod egal, deci P(xt< x} P{xt < x} при t t.

Aceasta înseamnă că proprietățile și regulile analizei statistice ale unui eșantion aleatoriu nu pot fi extinse la seriile de timp. Pe de altă parte, interdependența membrilor seriei temporale își creează propria bază specifică pentru construirea valorilor predictive ale indicatorului analizat pe baza valorilor observate.

Geneza observațiilor care formează o serie temporală (mecanism de generare a datelor). Este despre despre structura și clasificarea principalilor factori sub influența cărora se formează valorile seriei de timp. De regulă, se disting 4 tipuri de astfel de factori.

Pe termen lung, formând o tendință generală (pe termen lung) în schimbarea caracteristicii analizate xt. De obicei, această tendință este descrisă folosind una sau alta funcție non-aleatorie ftr(t) (al cărei argument este timpul), de obicei monotonă. Această funcție se numește funcție de tendință sau pur și simplu tendință.

Sezoniere, formându-se periodic repetate în anumit timp ani de fluctuație a trăsăturii analizate. Deoarece această funcție (e) trebuie să fie periodică (cu perioade care sunt multiple de „anotimpuri”), exprimarea ei analitică implică armonici ( funcții trigonometrice), a cărei frecvență, de regulă, este determinată de esența conținutului sarcinii.

Ciclice (oportuniste), care formează modificări ale trăsăturii analizate, datorită acțiunii unor cicluri de lungă durată de natură economică sau demografică (valuri Kondratiev, „gropi” demografice etc.) Se va nota rezultatul acțiunii factorilor ciclici. folosind o funcție non-aleatorie (t).

Aleatoriu (neregulat), nu este supus contabilității și înregistrării. Influența lor asupra formării valorilor seriei temporale determină doar natura stocastică a elementelor xt și, în consecință, necesitatea interpretării x1,…, xT ca observații făcute asupra variabilelor aleatoare 1,…, T. va desemna rezultatul impactului factorilor aleatori folosind cantități aleatorii („reziduuri”, „erori”) t.

Desigur, nu este deloc necesar ca factorii din toate cele patru tipuri să participe simultan la procesul de formare a valorilor oricărei serii cronologice. Concluziile despre faptul dacă factorii de acest tip sunt implicați sau nu în formarea valorilor unei anumite serii se pot baza atât pe analiza conținutului esenței problemei, cât și pe o analiză statistică specială a seriei temporale studiate. . Cu toate acestea, în toate cazurile, se presupune participarea indispensabilă a factorilor aleatori. Astfel, în vedere generala modelul de generare a datelor (cu o diagramă bloc aditivă a influenței factorilor) arată astfel:

xt = 1f(t) + 2(t) +3(t) + t. (unu)

unde i = 1 dacă factorii de tip i sunt implicați în formarea valorilor seriei și i = 0 în caz contrar.

Principalele sarcini ale analizei seriilor temporale. Scopul de bază al analizei statistice a unei serii de timp este de a urmări traiectoria existentă a acestei serii:

determinați care dintre funcțiile non-aleatoare sunt prezente în expansiune (1), adică determinați valorile indicatorilor i;

construiți estimări „bune” pentru acele funcții non-aleatoare care sunt prezente în expansiune (1);

alegeți un model care descrie în mod adecvat comportamentul reziduurilor aleatoare t și evaluați statistic parametrii acestui model.

Rezolvarea cu succes a sarcinilor enumerate, datorită scopului de bază al analizei statistice a seriei de timp, stă la baza atingerii obiectivelor finale de cercetare aplicată și, în primul rând, pentru rezolvarea problemei prognozei pe termen scurt și mediu. a valorilor seriei de timp. Să prezentăm pe scurt principalele elemente ale analizei econometrice a seriilor de timp.

· Majoritatea metodelor matematico-statistice se ocupă de modele în care se presupune că observațiile sunt independente și distribuite egal. În același timp, dependența dintre observații este considerată cel mai adesea un obstacol în calea aplicării eficiente a acestor metode. Totuși, diverse date din economie, sociologie, finanțe, comerț și alte domenii ale activității umane vin sub forma unor serii temporale în care observațiile sunt reciproc dependente, iar natura acestei dependențe este tocmai principalul interes pentru cercetător. Setul de metode și modele pentru studierea unor astfel de serii de observații dependente se numește analiză a seriilor de timp. Scopul principal al analizei econometrice a seriilor temporale este de a construi, pe cât posibil, modele simple și parametrizate economic, care să descrie adecvat seria de observații disponibile și să formeze baza pentru rezolvarea, în primul rând, a următoarelor sarcini:

(a) dezvăluirea mecanismului genezei observațiilor care alcătuiesc cele analizate

(b) serii de timp;

(c) construirea unei previziuni optime pentru valorile viitoare ale seriei de timp;

dezvoltarea unei strategii de gestionare si optimizare a proceselor analizate.

· Vorbind despre geneza observațiilor care formează o serie temporală, ar trebui să ținem cont (și, dacă este posibil, să descriem într-un mod model) patru tipuri de factori sub influența cărora se pot forma aceste observații: pe termen lung, sezonier , ciclic (sau conjunctural) și aleatoriu. În același timp, factorii din toate cele patru tipuri nu ar trebui să participe neapărat la procesul de formare a valorilor unei anumite serii de timp. Rezolvarea cu succes a problemelor de identificare și modelare a acțiunii acestor factori stă la baza, punctul de bază de plecare pentru atingerea obiectivelor finale ale cercetării aplicate, principalele dintre acestea fiind menționate în paragraful anterior.

· Când începeți să analizați o serie discretă de observații aranjate în ordine cronologică, trebuie în primul rând să vă asigurați dacă alți factori decât cei pur aleatori au participat cu adevărat la formarea valorilor acestei serii. În același timp, „pur aleatoriu” înseamnă doar acei factori aleatori, sub influența cărora sunt generate secvențe de variabile aleatoare necorelate reciproc și distribuite identic, care au medii și varianțe constante (independente de timp).

Dacă, ca urmare a verificării astfel ipoteza statistica s-a dovedit că observațiile disponibile sunt reciproc dependente (și, eventual, distribuite inegal), apoi se procedează la selectarea unui model adecvat pentru această serie. Setul de modele în cadrul căruia se efectuează această selecție este de obicei limitat la următoarele clase de modele: (a) clasa de serii de timp staționare (care sunt utilizate în principal pentru a descrie comportamentul „reziduurilor aleatoare”), (b) clasă de serii temporale nestaționare, care sunt suma o tendință deterministă și o serie de timp staționară, (c) o clasă de serii temporale nestaționare care au o tendință stocastică care poate fi eliminată prin diferențierea succesivă a seriei (adică prin trecerea de la o serie de niveluri la o serie de diferenţe de ordinul întâi sau superior).

Ca parte a analizei econometrice a seriilor temporale de indicatori macroeconomici economia rusă realizată în această lucrare, combinăm seria din clasele (a) și (b) într-o singură clasă, pe care, urmând practica recentă [vezi, de exemplu, Maddala, Kim (1998), o numim clasa TS- rânduri ( serie de tendințe staționare - rânduri care sunt staționare în raport cu o tendință deterministă). O metodă adecvată pentru seriile de timp staționare aparținând clasei (b) este scăderea unei tendințe deterministe din serie. Dimpotrivă, pentru seriile aparținând clasei (c), o metodă adecvată pentru seria staționară este trecerea de la o serie de niveluri la o serie de diferențe (de ordinul întâi sau superior).

· Seriile temporale staționare (în sens larg) xt se caracterizează prin faptul că valorile lor medii Ext, variațiile Dxt și covarianțele () = E nu depind de t pentru care sunt calculate. Interdependențele care există între membrii unei serii de timp staționare, de regulă, pot fi descrise în mod adecvat în cadrul modelelor autoregresive de ordin p (modele AR(p)), modelelor cu medii mobile de ordin q (MA(q) -modele), sau modele autoregresive medii mobile în resturile de ordin p și q (modele ARMA(p, q)) .

· O serie temporală xt se numește integrată (integrată) de ordin k dacă diferențele succesive kxt ale acestei serii de ordin k (dar nu mai puțin de ordin!) formează o serie temporală staționară. Comportamentul unor astfel de serii, inclusiv serii care conțin o componentă sezonieră, în problemele econometrice aplicate este descris cu destul de mult succes utilizând modele integrate de autoregresie p, k și q (modele ARIMA(p, k, q)) și unele dintre modificările acestora. . Această clasă include și cel mai simplu model de tendință stocastică - procesul de mers aleatoriu (ARIMA(0, 1, 0)). Creșterile aleatorii de mers formează o secvență de variabile aleatoare independente, distribuite identic („zgomot alb”). Prin urmare, procesul de mers aleatoriu este numit și „zgomot alb integrat”.

În prezent, clasa serii integrate de ordin k include și serii pentru care diferența de ordin k (dar nu mai puțin!) este un proces care este staționar în raport cu o tendință deterministă. Aceasta este definiția folosită în munca noastră. În plus, dacă seria temporală în sine este staționară sau staționară în raport cu o tendință deterministă (serie TS), atunci este definită ca o serie integrată de ordin zero.

În prezența sezonalității, uneori este posibil să se obțină o serie staționară trecând la diferențele nu ale valorilor învecinate ale seriei, ci ale valorilor separate de numărul corespunzător de unități de timp. De exemplu, cu date trimestriale, pentru a obține staționaritatea, poate fi suficient să mergeți la o secvență de diferențe în valorile seriei distanțate cu 4 unități de timp.

Ajustarea unui model pentru o serie temporală specifică (xt), t = 1, 2,…, T înseamnă identificarea unei familii parametrice adecvate de modele ca un set valid de soluții și apoi estimarea statistică a parametrilor modelului pe baza observațiilor disponibile x1, x2,…, xT. Întregul proces se numește proces de identificare a modelului sau pur și simplu identificare. Pentru a identifica corect un model de serie temporală, este necesar să se decidă dacă seria temporală studiată este staționară, staționară în raport cu o tendință deterministă (adică, suma componentelor deterministe și o serie staționară) sau dacă conține o tendință stocastică. Partea principală a acestei lucrări este dedicată soluționării acestei probleme pentru o serie de serii macroeconomice rusești.

În situațiile în care seriile de timp (xt) și (yt), t = 1, 2,…, T, sunt datele inițiale pentru construirea unei regresii y pe x și impactul unei modificări unice într-una dintre ele ( x) pe de altă parte (y) este întins (distribuit) în timp, așa-numitele modele de întârziere distribuită prezintă un mare interes aplicat. În cadrul acestei clase speciale de modele, se efectuează în special o analiză econometrică a unor fenomene economice atât de importante precum „procesul de ajustare parțială”, „modele de așteptări adaptative”, etc.

Un rol important în sistemele de sprijinire a deciziilor economice îl joacă prognoza indicatorilor economici. Metodele de auto-prognoză bazate pe analiza seriilor temporale extrapolează seriile disponibile numai pe baza informațiilor conținute în aceasta. Acest gen de prognoză poate fi eficientă doar pe termen scurt și, cel mult, pe termen mediu. O soluție serioasă la problemele previziunii pe termen lung necesită utilizarea unor abordări integrate și, în primul rând, implicarea diverselor tehnologii (inclusiv statistice) pentru colectarea și analiza estimărilor experților.

O abordare eficientă pentru rezolvarea problemelor de autoprognoză pe termen scurt și mediu este prognoza bazată pe utilizarea modelelor „adaptate” (identificate) de tip ARIMA(p, k, q), incluzând, ca cazuri speciale, AR-, MA- si modele ARMA.

Așa-numitele metode adaptive sunt, de asemenea, foarte răspândite în rezolvarea problemelor aplicate ale autoprognozelor pe termen scurt și mediu, care permit actualizarea prognozelor făcute anterior cu o întârziere minimă și utilizarea unor proceduri matematice relativ simple pe măsură ce devin disponibile noi date.

Capitolul 2. Analiza serii temporale

2.1. Serii temporale staționare și principalele lor caracteristici

Căutarea unui model care să descrie în mod adecvat comportamentul reziduurilor aleatoare t ale seriei temporale analizate xt se desfășoară de obicei în cadrul clasei serii de timp staționare.

Definiție 2.1. O serie xt se numește strict staționară (sau staționară în sens restrâns) dacă distribuția de probabilitate comună a m observații este aceeași ca pentru m observații, pentru orice și t1,..., tm.

Cu alte cuvinte, proprietățile unei serii temporale strict staționare nu se schimbă atunci când originea timpului este schimbată. În special, pentru m = 1, din ipoteza staționarității stricte a seriei temporale xt rezultă că legea distribuției probabilității a variabilei aleatoare xt nu depinde de t, ceea ce înseamnă că toate principalele ei caracteristici numerice, inclusiv: medie Ext = și varianța Dxt = 2.

În mod evident, valoarea determină nivelul constant în raport cu care fluctuează seria temporală analizată xt, iar valoarea constantă caracterizează intervalul acestor fluctuații. Deoarece legea distribuției de probabilitate a variabilei aleatoare xt este aceeași pentru tot t, atunci ea și principalele sale caracteristici numerice pot fi estimate din observațiile x1,..., xT. În special:

estimarea valorii medii, estimarea varianței.

Funcția de autocovarianță (). Valorile funcției de autocovarianță sunt estimate statistic din observațiile disponibile ale seriei temporale folosind formula

unde = 1,… T 1 și calculat prin formula (2.1).

În mod evident, valoarea funcției de autocovarianță la = 0 nu este altceva decât varianța seriei de timp.

Funcția de autocorelare r(). Una dintre principalele diferențe dintre succesiunea de observații care formează o serie de timp și un eșantion aleatoriu este aceea că membrii seriei de timp sunt, în general, interdependenți statistic. Gradul de etanșeitate legătura statisticăîntre două variabile aleatoare poate fi măsurată prin coeficientul de corelație pe perechi. Deoarece în cazul nostru coeficientul măsoară corelația care există între membrii aceleiași serii cronologice, se numește în mod obișnuit coeficientul de autocorelație. Când se analizează modificarea valorii lui r() în funcție de valoare, se obișnuiește să se vorbească despre funcția de autocorelare r(). O diagramă a unei funcții de autocorelare este uneori numită corelogramă. Funcția de autocorelare (spre deosebire de funcția de autocovarianță) este adimensională, adică. nu depinde de scara de măsurare a seriei temporale analizate. Valorile sale, prin definiție, pot varia de la 1 la +1. În plus, din staționaritate rezultă că r() = r(), astfel că atunci când analizăm comportamentul funcțiilor de autocorelare, ne restrângem să luăm în considerare doar valori pozitive.

Sunt comune caracteristici, care disting comportamentul funcției de autocorelare a unei serii de timp staționare. Cu alte cuvinte, se poate descrie in termeni generali vedere schematică a corelogramei unei serii temporale staţionare. Acest lucru se datorează următoarei considerații generale: în mod evident, cu cât mai mulți membri ai seriilor temporale xt și xt+ sunt separați în timp, cu atât relația dintre acești membri este mai slabă și, în consecință, cu atât valoarea absolută a lui r() ar trebui să fie mai mică. Mai mult, în unele cazuri există o astfel de valoare de prag r0, începând de la care toate valorile vor fi identic egale cu zero.

Funcție privată de autocorelare rpart(). Cu ajutorul acestei funcții se realizează ideea de măsurare a autocorelației care există între tactele temporale separate ale membrilor seriei temporale xt și xt+, eliminând influența indirectă a tuturor membrilor intermediari ai acestei serii temporale asupra acestei interdependențe. Autocorelația parțială de ordinul 1 poate fi calculată folosind relația:

unde este valoarea medie a procesului staționar analizat.

Autocorelațiile parțiale de ordine superioare pot fi calculate în mod similar prin elementele matricei generale de corelație R = ||rij||, în care rij = r(xi, xj) = r(|i j|), unde i, j = 1,… , T și r(0) = 1. Deci, de exemplu, autocorelația parțială de ordinul 2 este determinată de formula:

Versiunile empirice (selective) ale funcțiilor de autocorelare sunt obținute folosind aceleași relații (2.4), (2.5) prin înlocuirea valorilor teoretice de autocorelare r() implicate în acestea cu estimări statistice.

Autocorelațiile parțiale rezultate rpart(1), rpart(2),... pot fi reprezentate pe un grafic în care valoarea deplasării joacă rolul abscisei. Cunoașterea funcțiilor de autocorelare r() și rpart() oferă asistență semnificativă în rezolvarea problemei de selectare și identificare a modelului seriei temporale analizate.

Utilizarea proprietăților acestei funcții în analiza aplicată a seriilor de timp este definită ca „analiza spectrală a seriilor de timp”. O descriere destul de completă a acestei abordări este dată, de exemplu, în [Jenkins, Watts (1971, 1972)] și [Lloyd, Lederman (1990)]. În ceea ce privește analiza statistică a seriilor temporale economice, această abordare nu a primit răspândită, deoarece analiza empirică a densității spectrale necesită ca bază de informații fie serii temporale staționare suficient de lungi, fie mai multe traiectorii ale seriei temporale analizate (ambele situații sunt foarte rare în practica analizei statistice a seriilor temporale economice).

Pentru o analiză semnificativă, este important ca valoarea densității spectrale să caracterizeze puterea relației care există între seria temporală xt și o armonică cu o perioadă de 2/. Acest lucru face posibilă utilizarea spectrului ca mijloc de captare a periodicităților din seria temporală analizată: setul de vârfuri spectrului determină setul de componente armonice în expansiune. Dacă seria conține o armonică de frecvență ascunsă, atunci conține și termeni periodici cu frecvențele /2, /3 etc. Acesta este așa-numitul „ecou” repetat de spectru la frecvențe joase. Efectul „ecou” a fost analizat în articolul despre exemplul unei serii de plăți lunare fără numerar între băncile din SUA pentru perioada 1875-1958.

Este posibil să se extindă oarecum clasa de modele de serii de timp staționare utilizate în analiza unor serii specifice de dinamică economică.

Definiție 2.2. Se spune că o serie este slab staționară (sau în general staționară) dacă media, varianța și covarianța ei nu depind de t.

2.2. Componentă non-aleatorie a seriei temporale și metode de netezire a acesteia.

Un rol esențial în rezolvarea problemelor de identificare și evaluare a componentelor tendințe, sezoniere și ciclice în expansiune (1.1.1) îl joacă etapa inițială a analizei, la care:

este relevat însuși faptul prezenței/absenței unei componente non-aleatoare (și dependente de timp) în expansiune (1.1.1); În esență, acesta este un test de ipoteză statistică.

H0: Ext = = const (2,6)

(inclusiv afirmația despre independența statistică reciprocă a membrilor seriei temporale studiate) cu diverse opțiuni de concretizare a ipotezelor alternative de tip

se construiește o estimare (aproximare) pentru componenta nealeatorie integrală necunoscută f(t) = 1ftr(t) + 2(t) +3(t), adică. se rezolvă problema netezirii (eliminarea reziduurilor aleatoare t) a seriei temporale analizate xt.

Metodele de extragere a unei componente non-aleatoare într-o traiectorie care reflectă comportamentul unei serii de timp sunt împărțite în două tipuri.

Metodele de primul tip (analitice) se bazează pe presupunerea că forma generală a componentei nealeatoare în expansiune este cunoscută

f(t) = 1ftr(t) + 2(t) +3(t). (2,8)

De exemplu, dacă se știe că este descrisă componenta non-aleatorie a seriei de timp funcție liniară timpul f(t) = 0 + 1t, unde 0 și 1 sunt niște parametri necunoscuți ai modelului, atunci problema selecției acestuia (problema eliminării reziduurilor aleatoare sau problema netezirii seriilor temporale) se reduce la problema construirea unor estimări bune și pentru parametrii modelului.

Metodele de al doilea tip (algoritmice) nu sunt legate de ipoteza restrictivă că forma analitică generală a funcției dorite (2.8) este cunoscută de cercetător. În acest sens, sunt mai flexibile, mai atractive. Cu toate acestea, „la ieșirea” problemei, ei oferă cercetătorului doar un algoritm pentru calcularea estimării funcției dorite f(t) în orice punct predeterminat t și nu pretind că au o reprezentare analitică a funcției.

Metode analitice de selectare (estimare) a componentei nealeatoare a seriei temporale. Aceste metode sunt implementate în cadrul modelelor de regresie în care variabila xt acţionează ca variabilă dependentă, iar timpul t acţionează ca singura variabilă explicativă. Astfel, considerăm un model de regresie al formei

xt = f(t,) + t, t = 1,…, T, în care este cunoscută forma generală a funcției f(t,), dar valorile parametrilor = (0, 1,…, m) sunt necunoscute. Estimările parametrilor se bazează pe observații. Alegerea metodei de estimare depinde de forma ipotetică a funcției f(t,) și de natura stocastică a reziduurilor de regresie aleatoare t.

Metode algoritmice pentru extragerea unei componente non-aleatoare a unei serii de timp (metode ale mediei mobile). Aceste metode de eliminare ale fluctuațiilor aleatorii ale comportamentului seriei de timp analizate se bazează pe o idee simplă: dacă se caracterizează răspândirea „individuală” a valorilor unui membru al seriei temporale xt în jurul valorii sale medii (netezite) a. prin varianța 2, atunci răspândirea mediei N membri ai seriei temporale (x1 + x2 +…+ xT) / N aproape de aceeași valoare a lui a va fi caracterizată printr-o valoare a dispersiei mult mai mică, și anume, o dispersie egală cu 2 / N. Iar o scădere a măsurii de răspândire aleatorie (varianță) înseamnă tocmai netezirea traiectoriei corespunzătoare. Prin urmare, se alege o „lungime medie” impară N = 2m + 1, măsurată în numărul de membri consecutivi ai seriei temporale analizate. Și apoi valoarea netezită a seriei temporale xt este calculată din valorile xtm, xtm+1,…, xt, xt+1,…, xt+m

unde wk (k = m, m + 1,…, m) sunt niște coeficienți de „greutate” pozitivi care se însumează la unu, i.e. saptamana > 0 si. Deoarece, prin schimbarea t de la m + 1 la T m, se pare că „alunecăm” de-a lungul axei timpului, atunci metodele bazate pe formula (2.9) se numesc de obicei metode medii mobile (MSA).

Evident, un MSS diferă de altul în alegerea parametrilor m și wk.

Definirea opțiunilor wk se bazează pe următoarea procedură. În conformitate cu teorema Weierstrass, orice funcție netedă f(x) conform celor mai generale ipoteze poate fi reprezentată local printr-un polinom algebric de gradul adecvat p. Prin urmare, luăm primii 2m + 1 termeni ai seriei de timp x1,..., x2m+1, construim un polinom de gradul p folosind LSM care aproximează comportamentul acestei părți inițiale a traiectoriei seriei de timp și folosim acest polinom pentru a determina estimarea valorii netezite f(t) a seriei de timp în punctul mijlociu (adică (m + 1)-al-lea) punct al acestui segment al seriei, i.e. noi credem. Apoi „alunecăm” de-a lungul axei timpului cu un ciclu și în același mod selectăm un polinom de același grad p la segmentul seriei temporale x2,..., xm+2 și determinăm estimarea valorii netezite a seriei temporale. la mijlocul segmentului seriei temporale deplasat cu unu, adică de ex. , etc.

Ca rezultat, vom găsi estimări pentru valorile netezite ale seriei de timp analizate pentru tot t, cu excepția t = 1,..., m și t = T,... T m + 1.

Selectarea celui mai bun (în sensul criteriului celor mai mici pătrate) polinom de aproximare la traiectoria seriei de timp analizate conduce la o formulă a formei, iar rezultatul nu depinde de care dintre intervalele de timp „alunecante” această selecție a fost făcut pentru.

Media mobilă ponderată exponențial (metoda lui Brown). În conformitate cu această metodă, estimarea valorii netezite în punctul t este definită ca o soluție la o problemă de optimizare de forma

unde 0< < 1. Следовательно, веса k в критерии Q(f) обобщенного («взвешенного») МНК уменьшаются экспоненциально по мере удаления наблюдений xtk в прошлое. Решение оптимизационной задачи (2.10) дает:

Spre deosebire de MCC obișnuit, doar capătul din dreapta al intervalului de mediere alunecă aici și, în plus, ponderile scad exponențial pe măsură ce ne îndreptăm mai departe în trecut. Formula (2.11) oferă o estimare a valorii netezite a seriei de timp nu la mijloc, ci la punctul final din dreapta al intervalului de mediere.

2.3. Modele de serii temporale staţionare şi identificarea acestora.

În 2.2, a fost luată în considerare o clasă de serii de timp staționare, în cadrul căreia este selectat un model care este adecvat pentru descrierea comportamentului reziduurilor aleatorii ale seriei de timp studiate (1). Aici luăm în considerare un set de modele parametrice liniare din această clasă și metode de identificare a acestora. Astfel, nu vorbim aici despre modelarea seriilor temporale, ci despre modelarea reziduurilor lor aleatoare t, obținute în urma eliminării componentei sale non-aleatoare (2.8) din seria temporală originală xt. Prin urmare, spre deosebire de o prognoză bazată pe un model de regresie care ignoră valorile reziduurilor aleatoare, prognoza în serie de timp folosește în mod semnificativ interdependența și prognoza reziduurilor aleatoare în sine.

Să introducem notația. Deoarece comportamentul reziduurilor aleatoare este descris aici, notăm seria temporală simulată cu t și vom presupune că pentru tot t așteptarea sa matematică este egală cu zero, i.e. Et, 0. Secvențele de timp care formează „zgomot alb” vor fi notate cu t.

Descrierea și analiza modelelor discutate mai jos este formulată în termenii unui proces liniar general, reprezentat ca o sumă ponderată a valorilor prezente și trecute ale zgomotului alb și anume:

Astfel, zgomotul alb este o serie de impulsuri care, într-o clasă largă de situații reale, generează reziduuri aleatorii ale seriei temporale studiate.

Seria temporală t poate fi reprezentată într-o formă echivalentă, în care este obținută sub forma unui model clasic de regresie multiplă liniară, în care propriile valori în toate timpurile trecute acționează ca variabile explicative:

În acest caz, coeficienții de greutate 1, 2,... sunt legați de anumite condiții care asigură staționaritatea seriei t. Trecerea de la (2.14) la (2.13) se realizează prin înlocuirea succesivă în partea dreaptă a (2.14) în loc de t1, t2, ... expresiile lor calculate în conformitate cu (2.14) pentru momentele de timp t 1, t 2 , etc.

Să luăm în considerare, de asemenea, un proces de tip mixt în care există atât termeni autoregresivi ai procesului în sine, cât și o însumare glisantă a elementelor de zgomot alb:

Vom presupune că p și q pot lua, de asemenea, valori infinite și, de asemenea, că în cazuri speciale unii (sau chiar toți) coeficienții sau sunt egali cu zero.

Luați în considerare mai întâi cele mai simple cazuri speciale.

Model autoregresiv de ordinul 1 AR(1) (procesul Markov). Acest model este cea mai simplă versiune a unui proces autoregresiv de tipul (2.14), când toți coeficienții, cu excepția primului, sunt egali cu zero. În consecință, poate fi definit prin expresie

t = t1 + t, (2,15)

unde este un coeficient numeric care nu depășește unu în valoare absolută (||< 1), а t последовательность случайных величин, образующая белый шум. При этом t зависит от t и всех предшествующих, но не зависит от будущих значений. Соответственно, в уравнении (2.15) t не зависит от t1 и более ранних значений. В связи с этим, t называют инновацией (обновлением).

Secvențele care satisfac relația (2.15) sunt adesea numite și procese Markov. Înseamnă că

r(t, tk) = k, (2.17)

cov(t, tk) = kDt. (2,19)

O consecință importantă a (2.19) este că dacă || este aproape de unitate, atunci varianța lui t va fi mult mai mare decât varianța. Și aceasta înseamnă că, dacă valorile învecinate ale seriei t sunt puternic corelate, atunci o serie de perturbații destul de slabe ale lui t vor genera oscilații mari ale reziduurilor lui t.

Condiția de staționaritate pentru seria (2.15) este determinată de cerința pentru coeficientul: ||< 1, или, что то же, корень z0 уравнения 1 z = 0 должен быть по абсолютной величине больше единицы.

Funcția de autocorelare a procesului Markov este determinată de relația (2.17):

r() = r(t, t) = . (2,20)

Aceasta, în special, implică o interpretare probabilistă simplă a parametrului: = r(t, t1), adică, valoarea determină valoarea corelației dintre doi membri adiacenți ai seriei t.

Din (2.20) se poate observa că gradul de apropiere a corelației dintre membrii șirului (2.15) scade exponențial pe măsură ce se îndepărtează unul de celălalt în timp.

Funcția de autocorelare parțială rpart() = r(t, t+ | t+1 = t+2 =…= t+1 = 0) poate fi calculată folosind formulele (2.4)-(2.5). Calculul direct folosind aceste formule dă următorul rezultat simplu: valorile funcției de corelare parțială rpart() sunt egale cu zero pentru toate = 2, 3,…. Această proprietate poate fi utilizată la ajustarea unui model: dacă corelațiile parțiale calculate ale eșantionului sunt statistic nesemnificativ diferite de zero la = 2, 3,..., atunci utilizarea unui model autoregresiv de ordinul 1 pentru a descrie comportamentul reziduurilor aleatoare ale unei serii de timp. nu contrazice datele statistice originale.

Densitatea spectrală a procesului Markov (2.15) poate fi calculată ținând cont de forma cunoscută a funcției de autocorelare (2.20):

În cazul unei valori a parametrului apropiată de 1, valorile adiacente ale seriei t sunt apropiate una de alta ca mărime, funcția de autocorelare scade exponențial, rămânând pozitivă, iar frecvențele joase predomină în spectru, ceea ce înseamnă o medie destul de mare. distanța dintre vârfurile seriei t. Când valoarea parametrului este aproape de -1, seria oscilează rapid (frecvențele înalte predomină în spectru), iar graficul funcției de autocorelare scade exponențial la zero cu o schimbare de semn alternativă.

Identificarea modelului, de ex. estimarea statistică a parametrilor săi și conform implementării existente a seriei temporale xt (și nu reziduurile sale, care sunt neobservabile), se bazează pe relațiile (2.16)(2.19) și poate fi realizată folosind metoda momentelor. Pentru a face acest lucru, este necesar să rezolvăm mai întâi problema selectării unei componente non-aleatorie, care ne va permite să operam cu reziduuri în viitor.

Apoi varianța eșantionului a reziduurilor este calculată folosind formula

unde și „reziduurile” (reziduurile) sunt calculate prin formula.

Estimarea parametrului se obține folosind formula (2.18), înlocuind valoarea eșantionului acestuia în locul coeficientului de corelație, i.e. .

În sfârșit, estimarea parametrului se bazează pe relația (2.19), în care mărimile Dt și sunt înlocuite cu estimările, respectiv, și:

Modele autoregresive de ordinul 2 - AR(2) (procesele Youul). Acest model, ca și AR(1), este caz special proces autoregresiv, când toți coeficienții j din partea dreaptă ai (2.14) cu excepția primilor doi sunt egali cu zero. În consecință, poate fi definit prin expresie

t = 1t1 + 2t2 + t, (2,22)

unde secvența 1, 2,... formează zgomot alb.

Condițiile de staționaritate pentru seria (2.22) (necesare și suficiente) sunt definite ca:

În cadrul teoriei generale a modelelor, aceleași condiții de staționaritate se obțin din cerința ca toate rădăcinile ecuației caracteristice corespunzătoare să se afle în afara cercului unitar. Ecuația caracteristică pentru modelul autoregresiv de ordinul 2 este:

Funcția de autocorelare a procesului Yule se calculează după cum urmează. Primele două valori r(1) și r(2) sunt definite de relații

iar valorile pentru r(), = 3, 4,... sunt calculate folosind relația recursivă

r() = 1r(1) + 2r(2).

Funcția de autocorelare parțială a seriei de timp generate de modelul de autoregresie de ordinul 2 are următoarea proprietate distinctivă: rpart() = 0 pentru toate = 3, 4,...

Densitatea spectrală a procesului Yule poate fi calculată folosind formula:

Valorile sunt utilizate pentru a calcula estimările și, în consecință, variațiile lui Dt și autocorelațiile r(1) și r(2). Acest lucru se face folosind relațiile (2.2) și (2.3):

Modele autoregresive de ordin pth - AR(p) (p 3). Aceste modele, formând un subset în clasa modelelor liniare generale, constituie ele însele o clasă destul de largă de modele. Dacă în modelul liniar general (2.14) presupunem că toți parametrii j, cu excepția primilor p coeficienți, sunt egali cu zero, atunci ajungem la definiția modelului AR(p):

unde succesiunea variabilelor aleatoare 1, 2,... formează zgomot alb.

Condițiile de staționaritate pentru procesul generat de modelul (2.23) sunt formulate și în termenii rădăcinilor ecuației sale caracteristice

1 1z 2z2 … pzp = 0.

Pentru staționaritatea procesului, este necesar și suficient ca toate rădăcinile ecuației caracteristice să se afle în afara cercului unitar, i.e. ar depăși unitatea în modul.

Funcția de autocorelare a procesului (2.23) poate fi calculată folosind relația de recurență pentru primele sale p valori r(1),…, r(p). Acest raport arată astfel:

r () = 1r(1) + 2r(2) +…+ pr(p), = p + 1, p + 2,... (2.24)

Funcția de autocorelare parțială a procesului (2.23) va avea valori diferite de zero doar pentru p; toate valorile lui rpart(p) pentru > p vor fi zero, vezi, de exemplu, [Box, Jenkins (1974)]. seria de timp analizată. Dacă, de exemplu, toți coeficienții de autocorelare parțială, începând de la ordinul k, sunt statistic nesemnificativ diferiți de zero, atunci este firesc să se determine ordinea modelului autoregresiv egal cu p = k 1.

Identificarea modelului autoregresiv de ordin p se bazează pe relațiile care leagă parametrii necunoscuți ai modelului și autocorelațiile seriei temporale studiate. Pentru a deriva aceste relații, valorile = 1, 2,..., p sunt substituite succesiv în (2.24). Se pare că sistemul ecuatii lineare cu privire la 1, 2,…, p:

numite ecuațiile Yule-Walker Yule (1927), Walker (1931).. Estimările pentru parametrii k se vor obține prin înlocuirea valorilor teoretice ale autocorelațiilor r(k) cu estimările acestora și prin rezolvarea sistemului de ecuații astfel obținut.

Estimarea parametrului se obține din relație prin înlocuirea tuturor cantităților care participă în partea dreaptă cu estimările lor.

2.3.2. Modele de ordine medie mobilă q (modele MA(q)).

Să considerăm un caz particular al procesului liniar general (2.13), când numai primul q din coeficienții de greutate j sunt nenuli. În acest caz, procesul arată ca

t = t 1t1 2t2 … qtq, (2.26)

unde simbolurile 1,…, q sunt folosite pentru a desemna un set finit de parametri implicați în (2.13). Procesul (2.26) se numește modelul mediei mobile de ordin q (MA(q)).

Dualitate în reprezentarea modelelor AR și MA și conceptul de reversibilitate a modelului MA. Din (2.13) și (2.14) se poate observa că același proces liniar general poate fi reprezentat fie ca model AR de ordin infinit, fie ca model MA de ordin infinit.

Relația (2.26) poate fi rescrisă ca

t =t + 1t1 + 2t2 +…+ qtq.

t = t 1t1 2t2 …, (2.27)

unde coeficienții j (j = 1, 2,…) sunt exprimați într-un anumit mod în termenii parametrilor 1,…, q. Relația (2.27) poate fi scrisă sub forma unui model autoregresiv de ordin infinit (adică sub forma unei expansiuni inverse)

Este cunoscut (vezi, de exemplu, [Box, Jenkins, (1974)]) că condiția pentru reversibilitatea modelului MA(q) (adică condiția pentru convergența seriei) este formulată în termeni de ecuația caracteristică a modelului (2.26) după cum urmează:

Toate rădăcinile ecuației caracteristice trebuie să se afle în afara cercului unitar, adică |zj| > 1 pentru toate j = 1, 2,…, q.

Principalele caracteristici ale procesului MA(q). Astfel, funcția de autocorelare r() a procesului MA(q) este egală cu zero pentru toate valorile mai mari decât ordinea procesului q. Această proprietate importantă este utilizată pentru a selecta ordinea modelului MA(q) din datele experimentale;

Densitatea spectrală a procesului MA(q) poate fi calculată folosind relația:

Modelul MA(q) este identificat pe baza relațiilor (2.29), și anume: 1) valorile sunt calculate folosind formula; 2) valorile = 1,…, q sunt substituite succesiv în relațiile cu valorile r() înlocuite în partea stângă de estimările obținute anterior; 3) sistemul de ecuații q astfel obținut este rezolvat în raport cu valorile necunoscute 1,…, q; soluții ale acestui sistem și va da estimări ale parametrilor necunoscuți ai modelului; 4) estimarea parametrului poate fi obținută folosind prima dintre relațiile (2.28) prin substituirea în ea în loc de (0), 1,…, q estimările acestora.

Rețineți că, spre deosebire de sistemul de ecuații YuleWalker (2.25), ecuațiile pentru determinarea estimărilor pentru parametrii modelului MA(q) sunt neliniare. Prin urmare, aceste ecuații trebuie rezolvate folosind proceduri iterative, vezi, de exemplu, Box și Jenkins (1974).

Relația dintre procesele AR(q) și MA(q). Să facem câteva observații despre relația dintre procesele de autoregresie și media mobilă.

Pentru un proces autoregresiv finit de ordinul p, t poate fi reprezentat ca o sumă finită ponderată de antecedente, sau t poate fi reprezentat ca o sumă infinită de antecedente. În același timp, într-un proces finit de ordine medie mobilă, q t poate fi reprezentat ca o sumă finită ponderată a antecedentelor sau t ca o sumă infinită ponderată a antecedentelor.

Procesul MA finit are o funcție de autocorelare care dispare după un anumit punct, dar deoarece este echivalent cu un proces AR infinit, funcția sa de autocorelare parțială este extinsă la infinit. Rolul principal în aceasta este jucat de exponențiale amortizate și (sau) sinusoide amortizate. În schimb, un proces AR are o funcție de autocorelare parțială care dispare după un anumit punct, dar funcția sa de autocorelare are o extindere infinită și constă dintr-o colecție de exponențiale în descompunere și/sau sinusoide în descompunere.

Parametrii unui proces autoregresiv de ordin finit nu trebuie să îndeplinească nicio condiție pentru ca procesul să fie staționar. Cu toate acestea, pentru ca procesul MA să fie reversibil, rădăcinile ecuației sale caracteristice trebuie să se afle în afara cercului unitar.

Spectrul procesului de medie mobilă este inversul spectrului procesului autoregresiv corespunzător.

Reprezentarea unui proces de tip MA ca proces autoregresiv este neeconomică din punctul de vedere al parametrizării acestuia. În mod similar, procesul AR nu poate fi reprezentat economic cu un model de medie mobilă. Prin urmare, pentru a obține o parametrizare economică, este uneori oportun să se includă în model atât termenii care descriu autoregresia, cât și termenii care modelează reziduul ca medie mobilă. Astfel de procese liniare au forma

t = 1t1 +…+ ptp + t 1t1 … qtq (2,30)

Staționaritatea și reversibilitatea proceselor ARMA(p, q). Scriind procesul (2.30) sub forma (2.31) unde se poate analiza staționaritatea (2.31) după aceeași schemă ca și pentru procesele AR(p). Diferența dintre „reziduuri” și e nu va afecta în niciun caz concluziile care determină condițiile de staționaritate pentru procesul autoregresiv. Prin urmare, procesul (2.30) este staționar dacă și numai dacă toate rădăcinile ecuației caracteristice a procesului AR(p) se află în afara cercului unitar.

În mod similar, notând și considerând procesul (2.30) în formă, obținem aceleași concluzii privind condițiile de reversibilitate a acestui proces ca și pentru procesul MA(q): ca procesul ARMA(p, q) să fie reversibil , este necesar și suficient ca toate rădăcinile ecuației caracteristice MA(q)-procese să se afle în afara cercului unitar.

Funcția de autocorelare este analizată în același mod ca și pentru procesele AR și MA, ceea ce ne permite să tragem următoarele concluzii.

1) Din relațiile () = 1(1) +…+ p(p) + () 1(1) … q(q), (unde (k) = E(tkt) funcție de covarianță „încrucișată” a secvențelor t și t ) pentru = 0, 1,…, q rezultă că covarianțele (0), (1),…, (q) și, în consecință, autocorelațiile r(1),…, r(q) sunt legate printr-un anumit sistem de dependențe cu parametrii q medii mobile 1,…, q și p cu parametrii de autoregresie 1,…, p. În acest caz, covarianțele încrucișate (), (1),…, (q) pentru valorile pozitive ale deplasării în timp sunt egale cu zero, iar pentru cele negative, pot fi exprimate și în termeni de parametrii 1, …, p,1,…, q folosind următoarea metodă: fie k > 0; atunci (k) = E(tkt); în produsul tkt, cu ajutorul substituției secvențiale (k + 1) de ori a primului factor conform formulei (2.30), acesta este înlocuit cu o combinație liniară de t1, elemente de zgomot alb și parametri de model, care, după aplicând operația de mediere E la produsul rezultat, dă o expresie care depinde doar de modelul parametrilor (deoarece E(t1t) = 0).

2) Valorile funcției de autocorelare r() pentru q + 1 sunt calculate prin relația recursivă r() = 1r(1) + 2r(2) +…+ pr(p) pentru q + 1, care exact repetă relația recursivă similară (2.24 ) pentru funcția de autocorelare a procesului AR(p). Aceasta înseamnă că, pornind de la = q + 1, funcția de autocorelare a procesului ARMA(p, q) se comportă în același mod ca și funcția de autocorelare a procesului AR(p), adică. va consta dintr-un set de exponențiale amortizate și (sau) sinusoide amortizate, iar proprietățile sale sunt determinate de coeficienții 1,..., p și de valorile inițiale r(1),..., r(p).

Funcția de autocorelare parțială a procesului ARMA(p, q) se comportă la valori mari ca o funcție de autocorelare parțială a procesului MA(q). Aceasta înseamnă că în el predomină termeni precum exponențiale în descompunere și (sau) sinusoidele în descompunere (raportul dintre cele două depinde de ordinea mediei mobile q și de valorile parametrilor procesului).

Densitatea spectrală a procesului ARMA(p, q) poate fi calculată folosind relația:

Identificarea procesului ARMA(p, q) se bazează (precum și modelele AR și MA) pe estimarea statistică a parametrilor modelului folosind metoda momentelor. Procedura de estimare a parametrilor k (k = 1, 2,…, p), j (j = 1, 2,…, q) și se împarte în două etape. La prima etapă se obţin estimări ale parametrilor k, la a 2-a etapă estimări ale parametrilor j şi.

etapa 1. Parametrii componentei de autocorelare a modelului (2.30) satisfac sistemul de ecuații liniare:

Substituind valorile eșantionului lor în loc de r(k) în (2.32) și rezolvând sistemul rezultat în raport cu j (j = 1,…, p), obținem estimări.

a 2-a etapă. Înlocuind estimările obținute în (2.30) obținem o mulțime de relații q + 1:

Acest sistem face posibilă obținerea de dependențe neliniare care conectează parametrii doriti, 1,…, q cu autocovarianțele și estimările construite la prima etapă.

Concluzie

Econometria este o metodă de analiză economică care combină teoria economică cu metodele statistice și matematice de analiză. Este o încercare de a îmbunătăți previziunile economice și de a permite planificarea de succes a politicii economice. În econometrie, teoriile economice sunt exprimate ca rapoarte matematice și apoi testate empiric prin metode statistice. Acest sistem este utilizat pentru a crea modele pentru a prognoza indicatori importanți, cum ar fi produsul național brut, rata șomajului, rata inflației și deficitul bugetar federal. Econometria este folosită din ce în ce mai pe scară largă, în ciuda faptului că previziunile obținute cu ajutorul acesteia nu au fost întotdeauna suficient de precise.

Problemele în econometrie sunt multe și variate. Economia este un obiect complex, dinamic, multidimensional și în evoluție, așa că este dificil de studiat. Atât societatea, cât și sistemul social se schimbă în timp, legile se schimbă, apar inovații tehnologice, așa că nu este ușor să găsești invarianți în acest sistem. Seriile temporale sunt scurte, foarte agregate, eterogene, non-staționare, depind de timp și unele de altele, așa că avem puține informații empirice de studiat. Mărimile economice sunt măsurate imprecis, supuse unor corecții ulterioare semnificative, iar variabilele importante sunt adesea nemăsurate sau neobservabile, astfel încât toate concluziile sunt imprecise și nesigure. Teorii economice se schimbă în timp, explicațiile concurente coexistă între ele și, prin urmare, sunt de încredere fundal teoretic nu este disponibil pentru modele. Și printre econometrieni înșiși nu pare să existe un acord cu privire la modul în care ar trebui tratat subiectul lor.

În ultimii ani, în literatura econometrică s-a acordat multă atenție analizei proprietăților structurale ale seriilor temporale economice. Acest lucru se datorează faptului că valorile seriei temporale nu se formează întotdeauna sub influența anumitor factori. Se întâmplă adesea ca dezvoltarea unui anumit proces să se datoreze legilor sale interne, iar abaterile de la un proces determinist sunt cauzate de erori de măsurare sau fluctuații aleatorii. Recent, au apărut un număr destul de mare de lucrări care iau în considerare diverse aspecte econometrice ale dezvoltării economiei ruse.

Pentru seriile de timp, interesul principal este descrierea sau modelarea structurii acestora. Scopul unor astfel de studii, de regulă, este mai larg decât modelarea, deși unele informații pot fi obținute direct din model, trăgând concluzii despre performanța anumitor legi economice(să zicem, legea parității puterii de cumpărare) și testarea diverselor ipoteze. Modelul construit poate fi folosit pentru a extrapola sau prezice o serie de timp, iar apoi calitatea prognozei poate servi drept criteriu util atunci când alegeți dintre mai multe modele. Construirea unor modele de serie bune este necesară și pentru alte aplicații, cum ar fi ajustarea sezonieră și netezirea. În final, modelele construite pot fi utilizate pentru modelarea statistică a serii lungi de observații în studiul sistemelor mari, pentru care seria temporală este considerată ca informație de intrare.

Literatură

1. Efimova M. R., Petrova E. V., Rumyantsev V. N. Teoria generală a statisticii, Moscova: Infra-N, 2000.

2. Eliseeva I.I. Yuzbashev M.M. Teoria generală a statisticii. Moscova, „Finanțe și statistică” 2005.

3. A.O. Kryshtanovskiy. Metode de analiză a seriilor temporale // Monitorizarea opiniei publice: schimbări economice și sociale. 2000. Nr. 2 (46). pp. 44-51. [Articol]

4. Shmoylova R. A. Teoria statisticii, M.: Finanțe și statistică, 1996.

5. Teoria statisticii. Manual./Ed. Shmoylova R. A. Ed. a 3-a, Rev.-M.: Finanțe și Statistică, 2002

6. Gusarov V.M. Teoria statisticii. - M.: Audit, 2001. - 248 p.

7. Kildishev G.S., Ovsienko V.E., Rabinovici P.M., Ryabushkin T.V. Teoria generală a statisticii. - M.: Statistică, 2001. - 423 p.

8. Atelier de statistică: Tutorial pentru universități (Ed. V.M. Simchera). VZFEI. - M.: CJSC „Finstatinform”, 2001. - 259 p.

Introducere………………………………………………………………….2

1. Principalele sarcini ale analizei seriilor temporale…………….4

2. Analiza serii cronologice…………………………………………….9

11

2.3 Modele de serii temporale staționare și identificarea lor…13

2.3.2. Modele de ordine medie mobile q (modele MA(q))….17

Concluzie…………………………………………………………………21

Literatură………………………………………………………..23

Introducere

În ultimii ani, în literatura econometrică, s-a acordat multă atenție studiului seriilor de timp ale dinamicii. O varietate de sarcini de fond ale analizei economice necesită utilizarea datelor statistice care caracterizează procesele economice studiate și desfășurate în timp sub formă de serii cronologice. În același timp, aceleași serii cronologice sunt adesea folosite pentru a rezolva diferite probleme de fond.

Nu întotdeauna valorile seriei temporale se formează numai sub influența oricăror factori. Se întâmplă adesea ca dezvoltarea unui anumit proces să se datoreze legilor sale interne, iar abaterile de la un proces determinist sunt cauzate de erori de măsurare sau fluctuații aleatorii. De un interes deosebit sunt procesele care sunt în modul „tranzițional”, adică. procese care sunt în esență „staționare” dar prezintă proprietățile unei serii temporale nestaționare pe intervalul de timp studiat, ceea ce se explică prin condițiile inițiale departe de regimul staționar. În situațiile în care seria temporală se formează sub influența unui anumit set de factori aleatori și nealeatori, analiza serii temporale individuale, atât rezultante, cât și factori, este de mare importanță. Acest lucru este necesar pentru identificarea corectă a modelelor care sunt construite pe baza informațiilor despre procesele studiate (autoregresii vectoriale, modele de corectare a erorilor, modele dinamice cu întârzieri distribuite etc.).

La analiza seriilor temporale, atenția principală este acordată studiului, descrierii și/sau modelării structurii acestora. Scopul unor astfel de studii, de regulă, este mai larg decât simpla modelare a studiului proceselor relevante. Modelul construit este de obicei folosit pentru a extrapola sau prezice o serie de timp, iar apoi calitatea prognozei poate servi ca un criteriu util atunci când alegeți dintre mai multe modele alternative. Construirea unor modele de serie bune este necesară și pentru alte aplicații, cum ar fi ajustarea sezonieră și netezirea. În final, modelele construite pot fi utilizate pentru modelarea statistică a serii lungi de observații în studiul sistemelor mari, pentru care seria temporală este considerată ca informație de intrare.

Datorită prezenței erorilor în măsurarea indicatorilor economici, prezenței unor fluctuații aleatorii inerente sistemelor observate, abordarea probabilistic-statistică este utilizată pe scară largă în studiul seriilor temporale. În cadrul acestei abordări, seria temporală observată este înțeleasă ca realizarea unui proces aleatoriu. În acest caz, se presupune implicit că seria temporală are o structură care o deosebește de o succesiune de variabile aleatoare independente, astfel încât observațiile nu sunt un set de valori numerice complet independente. (Unele elemente ale structurii seriei pot fi uneori identificate deja pe baza unei analize vizuale simple a graficului seriei. Acest lucru se aplică, de exemplu, unor componente ale seriei cum ar fi tendința și ciclurile.) De obicei, se presupune că structura seria poate fi descrisă de un model care conține un număr mic de parametri în comparație cu numărul de observații, acest lucru este practic important atunci când se utilizează modelul pentru prognoză. Exemple de astfel de modele sunt modele de autoregresie, medie mobilă și combinațiile acestora - modelele AR(p), MA(q), ARMA(p, q), ARIMA(p, k, q).

La construirea modelelor de relaţii pe termen lung este necesar să se ţină cont de faptul că seria macroeconomică analizată are sau nu o tendinţă stocastică (nedeterministă). Cu alte cuvinte, este necesar să se decidă dacă fiecare dintre seriile luate în considerare aparține clasei de serii care sunt staționare în raport cu o serie de tendință deterministă (sau pur și simplu staționară) - serie TS (tendință staționară), sau clasei de serie care au o tendință stocastică (poate împreună cu o tendință deterministă) și care conduc la o serie staționară (sau staționară în raport cu o tendință deterministă) numai printr-o diferențiere unică sau de k-ori a seriei - seria DS (diferență staționară). Diferența fundamentală dintre aceste două clase de serii este că, în cazul seriei TS, scăderea tendinței deterministe corespunzătoare din serie duce la o serie staționară, în timp ce în cazul seriei DS, scăderea componentei deterministe a frunzelor seriei. seria nestaționară datorită prezenței în ea a unei tendințe stocastice.

Capitolul 1. Principalele sarcini ale analizei seriilor temporale.

Diferențele fundamentale dintre o serie de timp și o secvență de observații care formează un eșantion aleatoriu sunt următoarele:

în primul rând, spre deosebire de elementele unui eșantion aleatoriu, membrii seriei temporale nu sunt independenți;

în al doilea rând, membrii seriei temporale nu sunt neapărat distribuiți în mod egal, deci P(xt< x} P{xt < x} при t t.

Aceasta înseamnă că proprietățile și regulile analizei statistice ale unui eșantion aleatoriu nu pot fi extinse la seriile de timp. Pe de altă parte, interdependența membrilor seriei temporale își creează propria bază specifică pentru construirea valorilor predictive ale indicatorului analizat pe baza valorilor observate.

Geneza observațiilor care formează o serie temporală (mecanism de generare a datelor). Vorbim despre structura și clasificarea principalilor factori sub influența cărora se formează valorile seriei temporale. De regulă, se disting 4 tipuri de astfel de factori.

Pe termen lung, formând o tendință generală (pe termen lung) în schimbarea caracteristicii analizate xt. De obicei, această tendință este descrisă folosind una sau alta funcție non-aleatorie ftr(t) (al cărei argument este timpul), de obicei monotonă. Această funcție se numește funcție de tendință sau pur și simplu tendință.

Sezoniere, formând fluctuații ale trăsăturii analizate care se repetă periodic la o anumită perioadă a anului. Deoarece această funcție (e) trebuie să fie periodică (cu perioade care sunt multiple de „anotimpuri”), armonicele (funcții trigonometrice) participă la exprimarea ei analitică, a cărei periodicitate, de regulă, este determinată de conținutul problemei.

Ciclice (oportuniste), care formează modificări ale trăsăturii analizate, datorită acțiunii unor cicluri de lungă durată de natură economică sau demografică (valuri Kondratiev, „gropi” demografice etc.) Se va nota rezultatul acțiunii factorilor ciclici. folosind o funcție non-aleatorie (t).

Aleatoriu (neregulat), nu este supus contabilității și înregistrării. Influența lor asupra formării valorilor seriei temporale determină doar natura stocastică a elementelor xt și, în consecință, necesitatea interpretării x1,…, xT ca observații făcute asupra variabilelor aleatoare 1,…, T. va desemna rezultatul impactului factorilor aleatori folosind cantități aleatorii („reziduuri”, „erori”) t.

Desigur, nu este deloc necesar ca factorii din toate cele patru tipuri să participe simultan la procesul de formare a valorilor oricărei serii cronologice. Concluziile despre faptul dacă factorii de acest tip sunt implicați sau nu în formarea valorilor unei anumite serii se pot baza atât pe analiza conținutului esenței problemei, cât și pe o analiză statistică specială a seriei temporale studiate. . Cu toate acestea, în toate cazurile, se presupune participarea indispensabilă a factorilor aleatori. Astfel, în termeni generali, modelul de generare a datelor (cu o diagramă bloc aditivă a influenței factorilor) arată astfel:

xt = 1f(t) + 2(t) +3(t) + t. (unu)

unde i = 1 dacă factorii de tip i sunt implicați în formarea valorilor seriei și i = 0 în caz contrar.

Principalele sarcini ale analizei seriilor temporale. Scopul de bază al analizei statistice a unei serii de timp este de a urmări traiectoria existentă a acestei serii:

determinați care dintre funcțiile non-aleatoare sunt prezente în expansiune (1), adică determinați valorile indicatorilor i;

construiți estimări „bune” pentru acele funcții non-aleatoare care sunt prezente în expansiune (1);

alegeți un model care descrie în mod adecvat comportamentul reziduurilor aleatoare t și evaluați statistic parametrii acestui model.

Rezolvarea cu succes a sarcinilor enumerate, datorită scopului de bază al analizei statistice a seriei de timp, stă la baza atingerii obiectivelor finale de cercetare aplicată și, în primul rând, pentru rezolvarea problemei prognozei pe termen scurt și mediu. a valorilor seriei de timp. Să prezentăm pe scurt principalele elemente ale analizei econometrice a seriilor de timp.

Adnotare: În cadrul seriilor temporale înțelegeți valorile economice care depind de timp. În acest caz, timpul se presupune a fi discret; în caz contrar, se vorbește de procese aleatorii, și nu de serii temporale.

Modele de serii temporale staționare și nestaționare, identificarea lor

Să luăm în considerare seria temporală. Lăsați seria temporală să ia mai întâi valori numerice. Acesta poate fi, de exemplu, prețul unei pâini dintr-un magazin din apropiere sau cursul de schimb dolar-ruble la cel mai apropiat birou de schimb valutar. De obicei, în comportamentul unei serii de timp sunt identificate două tendințe principale - o tendință și fluctuațiile periodice.

În acest caz, tendința este înțeleasă ca dependența de timp a unui tip liniar, pătratic sau de alt tip, care este relevată printr-una sau alta metodă de netezire (de exemplu, netezire exponențială) sau prin calcul, în special, folosind metoda celor mai mici pătrate. Cu alte cuvinte, o tendință este tendința principală a unei serii de timp, curățată de aleatoriu.

Seria temporală oscilează de obicei în jurul unei tendințe, abaterile de la tendință fiind adesea corecte. Adesea, acest lucru se datorează unei frecvențe naturale sau desemnate, cum ar fi sezonieră sau săptămânală, lunară sau trimestrială (de exemplu, conform programelor de plată a salariilor și impozitelor). Uneori, prezența periodicității și cu atât mai mult cauzele acesteia sunt neclare, iar sarcina econometricianului este să afle dacă există într-adevăr o periodicitate.

Metodele elementare de estimare a caracteristicilor seriilor de timp sunt de obicei considerate suficient de detaliat în cursurile „Teoriei generale a statisticii” (a se vedea, de exemplu, manuale), deci nu este nevoie să le analizăm în detaliu aici. (Cu toate acestea, unele metode moderne de estimare a duratei perioadei și a componentei periodice în sine vor fi discutate mai jos.)

Caracteristicile seriilor temporale. Pentru un studiu mai detaliat al seriilor temporale se folosesc modele probabilistic-statistice. În acest caz, seria temporală este considerată ca un proces aleatoriu (cu timp discret), principalele caracteristici sunt așteptarea matematică, i.e.

Dispersia, adică

și funcția de autocorelare serii de timp

acestea. funcţie a două variabile egale cu coeficient de corelațieîntre două valori ale seriei temporale și .

În cercetarea teoretică și aplicată, sunt luate în considerare o gamă largă de modele de serie de timp. Selectați mai întâi staționar modele. Au funcții comune de distribuție pentru orice număr de puncte de timp și, prin urmare, toate caracteristicile seriei de timp enumerate mai sus nu se schimba in timp. În special, așteptarea și varianța matematică sunt constante, funcția de autocorelare depinde doar de diferență. Se numesc serii temporale care nu sunt staţionare nestaționare.

Modele de regresie liniară cu reziduuri homocedastice și heteroscedastice, independente și autocorelate. După cum se poate observa din cele de mai sus, principalul lucru este „curățarea” seriilor temporale de abaterile aleatorii, adică. estimarea așteptărilor matematice. Spre deosebire de cele mai simple modele analiza regresiei luate în considerare în , aici apar în mod firesc modele mai complexe. De exemplu, variația poate depinde de timp. Se numesc astfel de modele heteroscedastic, iar cele în care nu există dependență de timp sunt homoscedastice. (Mai precis, acești termeni se pot referi nu numai la variabila „timp”, ci și la alte variabile.)

cometariu. După cum s-a menționat în „Analiza statistică multivariată”, cel mai simplu model metoda celor mai mici pătrate permite generalizări foarte departe, mai ales în domeniul sistemelor de ecuaţii econometrice simultane pentru serii de timp. Pentru a înțelege teoria și algoritmii relevanți, este necesară o cunoaștere profesională a algebrei matriceale. Așadar, îi trimitem pe cei interesați la literatura de specialitate privind sistemele de ecuații econometrice și direct pe serii de timp, în care există mult interes pentru teoria spectrală, i.e. separând semnalul de zgomot şi descompunându-l în armonici. Subliniem încă o dată că în spatele fiecărui capitol al acestei cărți se află o mare arie de cercetare științifică și aplicată, care este destul de demnă de a-i dedica mult efort. Totuși, din cauza volumului limitat al cărții, suntem nevoiți să facem prezentarea concisă.

Sisteme de ecuații econometrice

Un exemplu de model autoregresiv. Ca exemplu inițial, luați în considerare un model econometric al unei serii de timp care descrie creșterea indicelui prețurilor de consum (indicele inflației). Să fie creșterea prețurilor pe lună (pentru mai multe despre această problemă, consultați „Analiza econometrică a inflației”). Apoi, după unii economiști, este firesc să presupunem că

(6.1)

unde este creșterea prețului în luna anterioară (a este un anumit coeficient de amortizare, presupunând că în absența unor influențe externe creșterea prețului se va opri), este o constantă (corespunde unei modificări liniare a valorii în timp), este un termen corespunzător efectului emisiei de bani (adică creșterea sumei de bani din economia țării, efectuată de Banca Centrală) în mărime și proporțional cu emisia cu un coeficient, iar acest efect nu apare imediat, ci dupa 4 luni; În cele din urmă, aceasta este o eroare inevitabilă.

Modelul (1), în ciuda simplității sale, demonstrează multe trăsături de caracter modele econometrice mult mai complexe. În primul rând, să acordăm atenție faptului că unele variabile sunt definite (calculate) în interiorul modelului, cum ar fi . Ei sunt numiti, cunoscuti endogen (intern). Altele sunt date extern (asta este exogene variabile). Uneori, ca în teoria controlului, printre variabile exogene, alocă gestionate variabile - cele cu care managerul poate aduce sistemul în starea dorită.

În al doilea rând, variabilele de noi tipuri apar în relația (1) - cu întârzieri, i.e. argumentele din variabile nu se referă la momentul actual în timp, ci la unele momente trecute.

În al treilea rând, compilarea unui model econometric de tip (1) nu este nicidecum o operație de rutină. De exemplu, o întârziere de exact 4 luni în termenul asociat emisiunii de bani este rezultatul unei prelucrări statistice preliminare destul de sofisticate. Mai mult, problema dependenței sau independenței cantităților și trebuie studiată. După cum sa menționat mai sus, implementarea specifică a procedurii depinde de soluționarea acestei probleme. metoda celor mai mici pătrate.

Pe de altă parte, în modelul (1) există doar 3 parametri necunoscuți și declarația metoda celor mai mici pătrate e usor de scris:

Problema identificabilității. Să ne imaginăm acum modelul tapa (6.1) cu un număr mare de endogene și variabile exogene, cu decalaje și o structură internă complexă. În general, nu rezultă de nicăieri că există cel puțin o soluție pentru un astfel de sistem. Deci nu există una, ci două probleme. Există cel puțin o soluție (problema identificării)? Dacă da, cum să găsești cea mai bună soluție posibilă? (Aceasta este o problemă de estimare a parametrilor statistici.)

Atât prima cât și a doua sarcină sunt destul de dificile. Pentru a rezolva ambele probleme au fost dezvoltate multe metode, de obicei destul de complexe, dintre care doar unele au rațiune științifică. În special, ei folosesc adesea estimări statistice care nu sunt consecvente (strict vorbind, nici măcar nu pot fi numite estimări).

Să descriem pe scurt câteva tehnici comune atunci când lucrăm cu sisteme de ecuații econometrice liniare.

Sistem de ecuații econometrice liniare simultane. Pur formal, toate variabilele pot fi exprimate în termeni de variabile care depind doar de momentul curent în timp. De exemplu, în cazul ecuației (6.1), este suficient să setați

Atunci ecuația este un exemplu de formă

(6.2)

Remarcăm aici și posibilitatea utilizării modelelor de regresie cu structura variabila prin introducerea de variabile fictive. Aceste variabile la un moment dat valorile (să zicem, cele inițiale) iau valori notabile, iar la altele ele dispar (devin de fapt egale cu 0). Ca rezultat, formal (matematic) unul și același model descrie dependențe complet diferite.

Cele mai mici pătrate indirecte, în doi pași și în trei etape. După cum sa menționat deja, au fost dezvoltate o mulțime de metode de analiză euristică a sistemelor de ecuații econometrice. Ele sunt concepute pentru a rezolva anumite probleme care apar atunci când se încearcă găsirea solutii numerice sisteme de ecuații.

Una dintre probleme este legată de prezența unor restricții a priori asupra parametrilor estimați. De exemplu, venitul gospodăriei poate fi cheltuit fie pentru consum, fie pentru economii. Aceasta înseamnă că suma cotelor acestor două tipuri de cheltuieli este a priori egală cu 1. Și în sistemul de ecuații econometrice, aceste cote pot participa independent. Există o idee de a le evalua cele mai mici pătrate, ignorând constrângerea a priori și apoi ajustați. Această abordare se numește indirectă. cele mai mici pătrate.

doi pasi metoda celor mai mici pătrate constă în estimarea parametrilor unei ecuații individuale a sistemului, mai degrabă decât în ​​considerarea sistemului ca întreg. În același timp, în trei pași metoda celor mai mici pătrate este utilizat pentru estimarea parametrilor sistemului de ecuații simultane în ansamblu. Mai întâi, fiecărei ecuații se aplică o metodă în două etape pentru a estima coeficienții și erorile fiecărei ecuații, apoi pentru a construi o estimare pentru matricea de covarianță a erorii, după care se aplică o metodă generalizată pentru a estima coeficienții întregul sistem. metoda celor mai mici pătrate.

Un manager și un economist nu ar trebui să devină un specialist în compilarea și rezolvarea sistemelor de ecuații econometrice, chiar și cu ajutorul anumitor sisteme software, dar ar trebui să fie conștienți de posibilitățile acestui domeniu de econometrie pentru a formula o sarcină pentru specialişti econometrici într-o manieră calificată dacă este necesar.

De la estimarea tendinței (tendința principală), să trecem la a doua sarcină principală a econometriei seriilor temporale - estimarea perioadei (ciclului).