Analiza i predviđanje vremenskih serija

Tijekom godina ljudi predviđaju vremenske uvjete, ekonomske i političke događaje i sportske rezultate, nedavno je ovaj opsežni popis nadopunjen kripto valutama. Za predviđanja svestranih događaja postoji mnogo načina za razvoj predviđanja. Na primjer, intuicija, stručna mišljenja, korištenje prošlih rezultata za usporedbu s tradicionalnom statistikom, a predviđanje vremenskih serija samo je jedno od njih, s najmodernijom i najtočnijom vrstom predviđanja sa širokim opsegom.

Metoda vremenskih serija

Metoda vremenskih serija

Metoda sa korištenje vremenskih serija (oceans) je skup podataka koji prikuplja informacije tijekom određenog vremenskog razdoblja. Postoje posebne metode za isticanje ove vrste:

  • linearni i nelinearni;
  • parametarski i neparametarski;
  • jednodimenzionalni i višedimenzionalni.

Predviđanje vremenskih serija sa sobom donosi jedinstveni skup mogućnosti za rješavanje suvremenih problema. Modeliranje se oslanja na proučavanje kako bi se utvrdila pokretačka snaga promjene podataka. Proces proizlazi iz dugoročnih trendova, sezonskih učinaka ili nepravilnih fluktuacija koje su karakteristične za Oceanside i nisu uočene u drugim vrstama analiza.

Strojno učenje je grana informatike u kojoj se algoritmi sastavljaju na temelju podataka i uključuju umjetne neuronske mreže, duboko učenje, pravila udruživanja, stabla odluka, učenje pojačanja i bajesovske mreže. Raznolikost algoritama pruža mogućnosti za rješavanje problema, a svaki ima svoje zahtjeve i kompromise u pogledu unosa podataka, brzine rada i točnosti rezultata. Oni će, zajedno s točnošću konačnih predviđanja, biti ponderirani kada korisnik odluči koji će algoritam raditi bolje za proučena situacija.

Predviđanje vremenskih serija posuđuje iz područja statistike, ali daje nove pristupe modeliranju problema. Glavni problem strojnog učenja i vremenskih serija je isti-predvidjeti nove rezultate na temelju prethodno poznatih podataka.

Svrha prediktivnog modela

Svrha prediktivnog modela

Internet je skup podatkovnih točaka prikupljenih u stalnim intervalima. Analiziraju se kako bi se utvrdio dugoročni trend kako bi se predvidjela budućnost ili izvršila neka druga vrsta analize. Postoje 2 stvari koje čine razliku između Interneta i uobičajenog problema s regresijom:

  1. Ovise o vremenu. Stoga osnovna pretpostavka modela linearne regresije da su opažanja neovisna u ovom slučaju ne vrijedi.
  2. Zajedno s tendencijom povećanja ili smanjenja, većina IPASINA ima neki oblik sezonalnosti, odnosno promjene specifične za određeno vremensko razdoblje.

Cilj modela predviđanja vremenskih serija je dati točno predviđanje na zahtjev. Vremenska serija ima vrijeme (oceans) kao neovisnu varijablu i ciljnu ovisnu varijablu. U većini slučajeva prognoza je specifičan ishod, poput vrijednosti kuće prilikom prodaje, sportski rezultat natjecanja, rezultati trgovanja na burzi. Predviđanje predstavlja medijan i srednju vrijednost i uključuje interval pouzdanosti koji izražava razinu punomoći u rasponu od 80-95 %. Kada se fiksiraju u redovitim intervalima, procesi se nazivaju vremenskim serijama i izražavaju se na dva načina:

  • s vremenskim indeksom koji stvara implicitni poredak;
  • skup s dvije dimenzije: vrijeme s neovisnom varijablom i druga ovisna varijabla.

Stvaranje značajki jedan je od najvažnijih i dugotrajnijih zadataka u primijenjenom strojnom učenju. Međutim, predviđanje vremenskih serija ne stvara značajke, barem ne u tradicionalnom smislu. To je osobito istinito kada je potrebno predvidjeti ishod nekoliko koraka unaprijed, a ne samo sljedeću vrijednost.

To ne znači da su značajke potpuno zabranjene. Samo ih treba koristiti s oprezom iz sljedećih razloga:

  1. Nejasno je koje će buduće stvarne vrijednosti biti za ove značajke.
  2. Ako su objekti predvidljivi i imaju neke obrasce, može se konstruirati prediktivni model za svaki od njih.

Međutim, trebate imati na umu, da će upotreba predviđenih vrijednosti kao značajki proširiti pogrešku na ciljnu varijablu i dovesti do pogrešaka ili dati pristrana predviđanja.

Komponente vremenske serije

Komponente vremenske serije

Trend postoji kada se serija vremenom povećava, smanjuje ili ostaje na konstantnoj razini, pa se uzima kao funkcija. Sezonalnost se odnosi na svojstvo vremenske serije koja prikazuje periodične obrasce koji se ponavljaju konstantnom frekvencijom (iPhone), na primjer, iPhone = 12 znači da se uzorak ponavlja svakih dvanaest mjeseci.

Lažne varijable slično sezonalnosti mogu se dodati kao binarna funkcija. Moguće je, na primjer, uzeti u obzir praznike, posebne događaje, marketinške kampanje, bez obzira je li vrijednost autsajder ili ne. Međutim, treba imati na umu da ove varijable moraju imati određene obrasce. S obzirom na to, broj dana može se lako izračunati čak i za buduća razdoblja i utjecati na predviđanje temeljeno na vremenskim serijama, posebno u financijskom području.

Ciklusi su godišnja doba koja se ne događaju fiksnom brzinom. Na primjer, godišnji atributi reprodukcije kanadskog risa odražavaju sezonske i cikličke obrasce. Ne ponavljaju se u redovitim razmacima i mogu se pojaviti čak i ako je frekvencija 1 (Internet = 1).

- Kao prediktori mogu se uključiti zaostale vrijednosti varijable. Neki modeli, kao što su oceani, vektorska autoregresija (oceani) ili autoregresivne neuronske mreže (oceani), rade na ovaj način.

Komponente varijable od interesa vrlo su važne za analizu vremenskih serija i predviđanje kako bi se razumjelo njihovo ponašanje, obrasci, kao i mogućnost odabira odgovarajućeg modela.

Atributi skupa podataka

Atributi skupa podataka

Možda je programer navikao unositi tisuće, milijune i milijarde podatkovnih točaka u model strojnog učenja, ali to nije potrebno za vremenske serije. U stvari, moguće je raditi s malim i srednjim oceanima, ovisno o učestalosti i vrsti varijable, a to nije nedostatak metode. Štoviše, zapravo postoji niz prednosti u ovom pristupu:

  1. Takvi skupovi informacija odgovarat će mogućnostima kućnog računala.
  2. U nekim slučajevima rade analizu vremenskih serija i predviđanje koristeći cijeli skup podataka, a ne samo uzorak.
  3. Duljina interneta prikladna je za stvaranje grafikona koji se mogu analizirati. Ovo je vrlo važna točka jer se programeri temelje na grafici u fazi analize. To ne znači da ne rade s ogromnim vremenskim serijama, ali u početku bi trebali biti u mogućnosti nositi se s manjim oceanima.
  4. Bilo koji skup podataka koji sadrži polje povezano s vremenom može imati koristi od analize vremenskih serija i predviđanja. Međutim, ako programer ima veći skup podataka, DB (oceans) bi mogao biti prikladniji.

Neki od ovih skupova potječu iz događaja zabilježenih vremenskom oznakom, zapisnicima sustava i financijskim podacima. Budući da se u početku radi s vremenskim serijama, ovo je izvrsna prilika za primjenu ove tehnike na skupove podataka velikih razmjera.

Strojno učenje

Strojno učenje (mo) može nadmašiti tradicionalne metode predviđanja vremenskih serija. Postoji cijela hrpa studija koje uspoređuju tehnike strojnog učenja s klasičnijim statistikama za podatke o oceanima. Neuronske mreže jedna su od tehnologija koja je prilično široko istražena i primjenjuje se na pristupe. Metode strojnog učenja vode u rangiranju prikupljanja podataka temeljenih na vremenskim serijama. Ovi su se pristupi pokazali učinkovitima, nadmašujući čiste pristupe u konkurenciji s ama3 ili ama.

Mo ima svoje specifične probleme. Inženjering značajki ili stvaranje novih prediktora iz skupa podataka važan je korak za njega i može imati ogroman utjecaj na performanse i biti nužan način rješavanje problema trend i sezonalnost podataka. Osim toga, neki modeli imaju problema s time koliko dobro odgovaraju podacima i ako ne, mogli bi propustiti glavni trend.

Vremenske serije i pristupi strojnom učenju ne bi trebali postojati izolirani jedni od drugih. Oni se mogu kombinirati kako bi se pružile prednosti svakog pristupa. Metode predviđanja i analiza vremenskih serija dobro rade na razgradnji podataka na trendovske i sezonske elemente. Ova se analiza tada može koristiti kao ulaz za mo model koji u svom algoritmu ima informacije o trendovima i sezonalnosti, što daje najbolju od dvije mogućnosti.

Razumijevanje izjave o problemu

Na primjer, možete uzeti u obzir IP-ove povezane s predviđanjem broja putnika u novoj brzoj željezničkoj vezi. Na primjer, dostupni su podaci za 2 godine (kolovoz 2016. - rujna 2018.), a pomoću ovih podataka potrebno je predvidjeti broj putnika za sljedećih 7 mjeseci, imajući podatke za 2 godine (2016-2018) na satnoj razini s brojem putnika koji putuju, a potrebno je procijeniti njihov broj u budućnosti.

Podskup skupa podataka za predviđanje pomoću vremenskih serija:

  1. Stvaranje vlaka i testne datoteke za simulaciju.
  2. Prvih 14 mjeseci (kolovoz 2016. - listopada 2017.) koriste se kao podaci o treningu, a sljedeća 2 mjeseca (studeni 2017. - prosinca 2017.)- podaci ispitivanja.
  3. Agregiranje skupa podataka na dnevnoj bazi.
Agregiranje skupa podataka

Izvršite vizualizaciju podataka kako biste znali kako se mijenjaju tijekom određenog vremenskog razdoblja.

Vizualizacija podataka

Metoda izgradnje NASA-e

Knjižnica koja se u ovom slučaju koristila za predviđanje oceana je. Mora se instalirati prije primjene bilo kojeg od navedenih pristupa. Moguće je da je IPA već instaliran u okruženju IPA, ali ne podržava metode predviđanja, pa će ga trebati klonirati iz spremišta i instalirati pomoću izvornog koda.

Slijed radnji

Za ovaj primjer, to znači da su cijene putovanja kovanice stabilne od samog početka i tijekom cijelog vremenskog razdoblja. Takva metoda pretpostavlja da je sljedeća očekivana točka jednaka zadnjoj promatranoj točki i naziva se a (naivna metoda).

Naivna metoda

Sada se izračunava standardna devijacija kako bi se provjerila točnost modela na skupu testnih podataka. Iz vrijednosti i prikazanog grafikona može se zaključiti da je IS nije prikladan za opcije s velikom varijabilnošću, već se primjenjuje za stabilne.

Jednostavan srednji stil

Kako bi se demonstrirala metoda, crta se grafikon pod pretpostavkom da OS AIP-a prikazuje cijenu, a OS AIP-a prikazuje vrijeme (dane).

Jednostavan srednji stil

Iz njega se može zaključiti da se cijena nasumično povećava i smanjuje s malom marginom, tako da, srednja vrijednost ostaje konstantna. U tom slučaju možete predvidjeti cijenu sljedećeg razdoblja sličnu prosjeku za sve protekle dane.

Takva metoda predviđanja s očekivanom srednjom vrijednošću prethodno promatranih točaka naziva se jednostavnom srednjom metodom.

U tom slučaju uzimaju prethodno poznate vrijednosti, izračunavaju prosjek i uzimaju ga kao sljedeću vrijednost. Naravno, to neće biti točno, ali prilično blizu i postoje situacije kada ova metoda djeluje najbolje od svega.

Jednostavna srednja metoda

Iz rezultata prikazanih na grafikonu može se vidjeti da ova metoda najbolje funkcionira kada prosjek za svako vremensko razdoblje ostane konstantan. Iako je naivna metoda bolja od prosjeka, ali ne za sve skupove podataka. Preporučuje se isprobati svaki model korak po korak i provjeriti poboljšava li rezultat ili ne.

Model pokretnog prosjeka

Model pokretnog prosjeka

Na temelju ovog grafikona može se zaključiti da su se cijene u prošlosti nekoliko puta povećavale s velikom razlikom, ali sada su stabilne. Da biste koristili prethodnu metodu prosjeka, morate uzeti prosjek svih prethodnih podataka. Cijene početnog razdoblja uvelike će utjecati na prognozu sljedećeg razdoblja. Stoga se kao poboljšanje u odnosu na jednostavan prosjek uzima prosjek cijena samo u posljednjih nekoliko vremenskih razdoblja.

Takva tehnika predviđanja naziva se tehnika pomičnog prosjeka, koja se ponekad naziva i "klizni prozor" veličine "n". Koristeći jednostavan model, predvidjeti sljedeću vrijednost u internetu kako bi se provjerila točnost metode. Jasno je da je i za ovaj skup podataka superiorniji i za ovaj skup podataka.

Postoji varijanta predviđanja metodom jednostavnog eksponencijalnog zaglađivanja. U metodi pomičnog prosjeka, jednako vagati prošla promatranja " interneta. U ovom slučaju, moguće je naići na situacije u kojima svaki od prošlih `interneta` utječe na prognozu na svoj način. Takva varijanta, koja različito ponderira prošla zapažanja, naziva se metodom ponderiranog pomičnog prosjeka.

Ekstrapolacija uzoraka

Jedno od najvažnijih svojstava, potreban za razmatranje algoritama predviđanja vremenskih serija, je sposobnost ekstrapoliranja uzoraka izvan područja podataka o treningu. Mnogi mo algoritmi nemaju tu mogućnost, jer imaju tendenciju da budu ograničeni na područje koje je određeno podacima o treningu. Stoga se ne uklapaju u one koji imaju za cilj projicirati rezultat u budućnost.

Još jedno važno svojstvo algoritma za ocean je sposobnost dobivanja intervala pouzdanosti. Iako je ovo zadano svojstvo za modele na internetu, a većina mo modela nema tu mogućnost, jer se svi ne temelje na statističkim distribucijama.

Nemojte misliti da se samo jednostavne statističke metode koriste za predviđanje oceana. To uopće nije slučaj. Ima ih mnogo složenih pristupa koji mogu biti vrlo korisni u posebnim slučajevima. Generalizirana autoregresivna uvjetna heteroskedastičnost (IPAS), BAJESOV i IPAs samo su neki od njih.

Postoje i modeli neuronskih mreža koji se mogu primijeniti na vremenske serije koje koriste zaostale prediktore i mogu se nositi s funkcijama kao što su autoregresija neuronskih mreža (oceans). Postoje čak i modeli vremenskih serija izvedeni iz složene studije, posebno u obitelji-ponavljajućoj neuronskoj mreži, kao što su mreže ina i ina.

Mjerni podaci i dijagnoza ostataka

Najčešće procijenjene metrike za predviđanje su RMS prosjeci, koje mnogi koriste u rješavanju regresijskih problema:

  • Budući da je neovisan o mjerilu i predstavlja omjer pogreške i stvarnih vrijednosti u postocima;
  • IPhone, koji pokazuje koliko se dobro prognoza izvodi u usporedbi s naivnom prosječnom prognozom.

Nakon što je metoda predviđanja prilagođena, važno je procijeniti koliko dobro može uhvatiti modele. Iako procijenjene metrike pomažu u određivanju koliko su bliske vrijednosti jednake stvarnim vrijednostima, one ne procjenjuju je li model u skladu s. Ostaci su dobar način da se to procijeni. Budući da programer pokušava primijeniti uzorke s oceana, može očekivati da će se pogreške ponašati poput "bijelog šuma", jer predstavljaju nešto što model ne može uhvatiti.

"Bijeli šum" mora imati sljedeća svojstva:

  1. Ostaci su nekorelirani (internet = 0)
  2. Ostaci odgovaraju normalnoj raspodjeli s nultom srednjom (nepristranom) i konstantnom varijancom.
  3. Ako nedostaje bilo koje od dva svojstva, to znači da model ima mjesto za poboljšanja.
  4. Svojstvo nulte srednje vrijednosti može se lako provjeriti pomoću kriterija za internet.
  5. Svojstva normalnosti i konstantne varijance vizualno se kontroliraju histogramom ostataka ili odgovarajućim jednodimenzionalnim testom normalnosti.

Model ARIMA

Ama-model Ama - ama, je jedan od najpopularnijih metoda koje se koriste u predviđanju oceana, uglavnom zahvaljujući autokorelaciji podataka za stvaranje visokokvalitetnih modela.

Kada se procjenjuju koeficijenti U vezi s oceanom, osnovna pretpostavka je da su podaci stacionarni. To znači da trend i sezonalnost ne mogu utjecati na varijancu. Kvaliteta modela može se procijeniti usporedbom vremenskog grafikona stvarnih vrijednosti s predviđenim vrijednostima. Ako su obje krivulje bliske, tada se može pretpostaviti da model odgovara analiziranom slučaju. Trebao bi otkriti sve trendove i sezonalnost, ako ih ima.

Analiza ostataka tada bi trebala pokazati je li model prikladan: slučajni ostaci znače da je točan. Uklapanje u vezi s parametrima (0,1,1) dat će iste rezultate kao i eksponencijalno zaglađivanje, a upotreba parametara (0,2,2) dat će rezultate dvostrukog eksponencijalnog zaglađivanja.

Algoritmi vremenskih serija u astronomiji

Može se pristupiti postavkama ama u ama:

  1. Lansiraju Se Oceani.
  2. Na nadzornoj ploči pronađite.
  3. Na vrpci se na padajućem izborniku odabiru oceans.

Skup mogućnosti modela NASA:

  1. Internet - AUTOREGRESIVNI integrirani pomični prosjek.
  2. Model predviđanja koji se koristi u analizi vremenskih serija.
  3. Sintaksa parametara ARIMA : ARIMA (p, d, q), gdje p = broj авторегрессионных članova, d = broj sezonskih разностей i q = broj članova pomičnog prosjeka.

Algoritmi u astronomiji

Izvođenje unakrsnog predviđanja jedna je od važnih značajki vremenskih serija u predviđanju financijskih zadataka. Ako se koriste dvije međusobno povezane serije, rezultirajući model može se primijeniti za predviđanje ishoda jedne serije na temelju ponašanja drugih.

Internet 2008 ima moćne nove značajke vremenskih serija koje treba naučiti i koristiti. Alat ima lako dostupne podatke o internetu, sučelje jednostavno za korištenje za simulaciju i reprodukciju funkcija algoritma i okvir za objašnjenje koji se odnosi na zahtjeve za internetom na strani poslužitelja, tako da možete bilo je razumjeti što se događa unutra.

Vremenske serije tržišta široko su područje na koje se mogu primijeniti modeli i algoritmi dubokog učenja. Banke, brokeri i fondovi danas eksperimentiraju sa svojim uvođenjem analize i predviđanja indeksa, tečaja, terminskih ugovora, cijena kriptovaluta, državnih dionica i još mnogo toga.

U predviđanju vremenskih serija, neuronska mreža pronalazi predvidljive obrasce proučavanjem struktura i trendova tržišta i daje savjete trgovcima. Te mreže također mogu pomoći u otkrivanju anomalija kao što su neočekivani vrhovi, padovi, promjene trenda i pomaci razine. Mnogi modeli umjetne inteligencije koristi se za financijske prognoze.

Članci o toj temi