Ebben a cikkben bemutatjuk az automatikus ARIMA modellt Pythonban, valamint annak alkalmazását az idősor-elemzésben és előrejelzésben. Az ARIMA (Autoregresszív Moving Average Model) egy klasszikus statisztikai modell, amelyet széles körben használnak idősorok modellezésében és előrejelzésében. Az automatikus ARIMA modell egy hatékony eszköz a Pythonban, amely automatikusan kiválasztja a legjobb ARIMA modellparamétereket, és pontos előrejelzési eredményeket biztosít.
Mi az ARIMA modell?
Az ARIMA modell három részből áll: autoregresszió (AR), különbség (I) és mozgóátlag (MA). E három rész kombinálásával az ARIMA modell széles körű idősor-adatokat képes modellezni és előrejelezni.
- Autoregresszió (AR): Ez a rész elsősorban a jelenlegi és korábbi értékek közötti függőségek leírására szolgál. Ez azt jelzi, hogy az aktuális értéket a korábbi értékek lineáris kombinációjából kapjuk.
- Különbség (I): Ezt a szakaszt az idősorok adatainak kisimítására használják. A stacionárius sorozatok olyan sorozatok, amelyekben az átlag, a variancia és az önkoordináló variancia nem változik az idő múlásával.
- Mozgóátlag (MA): Ez a rész a múltbeli és jelenlegi hibák közötti kapcsolat leírására szolgál. Ez azt jelzi, hogy a jelenlegi hiba a múltbeli hibák lineáris kombinációja.
Az ARIMA modell képes különböző AR, I és MA rendeket választani az idősor adatok természete szerint, hogy a legjobb illeszkedési hatást érje el.
Hogyan használjuk a Python automatikus ARIMA modelljét
A Python automatikus ARIMA modelljének használatához először telepítened kell a statsmodels könyvtárat és a pmdarima könyvtárat. E két könyvtár telepítése után elkezdheted használni az auto_arima() funkciót modellválasztáshoz és illesztéshez.
Az auto_arima() függvény egy erőteljes funkció a pmdarima könyvtárban, amely automatikusan választja ki az ARIMA modell paramétereit az idősor adatok természete alapján. Íme egy példa:
A fenti példakódban először használd a pandas könyvtárat az idősorok adataihoz, és állítsd be a dátumoszlopot indexként. Ezután használjuk a auto_arima() függvényt, hogy automatikusan kiválasszuk az ARIMA modell paramétereit, és hozzárendeljük azokat a modellváltozóhoz. Végül az ARIMA modellt a fit() függvény segítségével illesztik, és a modell paraméterösszefoglalóját kinyomtatják.
Automatikus ARIMA modellek alkalmazásainak példái
Íme egy gyakorlati alkalmazási példa, amely bemutatja, hogyan lehet használni a Python automatikus ARIMA modelljét idősorok elemzésére és előrejelzésére.
Tegyük fel, hogy van egy értékesítési adathalmazunk, amely minden hónapra vonatkozó értékesítési adatokat tartalmaz. Reméljük, hogy ezt az adatkészletet felhasználjuk a következő hónapok eladásainak előrejelzésére. Először el kell olvasnunk az adatokat, és el kell végeznünk a szükséges előfeldolgozást:
A fenti kódban a pandas könyvtárat használtuk az értékesítési adatok felolvasására, és a dátumoszlopot indexként állítottuk be. Ezután a diff() függvényt használjuk az adatok első sorrendjének differenciálására, így az adat statisztánus sorozat lesz.
Ezután az automatizált ARIMA modellt használhatjuk a jövőbeli eladások előrejelzésére:
A fenti kódban az auto_arima() függvény automatikusan kiválasztja az ARIMA modell paramétereit, és hozzárendeli azokat a modellváltozóhoz. Ezután használjuk a fit() függvényt az ARIMA modellhez igazítani. Végül használd a predict() függvényt, hogy előrejelezd a következő néhány hónap eladásait, és az eredményeket egy dátumokhoz és eladásokhoz tartozó DataFrame-be alakítsd át.
összefoglalás
Ez a cikk bemutatja az automatikus ARIMA modellek alapvető elveit és használatát a Pythonban. Az automatizált ARIMA modellek automatikusan kiválaszthatják a megfelelő ARIMA modellt az idősorozat adatai természete alapján, és pontos előrejelzési eredményeket adhatnak. Az automatikus ARIMA modellek használatával könnyebben végezhetjük az idősorok elemzését és előrejelzését, ami segít pontosabb döntéseket hozni. Remélem, ez a cikk hasznos volt az automatikus ARIMA modell megértésében és alkalmazásában!
Eredeti:A hiperlink bejelentkezés látható. |