У цій статті ми представимо автоматичну модель ARIMA в Python та її застосування в аналізі часових рядів і прогнозуванні. ARIMA (Авторегресивна модель ковзного середнього) — це класична статистична модель, широко використовується для моделювання та прогнозування даних часових рядів. Автоматична модель ARIMA — це потужний інструмент на Python, який автоматично вибирає найкращі параметри моделі ARIMA та забезпечує точні результати прогнозування.
Що таке модель ARIMA?
Модель ARIMA складається з трьох частин: авторегресії (AR), різниці (I) та ковзного середнього (MA). Поєднуючи ці три частини, модель ARIMA може моделювати та прогнозувати широкий спектр даних часових рядів.
- Авторегресія (AR): Цей розділ переважно використовується для опису залежностей між поточними та минулими значеннями. Воно вказує, що поточне значення отримується з лінійної комбінації минулих значень.
- Різниця (I): Цей розділ використовується для згладжування даних часових рядів. Стаціонарні послідовності — це ряди, у яких середнє, дисперсія та самокоординуюча дисперсія не змінюються з часом.
- Ковзне середнє (MA): Цей розділ використовується для опису зв'язку між минулими та поточними помилками. Вона вказує, що поточна помилка є лінійною комбінацією минулих помилок.
Модель ARIMA може обирати різні порядки AR, I та MA відповідно до характеру даних часових рядів для досягнення найкращого ефекту підгонки.
Як користуватися автоматичною моделлю ARIMA в Python
Щоб використовувати автоматичну модель Python ARIMA, спочатку потрібно встановити бібліотеку statsmodels і бібліотеку pmdarima. Після встановлення цих двох бібліотек можна почати використовувати функцію auto_arima() для вибору моделі та підгонки.
Функція auto_arima() — це потужна функція в бібліотеці pmdarima, яка автоматично вибирає параметри моделі ARIMA на основі характеру даних часових рядів. Ось приклад:
У наведеному вище прикладі коду спочатку використайте бібліотеку pandas для зчитування даних часових рядів і встановіть стовпець дати як індекс. Потім використайте функцію auto_arima() для автоматичного вибору параметрів моделі ARIMA та призначення їх змінній моделі. Нарешті, модель ARIMA підгоняється за допомогою функції fit(), і друкується підсумок параметрів моделі.
Приклади застосувань автоматичних моделей ARIMA
Ось приклад практичного застосування, який демонструє, як використовувати автоматичну модель ARIMA Python для аналізу та прогнозування часових рядів.
Припустимо, у нас є набір даних про продажі, який містить дані про продажі за кожен місяць. Ми сподіваємося використати цей набір даних для прогнозування продажів у найближчі місяці. Спочатку потрібно прочитати дані та виконати необхідну попередню обробку:
У наведеному вище коді ми використали бібліотеку pandas для зчитування даних про продажі та встановили стовпець дати як індекс. Потім ми використовуємо функцію diff() для диференціації даних у першому порядку, щоб зробити їх стаціонарною послідовністю.
Далі ми можемо використати автоматизовану модель ARIMA для прогнозування майбутніх продажів:
У наведеному вище коді функція auto_arima() використовується для автоматичного вибору параметрів моделі ARIMA та їх призначення змінній моделі. Потім використайте функцію fit(), щоб підібрати модель ARIMA. Нарешті, використайте функцію predict() для прогнозування продажів на наступні кілька місяців і конвертуйте результати у DataFrame для дат і продажів.
зведення
У цій статті представлені основні принципи та використання автоматичних моделей ARIMA в Python. Автоматизовані моделі ARIMA можуть автоматично обирати відповідну модель ARIMA залежно від характеру даних часових рядів і надавати точні результати прогнозування. Використовуючи автоматичні моделі ARIMA, ми можемо легше виконувати аналіз часових рядів і прогнозування, що допомагає приймати точніші рішення. Сподіваюся, ця стаття була корисною для вас у розумінні та застосуванні автоматичної моделі ARIMA!
Оригінальний:Вхід за гіперпосиланням видно. |