В этой статье мы представим автоматическую модель ARIMA в Python и её применение в анализе и прогнозировании временных рядов. ARIMA (Авторегрессивная модель скользящей средней) — это классическая статистическая модель, широко используемая для моделирования и прогнозирования данных временных рядов. Автоматическая модель ARIMA — это мощный инструмент на Python, который автоматически выбирает лучшие параметры модели ARIMA и предоставляет точные результаты прогнозирования.
Что такое модель ARIMA?
Модель ARIMA состоит из трёх частей: авторегрессии (AR), разности (I) и скользящей средней (MA). Объединяя эти три части, модель ARIMA может моделировать и прогнозировать широкий спектр данных временных рядов.
- Авторегрессия (AR): Этот раздел в первую очередь используется для описания зависимостей между текущими и прошлыми значениями. Оно указывает, что текущее значение получается из линейной комбинации прошлых значений.
- Различие (I): Этот раздел используется для сглаживания данных временных рядов. Стационарные последовательности — это ряды, в которых средние, дисперсия и самокоординирующая дисперсия не меняются со временем.
- Скользящая средняя (MA): Этот раздел используется для описания связи между прошлыми и текущими ошибками. Это указывает на то, что текущая ошибка является линейной комбинацией прошлых ошибок.
Модель ARIMA может выбирать различные порядки AR, I и MA в зависимости от характера данных временных рядов для достижения наилучшего эффекта соответствия.
Как использовать автоматическую модель ARIMA в Python
Чтобы использовать автоматическую модель Python ARIMA, сначала нужно установить библиотеку statsmodels и библиотеку pmdarima. После установки этих двух библиотек можно начать использовать функцию auto_arima() для выбора модели и подгонки.
Функция auto_arima() — это мощная функция в библиотеке pmdarima, которая автоматически выбирает параметры модели ARIMA на основе характера данных временных рядов. Вот пример:
В приведённом выше примере кода сначала используйте библиотеку pandas для чтения данных временных рядов и установите столбец даты в качестве индекса. Затем используйте функцию auto_arima(), чтобы автоматически выбрать параметры модели ARIMA и назначить их переменной модели. Наконец, модель ARIMA подгоняется с помощью функции fit(), и печатается сводка параметров модели.
Примеры применения автоматических моделей ARIMA
Вот практический пример применения, чтобы показать, как использовать автоматическую модель ARIMA Python для анализа и прогнозирования временных рядов.
Допустим, у нас есть набор данных по продажам, содержащий данные о продажах за каждый месяц. Мы надеемся использовать этот набор данных для прогнозирования продаж в ближайшие месяцы. Сначала нужно прочитать данные и выполнить необходимую предварительную обработку:
В приведённом выше коде мы использовали библиотеку pandas для чтения данных о продажах и установили столбец с датой в качестве индекса. Затем мы используем функцию diff() для первой дифференцировки данных, чтобы сделать их стационарной последовательностью.
Далее мы можем использовать автоматизированную модель ARIMA для прогнозирования будущих продаж:
В приведённом выше коде функция auto_arima() используется для автоматического выбора параметров модели ARIMA и их присвоения переменной модели. Затем используйте функцию fit() для соответствия модели ARIMA. Наконец, используйте функцию predict() для прогнозирования продаж на ближайшие несколько месяцев и конвертируйте результаты в DataFrame для дат и продаж.
сводка
В этой статье представлены основные принципы и использование автоматических моделей ARIMA в Python. Автоматизированные модели ARIMA могут автоматически выбирать подходящую модель ARIMA на основе характера данных временных рядов и предоставлять точные результаты прогнозирования. Используя автоматические модели ARIMA, мы можем легче проводить анализ и прогнозирование временных рядов, что помогает принимать более точные решения. Надеюсь, эта статья помогла вам понять и применить автоматическую модель ARIMA!
Исходный текст:Вход по гиперссылке виден. |