用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM)

本文主要是介绍用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、学习内容
1. 向量自回归模型 (VAR) 的基本概念与应用

向量自回归模型 (VAR) 是多元时间序列分析中的一种模型,用于捕捉多个变量之间的相互依赖关系。与单变量自回归模型不同,VAR 模型将多个时间序列作为向量输入,同时对这些变量进行回归分析。

VAR 模型的一般形式为:

Y_t = c + A_1 Y_{t-1} + A_2 Y_{t-2} + \dots + A_p Y_{t-p} + \epsilon_t

其中:

  • Y_t​ 是时间 t 的变量向量。
  • c 是常数向量。
  • A_1, A_2, \dots, A_p​ 是每个时间滞后的回归系数矩阵。
  • \epsilon_t​ 是误差项向量,假设其均值为 0,方差为常量。
2. 向量误差修正模型 (VECM) 的理论基础与应用

向量误差修正模型 (VECM) 是 VAR 模型的扩展,适用于具有协整关系的非平稳时间序列。VECM 通过捕捉长期均衡关系,建立短期动态调整模型。

VECM 的数学表达式为:

\Delta Y_t = \Pi Y_{t-1} + \sum_{i=1}^{p-1} \Gamma_i \Delta Y_{t-i} + \epsilon_t

其中:

  • \Delta Y_t 是差分后的变量向量。
  • \Pi 是协整矩阵,表示长期均衡关系。
  • \Gamma_i 是短期调整系数矩阵。
  • \epsilon_t  是误差项向量。
3. 多元时间序列分析

VAR 和 VECM 模型适用于多变量时间序列分析,通常用于经济、金融等领域。例如,多个宏观经济变量(如 GDP、通货膨胀率、利率)的相互影响可以通过 VAR 或 VECM 模型进行分析和预测。

二、实战案例

我们将使用 Python 的 statsmodels 库对实际的多元时间序列数据进行 VAR 和 VECM 模型的建模和预测。

(一)使用 VAR 模型的案例

假设我们有一组包含多个宏观经济指标的时间序列数据,如利率、GDP 和通货膨胀率。我们将构建一个 VAR 模型来分析这些变量之间的相互影响。

1. 数据生成与可视化

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.api import VAR# 生成模拟的多变量时间序列数据
np.random.seed(42)
n_obs = 100
dates = pd.date_range(start='2000-01-01', periods=n_obs, freq='Q')
data = pd.DataFrame(np.random.randn(n_obs, 3), columns=['GDP', 'Inflation', 'Interest Rate'], index=dates)# 绘制时间序列
data.plot(subplots=True, figsize=(10, 8), title="Simulated Time Series Data")
plt.show()

代码解释:

  • 我们生成了三个变量的随机时间序列数据,分别表示 GDP、通货膨胀率和利率,并绘制其随时间的变化。

结果输出:

2. 构建 VAR 模型
# 构建 VAR 模型
model = VAR(data)

代码解释:

  • 使用 VAR 模型拟合数据,自动选择最优的滞后阶数。
3. 模型拟合与预测
# 手动设置滞后阶数为 2(或根据需要调整)
lag_order = 2
var_model_fitted = model.fit(lag_order)# 预测未来10个时间点的数据
forecast = var_model_fitted.forecast(data.values[-lag_order:], steps=10)

代码解释:

  • 根据最优的滞后阶数拟合模型,并进行未来 10 个时间点的预测。

4. 预测结果可视化

# 创建一个 DataFrame 来存储预测结果
forecast_df = pd.DataFrame(forecast, index=pd.date_range(start=dates[-1], periods=10, freq='Q'), columns=data.columns)# 绘制预测结果
fig, axes = plt.subplots(nrows=3, ncols=1, figsize=(10, 8))
for i, col in enumerate(data.columns):axes[i].plot(data.index, data[col], label='Original')axes[i].plot(forecast_df.index, forecast_df[col], label='Forecast', linestyle='--')axes[i].set_title(col)axes[i].legend()
plt.tight_layout()
plt.show()

代码解释:

  • 绘制每个变量的历史数据和预测数据,展示 VAR 模型的预测能力。

结果输出:

5. 运行结果分析
  1. 滞后阶数选择:程序自动选择最优滞后阶数,以确保模型的拟合效果。
  2. 预测结果:预测的时间序列数据显示了每个变量在未来一段时间内的变化趋势。
(二)使用 VECM 模型的案例

VECM 模型适用于存在协整关系的非平稳时间序列。以下代码展示了如何使用 coint_johansen 函数来检查协整关系,并拟合 VECM 模型。

1. 协整关系检验
from statsmodels.tsa.vector_ar.vecm import VECM# 检查协整关系(Johansen检验)
coint_test = coint_johansen(data, det_order=0, k_ar_diff=1)
print("Eigenvalues:", coint_test.eig)

代码解释:

  • 使用 Johansen 协整检验来确定是否存在协整关系,协整关系表明多个时间序列变量在长期内存在稳定的均衡关系。

结果输出:

Eigenvalues: [0.40232704 0.32765159 0.24829596]
2. 构建 VECM 模型
# 构建 VECM 模型
vecm_model = VECM(data, k_ar_diff=1, coint_rank=1)
vecm_fitted = vecm_model.fit()# 输出 VECM 模型结果
print(vecm_fitted.summary())

代码解释:

  • 基于协整关系构建 VECM 模型,拟合数据并进行预测。

结果输出:

Det. terms outside the coint. relation & lagged endog. parameters for equation GDP 
====================================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------------
L1.GDP              -0.4603      0.087     -5.270      0.000      -0.631      -0.289
L1.Inflation        -0.1867      0.092     -2.040      0.041      -0.366      -0.007
L1.Interest Rate     0.0436      0.066      0.662      0.508      -0.085       0.173
Det. terms outside the coint. relation & lagged endog. parameters for equation Inflation
====================================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------------
L1.GDP              -0.1693      0.093     -1.824      0.068      -0.351       0.013
L1.Inflation        -0.0301      0.097     -0.309      0.757      -0.221       0.161
L1.Interest Rate    -0.1179      0.070     -1.686      0.092      -0.255       0.019
Det. terms outside the coint. relation & lagged endog. parameters for equation Interest Rate
====================================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------------
L1.GDP               0.0756      0.113      0.670      0.503      -0.145       0.297
L1.Inflation        -0.2562      0.118     -2.168      0.030      -0.488      -0.025
L1.Interest Rate    -0.5461      0.085     -6.426      0.000      -0.713      -0.380Loading coefficients (alpha) for equation GDP                 
==============================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
ec1           -0.1366      0.052     -2.626      0.009      -0.239      -0.035Loading coefficients (alpha) for equation Inflation              
==============================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
ec1            0.3797      0.055      6.869      0.000       0.271       0.488Loading coefficients (alpha) for equation Interest Rate            
==============================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
ec1           -0.0588      0.067     -0.876      0.381      -0.191       0.073Cointegration relations for loading-coefficients-column 1           
==============================================================================coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
beta.1         1.0000          0          0      0.000       1.000       1.000
beta.2        -2.3190      0.354     -6.545      0.000      -3.013      -1.625
beta.3         0.4073      0.313      1.300      0.193      -0.207       1.021
==============================================================================
3. VECM 模型预测与可视化
# 进行未来的预测
vecm_forecast = vecm_fitted.predict(steps=5)
vecm_forecast_df = pd.DataFrame(vecm_forecast, index=pd.date_range(start=dates[-1], periods=5, freq='Q'), columns=data.columns)# 绘制 VECM 预测结果
fig, axes = plt.subplots(nrows=3, ncols=1, figsize=(10, 8))
for i, col in enumerate(data.columns):axes[i].plot(data.index, data[col], label='Original')axes[i].plot(vecm_forecast_df.index, vecm_forecast_df[col], label='Forecast', linestyle='--')axes[i].set_title(f"VECM Forecast: {col}")axes[i].legend()
plt.tight_layout()
plt.show()

代码解释:

  • 对未来 5 个时间点进行预测,并将预测结果与历史数据一起绘制。

结果输出:

4. 运行结果分析
  1. 协整检验结果coint_johansen 函数的结果显示了协整向量的个数(即变量之间的长期关系)。
  2. VECM 模型的预测:VECM 模型捕捉了长期均衡关系,并预测了未来变量的变化趋势。
三、总结

通过 VAR 和 VECM 模型,可以分析多元时间序列中的相互依赖关系。VAR 模型适合用于平稳时间序列,而 VECM 模型则适用于具有协整关系的非平稳时间序列。

这篇关于用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1147952

相关文章

Nexus安装和启动的实现教程

《Nexus安装和启动的实现教程》:本文主要介绍Nexus安装和启动的实现教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Nexus下载二、Nexus安装和启动三、关闭Nexus总结一、Nexus下载官方下载链接:DownloadWindows系统根

SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程

《SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程》LiteFlow是一款专注于逻辑驱动流程编排的轻量级框架,它以组件化方式快速构建和执行业务流程,有效解耦复杂业务逻辑,下面给大... 目录一、基础概念1.1 组件(Component)1.2 规则(Rule)1.3 上下文(Conte

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句

Mybatis的分页实现方式

《Mybatis的分页实现方式》MyBatis的分页实现方式主要有以下几种,每种方式适用于不同的场景,且在性能、灵活性和代码侵入性上有所差异,对Mybatis的分页实现方式感兴趣的朋友一起看看吧... 目录​1. 原生 SQL 分页(物理分页)​​2. RowBounds 分页(逻辑分页)​​3. Page

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

一文全面详解Python变量作用域

《一文全面详解Python变量作用域》变量作用域是Python中非常重要的概念,它决定了在哪里可以访问变量,下面我将用通俗易懂的方式,结合代码示例和图表,带你全面了解Python变量作用域,需要的朋友... 目录一、什么是变量作用域?二、python的四种作用域作用域查找顺序图示三、各作用域详解1. 局部作

Python主动抛出异常的各种用法和场景分析

《Python主动抛出异常的各种用法和场景分析》在Python中,我们不仅可以捕获和处理异常,还可以主动抛出异常,也就是以类的方式自定义错误的类型和提示信息,这在编程中非常有用,下面我将详细解释主动抛... 目录一、为什么要主动抛出异常?二、基本语法:raise关键字基本示例三、raise的多种用法1. 抛

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

MYSQL查询结果实现发送给客户端

《MYSQL查询结果实现发送给客户端》:本文主要介绍MYSQL查询结果实现发送给客户端方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql取数据和发数据的流程(边读边发)Sending to clientSending DataLRU(Least Rec

Java中实现线程的创建和启动的方法

《Java中实现线程的创建和启动的方法》在Java中,实现线程的创建和启动是两个不同但紧密相关的概念,理解为什么要启动线程(调用start()方法)而非直接调用run()方法,是掌握多线程编程的关键,... 目录1. 线程的生命周期2. start() vs run() 的本质区别3. 为什么必须通过 st