经济景气计量分析方法(R语言程序算法)参照张永军老师的方法

本文主要是介绍经济景气计量分析方法(R语言程序算法)参照张永军老师的方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#==========方 法==========#
#1.经济指标时间序列数据的分解
#2.先行、一致、滞后指标的选取
#3.景气指数的计算
#4.景气指数的检验与修正(该步未写相关算法)

#=========================#
#首先肯定是读取数据,假设读进来之后命名为data1,而且数据的第一列是序号或者日期

data2 <- na.omit(data1[,-1]) #第一列是序号
n <- nrow(data2) #样本量


#1.经济指标时间序列数据的分解(采用的方法是stl分解)
#1.1季节调整
period<-11 #周期
fstl <- function(x){
  index1.ts <- ts(as.double(x),frequency = 11,start = 2009+2/12)#构造'ts'结构时间序列
  index1.ts.stl1 <- stl(index1.ts,t.window=13,s.window=ceiling((1.5*period)/(1-(1.5/13))),robust = T)
  return(index1.ts.stl1)

stl1 <- apply(data2,2,fstl)
data3 <- c()
for(i in 1:length(stl1))
  data3 <- cbind(data3, stl1[[i]]$time.series[,2])
colnames(data3) <- colnames(data2)


#2.先行、一致、滞后指标
#KL信息量(有的称为KL距离或者KL信息熵) 
fmm <- function(x) { #数据归一化
  (x - min(x))/(max(x) - min(x)) + 1 #加1是为了不出现0
}
datamm <- apply(data3, 2, fmm) #归一化,保证每个值都大于0


fp <- function(x) { #得到概率分布
  x/sum(x)
}
datap <- apply(datamm, 2, fp) #概率分布


fkl <- function(p1,p2,L=4) { #L是最大滞后期
  k <- c()
  for(l in -L:L) {
    k1 <- 0
    if(l > 0) {
      for(j in 1:(length(p1)-l))
        k1 <- k1 + p1[j]*log(p1[j]/p2[j+l])
    } else {
      for(j in (abs(l)+1):length(p1))
        k1 <- k1 + p1[j]*log(p1[j]/p2[j+l])
    }
    k <-c(k, k1) 
  }
  c(-L:L)[which.min(abs(k))] #KL信息量接近于0时对应的滞后
}


lag1 <- matrix(0, ncol(datap), ncol(datap)) #变量间的先行、一致、滞后关系,保证对角线为0
for(i in 1:ncol(datap)) {
  for(j in c(1:ncol(datap))[-i])
  lag1[j, i] <- fkl(datap[,i],datap[,j])
}


#EMD和符号化相结合(该方法是借鉴文献:基于EMD与K_means算法的时间序列聚类_刘慧婷)
#方法说明:
#1.先用EMD分解,得到数据的趋势序列
#2.计算趋势序列的符号化距离
library(EMD)
#library(hht)
library(TSclust)
fEMDSAx <- function(var1, var2, L=4) {
  fEMD <-function(var1, var2){
    #EMD分解,得到数据的趋势序列
    n <- length(var1)
    res_all <- matrix(NA,2,n)
    em1 <- emd(var1, tol = sd(var1)*0.01^2, boundary = "wave") #符号化距离,得到emd分解
    #imf1 <- em1$imf
    res1 <- em1$residue
    res_all[1,] <- res1
    
    em2<-emd(var2, tol = sd(var2)*0.01^2, boundary = "wave")
    #imf2 <- em2$imf  #固有模式函数
    res2 <- em2$residue #趋势序列
    res_all[2,] <- res2
    m <- max(em1$nimf,em2$nimf) #最大的分隔数
    
    #计算趋势序列的符号化距离
    if((m^2)<n) k <- m^2 else k <- sqrt(n)
    d2<-diss(res_all, "MINDIST.SAX", k, alpha = k) #dist类
    d2
    
  }
  
  for(l in -L:L) {
    k1 <- 0
    if(l > 0) {
      k1 <- fEMD(var1[1:(length(var1)-l)], var2[(1:(length(var1)-l))+l])
    } else { 
      k1 <- fEMD(var1[(abs(l)+1):length(var1)], var2[((abs(l)+1):length(var1))+l])
    }
    k <-c(k, k1) 
  }
  c(-L:L)[which.min(abs(k))] 
}
lag2 <- matrix(0, ncol(datamm), ncol(datamm)) #变量间的先行、一致、滞后关系,保证对角线为0
for(i in 1:ncol(datamm)) {
  for(j in c(1:ncol(datamm))[-i])
    lag2[j, i] <- fkl(datamm[,i],datamm[,j])
}




#3.权重的确定
#3.1.熵值法
fentropy <- function(x) {
  n4 <- dim(x)
  ej1 <- c()
  for(j in 1:n4[2]) {
    a1 <- 0
    for(i in 1:n4[1]) {
      a2 <- x[i, j]*log(x[i, j])
      a1 <- a1 + a2
    }
    ej1 <- c(ej1, a1)
  }
  ej <- c()
  for(i in 1:n4[2]) {
    ej2 <- (-1)/(nrow(x)*ej1[i])
    ej <- c(ej, ej2)
  }
  w <- (1-ej)/sum(1-ej)
  w
}


#3.2.层次分析法(AHP)
#先建立判断矩阵,然后调用ahp函数得到权重
library(stats4)
library(pmr)
fAHP <- function(data) {
  n <- ncol(data)
  A <- matrix(1, n, n) #判断矩阵
  for(i in 1:(n-1))
    for(j in (i+1):n) {
      A[j, i] <- abs(cor(data[,i], data[,j]))
      A[i, j] <-  1/A[j, i] 
    }
  ahp(A) #A是判断矩阵
}
ahp1 <- fAHP(datamm)


#4.扩散指数DI
fDI <- function(data, j=3) { #j为基期
  N <- ncol(data)
  w <- as.numeric(fentropy(data))
  DI <- 0
  for(i in 1:N){
    bool1 <- 0
    for(k in (j+1):nrow(data)){
      bool1 <- bool1 + (data[k,i]>data[k-j,i])
    }
    num <- 0.5*ceiling(0.5*nrow(data))
    if(bool1>num) I <- 1 else if(bool1==num) I <- 0.5 else I <- 0 
    DI <- DI + w[i]*I
  }
  DI
}
di1 <- fDI(datamm);di1


#5.合成指数CI
fCI <- function(lag1, vn=1) { #vn:所要研究变量(因变量)所在的列号
  p1 <- as.matrix(datamm[,which(lag1[,vn]<0)])#先行指标组
  p2 <- as.matrix(datamm[,which(lag1[,vn]==0)])#一致指标组
  p3 <- as.matrix(datamm[,which(lag1[,vn]>0)])#滞后指标组
  if(length(p1)>0){ #存在先行指标
    n11 <- dim(p1) 
    c1 <-  array(0,n11)
    for(i in 1:(n11[1]-1))
      for(j in 1:n11[2])
        c1[i, j] <- p1[i+1, j] - p1[i, j]
  }
  if(length(p2)>0) { #存在一致指标
    n22 <- dim(p2)
    c2 <-  array(0,n22)
    for(i in 1:(n22[1]-1))
      for(j in 1:n22[2])
        c2[i, j] <- p2[i+1, j] - p2[i, j]
    
  }
  if(length(p3)>0) { #存在滞后指标
    n33 <- dim(p3)
    c3 <-  array(0,n33)
    for(i in 1:(n33[1]-1))
      for(j in 1:n33[2])
        c3[i, j] <- p3[i+1, j] - p3[i, j]
  }
  if(length(p1)>0&&length(p2)>0&&length(p3)>0) c123 <- cbind(c1, c2, c3) else 
    if(length(p1)<=0&&length(p2)>0&&length(p3)>0) c123 <- cbind(c2, c3) else 
      if(length(p1)>0&&length(p2)<=0&&length(p3)>0) c123 <- cbind(c1, c3) else c123 <- cbind(c1, c2)
  a <- matrix(0,1,ncol(c123))
  for(i in 1:ncol(a))
    for(j in 1:ncol(c123))
      a[i] <- sum(abs(c123[, j]))/(n-1)
  s <- array(0,dim(c123))
  for(i in 1:ncol(c123))
    s[,i] <- c123[, i]/a[i]
  if(length(p1)>0&&length(p2)>0&&length(p3)>0) { #存在先行、一致、滞后指标
    w1 <- fentropy(p1)
    w2 <- fentropy(p2)
    w3 <- fentropy(p3)
    s1 <- as.matrix(s[,1:ncol(p1)])
    s2 <- as.matrix(s[,(ncol(p1)+1):(ncol(p1)+ncol(p2))])
    s3 <- as.matrix(s[,(ncol(p1)+ncol(p2)+1):ncol(s)])
    r1 <- r2 <- r3 <- matrix(0, 1, n)
    for(i in 1:(n-1)) {
      r1[i] <- sum(s1[i,]*w1)/sum(w1)
      r2[i] <- sum(s2[i,]*w2)/sum(w2)
      r3[i] <- sum(s3[i,]*w3)/sum(w3)
    }
    r <- rbind(r1, r2, r3)
    f <- matrix(0, 1, 3)
    for(i in 1:3)
      f[i] <- (sum(abs(r[i,]))/(n-1))/(sum(abs(r[2,]))/(n-1))
    v1 <- array(0,dim(r))
    for(i in 1:nrow(r))
      v1[i,] <- r[i,]/f[i]
    I <- matrix(0, 3, n)
    I[, 1] <- 100
    for(i in 1:3)
      for(j in 2:n)
        I[i, j] <- I[i, j-1]*(200+v1[i, j-1])/(200-v1[i, j-1])
    I <- I/100
    CI <- matrix(0, 3, n)
    for(i in 1:3) {
      I2 <- sum(I[i,])/n
      CI[i, ] <- (I[i,]/I2)*100
      if(i==1) plot(CI[i,],type = "l",col=1) else lines(CI[i,],col=i)
    }
    legend("topleft", cex=0.7, col = c(1:3), lty = 1, legend = c("先行","一致","滞后"))
  } else if(length(p1)<=0&&length(p2)>0&&length(p3)>0) { #存在一致、滞后指标
    w2 <- fentropy(p2)
    w3 <- fentropy(p3)
    s2 <- as.matrix(s[,1:ncol(p2)])
    s3 <- as.matrix(s[,(ncol(p2)+1):ncol(s)])
    r2 <- r3 <- matrix(0, 1, n)
    for(i in 1:(n-1)) {
      r2[i] <- sum(s2[i,]*w2)/sum(w2)
      r3[i] <- sum(s3[i,]*w3)/sum(w3)
    }
    r <- rbind(r2, r3)
    f <- matrix(0, 1, 2)
    for(i in 1:2)
      f[i] <- (sum(abs(r[i,]))/(n-1))/(sum(abs(r[2,]))/(n-1))
    v1 <- array(0,dim(r))
    for(i in 1:nrow(r))
      v1[i,] <- r[i,]/f[i]
    I <- matrix(0, 2, n)
    I[, 1] <- 100
    for(i in 1:2)
      for(j in 2:n)
        I[i, j] <- I[i, j-1]*(200+v1[i, j-1])/(200-v1[i, j-1])
    I <- I/100
    CI <- matrix(0, 2, n)
    for(i in 1:2) {
      I2 <- sum(I[i,])/n
      CI[i, ] <- (I[i,]/I2)*100
      if(i==1) plot(CI[i,],type = "l",col=1) else lines(CI[i,],col=i)
    }
    legend("topleft", cex=0.7, col = c(1:2), lty = 1, legend = c("一致","滞后"))
  } else if(length(p1)>0&&length(p2)<=0&&length(p3)>0) { #存在先行、滞后指标
    w1 <- fentropy(p1)
    w3 <- fentropy(p3)
    s1 <- as.matrix(s[,1:ncol(p1)])
    s3 <- as.matrix(s[,(ncol(p1)+1):ncol(s)])
    r1 <- r3 <- matrix(0, 1, n)
    for(i in 1:(n-1)) {
      r1[i] <- sum(s1[i,]*w1)/sum(w1)
      r3[i] <- sum(s3[i,]*w3)/sum(w3)
    }
    r <- rbind(r1, r3)
    f <- matrix(0, 1, 2)
    for(i in 1:2)
      f[i] <- (sum(abs(r[i,]))/(n-1))/(sum(abs(r[2,]))/(n-1))
    v1 <- array(0,dim(r))
    for(i in 1:nrow(r))
      v1[i,] <- r[i,]/f[i]
    I <- matrix(0, 2, n)
    I[, 1] <- 100
    for(i in 1:2)
      for(j in 2:n)
        I[i, j] <- I[i, j-1]*(200+v1[i, j-1])/(200-v1[i, j-1])
    I <- I/100
    CI <- matrix(0, 2, n)
    for(i in 1:2) {
      I2 <- sum(I[i,])/n
      CI[i, ] <- (I[i,]/I2)*100
      if(i==1) plot(CI[i,],type = "l",col=1) else lines(CI[i,],col=i)
    }
    legend("topleft", cex=0.7,col = c(1:2), lty = 1, legend = c("先行", "滞后"))
  } else { #存在先行、一致指标
    w1 <- fentropy(p1)
    w2 <- fentropy(p2)
    s1 <- as.matrix(s[,1:ncol(p1)])
    s2 <- as.matrix(s[,(ncol(p1)+1):ncol(s)])
    r1 <- r2 <- matrix(0, 1, n)
    for(i in 1:(n-1)) {
      r1[i] <- sum(s1[i,]*w1)/sum(w1)
      r2[i] <- sum(s2[i,]*w2)/sum(w2)
    }
    r <- rbind(r1, r2)
    f <- matrix(0, 1, 2)
    for(i in 1:2)
      f[i] <- (sum(abs(r[i,]))/(n-1))/(sum(abs(r[2,]))/(n-1))
    v1 <- array(0,dim(r))
    for(i in 1:nrow(r))
      v1[i,] <- r[i,]/f[i]
    I <- matrix(0, 2, n)
    I[, 1] <- 100
    for(i in 1:2)
      for(j in 2:n)
        I[i, j] <- I[i, j-1]*(200+v1[i, j-1])/(200-v1[i, j-1])
    I <- I/100
    CI <- matrix(0, 2, n)
    for(i in 1:2) {
      I2 <- sum(I[i,])/n
      CI[i, ] <- (I[i,]/I2)*100
      if(i==1) plot(CI[i,],type = "l",col=1) else lines(CI[i,],col=i)
    }
    legend("topleft", cex=0.7, col = c(1:2), lty = 1, legend = c("先行","一致"))
  }
  CI
}


#KL信息量得到的合成指数
ci1 <- vector("list", ncol(lag1))
for(i in 1:ncol(lag1)) {
  ci1[[i]] <- fCI(lag1, vn=i)
}


#EMD_SAX得到的合成指数
ci2 <- vector("list", ncol(lag2))
for(i in 1:ncol(lag2)) {
  ci2[[i]] <- fCI(lag2, vn=i)
}

这篇关于经济景气计量分析方法(R语言程序算法)参照张永军老师的方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/925561

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

504 Gateway Timeout网关超时的根源及完美解决方法

《504GatewayTimeout网关超时的根源及完美解决方法》在日常开发和运维过程中,504GatewayTimeout错误是常见的网络问题之一,尤其是在使用反向代理(如Nginx)或... 目录引言为什么会出现 504 错误?1. 探索 504 Gateway Timeout 错误的根源 1.1 后端

GO语言短变量声明的实现示例

《GO语言短变量声明的实现示例》在Go语言中,短变量声明是一种简洁的变量声明方式,使用:=运算符,可以自动推断变量类型,下面就来具体介绍一下如何使用,感兴趣的可以了解一下... 目录基本语法功能特点与var的区别适用场景注意事项基本语法variableName := value功能特点1、自动类型推

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

python 线程池顺序执行的方法实现

《python线程池顺序执行的方法实现》在Python中,线程池默认是并发执行任务的,但若需要实现任务的顺序执行,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋... 目录方案一:强制单线程(伪顺序执行)方案二:按提交顺序获取结果方案三:任务间依赖控制方案四:队列顺序消