【进阶实战】用PaddlePaddle实现LSTM股票预测

本文主要是介绍【进阶实战】用PaddlePaddle实现LSTM股票预测，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Paddlepaddle实现LSTM - 股票预测

欢迎大家来到这个实验，本实验实现的是利用LSTM (长短期记忆神经网络) 进行股票预测，通过本次实验，你将了解股票预测的方法、股票预测的数据集处理技巧、LSTM模型搭建以及训练过程等等，除此之外，你还将看到Paddlepaddle框架实现深度学习的一个十分清晰的结构流程，加深你对Paddlepaddle的了解。

在开始实验之前，我们有必要先来了解一下股票预测的一些知识，以便对股票预测实验有一个整体把握。

背景知识

我们之前做过关于房价预测的实验，房价预测就是根据影响房价的一些因素(面积，地理位置等等)来构建一个全连接层神经网络并对其函数参数进行训练，最后使得损失函数收敛，这样一来我们就可以得到确切的函数关系式，每给一个输入，便得到一个相应的房价输出，每次的房价输出仅仅与本次的输入有关，而与之前的输入输出没有关系，即房价的数据不构成时间序列。

股票预测虽然同样是预测类的实验，但却与房价预测有很大的不同，因为我们无法只根据一天的股票数据就能对后面的股票进行预测，换句话说，股票价格不仅仅与前面一天的数据有关系，还跟以前的股票价格有关系，这样，股票的数据就构成了一种时间序列，而每次决定股票预测结果的也不是仅仅是本次的输入，而是过去一段时间的数据序列，所以我们不能像预测房价那样使用全连接层神经网络，而是使用LSTM模型。

下面是LSTM模型的一个原理简图：

如上图所示，右图是左图的展开图，可以看出，此模型某一个时刻的输出ht不仅仅取决于当前的输入Xt，还跟上一个隐藏层的值有关系，这就意味着此模型具有一定的 “记忆力” ，而这正好符合股票预测的要求，所以在本次实验中，我们选择的是此模型，关于LSTM模型更详细的介绍，可以点此博客http://blog.csdn.net/fengkuangsake/article/details/51658489

简单了解了股票预测的原理后，我们就可以正式开始实验了。

本次实验分流程如下：

引用库的导入
数据预处理
构造数据读取的Reader
搭建模型
训练模型
预测及可视化
总结

1 - 引用库

首先，我们需要加载实验需要用到的一些库，他们分别是：

numpy：一个python的基本库，用于科学计算
matplotlib.pyplot：用于生成比特币预测效果图
paddle.fluid ：PaddlePaddle深度学习框架
from future import print_function:在开头加上from future import print_function这句之后，即使在python2.X，使用print就得像 python3.X那样加括号使用.

In[7]

import numpy as np
import math
import matplotlib.pyplot as plt
import paddle
import paddle.fluid as fluid 
from __future__ import print_function

2 - 数据预处理

本次实验采用的是上证指数的股票，数据集包含10列 (股票来源、日期、开盘价、收盘价、最低价、最高价、交易量、交易额、跌涨幅、后一天最高价) ，共有6109天的股票数据

在本实验中，我们利用历史数据中的开盘价、收盘价、最低价、最高价、交易量、交易额、跌涨幅来对下一日的最高价进行预测，第一列的数据在股票来源确定以后默认预测的是此支股票，第一行的数据完全一样，所以第一列数据在本实验中不参与训练。此外，由于我们处理股票数据时就是按照时间序列来进行处理的，所以第二列的日期数据也不会参与训练。

数据处理第一步，我们首先需要对文件中我们不需要的数据进行删除，在本实验中，我们可以直接在原数据集文件中删除前两列和第一行，然后保存文件为新的数据集stock_dataset.txt。然后我们需要读取剩下的数据：

In[4]

# 解压数据集
!unzip -qo -d data data/data3580/stock_LSTM_fluid.zip

In[5]

SAVE_DIRNAME = 'model'
f = open('data/stock_LSTM_fluid/datasets/stock_dataset.txt') 
df = f.readlines()    
f.close()

下面的代码把数据整理成我们需要的数组形式并保存在data中，形状为6109×8

In[8]

data = []
for line in df:data_raw = line.strip('\n').strip('\r').split('\t') #这里data_raw是列表形式，代表一行数据样本data.append(data_raw)#data为二维列表形式
data = np.array(data, dtype='float32')

在数据整理完成以后，我们可以查看一下数据信息，例如数据的类型、数据的个数、形状等等。

In[10]

print('数据类型：',type(data))
print('数据个数：', data.shape[0])
print('数据形状：', data.shape)
print('数据第一行：', data[0])

数据类型： <type 'numpy.ndarray'>
数据个数： 6109
数据形状： (6109, 8)
数据第一行： [1.0430000e+02 1.0439000e+02 9.9980003e+01 1.0439000e+02 1.9700000e+05

这篇关于【进阶实战】用PaddlePaddle实现LSTM股票预测的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

【进阶实战】用PaddlePaddle实现LSTM股票预测

Paddlepaddle实现LSTM - 股票预测

背景知识

1 - 引用库

2 - 数据预处理

相关文章

C++中unordered_set哈希集合的实现

C++中悬垂引用(Dangling Reference) 的实现

SpringBoot基于注解实现数据库字段回填的完整方案

Java HashMap的底层实现原理深度解析

Java AOP面向切面编程的概念和实现方式

Python版本信息获取方法详解与实战

Python实现字典转字符串的五种方法

Linux下利用select实现串口数据读取过程

Linux挂载linux/Windows共享目录实现方式

通过React实现页面的无限滚动效果