Python量化交易学习——Part6:多因子选股策略实战(2)

2024-06-08 22:28

本文主要是介绍Python量化交易学习——Part6:多因子选股策略实战(2),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本节主要是针对上节讲解的进行回测:
策略:
首先根据上节所选的因子进行选股,各个因子的权重都设置为1,之后对加权后的因子进行排序,选择因子权重值大的5只股票,进行买入,每个月执行一次上述策略,看最终收益率情况如何。

首先先编写函数代码,新建一个py文件,我们这里就命名为grow_yinzi_strange.py,内部代码如下:

import numpy as np
import pandas as pd
import gm.api as gm
import datetime
from dateutil.relativedelta import relativedelta
from sklearn.preprocessing import MinMaxScalerdef min_max_scaling(data):min_val = np.min(data)max_val = np.max(data)return (data - min_val) / (max_val - min_val)def grow_yinzi(index,now):HS300_array = gm.stk_get_index_constituents(index) #获取沪深300成分股数据"""按照股票代码从大到小进行排序,注意下面这句非常重要,因为在实际使用过程中我发现,gm.stk_get_finance_deriv()和参数symbols=HS300_symbol_list中的顺序并不一样,这回导致我们采用for循环中得到的参数数据和采用gm.stk_get_finance_deriv()顺序完全不同,所以我们先对股票代码进行排序,以控制for循环中返回的参数数据之后我们再把gm.stk_get_finance_deriv()中得到的顺序同样进行从大到小排序,才能保持两组数据完全一致。"""HS300_array = HS300_array.sort_values(["symbol"],ascending=False)  # 按照股票代码从大到小排序HS300_symbol_array = HS300_array['symbol'].valuesHS300_symbol_list = list(HS300_symbol_array) # 转换为list类型才能进行后续处理# 采用pd.DataFrame建立二维数据表,初始化数据表,后续可以将数据存储到表中factor_matrix = pd.DataFrame([])factor_matrix["symbol"] = HS300_symbol_list# factor_matrix["earnings before interest and tax"] = -999    # 息税前收益增长率,很多数据都差不到,暂时不用这个因子factor_matrix["net_prof_yoy"] = -999    # 净利润同比增长率factor_matrix["oper_prof_yoy"] = -999   # 营业利润同比增长率factor_matrix["ttl_asset_yoy"] = -999   # 总资产同比增长率factor_matrix["net_cf_oper_yoy"] = -999 # 经营活动产生的现金流量净额同比增长率factor_matrix["net_asset_yoy"] = -999   # 净资产同比增长率factor_matrix["eps_bas_yoy"] = -999     # 基本每股收益同比增长率factor_matrix["roe_yoy"] = -999         # 净资产收益率同比增长率(摊薄)factor_matrix["ttl_prof_yoy"] = -999    # 利润总额同比增长率"""在这里所有的值都被定义为-999,这样做的目的是在读取数据的时候,防止有数据缺失或者出错,将默认值设置成现实数据中可能遇到的最小值。这样做的好处是在后续计算时可以自动将出错的数据的计算结果降为最差的结果,自动排除出错的数据集后面我们也可以这样做,先批量获取数据值,之后判断数据有无缺失,如果产生缺失,就逐个获取对应因子的数据,对于缺失的因子数据,采用-999进行填充"""day_time,hour_and_mins = str(now.strftime('%Y-%m-%d %H:%M:%S')).split(" ")  # 调用datetime函数获取最新时间six_months_ago = now - relativedelta(months=3) # 获取9个月前的时间作为后续查询数据的起始时间(主要是息税前收益增长率的计算需要T-1的数据,所有这里设置需要大于6个月)last_day_time,last_hour_and_mins = str(six_months_ago.strftime('%Y-%m-%d %H:%M:%S')).split(" ") # 转换时间格式到str# 求息税前收益增长率,这个没有现成的公式,需要手动计算,计算公式为息税前收益增长率=(本期息税前利润 – 上期息税前利润) / 上期息税前利润 × 100%# 采用dataframe格式获取数据,因为有一些数据无法获取到,所以运行起来特别慢,先注释掉,不采用这个参数"""for number in range(len(HS300_symbol_list))

这篇关于Python量化交易学习——Part6:多因子选股策略实战(2)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1043484

相关文章

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd