[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性

2023-12-18 02:28

本文主要是介绍[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

[简介]
常用网名: 猪头三
出生日期: 1981.XX.XX
QQ联系: 643439947
个人网站: 80x86汇编小站 https://www.x86asm.org
编程生涯: 2001年~至今[共22年]
职业生涯: 20年
开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python
开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder
技能种类: 逆向 驱动 磁盘 文件
研发领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全
项目经历: 磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测

[序言]
从上一章内容: [原创][R语言]股票分析实战[1]:周级别涨幅趋势的相关性-CSDN博客, 通过使用卡方独立检测chisq.test()发现"涨幅(RC)"和"跟周1~周5(DW)"的两者关系是独立的, 也就是说没有相互影响的可能性. 那么这时候, 是不是要放弃了呢?其实数据分析工作, 还没做完, 不要忘记了, xtabs()函数生成的是频率表, 那么也就说除了"涨幅(RC)"和"周1~周5(DW)"这2个变量之外, 还有第3个变量, 那就是"频率(Freq)"

[继续探索"涨幅(RC)", "周1~周5(DW)", "频率(Freq)"的交叉关系]
要一次性分析这3个变量的交叉关系, 是否有内在的隐藏关系, 那么可以使用gmodels包中的CrossTable()函数, 查看"频率(Freq)"的"预期值"和"卡方贡献值", 通过这查看这2个数值, 可以观察出"频率(Freq)"与"涨幅(RC)", "频率(Freq)"与"周1~周5(DW)"的交叉关系.

library(gmodels)
CrossTable(stock_demo_rc_token$RC, stock_demo_rc_token$DW, expected = TRUE, prop.r = FALSE, prop.c = FALSE, prop.t = FALSE)

通过上面的代码, 就可以显示出"频率(Freq)"与"涨幅(RC)", "频率(Freq)"与"周1~周5(DW)"的交叉关系, 并且很容易看出异常值, 如下图说明:

1> 红圈表示: 实际频率 大于 预期频率 表示 正方向活跃
2> 绿圈表示: 实际频率 小于 预取频率 表示 反方向活跃
3> 红圈和绿圈 都有共同的特征: 卡方贡献值 都大于 1.0, 表示异动

那么从这3个描述在配合下图来看, 很明显周1~周5都有圈圈, 另外周3与周5有2个圈圈, 这种情况表明 "频率(Freq)" 与 "涨幅(RC)"和"周1~周5(DW)" 都有关系, 且还可以表示交易是否活跃的关系, 大家可要认真看如下的描述, 这是非常关键的.

1> 可以发现周1~周2的活跃度是在%6涨幅区间.
2> 可以发现周3~周5的活跃度是在7%涨幅以上区间, 甚至在周5, 10%涨幅的活跃度还不错, 但可惜是反方向活跃, 也就意味着是冲高出货.
3> 可以发现周3和周5, 比 周1, 周2, 周4 活跃. 因为周3和周5有2个圈圈.
4> 可以发现周1, 周2, 周4活跃度持平, 但是周4涨幅更大.
太令人兴奋了, 初步总结出一个规律: 周3, 周4, 周5的交易比周1, 周2活跃. (但别高兴, 虽然从数据看出了一点蛛丝马迹, 但是还需要继续分析, "频率(Freq)"与"涨幅(RC)", "频率(Freq)"与"周1~周5(DW)" 哪个 关系最密切?)

["频率(Freq)"与"涨幅(RC)", "频率(Freq)"与"周1~周5(DW)" 哪个 关系最密切?]
为了研究这个关系, 我们需要为这3个变量生成一个一维的数据表, 包含3列分别是: RC, DW, Freq. 代码如下:

stock_demo_rc_table <- xtabs(~ RC + DW, stock_demo_rc_token) # 生成频率表
stock_demo_rc_table_Freq <- as.data.frame(stock_demo_rc_table) # 把频率表转换为具有3列的矩阵
stock_demo_rc_table_Freq$RC <- as.integer(stock_demo_rc_table_Freq$RC) # 把RC因子转换为int型
stock_demo_rc_table_Freq$DW <- as.integer(stock_demo_rc_table_Freq$DW) # 把DW因子转换为int型

通过执行上面的代码,可以得到如下的表格.


非常重要, 再次查看"频率(Freq)", "涨幅(RC)", "周1~周5(DW)"的交叉关系, 也就是相互关系. 执行如下并可以看到一些数据

cor(stock_demo_rc_table_Freq)

          RC             DW             Freq
RC    1.0000000 0.0000000 -0.1937841
DW    0.0000000 1.0000000  0.0504346
Freq -0.1937841 0.0504346  1.0000000

那么如何看上面的数据呢?下面认真看如下描述

1> "频率(Freq)"与"涨幅(RC)" 关系值是: 0.1937841 (这里先不考虑正负关系)
2>  "频率(Freq)"与"周1~周5(DW)" 关系值是: 0.0504346
3> "涨幅(RC)"与"周1~周5(DW)" 没有任何关系 (这点跟用chisq.test()验证是一样的结果)

很显然, "频率(Freq)"与"涨幅(RC)"关系最密切, 因为 0.1937841 > 0.0504346, 但是他们是负方向关系. 也就是说: 当"频率(Freq)"增大的时候, "涨幅(RC)"就会降低. 反之 "频率(Freq)"减小的时候, 涨幅(RC)"就会增大. 这就非常贴切, 非常符合现实中的炒股情况. 在大A股市场, 确实涨停的股票就很少, 也就是说涨停的频率不高或者很低. 那么另外看看"涨幅(RC)"与"周1~周5(DW)"的关系, 很显然2者关系很弱, 没有太大显著关系, 但还好有一点好的迹象, 那就是他们是正方向的, 也就是说随着时间周1到周5的移动,  "频率(Freq)"会慢慢增加. 这又是一个关键的信息了, 也就说股票交易的活跃度随着时间向周5推移, 活跃度缓慢提升. 

[最后总体概括: 用CrossTable()分析出来的数据 与 cor() 是一致的, 关键信息如下]

1> 根据CrossTable()分析出来的关键信息是: 周1~周2交易不活跃, 周3开始启动, 周5交易活跃度达到最强
3> 根据cor()分析出来的关键是: 交易活跃度随着时间推进, 而变强.

[结尾]
通过上面的分析, 都是通过数值来进行挖掘, 那么通过数值挖掘出来的规律, 用图形来显示, 是否也是一样的特征规律呢? 下一篇我们可以通过图形进一步观察已经分析出来的关键信息.

这篇关于[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/506704

相关文章

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

C语言中%zu的用法解读

《C语言中%zu的用法解读》size_t是无符号整数类型,用于表示对象大小或内存操作结果,%zu是C99标准中专为size_t设计的printf占位符,避免因类型不匹配导致错误,使用%u或%d可能引发... 目录size_t 类型与 %zu 占位符%zu 的用途替代占位符的风险兼容性说明其他相关占位符验证示

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

C语言进阶(预处理命令详解)

《C语言进阶(预处理命令详解)》文章讲解了宏定义规范、头文件包含方式及条件编译应用,强调带参宏需加括号避免计算错误,头文件应声明函数原型以便主函数调用,条件编译通过宏定义控制代码编译,适用于测试与模块... 目录1.宏定义1.1不带参宏1.2带参宏2.头文件的包含2.1头文件中的内容2.2工程结构3.条件编

PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例

《PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例》词嵌入解决NLP维度灾难,捕捉语义关系,PyTorch的nn.Embedding模块提供灵活实现,支持参数配置、预训练及变长... 目录一、词嵌入(Word Embedding)简介为什么需要词嵌入?二、PyTorch中的nn.Em