perl:获取同花顺数据--业绩预告,送股派息

2024-03-24 16:04

本文主要是介绍perl:获取同花顺数据--业绩预告,送股派息,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

perldoc LWP::UserAgent

如果没有安装,则安装模块,运行 cpanm LWP::UserAgent  。

编写  get_yjyg_10jqka.pl  如下

#!/usr/bin/perl
# perl 获取同花顺数据--业绩预告
use LWP::UserAgent;
use Encode qw(decode encode);
use POSIX;
use Data::Dumper;
use HTML::TreeBuilder;
use HTML::TreeBuilder::XPath;my $tree= HTML::TreeBuilder::XPath->new;
open(my $DATA,'>', "data.html") or die "open data file failed:$!"; my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;
$ua->agent("Mozilla/8.0");
my $response = $ua->get('http://data.10jqka.com.cn/financial/yjyg/');if ($response->is_success) {print $DATA $response->decoded_content;  # or whateverclose $DATA;$tree->parse_file("data.html");
} else {print " get data failed.";exit;
}my $title=  $tree->findvalue('/html/body//span[@class="text-value"]');
print " title is $title\n";
$title ='yjyg-2024Q1'; 
my $ps = 1;
print " pages is $ps\n";sub utf2gbk { encode('gbk', decode('utf8', $_[0]));} for (my $n=1; $n<=$ps; $n++){open(my $T, ">", "$title-$n.csv");my @arr1= $tree->find_by_tag_name("tr") ;#shift @arr1;foreach my $row (@arr1) {my @arr2= $row->content_list;my @str;foreach my $a (@arr2){ push @str, $a->as_text;}my $line = utf2gbk(join(',', @str));     print $T "$line\n"; }close $T;
}

运行 chcp 65001

perl get_yjyg_10jqka.pl 

生成 yjyg-2024Q1-1.csv 


编写  get_sgpx_10jqka.pl 如下

#!/usr/bin/perl
# perl 获取同花顺数据--送股派息
use LWP::UserAgent;
use Encode qw(decode encode);
use POSIX;
use Data::Dumper;
use HTML::TreeBuilder;
use HTML::TreeBuilder::XPath;my $tree= HTML::TreeBuilder::XPath->new;
#open(my $DATA,'>', "data3.html") or die "open data file failed:$!"; my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;
$ua->agent("Mozilla/8.0");
my $response = $ua->get('http://data.10jqka.com.cn/financial/sgpx/');if ($response->is_success) {
#  print $DATA $response->decoded_content;  # or whatever
#  close $DATA;$tree->parse_file("data3.html");
} else {print " get data failed.";exit;
}my $title=  $tree->findvalue('/html/body//span[@class="text-value"]');
print " title is $title\n";
$title ='sgpx-2023Y'; 
my $pages = $tree->findvalue('/html/body//span[@class="page_info"]');
my @ps = split('/', $pages);
print " $title pages is $ps[1]\n";sub utf2gbk { encode('gbk', decode('utf8', $_[0]));} for (my $n=1; $n<=1; $n++){open(my $T, ">", "$title-$n.csv");my @arr1= $tree->find_by_tag_name("tr") ;shift @arr1;foreach my $row (@arr1) {my @arr2= $row->content_list;my @str;foreach my $a (@arr2){ push @str, $a->as_text;}my $line = join(',', @str);     print $T "$line\n"; }close $T;
}

运行 perl get_sgpx_10jqka.pl 

 title is 2023年年报
 sgpx-2023Y pages is 6

生成 sgpx-2023Y-1.csv

这篇关于perl:获取同花顺数据--业绩预告,送股派息的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/842081

相关文章

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数

python获取网页表格的多种方法汇总

《python获取网页表格的多种方法汇总》我们在网页上看到很多的表格,如果要获取里面的数据或者转化成其他格式,就需要将表格获取下来并进行整理,在Python中,获取网页表格的方法有多种,下面就跟随小编... 目录1. 使用Pandas的read_html2. 使用BeautifulSoup和pandas3.

SpringBoot UserAgentUtils获取用户浏览器的用法

《SpringBootUserAgentUtils获取用户浏览器的用法》UserAgentUtils是于处理用户代理(User-Agent)字符串的工具类,一般用于解析和处理浏览器、操作系统以及设备... 目录介绍效果图依赖封装客户端工具封装IP工具实体类获取设备信息入库介绍UserAgentUtils

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读