python项目练习-1

2024-04-26 20:28
文章标签 python 练习 项目

本文主要是介绍python项目练习-1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

获取无忧书城的小说内容!

import requests  # 导入请求包
from lxml import etree  # 导入处理xml数据包url = 'https://www.51shucheng.net/wangluo/douluodalu/21750.html'
book_num = 1  # 文章页数
download_urls = []  # 定义一个空列表,表示我们下载过小说的url!while True:# UA头headers = {'User-Agent=': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'}resp = requests.get(url, headers=headers)  # 使用get方式请求数据!resp.encoding = 'utf-8'  # 将请求的数据编码为 utf-8的格式e = etree.HTML(resp.text)  # 使用etree模块处理数据,并赋值给e对象!data = ''.join(e.xpath('string(//div[@class="neirong"]/p)'))  # 使用xpath插件获取我需要的标签内容!title = e.xpath('//h1/text()')[0]  # 获取文章的标题if url in download_urls:print(f"跳过重复下载的章节: {title}")else:filename = f'output/斗罗大陆-第{book_num}章.txt'with open(filename, mode='w', encoding='utf-8') as file:file.write(title + "\n" + data)book_num += 1download_urls.append(url)  # 将已经下载章节的url添加到列表中!next_url = e.xpath('//div[@class="next"]/a/@href')[0]  # 使用xpath插件获取下一章节url在html标签内的位置!if not next_url:breakurl = next_url

不会用xpath的话,看下边!

比如我要获取每章节的标题在xml数据中的位置,请看如下图~

 

 

这篇关于python项目练习-1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/938575

相关文章

Python-VBA函数之旅-round函数

目录 一、round函数的常见应用场景 二、round函数使用注意事项 三、如何用好round函数? 1、round函数: 1-1、Python: 1-2、VBA:  2、推荐阅读: 个人主页: https://blog.csdn.net/ygb_1024?spm=1010.2135.3001.5421 一、round函数的常见应用场景         round函

消息队列在项目中的使用总结

一、传统通信模式的不足 常用的传统进程通信模式一般是client调用server的服务,等待server的响应。但是在网络情况不好或者在server需要较长的处理时间的时候,就可能导致client的调用失败或超时。业务场景中经常会有一些非常耗时的操作容易阻塞通信,就需要选择独立、耦合性低的消息中间件来完成业务系统间的交互和数据传递。 二、消息队列的优势 消息队列可以作为通信的中介,临

在做ESP32-S3模组物联网项目时无法烧录下载怎么排查原因?分享经验

ESP32-S3模组在物联网中非常好用,可以做带屏小音箱、温控器、智能86盒、泳池清洁机器人等等,在烧录的时候经常会遇到一些问题,这里分享一些烧录失败的原因或者烧录遇到的问题,教大家怎么排查原因,希望能帮到大家,大家如果有什么疑问,可以后台私信小启。   今天讲下ESP32-S3模组烧录失败问题,分享下怎么排查原因?   问题1:   在对接一个做泳池清洁机器人项目时,客户使用的

Github下载的项目使用

根据该视频整理GitHub上的项目要怎么运行?一个视频教会你!_哔哩哔哩_bilibili 方法一:从release中找。   方法二: 从官网中找(位于右上角)  方法三:看readme(从readme中搜索以下词汇)

【基于 PyTorch 的 Python深度学习】5 机器学习基础(2)

前言 文章性质:学习笔记 📖 学习资料:吴茂贵《 Python 深度学习基于 PyTorch ( 第 2 版 ) 》【ISBN】978-7-111-71880-2 主要内容:根据学习资料撰写的学习笔记,该篇主要介绍了如何选择合适的激活函数、损失函数和优化器。 一、选择合适的激活函数 激活函数 在神经网络中的作用有很多,主要作用是给神经网络提供 非线性建模能力 。如果没有激活函数,

几个适合python初学者的简单小程序,看完受益匪浅!

我们在刚刚开始学习python的时候,基础部分很重要,常常要告诫自己不要好高骛远,把基础打好才是重中之重。   在写程序之前应我们要注意一个知识点: 结果是这样: 当我们使它们缩进一致时得到的结果就是正确的了。 输出1到100的偶数 输出1到100的奇数 输出1-2+3-4+…+99-100的和 代码实现: 用户登录三次重试 代码

10行代码-利用Python做一个微信聊天机器人(简单易懂)

我亲爱的伙计们,最近一直忙,导致文章迟迟没有更新,鄙人心里十分抱歉! 为了回报我亲爱的粉丝,今天鄙人将跟大家做一个有趣的小玩具~利用强大的python做一个微信聊天机器人! 是的也许你听说过QQ机器人、听说过图灵机器人,但今天我们只需要10行代码做一个微信机器人!当然,如果你想把这个机器人做的更加完善,那代码就不止10行啦,咱这篇文章算是基础案例吧,让大家知道有这么回事。 前期准备:

Logfire-Python可观测平台快速上手

我最近在优化之前的FastAPI接入可观测性平台,正好分享一下Pydantic团队推出的logfire,希望对大家的Python工程化有帮助。 Github: https://github.com/pydantic/logfire 官网链接: Pydantic Logfire Documentation Logfire是Pydantic团队推出的可观测性平台,提供了一个简单而强大的仪表板进行

Python解析和处理大规模数据

大家好,随着科技的不断发展,数据规模呈现出爆炸性的增长。传统的数据处理方式已经无法满足大规模数据处理的需求,因此出现了Python大数据处理这一概念。Python作为一种简洁而强大的编程语言,提供了处理大规模数据的便捷工具。 1.大数据处理的挑战 在大规模数据处理过程中面临着许多挑战。首先是数据量的庞大,往往需要处理海量的数据,这就要求我们有强大的计算和存储能力。其次是数据的多样性,数据的类型

Python爬虫基础知识学习(以爬取某二手房数据、某博数据与某红薯(书)评论数据为例)

一、爬虫基础流程 爬虫的过程模块化,基本上可以归纳为以下几个步骤:1、分析网页URL:打开你想要爬取数据的网站,然后寻找真实的页面数据URL地址;2、请求网页数据:模拟请求网页数据,这里我们介绍requests库的使用;3、解析网页数据:根据请求获得的网页数据我们用不同的方式解析成我们需要用的数据(如果网页数据为html源码,我们用Beautiful Soup、xpath和re正则表达式三