Python爬虫案例展示：实现花猫壁纸数据采集

本文主要是介绍Python爬虫案例展示：实现花猫壁纸数据采集，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

嗨喽~大家好呀，这里是魔王呐 ❤ ~!

python更多源码/资料/解答/教程等点击此处跳转文末名片免费获取

环境使用:

Python 3.10
Pycharm

模块使用:

import requests >>> pip install requests

win + R 输入cmd 输入安装命令 pip install requests 安装即可

爬虫实现基本流程:

一. 数据来源分析: 从单个数据 -> 多个数据

1. 明确需求: 明确采集的网站以及数据内容网址: huamaobizhi.com/数据: 壁纸图片(链接地址 下载地址)
2. 抓包分析: 浏览器开发者工具- 打开开发者工具: F12- 刷新网页- 找壁纸图片链接分辨率不高: https://img3.huamaocdn.com/upload/bizhi/images-wallpaper/1000w680h/202401231326538234.jpg- 下载地址:请求网址: https://huamaobizhi.com/normal-download/请求方法: POST请求参数:wallpaperId: 66919

二. 代码实现步骤

1. 发送请求
2. 获取数据
3. 解析数据
4. 保存数据

代码展示

导入模块

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：926207505
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
# 导入数据请求模块
import requests

模拟浏览器

headers = {# User-Agent 用户代理, 表示浏览器基本身份信息'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

多页获取

for page in range(3, 223):

列表页面请求网址

    link = f'https://huamaobizhi.com/pictures/?category=377&page={page}&orientation=0&order_by=0&time_range=0&size=0&purity=0&remember_filter=1&lang=zh-CN&request=data'

发送请求

    json_data = requests.get(url=link, headers=headers).json()

键值对取值

    results = json_data['results']

for循环遍历

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：926207505
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''for index in results:# 标题title = index['tit']# 壁纸IDimg_id = index['id']print(title, img_id)

请求网址 (下载图片的地址)

        url = 'https://huamaobizhi.com/normal-download/'

请求参数

        data = {'wallpaperId': img_id}

发送请求

        response = requests.post(url=url, data=data, headers=headers)

获取数据: 直接获取图片二进制数据

        img_content = response.content

保存数据

        with open(f'img\\{title}_{img_id}.jpg', mode='wb') as f:f.write(img_content)

尾语

最后感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉，有学习到一点知识~

躲起来的星星🍥也在努力发光，你也要努力加油（让我们一起努力叭）。

最后，宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

这篇关于Python爬虫案例展示：实现花猫壁纸数据采集的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Python爬虫案例展示：实现花猫壁纸数据采集

嗨喽~大家好呀，这里是魔王呐 ❤ ~!

环境使用:

模块使用:

爬虫实现基本流程:

一. 数据来源分析: 从单个数据 -> 多个数据

二. 代码实现步骤

代码展示

尾语

相关文章

Python实现终端清屏的几种方式详解

SpringBoot+EasyPOI轻松实现Excel和Word导出PDF

Python实现MQTT通信的示例代码

基于Python开发一个图像水印批量添加工具

使用zip4j实现Java中的ZIP文件加密压缩的操作方法

从入门到进阶讲解Python自动化Playwright实战指南

Python 字典 (Dictionary)使用详解

Python自动化批量重命名与整理文件系统

使用Python构建一个高效的日志处理系统

python生成随机唯一id的几种实现方法