python 爬虫 美桌网 50行代码爬取明星写真摄影图片

2023-11-09 02:40

本文主要是介绍python 爬虫 美桌网 50行代码爬取明星写真摄影图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

好几天没更图片爬虫了,今天就简单的趴一下美桌网:
运行效果如下:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
其中,每位明星单独一个文件夹,写真的册也是单独一个文件夹,非常的银杏

源码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2020/12/15 18:14
# @Author  : huni
# @File    : 美桌网.py
# @Software: PyCharm
import requests
from lxml import etree
import os
if __name__ == '__main__':headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36'}url = 'http://www.win4000.com/mt/star.html'resp = requests.get(url=url,headers=headers).texttree = etree.HTML(resp)li_list = tree.xpath('/html/body/div[4]/div/div[2]/ul/li')for li in li_list:href = li.xpath('./a/@href')[0]resp1 = requests.get(url=href,headers=headers).texttree1 = etree.HTML(resp1)href1_list = list(set(tree1.xpath('/html/body/div[4]/div/div[3]/div[1]/div[2]/div//@href')))href1_list.append(href)title = tree1.xpath('/html/head/title/text()')[0]m_path = './明星图片'if not os.path.exists(m_path):os.mkdir(m_path)title_path = m_path + f'/{title}'if not os.path.exists(title_path):os.mkdir(title_path)for href1 in href1_list:resp2 = requests.get(url=href1,headers=headers).texttree2 = etree.HTML(resp2)href2_list = tree2.xpath('/html/body/div[4]/div/div[3]/div[1]/div[1]/div[2]/div/div/ul//@href')for href2 in href2_list:resp3 = requests.get(url=href2,headers=headers).texttree3 = etree.HTML(resp3)page_num = int(tree3.xpath('/html/body/div[4]/div/div[2]/div/div[1]/div[1]/em/text()')[0])name = tree3.xpath('/html/head/title/text()')[0]name_path = title_path + f'/{name}'if not os.path.exists(name_path):os.mkdir(name_path)for i in range(1,page_num+1):every_href = href2.replace('.html',f'_{i}.html')resp4 = requests.get(url=every_href,headers=headers).texttree4 = etree.HTML(resp4)src = tree4.xpath('//*[@id="pic-meinv"]/a/img/@src')[0]jpg_data = requests.get(url=src,headers=headers).contentjpg_name = src.split('/')[-1]jpg_path = name_path + f'/{jpg_name}'with open(jpg_path,'wb') as fp:fp.write(jpg_data)print(jpg_name,'下载完成')

单线程如此,多线程内容还可以参考我之前的博客

好了,今天就码到这里来,如果各位看官觉得不错,可以多多投喂小编哟

在这里插入图片描述

这篇关于python 爬虫 美桌网 50行代码爬取明星写真摄影图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/373651

相关文章

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文