爬取需要的图片

2024-09-04 12:36
文章标签 需要 图片 爬取

本文主要是介绍爬取需要的图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

爬取图片

import re,requests,time#导入所需要的库headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36 Edg/128.0.0.0","Cookie":"BDqhfp=%E5%8A%9E%E5%85%AC%E5%AE%A4%E7%9D%A1%E8%A7%89%26%26NaN-1undefined%26%260%26%261; winWH=%5E6_2000x1036; BDIMGISLOGIN=0; BDUSS=EpTSG13eEZldzFMOWJ5dWR4eDd3ZW5KUHdjNGNSN1lHNlJ4MXF6SU0wRTdwZUptRUFBQUFBJCQAAAAAAAAAAAEAAAADYpx-v8mwrrXEwfXesd6xAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADsYu2Y7GLtmb; BDUSS_BFESS=EpTSG13eEZldzFMOWJ5dWR4eDd3ZW5KUHdjNGNSN1lHNlJ4MXF6SU0wRTdwZUptRUFBQUFBJCQAAAAAAAAAAAEAAAADYpx-v8mwrrXEwfXesd6xAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADsYu2Y7GLtmb; BAIDUID=4D17154262B4504CFAE0E1C130A58739:FG=1; BIDUPSID=4D17154262B4504CFAE0E1C130A58739; PSTM=1723594384; H_WISE_SIDS=60450_60515_60566_60447_60574_60360_60622; BDSFRCVID=QgIOJeC62xZZPyJt1coJtHooIDYB-w6TH6_nkYIn5XtsdSiEoGHiEG0PRx8g0KFbwpqVogKKBmOTHn4F_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF=tb4t_CLbfI-3fP36q46Eh4-jMfQX--QXHD7yWCvl5hTcOR5Jj65WWlIr2t6JJ4JyWjn7Wb7Y3UTIKt0C3MA-BPCfWtrXtlvJ-KngBl5O3hnEsq0x0h5We-bQyPja-bODQDOMahvPal7xObumQlPK5JkgMx6MqpQJQeQ-5KQN3KJmfbL9bT3tjjISKx-_J6KqJbTP; H_PS_PSSID=60450_60515_60360_60622_60664_60677; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; BDSFRCVID_BFESS=QgIOJeC62xZZPyJt1coJtHooIDYB-w6TH6_nkYIn5XtsdSiEoGHiEG0PRx8g0KFbwpqVogKKBmOTHn4F_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF_BFESS=tb4t_CLbfI-3fP36q46Eh4-jMfQX--QXHD7yWCvl5hTcOR5Jj65WWlIr2t6JJ4JyWjn7Wb7Y3UTIKt0C3MA-BPCfWtrXtlvJ-KngBl5O3hnEsq0x0h5We-bQyPja-bODQDOMahvPal7xObumQlPK5JkgMx6MqpQJQeQ-5KQN3KJmfbL9bT3tjjISKx-_J6KqJbTP; BAIDUID_BFESS=4D17154262B4504CFAE0E1C130A58739:FG=1; BDRCVFR[dG2JNJb_ajR]=mk3SLVN4HKm; userFrom=www.baidu.com; BDRCVFR[-pGxjrCMryR]=mk3SLVN4HKm; BDRCVFR[tox4WRQ4-Km]=mk3SLVN4HKm; delPer=0; PSINO=1; indexPageSugList=%5B%22%E5%A6%82%E4%BD%95%E6%89%BE%E5%87%BA%E6%B5%8F%E8%A7%88%E5%99%A8%E7%9A%84User-Agent%E5%92%8Ccooki%22%2C%22%E6%8A%BD%E7%83%9F%22%5D; cleanHistoryStatus=0; ab_sr=1.0.1_NmU1ZWNmMzhkY2I4ZmJlMGMzN2FkMTJhYTNjNjE4MmYxNTk0YjQyOTY0OTMxNzE1ZmZhODBiNTY4OTA0NTAwODA4NWFjYzk1NjgyODBhN2IyNjdhZGI4YTZkZWNkODM1MWY5MzhlNWZlZGM0ZDNhNGIyNmJkZTA3YTczMDUwMDI3MGJhZjczMjk4YzFkNDU4MTI2NzRlZjNhNGI4MGQxYg==; BA_HECTOR=a48k0ka184a4ak85a08ha001b2rs8p1jcnofs1u; ZFY=7jp5CbqgnncF8g3rGloEzlb:B5phany8Uza:BjKYbl3Sk:C",	
}detail_urls = []  # 存储图片地址  
save_path = r'C:\Users\SHINOW\Desktop\pic'  # 设置图片保存的文件夹路径  for i in range(1,400,20):#20页一张# url = 'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1592804203005_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1592804203008%5E00_1328X727&sid=&word=%E5%BE%B7%E9%B2%81%E7%BA%B3&pn={}'.format(i)#请求的地址# url = 'https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1724212493397_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&dyTabStr=&ie=utf-8&ctd=1724212493398%5E00_1217X604&sid=&word=%E6%8A%BD%E7%83%9F&pn={}'.format(i)#请求的地址url = 'https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1592804203005_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1592804203008%5E00_1328X727&sid=&word=%e7%9d%a1%e5%b2%97&pn={}'.format(i)#请求的地址response = requests.get(url,headers,timeout = (3,7))#设置请求超时时间3-7秒content = response.content.decode('utf-8')#使用utf-8进行解码detail_url = re.findall('"objURL":"(.*?)"',content,re.DOTALL)#re.DOTALL忽略格式#匹配objURL的内容,大部分为objURL或URLdetail_urls.append(detail_url)#将获取到的图片地址保存在之前定义的列表中response = requests.get(url,headers=headers)#请求网站content = response.content
b = 0#图片第几张
for page in detail_urls:for url in page:try:print('获取到{}张图片'.format(i))response = requests.get(url,headers = headers)content = response.contentif url[-3:] == 'jpg':with open('保存的地址{}.jpg'.format(b),'wb') as f:f.write(content)elif url[-4:] == 'jpeg':with open('保存的地址{}.jpeg'.format(b),'wb') as f:f.write(content)elif url[-3:] == 'png':with open('保存的地址{}.pon'.format(b),'wb') as f:f.write(content)else:continueexcept:print('超时')b +=1

这篇关于爬取需要的图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136041

相关文章

Android使用ImageView.ScaleType实现图片的缩放与裁剪功能

《Android使用ImageView.ScaleType实现图片的缩放与裁剪功能》ImageView是最常用的控件之一,它用于展示各种类型的图片,为了能够根据需求调整图片的显示效果,Android提... 目录什么是 ImageView.ScaleType?FIT_XYFIT_STARTFIT_CENTE

关于MongoDB图片URL存储异常问题以及解决

《关于MongoDB图片URL存储异常问题以及解决》:本文主要介绍关于MongoDB图片URL存储异常问题以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录MongoDB图片URL存储异常问题项目场景问题描述原因分析解决方案预防措施js总结MongoDB图

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel

JS+HTML实现在线图片水印添加工具

《JS+HTML实现在线图片水印添加工具》在社交媒体和内容创作日益频繁的今天,如何保护原创内容、展示品牌身份成了一个不得不面对的问题,本文将实现一个完全基于HTML+CSS构建的现代化图片水印在线工具... 目录概述功能亮点使用方法技术解析延伸思考运行效果项目源码下载总结概述在社交媒体和内容创作日益频繁的

使用Node.js制作图片上传服务的详细教程

《使用Node.js制作图片上传服务的详细教程》在现代Web应用开发中,图片上传是一项常见且重要的功能,借助Node.js强大的生态系统,我们可以轻松搭建高效的图片上传服务,本文将深入探讨如何使用No... 目录准备工作搭建 Express 服务器配置 multer 进行图片上传处理图片上传请求完整代码示例

基于Python实现高效PPT转图片工具

《基于Python实现高效PPT转图片工具》在日常工作中,PPT是我们常用的演示工具,但有时候我们需要将PPT的内容提取为图片格式以便于展示或保存,所以本文将用Python实现PPT转PNG工具,希望... 目录1. 概述2. 功能使用2.1 安装依赖2.2 使用步骤2.3 代码实现2.4 GUI界面3.效

Python实现AVIF图片与其他图片格式间的批量转换

《Python实现AVIF图片与其他图片格式间的批量转换》这篇文章主要为大家详细介绍了如何使用Pillow库实现AVIF与其他格式的相互转换,即将AVIF转换为常见的格式,比如JPG或PNG,需要的小... 目录环境配置1.将单个 AVIF 图片转换为 JPG 和 PNG2.批量转换目录下所有 AVIF 图