爬取需要的图片

2024-09-04 12:36
文章标签 需要 图片 爬取

本文主要是介绍爬取需要的图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

爬取图片

import re,requests,time#导入所需要的库headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36 Edg/128.0.0.0","Cookie":"BDqhfp=%E5%8A%9E%E5%85%AC%E5%AE%A4%E7%9D%A1%E8%A7%89%26%26NaN-1undefined%26%260%26%261; winWH=%5E6_2000x1036; BDIMGISLOGIN=0; BDUSS=EpTSG13eEZldzFMOWJ5dWR4eDd3ZW5KUHdjNGNSN1lHNlJ4MXF6SU0wRTdwZUptRUFBQUFBJCQAAAAAAAAAAAEAAAADYpx-v8mwrrXEwfXesd6xAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADsYu2Y7GLtmb; BDUSS_BFESS=EpTSG13eEZldzFMOWJ5dWR4eDd3ZW5KUHdjNGNSN1lHNlJ4MXF6SU0wRTdwZUptRUFBQUFBJCQAAAAAAAAAAAEAAAADYpx-v8mwrrXEwfXesd6xAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAADsYu2Y7GLtmb; BAIDUID=4D17154262B4504CFAE0E1C130A58739:FG=1; BIDUPSID=4D17154262B4504CFAE0E1C130A58739; PSTM=1723594384; H_WISE_SIDS=60450_60515_60566_60447_60574_60360_60622; BDSFRCVID=QgIOJeC62xZZPyJt1coJtHooIDYB-w6TH6_nkYIn5XtsdSiEoGHiEG0PRx8g0KFbwpqVogKKBmOTHn4F_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF=tb4t_CLbfI-3fP36q46Eh4-jMfQX--QXHD7yWCvl5hTcOR5Jj65WWlIr2t6JJ4JyWjn7Wb7Y3UTIKt0C3MA-BPCfWtrXtlvJ-KngBl5O3hnEsq0x0h5We-bQyPja-bODQDOMahvPal7xObumQlPK5JkgMx6MqpQJQeQ-5KQN3KJmfbL9bT3tjjISKx-_J6KqJbTP; H_PS_PSSID=60450_60515_60360_60622_60664_60677; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; BDSFRCVID_BFESS=QgIOJeC62xZZPyJt1coJtHooIDYB-w6TH6_nkYIn5XtsdSiEoGHiEG0PRx8g0KFbwpqVogKKBmOTHn4F_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF_BFESS=tb4t_CLbfI-3fP36q46Eh4-jMfQX--QXHD7yWCvl5hTcOR5Jj65WWlIr2t6JJ4JyWjn7Wb7Y3UTIKt0C3MA-BPCfWtrXtlvJ-KngBl5O3hnEsq0x0h5We-bQyPja-bODQDOMahvPal7xObumQlPK5JkgMx6MqpQJQeQ-5KQN3KJmfbL9bT3tjjISKx-_J6KqJbTP; BAIDUID_BFESS=4D17154262B4504CFAE0E1C130A58739:FG=1; BDRCVFR[dG2JNJb_ajR]=mk3SLVN4HKm; userFrom=www.baidu.com; BDRCVFR[-pGxjrCMryR]=mk3SLVN4HKm; BDRCVFR[tox4WRQ4-Km]=mk3SLVN4HKm; delPer=0; PSINO=1; indexPageSugList=%5B%22%E5%A6%82%E4%BD%95%E6%89%BE%E5%87%BA%E6%B5%8F%E8%A7%88%E5%99%A8%E7%9A%84User-Agent%E5%92%8Ccooki%22%2C%22%E6%8A%BD%E7%83%9F%22%5D; cleanHistoryStatus=0; ab_sr=1.0.1_NmU1ZWNmMzhkY2I4ZmJlMGMzN2FkMTJhYTNjNjE4MmYxNTk0YjQyOTY0OTMxNzE1ZmZhODBiNTY4OTA0NTAwODA4NWFjYzk1NjgyODBhN2IyNjdhZGI4YTZkZWNkODM1MWY5MzhlNWZlZGM0ZDNhNGIyNmJkZTA3YTczMDUwMDI3MGJhZjczMjk4YzFkNDU4MTI2NzRlZjNhNGI4MGQxYg==; BA_HECTOR=a48k0ka184a4ak85a08ha001b2rs8p1jcnofs1u; ZFY=7jp5CbqgnncF8g3rGloEzlb:B5phany8Uza:BjKYbl3Sk:C",	
}detail_urls = []  # 存储图片地址  
save_path = r'C:\Users\SHINOW\Desktop\pic'  # 设置图片保存的文件夹路径  for i in range(1,400,20):#20页一张# url = 'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1592804203005_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1592804203008%5E00_1328X727&sid=&word=%E5%BE%B7%E9%B2%81%E7%BA%B3&pn={}'.format(i)#请求的地址# url = 'https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1724212493397_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&dyTabStr=&ie=utf-8&ctd=1724212493398%5E00_1217X604&sid=&word=%E6%8A%BD%E7%83%9F&pn={}'.format(i)#请求的地址url = 'https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf=1&fmq=1592804203005_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1592804203008%5E00_1328X727&sid=&word=%e7%9d%a1%e5%b2%97&pn={}'.format(i)#请求的地址response = requests.get(url,headers,timeout = (3,7))#设置请求超时时间3-7秒content = response.content.decode('utf-8')#使用utf-8进行解码detail_url = re.findall('"objURL":"(.*?)"',content,re.DOTALL)#re.DOTALL忽略格式#匹配objURL的内容,大部分为objURL或URLdetail_urls.append(detail_url)#将获取到的图片地址保存在之前定义的列表中response = requests.get(url,headers=headers)#请求网站content = response.content
b = 0#图片第几张
for page in detail_urls:for url in page:try:print('获取到{}张图片'.format(i))response = requests.get(url,headers = headers)content = response.contentif url[-3:] == 'jpg':with open('保存的地址{}.jpg'.format(b),'wb') as f:f.write(content)elif url[-4:] == 'jpeg':with open('保存的地址{}.jpeg'.format(b),'wb') as f:f.write(content)elif url[-3:] == 'png':with open('保存的地址{}.pon'.format(b),'wb') as f:f.write(content)else:continueexcept:print('超时')b +=1

这篇关于爬取需要的图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136041

相关文章

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意

c/c++的opencv实现图片膨胀

《c/c++的opencv实现图片膨胀》图像膨胀是形态学操作,通过结构元素扩张亮区填充孔洞、连接断开部分、加粗物体,OpenCV的cv::dilate函数实现该操作,本文就来介绍一下opencv图片... 目录什么是图像膨胀?结构元素 (KerChina编程nel)OpenCV 中的 cv::dilate() 函

使用Python实现调用API获取图片存储到本地的方法

《使用Python实现调用API获取图片存储到本地的方法》开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接... 目录使用python实现调用API获取图片存储到本地1、项目概述2、核心功能3、环境准备4、代码实现

Java实现图片淡入淡出效果

《Java实现图片淡入淡出效果》在现代图形用户界面和游戏开发中,**图片淡入淡出(FadeIn/Out)**是一种常见且实用的视觉过渡效果,它可以用于启动画面、场景切换、轮播图、提示框弹出等场景,通过... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细

Java如何根据文件名前缀自动分组图片文件

《Java如何根据文件名前缀自动分组图片文件》一大堆文件(比如图片)堆在一个目录下,它们的命名规则遵循一定的格式,混在一起很难管理,所以本文小编就和大家介绍一下如何使用Java根据文件名前缀自动分组图... 目录需求背景分析思路实现代码输出结果知识扩展需求一大堆文件(比如图片)堆在一个目录下,它们的命名规

将图片导入Python的turtle库的详细过程

《将图片导入Python的turtle库的详细过程》在Python编程的世界里,turtle库以其简单易用、图形化交互的特点,深受初学者喜爱,随着项目的复杂度增加,仅仅依靠线条和颜色来绘制图形可能已经... 目录开篇引言正文剖析1. 理解基础:Turtle库的工作原理2. 图片格式与支持3. 实现步骤详解第

在React聊天应用中实现图片上传功能

《在React聊天应用中实现图片上传功能》在现代聊天应用中,除了文字和表情,图片分享也是一个重要的功能,本文将详细介绍如何在基于React的聊天应用中实现图片上传和预览功能,感兴趣的小伙伴跟着小编一起... 目录技术栈实现步骤1. 消息组件改造2. 图片预览组件3. 聊天输入组件改造功能特点使用说明注意事项