影刀实例二,小某书如何持续下载图片

2023-11-28 14:52

本文主要是介绍影刀实例二,小某书如何持续下载图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一,案例背景:

      小某书平台,利用影刀rpa搜索关键词,然后下载对应文章的图片.

二,思路

1. 登录小某书平台,将网页放大最大【手动完成,作为初始状态】

2. 利用影刀命令【打开输入对话框】获得要搜索的关键词

3.利用命令【填写输入框】接受2的结果,填入搜索框,并点击搜索

4.因为之想下载图文,不涉及视频,所以在点击 【图文】

5.重点来了,本来批量获得相类似的元素一般使用【循环相似元素】或者【循环相似列表】就可以,但是这了面设计一个很重要的概念”懒加载“

三 ,懒加载 介绍 

简单说:就是所有的元素不在屏幕上一次展现,这就造成了无法一次取到所有对象的困难.

常用的套路为:无限循环嵌套【循环像素元素】

需要注意的事项为:1.无限循环,必须设定退出条件.2.无限循环必须去重

如何去做,需要更具具体场景去做.这里就不在赘述

四 ,如何是的程序稳定性更好

前三步,已经获得了所有笔记的链接,循环笔记链接列表就可以

每打开一个可以利用一下步骤获得图片中心思想是模拟人工:

1. 点击图片

2.弹出下载图片,点击.随机等待几秒

3.获得笔记题目元素文本,命名下载图片

但是但是但是,下载超过200左右的时候,在运行会发现无发下载

这是为什么呢?

就是:1点击图片后 没有出现2,而是复制图片或者链接.应该是触发了反爬机制

如何解决呢,利用条件分支分情况解决

思路如下,点击图片后,出现下载图片就按照原先处理,没有则利用【网页截图】命令处理一下 

五,总结一下 

实践出真知,套路得人心

处理懒加载问题得套路要深深记忆在脑袋里,这个是常见得网页自动化的场景,记住思路一通百通.

规避反爬虫机制,有的时候并不一定需要高深的编程知识,更重要的是实践中仔细观察,理清思路.

谢谢大家,希望觉得对大家又帮助的话 ,关注我并多提意见

 

这篇关于影刀实例二,小某书如何持续下载图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/429869

相关文章

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

springboot下载接口限速功能实现

《springboot下载接口限速功能实现》通过Redis统计并发数动态调整每个用户带宽,核心逻辑为每秒读取并发送限定数据量,防止单用户占用过多资源,确保整体下载均衡且高效,本文给大家介绍spring... 目录 一、整体目标 二、涉及的主要类/方法✅ 三、核心流程图解(简化) 四、关键代码详解1️⃣ 设置

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Python pip下载包及所有依赖到指定文件夹的步骤说明

《Pythonpip下载包及所有依赖到指定文件夹的步骤说明》为了方便开发和部署,我们常常需要将Python项目所依赖的第三方包导出到本地文件夹中,:本文主要介绍Pythonpip下载包及所有依... 目录步骤说明命令格式示例参数说明离线安装方法注意事项总结要使用pip下载包及其所有依赖到指定文件夹,请按照以

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意

Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析

《Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析》InstantiationAwareBeanPostProcessor是Spring... 目录一、什么是InstantiationAwareBeanPostProcessor?二、核心方法解