python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码)

本文主要是介绍python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

效果如下:

 实现流程:

一、Pyppeteer打开网址

import asyncio
from pyppeteer import launch
import pdb
import random# 启动 Pyppeteer
browser = await launch({'headless': False})
page = await browser.newPage()# 打开登录页面
await page.goto('http://localhost:8080/login.html')

二、调用后台springboot接口,springboot调用验证码ocr识别接口识别,返回识别结果

 核心代码如下:

public static String getImgWord(String body) {// 【1】请求地址 支持http 和 https 及 WEBSOCKETString host = "https://imgurlocr.market.alicloudapi.com";// 【2】后缀String path = "/urlimages";// 【3】开通服务后 买家中心-查看AppCode,有100次免费String appcode = "xxxxx";// 【4】请求参数,详见文档描述String urlSend = host + path; // 【5】拼接请求链接try {URL url = new URL(urlSend);HttpURLConnection httpURLCon = (HttpURLConnection) url.openConnection();httpURLCon.setRequestMethod("POST");httpURLCon.setRequestProperty("Authorization", "APPCODE " + appcode);// 格式StringBuilder postData = new StringBuilder(body);byte[] postDataBytes = postData.toString().getBytes("UTF-8");httpURLCon.setDoOutput(true);OutputStream out = httpURLCon.getOutputStream();out.write(postDataBytes);out.close();int httpCode = httpURLCon.getResponseCode();if (httpCode == 200) {String json = read(httpURLCon.getInputStream());System.out.println("正常请求计费(其他均不计费)");System.out.println("获取返回的json:");System.out.print(json);return json.substring(json.indexOf("words\":\"")).replace("words\":\"", "").replace("\"}]}", "");} else {Map<String, List<String>> map = httpURLCon.getHeaderFields();String error = map.get("X-Ca-Error-Message").get(0);if (httpCode == 400 && error.equals("Invalid AppCode")) {System.out.println("AppCode错误 ");} else if (httpCode == 400 && error.equals("Invalid Url")) {System.out.println("请求的 Method、Path 或者环境错误");} else if (httpCode == 400 && error.equals("Invalid Param Location")) {System.out.println("参数错误");} else if (httpCode == 403 && error.equals("Unauthorized")) {System.out.println("服务未被授权(或URL和Path不正确)");} else if (httpCode == 403 && error.equals("Quota Exhausted")) {System.out.println("套餐包次数用完 ");} else if (httpCode == 403 && error.equals("Api Market Subscription quota exhausted")) {System.out.println("套餐包次数用完,请续购套餐");} else {System.out.println(httpCode);System.out.println("参数名错误 或 其他错误");System.out.println(error);}return error;}} catch (MalformedURLException e) {System.out.println("URL格式错误");return e.getMessage();} catch (UnknownHostException e) {System.out.println("URL地址错误");return e.getMessage();} catch (Exception e) {// 打开注释查看详细报错异常信息// e.printStackTrace();return e.getMessage();}}/** 读取返回结果*/private static String read(InputStream is) throws IOException {StringBuffer sb = new StringBuffer();BufferedReader br = new BufferedReader(new InputStreamReader(is));String line = null;while ((line = br.readLine()) != null) {line = new String(line.getBytes(), "utf-8");sb.append(line);}br.close();return sb.toString();}

三、将验证码识别结果自动填充到input组件

# 执行JavaScript函数并传递参数,等待结果
response_text = await page.evaluate(postFunction, data)
print(response_text)input_verify_code = await page.xpath("//input[@name='verifyCode']")
await input_verify_code[0].type(response_text, {'delay': random.randint(100, 151) - 50})input_username = await page.xpath("//input[@name='username']")
await input_username[0].type('admin', {'delay': random.randint(100, 151) - 50})input_password = await page.xpath("//input[@name='password']")
await input_password[0].type('123456', {'delay': random.randint(100, 151) - 50})

四、自动登录

# 自动点击"立即登录"按钮
button = await page.xpath('//button[@type="submit"]')# 如果找到了button,则执行回车操作
if button:await button[0].press('Enter')

 python完整代码:

import asyncio
from pyppeteer import launch
import pdb
import randomasync def main():# 启动 Pyppeteerbrowser = await launch({'headless': False})page = await browser.newPage()# 打开登录页面await page.goto('http://localhost:8080/login.html')# 等待await asyncio.sleep(5)# 获取验证码图片组件img = await page.xpath("//*[@id='vCode']")# 获取img的srcsrc = await (await img[0].getProperty('src')).jsonValue()# 定义ajax post请求函数postFunction = """(data) => {// 这里使用fetch API发起POST请求return fetch('http://localhost:8080/getImgWord', {method: 'POST',headers: {'Content-Type': 'application/json',},body: JSON.stringify(data)}).then(response => response.text())}"""# 传递参数给JavaScript函数data = {'img': src}# 执行JavaScript函数并传递参数,等待结果response_text = await page.evaluate(postFunction, data)print(response_text)input_verify_code = await page.xpath("//input[@name='verifyCode']")await input_verify_code[0].type(response_text, {'delay': random.randint(100, 151) - 50})input_username = await page.xpath("//input[@name='username']")await input_username[0].type('admin', {'delay': random.randint(100, 151) - 50})input_password = await page.xpath("//input[@name='password']")await input_password[0].type('123456', {'delay': random.randint(100, 151) - 50})# 自动点击"立即登录"按钮button = await page.xpath('//button[@type="submit"]')# 如果找到了button,则执行回车操作if button:await button[0].press('Enter')# 关闭浏览器# await browser.close()    # 运行爬虫
asyncio.get_event_loop().run_until_complete(main())

完整资源包:

https://download.csdn.net/download/svygh123/89254844

这篇关于python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/955946

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D