python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码)

本文主要是介绍python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

效果如下:

 实现流程:

一、Pyppeteer打开网址

import asyncio
from pyppeteer import launch
import pdb
import random# 启动 Pyppeteer
browser = await launch({'headless': False})
page = await browser.newPage()# 打开登录页面
await page.goto('http://localhost:8080/login.html')

二、调用后台springboot接口,springboot调用验证码ocr识别接口识别,返回识别结果

 核心代码如下:

public static String getImgWord(String body) {// 【1】请求地址 支持http 和 https 及 WEBSOCKETString host = "https://imgurlocr.market.alicloudapi.com";// 【2】后缀String path = "/urlimages";// 【3】开通服务后 买家中心-查看AppCode,有100次免费String appcode = "xxxxx";// 【4】请求参数,详见文档描述String urlSend = host + path; // 【5】拼接请求链接try {URL url = new URL(urlSend);HttpURLConnection httpURLCon = (HttpURLConnection) url.openConnection();httpURLCon.setRequestMethod("POST");httpURLCon.setRequestProperty("Authorization", "APPCODE " + appcode);// 格式StringBuilder postData = new StringBuilder(body);byte[] postDataBytes = postData.toString().getBytes("UTF-8");httpURLCon.setDoOutput(true);OutputStream out = httpURLCon.getOutputStream();out.write(postDataBytes);out.close();int httpCode = httpURLCon.getResponseCode();if (httpCode == 200) {String json = read(httpURLCon.getInputStream());System.out.println("正常请求计费(其他均不计费)");System.out.println("获取返回的json:");System.out.print(json);return json.substring(json.indexOf("words\":\"")).replace("words\":\"", "").replace("\"}]}", "");} else {Map<String, List<String>> map = httpURLCon.getHeaderFields();String error = map.get("X-Ca-Error-Message").get(0);if (httpCode == 400 && error.equals("Invalid AppCode")) {System.out.println("AppCode错误 ");} else if (httpCode == 400 && error.equals("Invalid Url")) {System.out.println("请求的 Method、Path 或者环境错误");} else if (httpCode == 400 && error.equals("Invalid Param Location")) {System.out.println("参数错误");} else if (httpCode == 403 && error.equals("Unauthorized")) {System.out.println("服务未被授权(或URL和Path不正确)");} else if (httpCode == 403 && error.equals("Quota Exhausted")) {System.out.println("套餐包次数用完 ");} else if (httpCode == 403 && error.equals("Api Market Subscription quota exhausted")) {System.out.println("套餐包次数用完,请续购套餐");} else {System.out.println(httpCode);System.out.println("参数名错误 或 其他错误");System.out.println(error);}return error;}} catch (MalformedURLException e) {System.out.println("URL格式错误");return e.getMessage();} catch (UnknownHostException e) {System.out.println("URL地址错误");return e.getMessage();} catch (Exception e) {// 打开注释查看详细报错异常信息// e.printStackTrace();return e.getMessage();}}/** 读取返回结果*/private static String read(InputStream is) throws IOException {StringBuffer sb = new StringBuffer();BufferedReader br = new BufferedReader(new InputStreamReader(is));String line = null;while ((line = br.readLine()) != null) {line = new String(line.getBytes(), "utf-8");sb.append(line);}br.close();return sb.toString();}

三、将验证码识别结果自动填充到input组件

# 执行JavaScript函数并传递参数,等待结果
response_text = await page.evaluate(postFunction, data)
print(response_text)input_verify_code = await page.xpath("//input[@name='verifyCode']")
await input_verify_code[0].type(response_text, {'delay': random.randint(100, 151) - 50})input_username = await page.xpath("//input[@name='username']")
await input_username[0].type('admin', {'delay': random.randint(100, 151) - 50})input_password = await page.xpath("//input[@name='password']")
await input_password[0].type('123456', {'delay': random.randint(100, 151) - 50})

四、自动登录

# 自动点击"立即登录"按钮
button = await page.xpath('//button[@type="submit"]')# 如果找到了button,则执行回车操作
if button:await button[0].press('Enter')

 python完整代码:

import asyncio
from pyppeteer import launch
import pdb
import randomasync def main():# 启动 Pyppeteerbrowser = await launch({'headless': False})page = await browser.newPage()# 打开登录页面await page.goto('http://localhost:8080/login.html')# 等待await asyncio.sleep(5)# 获取验证码图片组件img = await page.xpath("//*[@id='vCode']")# 获取img的srcsrc = await (await img[0].getProperty('src')).jsonValue()# 定义ajax post请求函数postFunction = """(data) => {// 这里使用fetch API发起POST请求return fetch('http://localhost:8080/getImgWord', {method: 'POST',headers: {'Content-Type': 'application/json',},body: JSON.stringify(data)}).then(response => response.text())}"""# 传递参数给JavaScript函数data = {'img': src}# 执行JavaScript函数并传递参数,等待结果response_text = await page.evaluate(postFunction, data)print(response_text)input_verify_code = await page.xpath("//input[@name='verifyCode']")await input_verify_code[0].type(response_text, {'delay': random.randint(100, 151) - 50})input_username = await page.xpath("//input[@name='username']")await input_username[0].type('admin', {'delay': random.randint(100, 151) - 50})input_password = await page.xpath("//input[@name='password']")await input_password[0].type('123456', {'delay': random.randint(100, 151) - 50})# 自动点击"立即登录"按钮button = await page.xpath('//button[@type="submit"]')# 如果找到了button,则执行回车操作if button:await button[0].press('Enter')# 关闭浏览器# await browser.close()    # 运行爬虫
asyncio.get_event_loop().run_until_complete(main())

完整资源包:

https://download.csdn.net/download/svygh123/89254844

这篇关于python+Pyppeteer+SpringBoot验证码自动识别登录(文末附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/955946

相关文章

Spring WebClient从入门到精通

《SpringWebClient从入门到精通》本文详解SpringWebClient非阻塞响应式特性及优势,涵盖核心API、实战应用与性能优化,对比RestTemplate,为微服务通信提供高效解决... 目录一、WebClient 概述1.1 为什么选择 WebClient?1.2 WebClient 与

Java.lang.InterruptedException被中止异常的原因及解决方案

《Java.lang.InterruptedException被中止异常的原因及解决方案》Java.lang.InterruptedException是线程被中断时抛出的异常,用于协作停止执行,常见于... 目录报错问题报错原因解决方法Java.lang.InterruptedException 是 Jav

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

Java Stream流之GroupBy的用法及应用场景

《JavaStream流之GroupBy的用法及应用场景》本教程将详细介绍如何在Java中使用Stream流的groupby方法,包括基本用法和一些常见的实际应用场景,感兴趣的朋友一起看看吧... 目录Java Stream流之GroupBy的用法1. 前言2. 基础概念什么是 GroupBy?Stream

Python操作PDF文档的主流库使用指南

《Python操作PDF文档的主流库使用指南》PDF因其跨平台、格式固定的特性成为文档交换的标准,然而,由于其复杂的内部结构,程序化操作PDF一直是个挑战,本文主要为大家整理了Python操作PD... 目录一、 基础操作1.PyPDF2 (及其继任者 pypdf)2.PyMuPDF / fitz3.Fre

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

python中列表应用和扩展性实用详解

《python中列表应用和扩展性实用详解》文章介绍了Python列表的核心特性:有序数据集合,用[]定义,元素类型可不同,支持迭代、循环、切片,可执行增删改查、排序、推导式及嵌套操作,是常用的数据处理... 目录1、列表定义2、格式3、列表是可迭代对象4、列表的常见操作总结1、列表定义是处理一组有序项目的

python运用requests模拟浏览器发送请求过程

《python运用requests模拟浏览器发送请求过程》模拟浏览器请求可选用requests处理静态内容,selenium应对动态页面,playwright支持高级自动化,设置代理和超时参数,根据需... 目录使用requests库模拟浏览器请求使用selenium自动化浏览器操作使用playwright