Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...

本文主要是介绍Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 一、前提

    • 1.根据元素的特征来定位

    • 2.xpath相对定位

    • 3.等待 --sleep

  • 二、为什么不能用右键拷贝xpath?

  • 三、手写表达式唯一定位元素

    • 1.如何看自己手写的表达式是否正确

    • 2.唯一定位目的地输入框

    • 3.id属性

    • 4.唯一定位城市--广州

    • 5.唯一定位入住日期输入框

一、前提

d8c4c561f5ad96eaf7e2748303399b2f.png

1.根据元素的特征来定位:

1、标签名--   类别<标签名
2、属性(可选)--    属性名=值
3、文本内容(可选)  <标签名>文本内容</标签名>   <dl>目的地</dl>

8大定位方式。

2.xpath相对定位:

原则:根据元素本身的特征来唯一识别。

相对的是整个html页面,比如首页,相对的就是整个首页。

提供:你要什么样的元素?再去写表达式。

//标签名[@属性=值]

//标签名[text()=文本内容]

//标签名[text()=文本内容]//标签名[text()=文本内容]

当然后面可以一直加的,这个可以不止两层,三层四层都可以。

3.等待 --sleep

这个等待方式用得很多,一般把这种等待方式和另外一种显性等待结合起来用。

需要考虑等待的时机和方式。

二、为什么不能用右键拷贝xpath?

(截图讲解的技术知识是正确的。因为艺龙网站的页面元素有变动,所以你实操起来,看到的元素和截图上的会有区别。)

选中某个元素右键拷贝xpath

选中这个元素后,右键拷贝xpath,拷贝出来了这个:

以//开头
//*[@id="domesticDiv"]/dl[1]/dd/input太爷爷           爷爷 爸爸  我dl这辈有兄弟姐妹好几个,1表示是第一个。dl是个元素类型,1也是dl类型,但是1是dl的大哥。
比如dl是沙发,爷爷这代有四个沙发,1是老大。

看到这个后面有/,单斜杆表示父子关系。说明*[@id="domesticDiv"]dl[1]是父子级别关系。

一旦看见这种 下标加/ ,这种是遵照了页面的层级结构和兄弟姐妹的位置来表达元素定位的。

页面中,先出现的就是老大,后出现的就是老二老三。elements里面的html是从上往下看的。

严格按照了它在页面中的关系和位置,只要页面中有一点改变,这个元素定位就会失败。

这种拷贝的都要自己私下来改,改的时候也得去看看elements里面的html中的元素特征,考虑怎么改比较合适,等于是自己重新写一遍表达式。

三、手写表达式唯一定位元素

1.如何看自己手写的表达式是否正确呢?

按ctrl+f

6826367692e88e506ef80cb601ac1048.png
在这里去写表达式,在这里确认表达式的对错

2.唯一定位目的地输入框

1)先找标签名:

表达式://标签名

//input

f556050e3156e8009d17fb264e195834.png

可以看到找到了25个,那么就加条件。

2)根据标签名和属性来找
2eab08fc7eecf61940d39471b6c682c5.png
看到粉色一闪而过的都是会变的,框起来的是没变的属性

属性多的时候要选具备参考价值的,选不会变化的属性,确认下是不是唯一的。

看到data-bindid="city",这个值是city,是比较靠谱的不会变的。

//input[@data-bindid="city"]

dd7e73e6e888a525da570c416de37d2b.png
看到1of1,这样就唯一定位了

//input[@class="input_text"]

bffefb36a65cebb21a012b55490e3075.png
它也是唯一的

表达式://标签名[@属性=值]

变动的属性不用来定位,选择具有唯一性的属性来定位。

这样我没有借助它们间的关系和所谓的位置,就这样唯一定位了该元素。

3.id属性

id属性,是个身份证,在整个当前的这个html页面当中,它是绝对唯一的。得看页面有没有id,没有就用不了了。

换个页面就不管了,不是指整个系统里只有这个元素能叫id。 中国境内,身份证是不会重复的。外国境内,外国人的身份证和我的重复了也没关系。国家不一样啊。

在整个当前的这个html页面当中,其它的属性并不是绝对唯一的。

需要观察id,有的系统中,每次访问,id都会发生变化。

像这个一般不会变化:
8fd238635c33f9d20065ab2d4c9d7fd6.png

因为它是纯字母的。 如果id的值包含了字母和数字,可能就是每次都会变化的。

多访问几次,确认id的值会不会变。

4.唯一定位城市--广州

5c11f5d06c261ecbb47b48438382ab70.png
鼠标放在广州上面,右键--检查
1)特殊情况
8f0c8de4df4525bf843f8c34d864f449.png
我要试试这个元素是不是唯一的
01b6d4e5963ed55906977e73a460df09.png
看到是唯一定位到了
129f4029dd32772c0cdca011efff83de.png
明确想要的是广州,当我鼠标悬浮在北京上,广州的class值就变了

ac_over代表鼠标悬浮,就是鼠标现在在这个焦点上。

2)现在试试属性data行不行:

//li[@data="0|15"]

b1f92184d8751fe46eb5270071feef99.png
data是可以用的

//li[@title="广州"]

50f6e3f6ecc7c0fdb516006325ad7d5f.png
title也是可以的

两个属性都可以用的情况下,选一个放进代码里来用就可以了。

5.唯一定位入住日期输入框

//input[@data-bindid="checkIn"]

4b7c06a02ebd3a6644c6b2f307dc0e8b.png

文章中的链接的版权归原作者所有,除标明 “图片来自网络” 的图片,皆为小编本人所画所截图。欢迎关注“清菡软件测试”,进群加v:qhtester,感谢点赞与分享!

这篇关于Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/285120

相关文章

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型:

5 种使用Python自动化处理PDF的实用方法介绍

《5种使用Python自动化处理PDF的实用方法介绍》自动化处理PDF文件已成为减少重复工作、提升工作效率的重要手段,本文将介绍五种实用方法,从内置工具到专业库,帮助你在Python中实现PDF任务... 目录使用内置库(os、subprocess)调用外部工具使用 PyPDF2 进行基本 PDF 操作使用

C#自动化实现检测并删除PDF文件中的空白页面

《C#自动化实现检测并删除PDF文件中的空白页面》PDF文档在日常工作和生活中扮演着重要的角色,本文将深入探讨如何使用C#编程语言,结合强大的PDF处理库,自动化地检测并删除PDF文件中的空白页面,感... 目录理解PDF空白页的定义与挑战引入Spire.PDF for .NET库核心实现:检测并删除空白页

Oracle Scheduler任务故障诊断方法实战指南

《OracleScheduler任务故障诊断方法实战指南》Oracle数据库作为企业级应用中最常用的关系型数据库管理系统之一,偶尔会遇到各种故障和问题,:本文主要介绍OracleSchedul... 目录前言一、故障场景:当定时任务突然“消失”二、基础环境诊断:搭建“全局视角”1. 数据库实例与PDB状态2

Python实现自动化删除Word文档超链接的实用技巧

《Python实现自动化删除Word文档超链接的实用技巧》在日常工作中,我们经常需要处理各种Word文档,本文将深入探讨如何利用Python,特别是借助一个功能强大的库,高效移除Word文档中的超链接... 目录为什么需要移除Word文档超链接准备工作:环境搭建与库安装核心实现:使用python移除超链接的

Git进行版本控制的实战指南

《Git进行版本控制的实战指南》Git是一种分布式版本控制系统,广泛应用于软件开发中,它可以记录和管理项目的历史修改,并支持多人协作开发,通过Git,开发者可以轻松地跟踪代码变更、合并分支、回退版本等... 目录一、Git核心概念解析二、环境搭建与配置1. 安装Git(Windows示例)2. 基础配置(必

Python正则表达式匹配和替换的操作指南

《Python正则表达式匹配和替换的操作指南》正则表达式是处理文本的强大工具,Python通过re模块提供了完整的正则表达式功能,本文将通过代码示例详细介绍Python中的正则匹配和替换操作,需要的朋... 目录基础语法导入re模块基本元字符常用匹配方法1. re.match() - 从字符串开头匹配2.

MyBatis分页查询实战案例完整流程

《MyBatis分页查询实战案例完整流程》MyBatis是一个强大的Java持久层框架,支持自定义SQL和高级映射,本案例以员工工资信息管理为例,详细讲解如何在IDEA中使用MyBatis结合Page... 目录1. MyBATis框架简介2. 分页查询原理与应用场景2.1 分页查询的基本原理2.1.1 分

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结