Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...

本文主要是介绍Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 一、前提

    • 1.根据元素的特征来定位

    • 2.xpath相对定位

    • 3.等待 --sleep

  • 二、为什么不能用右键拷贝xpath?

  • 三、手写表达式唯一定位元素

    • 1.如何看自己手写的表达式是否正确

    • 2.唯一定位目的地输入框

    • 3.id属性

    • 4.唯一定位城市--广州

    • 5.唯一定位入住日期输入框

一、前提

d8c4c561f5ad96eaf7e2748303399b2f.png

1.根据元素的特征来定位:

1、标签名--   类别<标签名
2、属性(可选)--    属性名=值
3、文本内容(可选)  <标签名>文本内容</标签名>   <dl>目的地</dl>

8大定位方式。

2.xpath相对定位:

原则:根据元素本身的特征来唯一识别。

相对的是整个html页面,比如首页,相对的就是整个首页。

提供:你要什么样的元素?再去写表达式。

//标签名[@属性=值]

//标签名[text()=文本内容]

//标签名[text()=文本内容]//标签名[text()=文本内容]

当然后面可以一直加的,这个可以不止两层,三层四层都可以。

3.等待 --sleep

这个等待方式用得很多,一般把这种等待方式和另外一种显性等待结合起来用。

需要考虑等待的时机和方式。

二、为什么不能用右键拷贝xpath?

(截图讲解的技术知识是正确的。因为艺龙网站的页面元素有变动,所以你实操起来,看到的元素和截图上的会有区别。)

选中某个元素右键拷贝xpath

选中这个元素后,右键拷贝xpath,拷贝出来了这个:

以//开头
//*[@id="domesticDiv"]/dl[1]/dd/input太爷爷           爷爷 爸爸  我dl这辈有兄弟姐妹好几个,1表示是第一个。dl是个元素类型,1也是dl类型,但是1是dl的大哥。
比如dl是沙发,爷爷这代有四个沙发,1是老大。

看到这个后面有/,单斜杆表示父子关系。说明*[@id="domesticDiv"]dl[1]是父子级别关系。

一旦看见这种 下标加/ ,这种是遵照了页面的层级结构和兄弟姐妹的位置来表达元素定位的。

页面中,先出现的就是老大,后出现的就是老二老三。elements里面的html是从上往下看的。

严格按照了它在页面中的关系和位置,只要页面中有一点改变,这个元素定位就会失败。

这种拷贝的都要自己私下来改,改的时候也得去看看elements里面的html中的元素特征,考虑怎么改比较合适,等于是自己重新写一遍表达式。

三、手写表达式唯一定位元素

1.如何看自己手写的表达式是否正确呢?

按ctrl+f

6826367692e88e506ef80cb601ac1048.png
在这里去写表达式,在这里确认表达式的对错

2.唯一定位目的地输入框

1)先找标签名:

表达式://标签名

//input

f556050e3156e8009d17fb264e195834.png

可以看到找到了25个,那么就加条件。

2)根据标签名和属性来找
2eab08fc7eecf61940d39471b6c682c5.png
看到粉色一闪而过的都是会变的,框起来的是没变的属性

属性多的时候要选具备参考价值的,选不会变化的属性,确认下是不是唯一的。

看到data-bindid="city",这个值是city,是比较靠谱的不会变的。

//input[@data-bindid="city"]

dd7e73e6e888a525da570c416de37d2b.png
看到1of1,这样就唯一定位了

//input[@class="input_text"]

bffefb36a65cebb21a012b55490e3075.png
它也是唯一的

表达式://标签名[@属性=值]

变动的属性不用来定位,选择具有唯一性的属性来定位。

这样我没有借助它们间的关系和所谓的位置,就这样唯一定位了该元素。

3.id属性

id属性,是个身份证,在整个当前的这个html页面当中,它是绝对唯一的。得看页面有没有id,没有就用不了了。

换个页面就不管了,不是指整个系统里只有这个元素能叫id。 中国境内,身份证是不会重复的。外国境内,外国人的身份证和我的重复了也没关系。国家不一样啊。

在整个当前的这个html页面当中,其它的属性并不是绝对唯一的。

需要观察id,有的系统中,每次访问,id都会发生变化。

像这个一般不会变化:
8fd238635c33f9d20065ab2d4c9d7fd6.png

因为它是纯字母的。 如果id的值包含了字母和数字,可能就是每次都会变化的。

多访问几次,确认id的值会不会变。

4.唯一定位城市--广州

5c11f5d06c261ecbb47b48438382ab70.png
鼠标放在广州上面,右键--检查
1)特殊情况
8f0c8de4df4525bf843f8c34d864f449.png
我要试试这个元素是不是唯一的
01b6d4e5963ed55906977e73a460df09.png
看到是唯一定位到了
129f4029dd32772c0cdca011efff83de.png
明确想要的是广州,当我鼠标悬浮在北京上,广州的class值就变了

ac_over代表鼠标悬浮,就是鼠标现在在这个焦点上。

2)现在试试属性data行不行:

//li[@data="0|15"]

b1f92184d8751fe46eb5270071feef99.png
data是可以用的

//li[@title="广州"]

50f6e3f6ecc7c0fdb516006325ad7d5f.png
title也是可以的

两个属性都可以用的情况下,选一个放进代码里来用就可以了。

5.唯一定位入住日期输入框

//input[@data-bindid="checkIn"]

4b7c06a02ebd3a6644c6b2f307dc0e8b.png

文章中的链接的版权归原作者所有,除标明 “图片来自网络” 的图片,皆为小编本人所画所截图。欢迎关注“清菡软件测试”,进群加v:qhtester,感谢点赞与分享!

这篇关于Web网页自动化实战《2.在艺龙网中,根据城市+日期+关键词精准匹配了酒店》上篇...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/285120

相关文章

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

POI从入门到实战轻松完成EasyExcel使用及Excel导入导出功能

《POI从入门到实战轻松完成EasyExcel使用及Excel导入导出功能》ApachePOI是一个流行的Java库,用于处理MicrosoftOffice格式文件,提供丰富API来创建、读取和修改O... 目录前言:Apache POIEasyPoiEasyExcel一、EasyExcel1.1、核心特性

SpringBoot中四种AOP实战应用场景及代码实现

《SpringBoot中四种AOP实战应用场景及代码实现》面向切面编程(AOP)是Spring框架的核心功能之一,它通过预编译和运行期动态代理实现程序功能的统一维护,在SpringBoot应用中,AO... 目录引言场景一:日志记录与性能监控业务需求实现方案使用示例扩展:MDC实现请求跟踪场景二:权限控制与

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

python获取网页表格的多种方法汇总

《python获取网页表格的多种方法汇总》我们在网页上看到很多的表格,如果要获取里面的数据或者转化成其他格式,就需要将表格获取下来并进行整理,在Python中,获取网页表格的方法有多种,下面就跟随小编... 目录1. 使用Pandas的read_html2. 使用BeautifulSoup和pandas3.

Python如何精准判断某个进程是否在运行

《Python如何精准判断某个进程是否在运行》这篇文章主要为大家详细介绍了Python如何精准判断某个进程是否在运行,本文为大家整理了3种方法并进行了对比,有需要的小伙伴可以跟随小编一起学习一下... 目录一、为什么需要判断进程是否存在二、方法1:用psutil库(推荐)三、方法2:用os.system调用

Nginx location匹配模式与规则详解

《Nginxlocation匹配模式与规则详解》:本文主要介绍Nginxlocation匹配模式与规则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、环境二、匹配模式1. 精准模式2. 前缀模式(不继续匹配正则)3. 前缀模式(继续匹配正则)4. 正则模式(大

Java实现优雅日期处理的方案详解

《Java实现优雅日期处理的方案详解》在我们的日常工作中,需要经常处理各种格式,各种类似的的日期或者时间,下面我们就来看看如何使用java处理这样的日期问题吧,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言一、日期的坑1.1 日期格式化陷阱1.2 时区转换二、优雅方案的进阶之路2.1 线程安全重构2