【背景】
使用了一段时间的Appium,但是对它还有一些疑问,比如 Appium和Selenium WebDriver什么关系? 其实现原理? 如何使用Appium+python环境来测试移动端应用呢?
粗浅的学习下原理:
【Question】
1.什么是 Appium?
■ 开源、跨平台的测试框架,用来测试移动端应用;
■ 支持IOS、Android及FirefoxOS平台,使用WebDriver的json wire协议,来驱动Apple系统的UIAutomation库、Android系统的UIAutomator框架;
■ 支持Selenium WebDriver支持的所有语言,如java、Object-C、JavaScript、Php、Python、Ruby、C#、Clojure、Perl,更可以使用Selenium WebDriver的Api;
■ client-server的设计模式: 只要client能够发送http请求给server,那么client用什么语言来实现都是可以的,这就是appium及webdriver如何做到支持多语言的原因;
2.Appium和Selenium WebDriver什么关系?
■ Selenium 是一个基于浏览器的自动化工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分:
Selenium IDE:Firefox的一个扩展,它可以进行录制回放,并可以把录制的操作以多种语言(例如java,python等)的形式导出成测试用例。
Selenium WebDriver:提供Web自动化所需的API,主要用作浏览器控制、页面元素选择和调试。不同的浏览器需要不同的WebDriver。
Selenium Grid:提供了在不同机器的不同浏览器上运行selenium测试的能力
■看一大堆的原理会不会绕晕,so 简单点, 是不是可以这么理解:Selenium是一套基于web自动化测试的解决方案,Appium是基于移动端自动化测试的解决方案,共通点是,他们都使用了WebDriver的json wire协议来作为客户端发出指令,与远程服务器进行指令交互;
3.在Android端的实现原理?
工作流如图所示:
说的直白点,就是我们的测试脚本,调用了webdriver的api(如在python中就提供了AppiumLibrary,其中包含各种api可供调用),这个测试脚本作为client端;手机作为server端;
首先,client端与server端建立连接,如何建立连接呢?我们开启一个Appium服务,这个服务在手机中使用4732端口开启一个server,监听来自client端的请求,如果监听到请求,则进行处理、响应,它们统一使用的通信规则是json通信协议(JsonWP);
server端接受到请求如何响应呢?在Android系统中,.Bootstrap程序监听到4724端口的指令,调用UIAutomator执行指令并返回结果;
4.如何使用Appium+python环境来测试移动端应用呢?
假设此刻环境搭建已经成功,一台Android真机连上电脑,电脑开启了Appium服务,python脚本:
//# coding=utf-8
import AppiumLibrary
Open Application('http://localhost:4723/wd/hub',platformName='Android',platformVersion=6.0,deviceName='28DDU17506001053',appPackage='com.lingcod.mobile.pad',appActivity='activity.MainActivity',unicodeKeyboard=True,resetKeyboard=True,newCommandTimeout=240)
运行脚本即可启动特定的apk,其中:
platformName:android
deviceName:手机设备名称,通过adb devices查看
platformVersion:android系统的版本号
appPackage:apk包名
appActivity:apk的launcherActivity
http://localhost:4723/wd/hub:此地址为Appium服务的地址,可在Appium中查看
启动了apk之后可以使用api识别、操作页面元素,那么,Appium如何识别页面元素的呢?
android-sdk自带一个元素定位工具:uiautomatorviewer,使用它可查看应用的布局和组件以及相关的属性:
出于识别元素的唯一性考虑,一般使用text/resource-id/content-desc来是识别元素;
5.python的三方库AppiumLibrary有哪些常用的api?
■ 实用函数:
点击元素 Click Element [locator]
点击文字 Click Text [locator]
开始 Open Application [...]
结束 Close Application
获取内容 {account} Get Text [locator]
点击坐标click a point [...]
滑动页面swipe [...]
输入文本Input Text [locator] {val}
清除文本 Clear Text [locator]
后台运行 Background App {sec}
输入密码 Input Password [locator] {passwd}
点击元素坐标 Click Element At Coordinates {coordinate_x} {coordinate_y}
■ 校验函数:
页面不应该包含元素Page Should Not Contain Element {locator}
页面不应该包含文本Page Should Not Contain Text {locator}
页面应该包含元素Page Should Contain Element {locator}
页面应该包含文本Page Should Contain Text {locator}
元素应该包含文本Element Should Contain Text {locator} {expected} {msg}
元素不应该包含文本Element Should not Contain Text {locator} {expected} ${msg}
元素名应该是Element Name Should Be {path} {name}
元素文本应该是Element Text Should Be {locator} {expected} {msg}
■等待函数:
等待元素Wait Until Page Contains Element {locator} {timeout}
等待文本Wait Until Page Contains {text} {timeout}
等待页面不包含元素 Wait Until Page Does Not Contain Element {locator} {timeout}
等待页面不包含文本Wait Until Page Does Not Contain {text} {timeout}
■其他函数/自写函数...
6.是不是使用Appium就可以完全的实现移动端自动化了呢?有哪些好处和局限性?
从自动化角度,使用Appium确实可以实现界面控件的自动化,比如简单的识别元素、界面操作;从测试场景出发,其可以作为版本回归测试,编写自动化测试用例,用于验证主体功能,但是也有很多局限性:
■基于UI界面,一步一骤都是写死的,有顺序的,一旦界面元素变动,或者界面的数据改变,或者网络情况不佳,维护测试脚本是一项费时的工作,测试脚本的通过率也不高;
■由于要唯一识别界面上的控件元素,需要保证元素的唯一性,即可能需要费时抓取独特的元素id或者请求apk开发者的协助,保证元素唯一、可识别;
■api本身的方法不够用,需要额外的方法协助,比如,要在apk的数字键盘中输入回车键、返回键等,可使用adb键值来实现;再比如,验证apk中的播放器的播放状态,需要另想办法判断;再比如,如果apk中存在图片/控件无法识别到,如何获取此图片包含的信息或者控件属性呢(python的图像识别库PIL和pytesseract可以一试);
当然,也有适用场景:数据变化不大的,重复性的操作,以及费时校验的情况,可以用界面自动化工具来代替手工测试;产品的回归测试也可以使用Appium来验证;
7.如何使用Appium给控件输入中文?
连接apk时,在Open Application方法中设置参数:
'unicodeKeyboard':True, //使用unicodeKeyboard的编码方式发送字符串
'resetKeyboard':True //键盘隐藏
进入App后,页面键盘被隐藏,页面元素不会被键盘挡住,而输入的值是传入的字符串,没有调用本身的键盘,当需要使用键盘时,再将appium键盘隐藏,切换至其他输入法即可使用。