前言:
元素定位中,一定要先先看页面中是否有iframe。如果有,对iframe中的元素进行定位前,一定要切换iframe,操作结束之后需要操作其他iframe外面的元素需要先退出iframe,不然所有的操作都是没有用的。
一、表单元素
(一)radio
- is_displayed 判断元素是否显示
- is_selected 判断元素是否被选择
from selenium import webdriver
driver=webdriver.Chrome()
driver.get('https://www.runoob.com/html/html-forms.html')
print("判断元素是否显示:显示返回True,不显示返回False")
#不需要滚动屏幕直到显示元素
text=driver.find_element_by_xpath('//*[@id="content"]/form[3]/input[2]').is_displayed()
print(text)
print("判断元素是否被选择:被选择返回True,未被选择返回False")
#不需要滚动屏幕直到显示元素
radio_assert=driver.find_element_by_xpath('//*[@id="content"]/form[3]/input[2]').is_selected()
print(radio_assert)
#不需要滚动屏幕直到显示元素,下面方法执行之后,直接就到了元素位置
print("只执行指令,成功之后没有返回值,即None")
#失败则报错
radio_select=driver.find_element_by_xpath('//*[@id="content"]/form[3]/input[3]').click()
print(radio_select)
print("判断元素是否被选择:被选择返回True,未被选择返回False")
radio_assert=driver.find_element_by_xpath('//*[@id="content"]/form[3]/input[2]').is_selected()
print(radio_assert)
注意:若需要循环点击单选框,可以与checkbox操作一样做
(二)checkbox
checkbox的操作与判断,都与radio单选框一样,可以每一个操作都像单选框一样操作、定位也可以使用find_elements_by_xpath,与for循环进行循环点击,同时进行切片操作。下面代码没有做切片,因为checkbox的内容太少,没有必要。
from selenium import webdriver
driver=webdriver.Chrome()
driver.get('https://www.runoob.com/html/html-forms.html')
"""多选框测试点击单个元素"""
driver.find_element_by_xpath('//*[@id="content"]/form[4]/input[1]').click()
assert_selected_single=driver.find_element_by_xpath('//*[@id="content"]/form[4]/input[1]').is_selected()
print(assert_selected_single)
"""多选框测试循环点击多个元素"""
#注意:是find_elements,多了一个s,返回的是一个定位到的元素列表,
# 没有s就算有多个元素,也只能操作第一个,还不能使用索引
element_list=driver.find_elements_by_xpath('//*[@id="content"]/form[4]/input')
for i in range(len(element_list)):
driver.find_elements_by_xpath('//*[@id="content"]/form[4]/input')[i].click()
assert_selected=driver.find_elements_by_xpath('//*[@id="content"]/form[4]/input')[i].is_selected()
print(assert_selected)
(三)下拉列表
from selenium import webdriver
driver=webdriver.Chrome()
driver.get('https://www.runoob.com/try/try.php?filename=tryhtml_select')
#元素存在iframe中,所以需要切换
driver.switch_to.frame(0)
#由于此网站option的tag都是显示的,所以可以像单选框和复选框一样进行操作
#注意复制的xpath,现在浏览器的console中检查以下是否能定位到元素,不能就得改xpath,我的xpath就是改过的
driver.find_element_by_xpath('//select/option[2]').click()
check_selceted=driver.find_element_by_xpath('//select/option[2]').is_selected()
print(check_selceted)
另外还可以参考他写这篇使用select解决下拉列表的方法:https://www.cnblogs.com/qingqing-919/p/8709308.html
(四)检查输入框内是否输入了指定值
import time
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
js='var js=document.querySelector("#kw");js.value="selenium";' \
'document.querySelector("#su").click();'
driver.execute_script(js)
#注意:若需要返回值(在python中能看到),需要加return
js2=' return document.querySelector("#kw").value'
value=driver.execute_script(js2)
print(value)
(五)上传文件
上传文件一般有两种方法:
- 找到type="file"的input按钮,直接send_keys(文件路径)
- 模拟正常操作,使用第三方库AutoIt(window应用程序的UI自动化工具)
下例,直接send_keys:
from selenium import webdriver
driver=webdriver.Chrome()
driver.get('https://www.baidu.com/')
driver.implicitly_wait(10)
driver.find_element_by_xpath('//*[@id="form"]/span[1]/span[1]').click()
#太长了所以分行显示
driver.find_element_by_xpath('//*[@id="form"]/div[1]/div[2]/div[2]/input').\
send_keys(r'F:\source\TPShop网络商城实战\BaseMethod\check_code.png')
二、验证码
验证码解决方案:
- 由开发提供验证码接口
- 由开发提供万能验证码
- 开发关闭验证码功能
- 使用人工智能识别,推介使用。
智能识别验证码:
(一)pytesseract+jTessBoxEditor
可以使用pytesseract模块,需要安装tesseract软件,以及下载用于训练的jTessBoxEditor,剩下的就是不停的训练,让其识别精准度提高。
中间还需要处理很多方面,比如智能发现在识别过程出现错误的验证码,进行截图保存用于后续训练。
涉及的代码量和内容比较多,可以参考:
知乎:https://zhuanlan.zhihu.com/p/40178190
CSDN:https://blog.csdn.net/ruyulin/article/details/89046148
自己试过,可以用,不过使用中有许多细节需要注意,得到的结果还需要使用正则表达式进行提取
(二)调用第三方接口
可以调用腾讯云和百度AI的第三发识别库,但是这是需要付费的,免费的每个月只有1000次,学习的话建议用pytesseract