一、Selenium简介

Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在
 操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。
 适用于自动化测试,js动态爬虫(破解反爬虫)等领域。

提供了丰富的测试函数,用于实施web自动化的一款流行的测试工具,直接运行于浏览器中,真实模拟用户的业务行为

扩展性比较好,支持语言比较多,简单快捷

实际上不是一个 测试工具,是一个工具集,主要由三个核心组件组成:Selenium IDE,Selenium RC(Remote Control) 及Selenium Grid

1.1、自动化测试简介:

测试用例主要包括以下几个内容:1、用例序号  2、用例标题 3、重要级别 4、测试环境  5、操作步骤  6、预期结果

Selenium:流行的开源web自动化测试工具, 直接运行在浏览器中,就像真正的用户在操作一样,支持的的浏览器包括IE,Firefox,Chrom等

自动化测试的优点:快速回归、脚本重用、代替人的重复工作、提高工作效率

缺点:只能检查主要的问题,没有办法发现新的问题,工作量比较大

二、Selenium组成

1)Selenium IDE:嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言
     2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的
     3)
Selenium WebDriver(重点):一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby
     4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。

三、Selenium特点

1)开源、免费
     2)多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
     3)多平台支持:Linux、Windows、MAC;
     4)多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
     5)对Web页面有良好的支持;
     6)简单(API 简单)、灵活(用开发语言驱动);
     7)支持分布式测试用例执行。

四、案例演示

爬虫:数据采集、数据清晰、数据分析!!!

4.1 java爬虫入门

1.下载驱动包

http://chromedriver.storage.googleapis.com/index.html

2.创建项目并导入依赖

 <dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>3.141.59</version></dependency>

3.入门

   //设置驱动System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");//创建驱动WebDriver driver=new ChromeDriver();//与将要爬取的网站建立连接driver.get("https://www.baidu.com");//关闭浏览器driver.close();//释放资源driver.quit();

4.2 相关API

 1.元素选择方式
     
     1)Class选择:driver.findElement(By.className("s_ipt"));
     2)ID选择:   driver.findElement(By.id("kw"));
     3)name选择: driver.findElement(By.name("wd"));
     4)tag选择:  driver.findElements(By.tagName("input"));
     5)link选择: driver.findElement(By.linkText("地图"));
     6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
     7)css选择器:driver.findElement(By.cssSelector("#kw"));
     8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));

2.获取单个元素:driver.findElement

3.获取多个元素:driver.findElements

4.输入内容:input.sendKeys("java");

5.元素点击:element.click();

6.获取元素属性:nextPageEle.getAttribute("class")

7.获取标签文本内容:titleEle.getText()

代码演示:

package com.zking;import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;import java.util.List;public class Demo {public static void main(String[] args) {//设置驱动System.setProperty("webdriver.chrome.driver","C:\\Users\\zjjt\\Downloads\\chromedriver.exe");//创建驱动WebDriver driver=new ChromeDriver();//与将要爬取的网站建立连接driver.get("https://www.baidu.com");//关闭浏览器
//        driver.close();
//        //释放资源
//        driver.quit();//        1)Class选择:driver.findElement(By.className("s_ipt"));
//            WebElement element=driver.findElement(By.className("s_btn"));
//        System.out.println(element.getAttribute("value"));//        2)ID选择:   driver.findElement(By.id("kw"));
//        WebElement element=driver.findElement(By.id("kw"));
//        System.out.println(element.getAttribute("class"));
//
//        3)name选择: driver.findElement(By.name("wd"));
//        WebElement element=driver.findElement(By.name("wd"));
//        System.out.println(element.getAttribute("maxlength"));//        4)tag选择:  driver.findElements(By.tagName("input"));
//        List<WebElement> elements = driver.findElements(By.tagName("a"));
//        for (WebElement element:elements){
//            System.out.println(element.getText().trim());
//        }
//        5)link选择: driver.findElement(By.linkText("地图"));
//        WebElement elemen = driver.findElement(By.linkText("网盘"));
//        System.out.println(elemen.getText());
//        6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
//        List<WebElement> elements = driver.findElements(By.partialLinkText("人"));
//        for (WebElement element:elements){
//            System.out.println(element.getText());
//        }
//        7)css选择器:driver.findElement(By.cssSelector("#kw"));
//        List<WebElement> elements = driver.findElements(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
//        for(WebElement element:elements){
//            System.out.println(element.getText());
//        }
//        8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
//        WebElement element = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
//        System.out.println(element.getAttribute("value"));driver.findElement(By.id("kw")).sendKeys("java");driver.findElement(By.id("su")).click();}
}

五:Selenium爬取JD商品信息

1.初始化

  //将驱动加载到Java的JVM虚拟机中System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");/************************** 方式一:不打开浏览器 **************************///定义浏览器参数ChromeOptions chromeOptions = new ChromeOptions();//设置不打开浏览器chromeOptions.addArguments("--headless");//初始化驱动driver = new ChromeDriver(chromeOptions);/************************** 方式二:打开浏览器 **************************///初始化驱动driver = new ChromeDriver();

 2.点开JD网址并指定关键字搜索

  driver.get("https://www.jd.com/");//输入关键字衣服driver.findElement(By.id("key")).sendKeys("衣服");//点击搜索按钮driver.findElement(By.cssSelector("button.button")).click();

3.设定睡眠时间(可根据网络速度实际调整)

   Thread.sleep(i * 1000);

4.查找商品列表并获取相关信息
     
     //*[@id="J_goodsList"]/ul/li

 商品信息:className="p-name"
     商品价格:className="p-price"

package com.zking;import org.openqa.selenium.By;
import org.openqa.selenium.JavascriptExecutor;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;import java.util.List;public class Demo01 {public static void main(String[] args) {//设置驱动System.setProperty("webdriver.chrome.driver","C:\\Users\\zjjt\\Downloads\\chromedriver.exe");//创建驱动WebDriver driver=new ChromeDriver();//与将要爬取的网站建立连接driver.get("https://www.jd.com");//模拟输入查询条件driver.findElement(By.id("key")).sendKeys("手表");//模拟点击事件,实现商品查询driver.findElement(By.cssSelector("button.button")).click();sleep(3);//执行js,滚动条下拉到最底((JavascriptExecutor) driver).executeScript("window.scrollTo(0,document.body.scrollHeight)");sleep(3);//获取数据List<WebElement> elements = driver.findElements(By.xpath("//*[@id=\"J_goodsList\"]/ul/li"));//循环遍历for (WebElement element : elements) {//获取商品价格·WebElement price = element.findElement(By.className("p-price"));//获取商品名称WebElement name = element.findElement(By.className("p-name"));System.out.println("【"+price.getText()+"】-"+name.getText().trim());}//  关闭浏览器&&释放资源driver.close();driver.quit();}/*** 获取数据模拟等待时间* @param second*/private  static void sleep(int second){try {Thread.sleep(second*1000L);}catch (Exception e){e.printStackTrace();}}
}

二、Selenium爬取图片

package com.zking;import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;import java.io.*;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;public class Demo02 {//定义获取图片的下载地址集合private static List<String> paths=new ArrayList<>();//定义图片下载网址private static final String PATH="https://www.139ys.com/";//下载图片保存到指定的目录private static final String DIR="E:\\images\\";private static void getImages(){//设置驱动System.setProperty("webdriver.chrome.driver","C:\\Users\\zjjt\\Downloads\\chromedriver.exe");//创建驱动WebDriver driver=new ChromeDriver();//与将要扒取的网站建立连接driver.get(PATH);sleep(1);//获取图片资源List<WebElement> elements = driver.findElements(By.xpath("/html/body/div[2]/div/div[1]/div/div[2]/ul/li"));//循环遍历获取图片资源for (WebElement element : elements) {//获取a标签WebElement a = element.findElement(By.tagName("a"));paths.add(a.getAttribute("data-original"));}//  关闭浏览器&&释放资源driver.close();driver.quit();}public static void main(String[] args) {getImages();for (String str : paths) {System.out.println(str);saveImg(str);}}private static void saveImg(String path){try{sleep(1);//定义图片名称String img =System.currentTimeMillis()+".jpg";URL url=new URL(path);//定义输入流DataInputStream is = new DataInputStream(url.openStream());//定义输出流FileOutputStream fileOutputStream = new FileOutputStream(new File(DIR + img));//定义每次读取长度int len=0;//定义每次读取大小byte[] size=new byte[1024];//循环读流写流while ((len=is.read(size))!=-1){fileOutputStream.write(size,0,len);}//关闭is.close();fileOutputStream.close();}catch (Exception e){e.printStackTrace();;}}/*** 获取数据模拟等待时间* @param second*/private  static void sleep(int second){try {Thread.sleep(second*1000L);}catch (Exception e){e.printStackTrace();}}
}

Selenium的组成及特点相关推荐

  1. Python:Selenium和PhantomJS

    Selenium Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上, ...

  2. python+selenium浏览器常用操作(一)

    1.导入selenium自定义的webdriver.后续可通过调用此协议启动各大浏览器 from selenium import webdriver #浏览器 from selenium.webdri ...

  3. selenium 不同版本Driver

    selenium进行UI自动化测试需要Driver支持,不同的浏览器需要不同的Driver,之前使用的Driver可以正常运行,但是总会报一些莫名的问题,经过查找,原来IE的Driver需要与sele ...

  4. selenium+Python(鼠标和键盘事件)

    本篇总结了 web 页面常用的一些操作元素方法,可以统称为行为事件 有些 web 界面的选项菜单需要鼠标悬停在某个元素上才能显示出来(如百度页面的设置按钮). 1 简单操作 1.点击(鼠标左键)页面按 ...

  5. web自动化测试从入门到持续集成(selenium webdriver)

    在很多刚学习自动化的可能会认为我只需要会运用selenium,我只需要在一个编辑器中实用selenium +java编写了一些脚本那么就会自动化了,是真的吗?答案肯定是假的.自动化肯定是需要做到真的完 ...

  6. 「UI 测试自动化selenium」汇总

    <selenium 基础之java实现> selenium RC 环境配置 菜鸟学自动化测试(一)----selenium IDE 菜鸟学自动化测试(二)----selenium IDE ...

  7. java selenium_java+selenium,40行代码完成支付宝账单爬取

    java+selenium,40行代码完成支付宝账单爬取 需要jar selenium-server-4.0.0-alpha-5.jar 需要驱动 chromedriver.exe 驱动需要和浏览器版 ...

  8. linux firefox xvfb,自动化测试之linux+xvfb+selenium+firefox+python测试环境搭建与测试

    1. Xvfb 为一个X虚拟框架,这个框架使用虚拟内存能让linux系统图形界面服务器(X-Server)运行在没有显示设备的机器上,这样,浏览器就可以运行了. (1) 安装xvfb 需根据自己lin ...

  9. python get请求 由于目标机器_使用python和selenium进行Web抓取:由于目标机器主动拒绝i...

    我知道这个错误已经被讨论了很多,但似乎每种情况都有不同的原因. 我使用下面的代码和selenium从一个网站提取一些数据,并在第二次调用浏览器.get(url).在import openpyxl, o ...

  10. 在CentOS 7.7 x86_64上安装python3的selenium 3模块实录

    安装selenium3模块 pip3 install selenium 如果上面的命令因为网络问题,重试多次仍失败,可以尝试下面的命令 pip3 install selenium -i http:// ...

最新文章

  1. 数据结构与算法:22 精选练习50
  2. OpenCv Mat -类 成员函数
  3. java打印文档_从Java应用程序打印文档?
  4. 使用VC++远程调试Linux程序
  5. 算法训练 猴子分苹果c语言,算法训练 猴子分苹果
  6. 关于Android 中 一个错误的解决办法 “Do not request Window.FEATURE_ACTION_BAR.....
  7. MySQL的行锁和表锁
  8. mysql 深胡_Mysql胡说八道
  9. intellij idea 如何将普通项目转换为maven项目
  10. .NET平台开源项目速览(9)软件序列号生成组件SoftwareProtector介绍与使用
  11. http的response遇到illegalstateexception解决办法
  12. bulk insert java_从JAVA插入SQL Server时,我可以获得“BULK INSERT”般的速度吗?
  13. 2022年十大突破性技术,“无密码”排名第一
  14. Java 拾遗补阙 ----- 数据类型
  15. 2019利兹大学计算机排名,2019软科世界大学学术排名利兹大学排名第101-150
  16. 通过js唤醒app或者跳转应用市场
  17. C#连接SQL Server并查询数据
  18. 百事起诉可口可乐广告不当
  19. 保研面试/考研复试:英语口语面试必备话题及常用句型句式整理(三)
  20. 用google突破图书馆入口IP限制小技巧

热门文章

  1. linux 挂载nfts U盘或着移动硬盘
  2. 看移动认证一键登录如何为用户提供便捷认证登录体验
  3. 通过众筹方式获得项目启动的第一笔资金
  4. NZT 9系统详细安装办法
  5. Pr:制作快闪转场效果
  6. 项目管理之敏捷方法--敏捷环境创建
  7. 学习Autodock分子对接
  8. 函数计算机度数怎么打,excel怎么输入度分秒并可以计算?(角度表格)
  9. Use-KALI in Physical-machine(物理机)
  10. [Spark的TopN算法实现]