Java自动化——使用Selenium+POI实现Excel自动化批量查单词

写在最前

相信大家都对爬虫非常熟悉,一般来说,利用HttpClient发送请求并获取响应以获得想要提取的数据应该是最常用的方法。最近工作中频繁使用了Selenium,在本文中,我们将使用Selenium和POI(读写Excel)来完成一个入门级的自动化程序,源码地址见附录。

步骤一览

  1. 使用Maven创建工程,引入Selenium和POI依赖
  2. 下载ChromeDriver并配置环境变量
  3. 编写Selenium查词脚本
  4. 读写Excel并保存
  5. 编写main方法,运行程序

现在开始

  1. 使用Maven创建工程,引入Selenium和POI依赖

    1.1 下载Maven,配置环境变量

    Windows和Mac将Maven目录地址写入path即可,具体步骤可百度,Google,十分常见。

    1.2 在IDEA中配置Maven

    IDEA自带Maven可能版本非最新,建议自行引入本地最新版本。

1.3 创建工程

创建工程时只要使用最基础的模板,也就是直接点击next。


image

1.4 在mvnrepository.com搜索Selenium,POI和POI-ooxml依赖,将其引入pom.xml,并在右下角点击import change,最终pom.xml加入内容如下:

 <dependencies>
     <!-- https://mvnrepository.com/artifact/org.seleniumhq.selenium/selenium-java -->
     <dependency>
         <groupId>org.seleniumhq.selenium</groupId>
         <artifactId>selenium-java</artifactId>
         <version>3.14.0</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
     <dependency>
         <groupId>org.apache.poi</groupId>
         <artifactId>poi</artifactId>
         <version>4.0.0</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml -->
     <dependency>
         <groupId>org.apache.poi</groupId>
         <artifactId>poi-ooxml</artifactId>
         <version>4.0.0</version>
     </dependency>
 </dependencies>
  1. 下载ChromeDriver并配置环境变量(三选一)

    2.1 在镜像站下载ChromeDriver,配置环境变量

    自行手动下载ChromeDriver后如不配置环境变量,需在代码中加上System.setProperty("webdriver.chrome.driver",path); 其中path是你的driver路径。

    2.2 Windows使用choco install直接安装

    2.3 Mac使用brew install cask直接安装

  2. 编写Selenium查词脚本

    3.1 创建Search类,编写setUp方法
    在setUp中,首先需要初始化WebDriver,然后访问到有道首页,搜索test点击确定并跳转至搜索页,注意在driver访问此页面时会弹出广告,需要一行代码来抓取关闭链接关掉广告,代码如下:

    //Direct to YoudaoDic homepage, land in the main search page
     public void setUp() {
         //Go to youdao.com
         driver.get(YOUDAO_HOME_URL);
         driver.manage().window().maximize();
         //Go to the main search page
         driver.findElement(By.id(INPUT_HOME_ID)).sendKeys("test");
         driver.findElement(By.xpath(SEARCH_HOME_XPATH)).click();
         driver.findElement(By.xpath(CLOSE_BTN)).click();
     }
    

    3.2 编写searchWord脚本方法

    searchWord方法需要传入你要搜索的单词,然后抓取搜索框,输入后点击确认。这时你将获得搜索详情的页面,其中你需要抓取中文翻译的div并且获取其中文字,代码如下:

    //Search word and get the translation
     public String searchword(String s) {
         //Find the input element, input the word and click the button
         WebElement input_search = driver.findElement(By.id(INPUT_SEARCH));
         input_search.clear();
         input_search.sendKeys(s);
         driver.findElement(By.xpath(SEARCH_BTN_XPATH)).click();
         //Get the text inside translation div
         String result = driver.findElement(By.className(TRANSLATION_CLASS)).getText();
         return result;
     }
    
  3. 读写Excel并保存

    4.1 创建Excel文件并写入单词

    新建一个Excel,然后在最左边第一列填入一些单词,注意,不要有空行,本文代码中没有带异常处理,空行会报错。


    image

    4.2 编写Excelio类,编写read方法

    利用poi框架,与普通文件读写异曲同工,代码如下:

    public Workbook read(int columnIndex, int count) throws IOException {
        FileInputStream fis = null;
        fis = new FileInputStream(new File(path));
        //Input and save as a xlsx workbook
        Workbook workbook = new XSSFWorkbook(fis);
        fis.close();
        return workbook;
    }
    

    4.3 编写searchWord方法

    调用Search类的searchWord进行搜索,然后将获取到的String写入Excel,代码如下:

    //Search the word and write down
     public void searchWord(Workbook workbook, int columnIndex, int count) {
         //Initialize driver
         WebDriver driver = new ChromeDriver();
         Search search = new Search(driver);
         search.setUp();
         //Search for all words in one column and print to another column
         for (int i = 0; i < count; i++) {
             //Get value of the cell and get the translation through search method
             Sheet sheet = workbook.getSheetAt(0);
             Row row = sheet.getRow(i);
             Cell cell = row.getCell(columnIndex);
             String results = search.searchword(cell.getStringCellValue());
             //Write the translation to another column
             Cell temp = row.createCell(columnIndex+1);
             temp.setCellValue(results);
             //Set the new column as "Wrap Text"
             CellStyle cellStyle = workbook.createCellStyle();
             cellStyle.setWrapText(true);
             temp.setCellStyle(cellStyle);
             sheet.setColumnWidth(1,31*256);
         }
    

    4.4 编写save方法

    使用FileOutputStream,保存Excel,代码如下:

     //Save the change
     public void save(Workbook workbook) throws IOException {
         FileOutputStream outputStream = new FileOutputStream(path);
         workbook.write(outputStream);
         outputStream.close();
         workbook.close();
     }
    
  4. 编写main方法,运行程序

    编写入口方法,代码如下:

//Entrance
    public static void main(String[] args) throws IOException {
        Excelio excelio = new Excelio("src/main/resources/wordlist/test.xlsx");
        Workbook workbook = excelio.read(0, 30);
        excelio.searchWord(workbook,0,30);
        excelio.save(workbook);
    }

结果展示

Excel


image

过程


image

结语

本文是为Selenium的入门而设计,后续作者将在此基础上,将Selenium结合JavaWeb,更新自动化WebApp的文章,敬请期待。如有疑问欢迎留言交流,欢迎issue和PR,感谢阅读。

附录

源码地址:https://gitee.com/daniel_ddd/selenium-poi-test

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,287评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,346评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,277评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,132评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,147评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,106评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,019评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,862评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,301评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,521评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,682评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,405评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,996评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,651评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,803评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,674评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,563评论 2 352

推荐阅读更多精彩内容