HtmlUnit爬虫

首先来看一下实例

WebClient client=new WebClient(BrowserVersion.CHROME);

初始化client,可以设置不同浏览器版本的client.

HtmlPage page=client.getPage("http://www.baidu.com/");

/**设置不需要javascript支持*/

client.getOptions().setJavaScriptEnabled(false);

/**设置不需要css支持*/

client.getOptions().setCssEnabled(false);

/**获取form*/

HtmlForm form=page.getFormByName("f");

//HtmlTextInput text= form.getInputByName("wd");

HtmlInputhtmlInput= (HtmlInput)page.getHtmlElementById("kw");

htmlinput  比 htmltextinput要好,

System.out.println(htmlInput.toString());

htmlInput.setValueAttribute("雅蠛蝶");

System.out.println("input value attribute==>"+htmlInput.toString());

HtmlInputbtn= (HtmlInput)page.getHtmlElementById("su");

HtmlPagepage2=btn.click();

System.out.println(page2.asXml());

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,281评论 19 139
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,874评论 18 399
  • 一. Java基础部分.................................................
    wy_sure阅读 3,881评论 0 11
  • 小编费力收集:给你想要的面试集合 1.C++或Java中的异常处理机制的简单原理和应用。 当JAVA程序违反了JA...
    八爷君阅读 4,731评论 1 114