五天早中晚进展<信息采集及获取>

信息采集

需要登录 cookies+jsoup
不需要登录 cookies

cookies来源

通过webview获取

jsoup使用

爬取规则
标签内部属性爬取 例如 <a class="test" type="v"> 目的:爬取type
标签直接爬取 例如<a>文字</a> 目的:爬取文字
标签内到标签内 例如 <a>我是文字<br>干扰信息文字</a> 目的:爬取我是文字
爬取数量统计
size()函数

1)、Android Studio使用已经顺手,alt+enter是一个很不错的选择

2)、解决的难点问题

1、使用webview登录后获取cookies,利用cookies再通过jsoup自动登录采集信息

ps:还可以通过chrome浏览器F12开发人员工具直接读取cookies

2、Jsoup抓取相关的问题

抓取一个标签内部的属性值方法:

attr[shuxing]

统计item个数:

size()函数

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,539评论 25 709
  • 国家电网公司企业标准(Q/GDW)- 面向对象的用电信息数据交换协议 - 报批稿:20170802 前言: 排版 ...
    庭说阅读 11,297评论 6 13
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,256评论 19 139
  • 一日曹操帐中闲坐,忽闻帐外脚步声声。郭嘉大步进来满面春风:“恭喜主公,贺喜主公!”曹操一皱眉:“大乔同意改嫁了还是...
    大司马大将军阅读 528评论 0 1
  • 听说你去过很多地方 也看过很多风景 听说你有很好的爱人 也有多年密交的老友 听说你有高薪体面的工作 也有一套不大却...
    盛夏小葵阅读 265评论 0 0