爬取系统的代码

note first:从学长那里接过来的代码混乱不堪,变量命名随意,直接从网上copy的代码导致大量冗余代码,外加没有文档,论文写的不详细,看了一晚上,代码反推功能,唉...

几个已经猜到或者改造的功能

1.爬取知识卡片(aaa.java)=从博客里爬取+存储了12个性质作为知识卡片

  • 勘误!不是博客是相同网站...原来注释也是从网上copy的我也是醉醉醉醉醉了

2.同花顺爬取(webspider.java)=目前已改成问财爬取,定向爬取股票名称作为父节点,爬取股票行业作为上下位属性提取(treedata数据库).爬取其他各项性质来作为知识卡片..
3.文本提取(checkservice)=语义学爬取(..是..,...为...)
4.分类树(写死的)+提取叶子节点(将treedata的树展示出来,还不知道展示效果如何,理论上应该在可视化的地方展示)

烂代码坑人!

很好,现在tm的发现问财返回的数据都是加密过来的js变量我bi了狗了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,560评论 25 708
  • 常年困在喧嚣的城市文明里,为生活琐碎。今年国庆节没有去热门景点看人头攒动,而是走进深山,体验了两天远离人类文明的隐...
    我出去割草阅读 4,276评论 33 21
  • 能忘则忘 随意而安
    艾郁然阅读 210评论 0 0
  • 祭奠 2013年2月1日 08:56 编辑 | 删除 分享分享给好友 祭奠这半年以来的自己—— “ 破灭的美梦,一...
    野望全宇宙阅读 700评论 0 0
  • 读的什么书:《西尔斯亲密育儿练习手册》 阅读有效时间:30分钟 阅读中遇到了什么困难:看完就忘 阅读有什么收...
    彩云悠然阅读 83评论 0 0