用Python提取HTML页面中所有具有查询参数的URL以及所有参数

项目介绍 :

项目地址

在批量检测注入点的时候 , 需要做的第一步就是从页面中提取出来所有的和查询相关的URL以及其对应的查询参数
这个脚本就是为了解决这个问题 , 输入一个页面的URL , 经过脚本分析后 , 会返回这个页面中所有同源的查询参数 , 可以配置过滤条件 , 比如过滤掉非同源的URL , 或者保留子域名URL

使用方法 :

Usage : 
    python getQueryParameters.py [URL]
Example : 
    python getQueryParameters.py "http://www.jianshu.com/"

截图 :

图片.png

TODO :

修复../和./的BUG
增加灵活性 , 将函数进行更高层次的抽取和封装
让用户可以配置过滤条件
使用Pthon的命令行参数解析库
有的链接并不是存在于herf中 , 需要解决这个问题(发现有的畸形链接是//开头的 , 这种默认为http协议 , 而不是在当前域下的子文件夹)

最后编辑于：2017.12.05 02:54:19

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文

用Python提取HTML页面中所有具有查询参数的URL以及所有参数

相关阅读更多精彩内容

友情链接更多精彩内容