用Python提取HTML页面中所有具有查询参数的URL以及所有参数


项目介绍 :

项目地址

在批量检测注入点的时候 , 需要做的第一步就是从页面中提取出来所有的和查询相关的URL以及其对应的查询参数
这个脚本就是为了解决这个问题 , 输入一个页面的URL , 经过脚本分析后 , 会返回这个页面中所有同源的查询参数 , 可以配置过滤条件 , 比如过滤掉非同源的URL , 或者保留子域名URL


使用方法 :

Usage : 
    python getQueryParameters.py [URL]
Example : 
    python getQueryParameters.py "http://www.jianshu.com/"

截图 :

图片.png
图片.png
图片.png

TODO :

  1. 修复.././的BUG
  2. 增加灵活性 , 将函数进行更高层次的抽取和封装
  3. 让用户可以配置过滤条件
  4. 使用Pthon的命令行参数解析库
  5. 有的链接并不是存在于herf中 , 需要解决这个问题(发现有的畸形链接是//开头的 , 这种默认为http协议 , 而不是在当前域下的子文件夹)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容