今天遇到一个问题,爬取一个网站的数据,只是提取出来一个链接就可以了,但是,有点意思的是,直接访问该网站的时候并没有找到我需要的链接地址,必须再进行一个格式转换再次提取才ok.but,这是我把所有页面链接都提取出来之后才知道的.因为我也是帮朋友找这些东西,,
我观察了一下,其实很简单,就是在Local Storage里面有一个value改一下格式,再访问就可以直接找到想要的了.
然后.我大致思路就是先把一个网站提取出来,再修改它的Local Storage,最后提取出来之后,再批量,so easy 呀!
然而,却遇到一个很麻烦的问题,因为第一次遇到,挺难受的,但是,既然遇到了还是要解决的.
我先描述一下问题
在Local Storage里面,本来就是key:value的形式存放数据.
就是这样:
但是,当我去修改那个value的时候,却不知道怎么提取,因为这个value是这样式的:.........
[{{{{{}}}}}]
但最外面就是一个列表,所以我可以直接就当成列表来用方法很简单:
我擦,我又发现了个问题,取出来的value虽然是个[ ]格式,但是type竟然是str????
WHT???
然后直接:
问题不大,哈哈哈哈哈哈哈后续有问题继续记录
其实,我也没必要纠结这个,如果正则直接提取出来那个字段是不是可以简单点呢,,,,