这两天利用业余时间终于是把自己手头所有的文章(QQ空间)做了一个大致的备份。
过程曲折复杂,想了许多招数终于有了一个初步的结果。 事情刚刚完成,完成之后只有感慨,真是不容易那。
简单叙述一下整个过程,免得以后要做第二次备份,又忘记了怎么做。
首先打开自己的空间页面,切换到日志一页,就遇到了第一个难题。如图,我现在的总数是175页,而每页显示15篇日志,也就是说总日志数可以计算得到是2625篇,和实际值2616篇相差不多。这2616篇如果采用手动复制...,实在是一个太过恐怖的过程。即使你一个小时能够完成30篇,2616篇/30篇=87.2小时,光是复制下来的工作量就是整整四天,这还不带休息的,也不能避免出错。那么也就是说必须想出来一个办法,能够非常好的解决复制问题。怎么办呢?
好在右键点击每篇文章的标题后,会右键出现一个“复制链接地址”的选项,点击复制最终会复制下来这么一串链接“http://user.qzone.qq.com/xxxxxxxx/blog/1547974001”,其中blog前边的那串号码xxxxxx就是本人的qq号,而blog后边的这串数字则是为这篇文章分配的一个id号,如果你右键使用Chrome浏览器的“审查元素”功能,就会发现这串号码实际上叫做bolgid,很明显就是日志的id号了。但是你去点击相邻的两个标题,发现它们的号码实际上并不连着,也就是说1547004001前并非是1547004000的号码,这个是怎么回事呢?我们留到后边再说。
有了这个思路,应该怎么做呢?手动复制所有的日志id号?
不,2600多个id号也够你受的,只能想别的方法了,首先想到的是使用迅雷的“下载所有链接功能”,然而下载迅雷后网页上点击并非此选项。最后只能用自己平常玩儿游戏作弊用的一个工具——按键精灵来实现半自动化操作了。具体方法就是首先录制一个自己操作复制的过程,然后设置热键,让其不断重复,直至把所有的id都保存到一个文本文件中。但这其中也有些小的问题,比如在鼠标点击的时候鼠标的位置不能太靠标题左边也不能太靠标题右边。这是因为当初写日志的时候,有的文章名字长,有的文章名字短。因此得掌握位置。如果当时写文章时,统一用的是非常规范的标题,比如”随笔(111)——xxx“,这样在后续操作的时候会方便非常多,因此以后也得记住这个窍门,不胡乱给文章取名了。这一步可能用三四个小时就能够完成,最终得到的就是如下的一个文本文件:
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361”
这个文件的行数理论上应该等于你的文章总数量,但是由于操作的时候难免有失误,因此有可能出现数量不一致的情况,比如我这次复制完毕了,使用excel进行了一次去重,最终惊讶的发现总数应该是2600多,但实际上我复制完毕的文本文件只有2400多篇,这是使用这种半自动化工具的一个弊端,或者说是我们不太熟悉这些工具所以发生的情况,如果有更加快捷的方法直接读取什么接口之类,大约会迅速的多,而且不会有失误。
总之,获取完毕文本文件后就可以进行下一步操作了。这步需要使用到bat批处理文件。里边的命令如下:
@echo off
pause
pause
pause
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1328000004
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1370000001”
“
一眼就能够看出,这个的主要目的是让Chrome浏览器一次打开多个标签页,我测试发现,一次打开100个是可以的。打开之后就又要使用到按键精灵了,更准确来说,是使用按键精灵来操作Chrome的另存为pdf功能。
使用按键精灵依次操作”复制blogid“、”保存“、”将blogid“粘贴在对话框中作为文件名等操作。这样就完成了一次保存操作,而后再关闭当前标签页,继续操作下一个标签页,以此类推。
最终就会存储完毕所有的单篇pdf文件。如下图所示:
继续下一步,单篇算是存下来了,但如果你要在kindle上阅读,这样放进去,就会出现2600篇单独的文章,没法弄,得继续操作。使用”福昕PDF编辑器
“中的文件合并功能,将若干个文件合成一个pdf。我一般是150篇合为一篇,这样下来,就是下边的这个样子:
然后把每个合集文件命名,2600篇就成了总共17个文件。再把日期信息加入到标题中,方便以后进行一些编辑操作。这个已经就可以当作存档备份保存了,主要目的是防丢失。要哪天遇到个特殊情况,腾讯关闭了qq空间,里边的东西全部丢失,这个情景,我真是想都不敢想。这简直就像大唐在风雨飘摇中不断丢失各处领土一般,多恐怖痛心哪?
再下一步,要是要阅读自己的大作,用电脑肯定是不方便。所以得转换格式,把东西放到Kindle里边,这就要用到一个叫做calibre的软件,如下所示:
使用这个软件操作后,上边显示的16个合集文件就转换成为mobi格式,可以在Kindle当中阅读了。当然,显示效果相比网络上那些好的电子书还是需要进一步提升的。kindle阅读效果如下所示:
以上就是全部将QQ空间日志转移到Kindle当中阅读的方法。以后还需要进一步改进。