百度新公告

百度公告称,4月21日起,百度空间将停止编撰更新博文,博文内容迁移后只对自己可见,百度空间内容将于2015年5月7日正式迁移到百度云,博文内容(包括字体格式、原文、图片以及视频链接)不变;博文评论、标签、私信、浏览转载及原粉丝数擦除。

随着百度空间宣布关闭后,当天下午微博上骂声一片,运营八年的百度空间内容将于5月7日正式迁移到百度云,简单的说就是百度空间倒闭了。

我在 13 年初的时候也有过使用百度空间作为博客内容的经历,在使用的过程中已经逐渐感受到各种令我不爽的地方,例如发表的文章经常会莫名其妙的被关闭仅自己可见,原因好像是因为文章中出现的黑客、入侵、漏洞等敏感关键字,但黑哥的文章却未被“查封”,可能错别字大法发挥了作用。

虽然越做越烂,但倒闭这个消息仍令我和几个朋友比较郁闷,其中一大原因是由于国内安全圈写文章的很多托管在百度空间,tombkeeper 在当天也发表了八卦缘由:“我比较早开始使用百度空间。在我的忽悠下,国内安全界很多人都在百度空间开设了自己的 Blog。同时,我也是改版后比较早停止使用的人。后来听说主持改版的 PM 弄完这事儿后就离开了。我写了首诗:轻轻的他走了,正如他轻轻的来。他轻轻的开会, 搞烂本来挺好的产品。给接任者,留下,一个,烂摊子。”

关于写作与博客我经历了这样几个阶段,开始刚写文章时觉得很有趣,新鲜感十足,抱着憧憬选择免费博客提供商(已经被墙),轻松的开始了“写作”之旅。但在使用的过程中发现免费博客(例如新浪、网易等)限制太多,不能任性的修改 CSS ,添加 JS 等,于是便转身购买了主机域名搭配 WordPress 做起了个人博主。这个时间周期比较长,几年后又觉得 WP 太臃肿,单纯的写作似乎不需要如此花哨的配合,便在能保留控制权限的前提下,让别人托管,自己只负责写文章。这就是我现在所使用的 Github pages + Jekyll 模式,详情搭建过程可以参考我的博文《Github pages + Jekyll build a blog》。

百度空间倒闭了,又会有不少人踏上新的征途,但我并不希望从此那么多优秀的文章在互联网上消失,我能够体会到历经几年撰写的文章只因为提供商跑路就无法与他人分享,分享是值得尊敬的。每篇文章背后都是作者坐在荧光屏前深思熟虑敲打出来的,所以我经常会对优秀的文章进行“打赏”,至少够人家买个鸡蛋核桃补补脑。面对文章消失的问题,我在下午茶时间裸写了百度空间爬虫从而对我比较敬重的几个博客内容进行存档。

简单提一下实现过程:

爬取存档页面:百度空间-让世界发现你{author}/archive ;

获取所有发表过文章的年月份;

爬取发表过文章月份中的博文链接;

多线程进行 Wget 操作,下载到本地;

因为是轻量级爬虫,所以没有使用 BS 等多余的第三方库,效果如下:

脚本开源在 Github :https://gist.github.com/Evi1m0/a3cc41690c69bce02ed3

最后无论怎样,至少我们还能留下那些年的印迹和那点儿依稀的回忆。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,050评论 25 707
  • 题目 给定一个排序的整数数组(升序)和一个要查找的整数target,用O(logn)的时间查找到target第一次...
    六尺帐篷阅读 221评论 0 1
  • 探索与计划 用户体验设计工作应该从探索和计划开始。只有做好了这两点,才能顺利开展工作。你应该先 集中注意力收集信息...
    z嘉嘉嘉阅读 205评论 0 1
  • 这周的马老师刘老师的微课以及妈妈们的分享
    开心果Apple阅读 191评论 0 0