2.20-2.22号,参加了《目标达成术》的三次课程,具体的总结和周目标的实施过程,查看文章:《01期『目标达成术』训练营总结——人生总有些目标要全力以赴》
我学习到了什么
我达成了什么样的目标,目标的是否成功了?
最终目标没有成功,没有爬取将学习了《用Python写网络爬虫》《Python网络数据采集》和查找了很多技术网站上的资料,实现了“将廖雪峰的Git教程转换成PDF文档”。
答疑课上的问答
在3.1日的“答疑课”上,我问了这样的问题:
【姓名】我是MiracleWong,学号:048
【目标】使用Python爬取『永澄老师』(YCMentor)微信公众号的文章并进行前端展示
【问题】我遇到的问题/ 困惑是:
【1】过程中发现初始目标完不成,重新修整目标算不算没有完成?
【2】目标太难,微信没有提供可调用的接口,找了很多技术文章,没有成型的方法。爬取下来的内容都是松散的,不成段,有的因为格式的问题都连不成句。
【3】但是在爬取其他的网站,比如『廖雪峰的Git教程』,可以爬取下来,并制成PDF文档
@永澄老师给出的回答是:
【1】完成目标是关键,更关键的是你要判断:为什么一开始你觉得自己可以完成目标?而实际上不能了?你的假设哪里出错了,以后要怎么改进,如何避免这种错误再发生。
【2】后面两点,是你的描述性文字,不做反馈。你比较廖雪峰的网站这个思路不对吧?你应该爬其他的公众号啊?如果其他公众号能爬下来,再考虑我的啊。
我的触动:
【1】定目标的时候,总是不能明确自己的假设,经常高估自己的能力,自己做的时候,往往希望去死磕一下,但是闯不过去的话,就会沮丧,然后就会拖延。这种情绪经常产生,现在的话可以进行控制。
【2】练习PORT和RSQC模型次数较少,还需要刻意练习。
我的复盘
以下内容,采用的是《管理复盘》中的复盘的格式:
目标是什么?
通过Python+网络爬虫爬取“永澄老师”(YCMentor)微信公众号的文章,并进行前端的展示
背后的假设是什么?
- 微信文章的文章是可以被爬取的。
- 自己有通过Python+网络爬虫的能力。
- 可以根据原文排版,在前端对数据进行还原。
为什么没有完成,有哪些假设是错误的?
- 高估了自己的能力。其实自己并没有完全的掌握网络爬虫的技术,但是希望通过这个周目标计划进行达成。
- 低估了问题的难度。在查找解决方案的过程中,微信并没有给出相应的API接口,因此通过微信公众平台获取相应的数据。很多人只是给出了假象解决的方案,没有成熟的解决方法。
- 爬去数据过程中的问题。数据是可以爬取出来,但是因为排版格式的原因,很多的数据都不是一整段的,而是根据加粗和颜色的不同,分成了一句句或者是几个字,这样的数据不能够进行前端还原。
- 微信的统一性。因为微信的公众号是统一的,因为“永澄老师”微信公众号的文章爬去不成功,其他的也就爬去不成功,这样就回答了永澄老师的问题。至于比较“廖雪峰的网站”,是因为他的网站适合爬取。
以后怎么进行改进,避免这种错误的发生?
- 降低自己的目标,不要高估,同时在制定目标的时候,要进行全方位的考虑,目标的难度超过自己一点点就可以了。要牢记“量小、短期、有能量”的原则。比如如果当时,将目标定为“爬取廖雪峰网站Git的教程,并导出为PDF文档”就可以进行实现了。
- 可以遇见的将来,可能还会有几次发生类似的事情,只能是将错误的概率和影响降低,随着练习的逐步增多,才可以完全地避免发生。
- 刻意练习PORT模型和RSQC模型。需要至少练习很多次,先曾周目标开始,在逐步的扩展到月计划等。
我的扩展
后来找到的类似的网站——传送门,通过爬虫的技术,将微信上的文章,爬取下来再组合成自己的网站,但是他的实现形式和别人的不一样,很值得自己分析学习,但是现在自己的能力还实现不了。