大学期间本人学过很多门计算机语言,却没有一门学好过。印象最深的是Java,上课的时候没怎么听过,后来突击了一下考试勉强得个及格。诸如C,C#,SQL,数据结构等都是学过的,除了考试以外根本没有用过。本科写论文时没有用到过任何软件(如果office不算的话),东拼西凑的把论文搞定了。俗话说,出来混迟早是要还的,这不,到了研究生的毕业论文统统还上了。自己office除了粘贴复制之外,几乎没有用过其他功能。Stata,SPSS,Eviews等统计学软件初步接触,花了很多时间去研究,现在也不怎么会。论文大部分时间都花在了数据寻找,分析上。
1、 Office上的装逼之路,也是自己最愚蠢做法。看了很多视频,书籍为了让自己更好的掌握Office的功能,花了很多时间。别人需要的时候自己非常主动,帮别人把问题解决,除了解决别人问题,你获得什么?好像什么都没有吧。论文时候帮别人改格式,重复着以前的“粘贴复制”。有没有想过自己想要的是什么?重复自己都感到傻逼的操作,你能有什么进步?(不要说我自私,几个人能做到无私)
第一次把python用到工作中是找客户的邮箱,在此之前我看过有关Python爬虫的书籍,也练习了几个例子。那天在浏览网页的时候,看到很多客户的邮箱,一个一个的去粘贴复制太过麻烦,就试着用python爬了下数据,结果得到1000多个邮箱,然后发邮件,得到客户回应并成功下单,后面还得到了领导表扬。
爬虫代码如下:
import requests
from lxml import etree
import csv
fp = open(r'C:\Users\Administrator\Desktop\邮箱0328.csv','wt',newline='',encoding='utf-8')
writer = csv.writer(fp)
writer.writerow(('name', 'address'))
urls = ['网址'.format(str(i)) for i in range(1,75)]
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}
for url in urls:
html = requests.get(url,headers=headers)
selector = etree.HTML(html.text)
infos = selector.xpath('//div[@class="info-box"]')
for info in infos:
name = info.xpath('div/a/text()')[0]
address = info.xpath('div[2]/div/div/div/text()')[0].strip()
writer.writerow((name, address))
fp.close()
部分数据结果如下
学以致用大概就是这个道理吧。当我们遇到问题时,看能不能从以往的经历中得到解决问题的方法。遇到数据在重复性处理时,想想python,也许一下子就会变得很简单。解忧的方式有很多种,至于喝杜康我是不提倡的,Python大家有时间可以关注一下。