第一次实习
4点到江华
到大江华的第一感觉:凉爽(凌晨4点,大江华不凉爽就有鬼了),舒服(谁回家了还不舒服,看潘帅现在把回家都说成度假了就完全足以说明舒服程度了)
乘坐K1561的潘帅回到大江华的第一件事情,是写一个实习小结,哈哈,说出去有人信不?
算了反正不管你们信不信,反正潘帅我是在写了。处于这个尴尬的时间,比较尴尬的我只能也只有这个机会可以来写实习小结了。
别问我为什么在长沙实习的时候为什么不写,不是我不想,是并没有机会好么。如果可以的话,我也选择早早地把实习小结在我完成实习的时候就写了,然后现在就可以胡乱写点和心情相关的一堆东西啦,哈哈
从学校开始
鄙人是通过我的一个小妹妹知道她的java课老师开了公司,然后需要招实习的。很巧的是哥哥当时是大三,更巧的是同样要找实习,遂火车上道,还算有点java编程经验(其实和多写了几个helloworld没有太大区别)的潘帅通过简单的qq语音(对就是这么简单粗暴)就确定去郑浩老师(俗称浩哥)的公司实习了。
然后就是选了一个日子到了长沙超算中心(全名是:国家超级计算长沙中心)
初到公司,第一印象
电脑配置还不错,原谅我只对机器有点感觉(别打脸,潘帅虽然不靠脸吃饭--有嘴),内存12g,显示屏也够大差不多34英寸(没说明书)
接我的是一个之后叫宇哥的人,然后,他是公司里面最牛的大神。然后的然后,宇哥orz。
期间回学校考试,考完就回到长沙继续实习
不过比较搞笑的事情是:我去得比较晚,实习生大部队是上午到的,我是下午一点到的。然后之前的位置也没有了([]我好方)
不过说实话,新来的一批实习生里面妹子居多,很多(不愧是bjl orz)。//福利,绝对的福利
然而和我有什么关系(笑尿),该单身也还是没有耽误(活该单身狗)。
下面开始说正题
简要背景介绍
- 公司全名:湖南奇点创智科技有限公司
- 在公司职务:爬虫组-实习生
- 工作内容:用java做网络爬虫
- 让我做的第一个程序:抓豆瓣前50个详细影评的标题和内容。//纳闷了好久想知道为什么不是抓helloworld?
- 第二个程序做的一个是工商数据解析。(这个是主要工作)
- 连接公司mongodb(数据库),并做需要的插删改查操作。
- 连接linux服务器,并且运行相应的java可运行jar包(通俗来讲就是在机器上运行一个程序)。
抓取豆瓣影评
这是个比较简单的活,上csdn上看了几个比较多的爬虫教程里面java爬网页数据的实现,果断在htmlparse和htmlcleaner里面选择了后者,原因就是因为觉得后者的代码写起来简单方便。
在做了一段时间的解析之后,我才知道和这个练习相关的关键就是初步接触xpath、json、正则、网页标签布局、vector容器的使用。
然后一天写完。(因为后面四个学过,xpath又出奇简单,求不打脸)
一个比较小的插曲是:因为下载次数比较多被豆瓣封了ip几个小时QAQ。
工商数据解析
知识需要用时方恨少
如果你自己都认为自己很傻逼的时候,那说明你傻逼到一定程度了。
傻眼-装插件呀
第二天讲解完我写的抓取豆瓣的思路和java源码之后,直接让我做工商数据解析了。
当时的我是一脸懵逼的表情回了个:好//好像比嗯这个回答好一些吧
对着个网页,开个源码,干巴哋。(亚麻嘚)积极认真的我还是好好地写代码的,
然而我还是too young too simple
,我以为他们没提醒其它东西然后就让我写数据解析,那就是只是对着源码和页面写解析。居然没想过有会有工具可以检查和生成xpath,我好方。
听了我说直接看源码来写xpath,bjl过来和我说火狐有一个xpath插件,可以生成部分xpath也可以检验你写的xpath对不对。
当场:哦
在然后就是下载了一个火狐浏览器,添加了xpath checker、firebug等插件。
写起代码来,果然好多了。
傻眼-使用JSONArray呀
一开始的解析我好像只用到了JSONObject。解析的差不多的时候就需要存类似数组一样的东西了,但是我在程序里面好像没有看到类似的东西(后来事实证明的是:世界上最傻逼的事情是这个数组就在baba眼前,但baba却不认识它)
然后丹姐就指出可以用一种叫做JSONArray的数据结构。
当场:哦
傻眼-自己从新写代码
龙哥(前面的bjl)在给我说解析的时候,还给我发了一份代码模版,然后本着学习的心,简单问了一下知道并不一定要求按照模版的代码来写。
然后我就shabb的用自以为比较好的办法,一个小部分内容用一个方法取数据,写的差不多的时候,撞上浩哥检查代码了。
当浩哥看到我代码后铁青这脸的时候我就知道,这下赚了。但作为咱们老师的浩哥(虽然都没有教过我的课)这个时候还是心平气和地和我谈了下,
内容主要内容是:做一个团队项目,代码风格最好不要太多(你的是多余的)不然是不好维护的。当然写的好也可以,不过现阶段我刚开始做解析(手生,相关的代码也生),相关代码的使用还不熟练。
是要考虑先使用bjl提供的模版。(那个说自己写代码的拖出去枪毙3分钟)希望我要先学好,用熟练再思考其它问题。
当场:嗯、哦、是的、好(话比较多)
傻眼-带证书的下载方法
遇到过一个问题,下载的时候需要证书,然后公司提供的jar包里面并不支持证书下载,所以什么都不知道的我当时又是一脸懵逼。
灰溜溜跑过去和丹姐说,这个网页不能下载到源码怎么办,丹姐看完之后,脱口说出这个需要证书。
当场:哦
于是就去网上搜下载方法,证书下载,免证书下载,etc。结局就是没找到一个能够下载的方法。当时哥哥的心是崩溃的。
然后又灰溜溜向丹姐求助。几个分钟之后,丹姐就把源码通过qq发给我了,编译运行,下载成功。
当时太激动,直接说了不愧是丹姐,好厉害。(其实更想的是找个地洞钻。)
傻眼-自己写下载方法
公司提供了一个通用的下载方法但只支持大部分get请求和post请求的网页源码下载,并不是万能的下载器。然而当初的我就以为是万能的。。。
然后就gg了。直到有一次实在是想不出到底要怎么办了,才问怎么才能解决这个问题,得到的回答是自己写个下载方法。
当场:哦
我好方。。。
不过还是乖乖看下载方法的代码,看请求头,看延迟,看json请求字段,看cookie,看robotid。。。etc。
看了之后知道这些东西上课都学过,但是到了实际应用了就不行了,都怪自己没好好听课,没好好应用于实际。
关于工具
其实开发人员专用浏览器是火狐浏览器,但是我没怎么用,具有强迫症的潘帅怎么可能受得了如此慢的开启速度呢!
果断chrome浏览器(谷歌浏览器),然后到插件网去下载了排名和口碑都不错的xpath helper,外加chrome自带的开发工具箱黑色的哦.开发速度和效率进一步提升。
作为一个软件迷,各种软件各种玩,一个暑假还是学到了挺多东西,软件也不少。
- robomongo mongo数据库的图形界面,工作使用。为一记得的是为了会操作这个软件以及会操作这个数据库,我第一次破天荒地开始没有百度,直接去官方网站看帮助文档(api)那个速度叫做奇慢,不过看完以后学到的东西还是不少的,至少英文词汇增加了对于看英文资料来说,然后也学会了怎么看以及如何查找我需要的东西,那感觉还是不错的。至少不用担心因为在查到的资料过时的问题(官方文档是没有这个担心的)。
其实这是因为我们实习生的大神都是直接看api和英文文档的,所以喜欢耍帅的潘帅(在实习的地方完全是被帅耍)当然也要好好学习,虽然英文不咋的。哈哈,强行耍帅!
- onenote 有点软公司的office系列之一,老实说它的同步很烂,但是我也不需要这么多同步,而且我只是给自己做个笔记,然后onenote的布局也挺符合我的要求的。
- 印象笔记 这个不知道咋么说,本来想用这个跨平台的软件,但是怎么都用不下去,反正就是不适合我潘帅咯。
- ps/pr (photoshop/premiere) adobe的图片和视频软件,然而都不会。。。
- foobar2000 和vim一样的神器,不过是用来放歌的,因为没有时间去配置了,所以电脑用的是别人配置过的,手机端直接用原版了。开始完全不会用,但是用了一段时间,熟悉了操作之后会发现完全离不开这个东西,就像我现在没有用typora(一个效果很好的markdown编辑器)而是用gVim写这个日志一样。
- wireshark一个网络抓包工具,本来是想用sniffer的,但是玩不起。反正都不好玩QAQ。
- winSCP windows向linux传输文件的便捷工具软件,以前是完全不知道,知道的就是windows和linux下的文件系统完全不一样,却没想到即使文件系统不一样,但是具体的应用格式一样就ok,只要把需要的部分转移就好了,反正用的是一样的。
- xshell windows上连接远程linux系统的强大shell工具,还连接了我的腾讯云。
- excel 潘帅以人格保证,在学校的时候除了统计成绩的时候从来都没有用过excel了。不过这次实习的时候,还是感觉excel表格是有多大的作用,excel的操作六的话那么那效率得有多高。感觉表格的存在也是有道理而且十分必要的。少年,没事就多学学excel的各种应用吧。
- tc total commander 一个windows系统的文件管理器,高效神器哦。要是会用这个软件,那就很少用到windows自带的文件管理器了吧。
- etc
实习比较有意思的事情
- 妹子提前回家史:因为很多妹子都先回家了,所以后面去吃饭的是都是清一色的IT男(还大部分都单身狗狗,逃~ ),我都看不下去了,这个时候终于发现妹子也是有很重要的作用的....继续逃~~
- 宿舍有洗衣机冷落史:一开始大家都等着那个洗衣机,一个一个轮着洗,甚至中午回去把衣服扔进洗衣机。然后就是不知道为什么都开始自己手动洗衣服了,到后来的一个多月时间里面,我都没有碰过洗衣机了。(我想说我衣服少,要是等洗衣机,那我衣服非穿臭不可,那你们是什么梗?)
- 贾谊故居无端关门史:那天好不容易找到个同学带我转长沙,本来都打算好了去贾谊故居的,想不到还不是关门的时候居然关门大吉了,求潘帅的心里影音面积。然后就答应去逛商场,俗话说得好:“头可断血可流,逛街绝对不能怂”。所以就去逛咯,然后就发生了两件剧情完全不在一条水平线上的事情,其中一条还是你绝对想象不到的:
- 程序猿的穿着都比较随意的,我是程序员->我是程序员,所以穿得也比较随意。然后同样是逛商场,服务员看到我的眼神都变了,开始还以为会觉得我帅,后来注意到是看完潘帅(勉强让我这么写)穿着和搭配之后,xxx(那里有地洞)。胆敢这样藐视潘帅,保证下次亮瞎你们的dog eyes。
- 本来是陪别人逛的,然后就变成我一个人在试衣服了QAQ,剧情大反转呀,潘帅居然反客为主了。事实是别人早就逛得不想逛了吧,就我这个乡村来的小子才到处尝试,哈哈。逛一次街让我从别人眼中看出衣服不一样的审美和搭配价值。
人生处处是学问。
实习收获到的
- 学到技术和编程技巧。
- 要学会融入一个团队(是我),而不是单干(是我),不论个人能力多强,终究有限(不是我哟),不管团队是不是有诸多不足,终能成事。
- 以为自己很厉害,当你遇到问题怎么都解决不了,别人就给你三下五除二解决了的时候就无限打脸了。是该好好向身边的人好好学习了。
- 学会交流。
- 浩哥在给我建议的时候特地提到我和团队急需加强,因为我在做任务的时候很多时候都是自己在想怎么解决,解决完了就ok,也不会有太多讨。实际上是考虑到大家都很忙,除了有特别困难的技术以外我都尽量不去打扰他们,可是我确不知道这样我实现的方式还有我写的代码很多不成熟的地方就缺少指导,出现的缺陷(bug)不少,这反而给团队项目拉了后腿,这是我没想到的。交流是重要的一环,缺少这个就是会出现我深有体会的各种尴尬,关键是给别人带来烦恼。
- 当然我性格就是属于那种比较内敛的,本来就不是特别喜欢讲话,不过通过这个实习我也能明确感觉到自己交流能力比之前好多了。至少现在敢主动说这么一两句话了,虽然依旧别扭,依旧难听就和我唱歌一样,哈哈。
总之,即使不能留在那里。我也很感谢奇点给我的这段实习时光。
或许有句话说得还不错:我们不害怕面对新的事物表现得错误百出,因为我们终将因为这个新事物而变得更加自信。
到学校结束
回到学校是13:11分,学校真心的热,潘帅我以前怎么就没怎么感觉出来呢? 哈哈,是不是在长沙实习空调吹多了回到学校就受不了了。(难道你还有其它解释?),算了反正马上要去度假了,管这么多干嘛呢!嘻嘻。
附上配图:
-
超算中心!
1. 超算中心!
-
这是之前的办公桌,后来就没有右边的显示屏!
之前的办公桌
-
经常出现的飞机!
经常出现的飞机! -
都是吃货不解释:反正12点吃到15点!
都是吃货不解释 -
3个小时的奋斗之后依旧整洁的桌面 好吧还算整洁 哈哈!
3个小时的奋斗之后依旧整洁的桌面 -
巴比伦溜冰!
巴比伦溜冰
-
潘帅夜跑 这个是猴子湖大桥(好像是这么叫的诶 没关系反正重点是夜跑)
猴子湖大桥 -
橘子洲看烟花
橘子洲的烟花 -
很有诗意 并且菜也很好吃的餐馆
很有诗意
-
临行前k歌,原谅我在毁歌
原谅我在毁歌 -
卧室以及准备撤的行李
卧室以及准备撤的行李 -
没做到车,从长沙回湘大的时候买了商务票QAQ !
高铁商务票QAQ -
大合照 请大声告诉我谁最帅
大合照2 -
最后献祭-潘帅!
最后献祭-潘帅