记录intern

(week1)

day1. 在paperwork 配环境 搞琐碎的事 一天就过去了。。

day2. 装了虚拟机 尼玛装了超久 讨厌用windows== 下午导数据

day3. 太久没用数据库了 非常疲惫。。今天预计完成的任务没有做完 晚上在家里写完script吧

day4. 今天吃太多了!!!没有战斗力(布朗委屈脸) 任务差不多完成啦

day5. 有点累 research就是麻烦 跟做data sci一样 还是挺喜欢上班的 感觉像在实验室一样

(week2)

day1. 不行 放了周末就不想上班了。。当我得知税后工资才两千 当我发先我才上7周的班 我。。想哭。。每天最累的是眼睛 今晚又做不进去事 这一天做了slide和数据分析

day2. phd提出一种酷炫的online learning的方法 还要做成distributed  真好玩!好想做!结果因为知识产权什么之类的问题我不能和他合作😢但是我可以用他的概念 自己写。。好 学scala!现在我的任务是 给你一杯饮料 把它变成水。。然后我们不知道什么是水 也不能花太长时间变成饮料。。看了一下午资料毫无头绪 天哪

day3. 本来想换问题 似乎mentor不愿意 那我就尽快做完这个问题。下午完成pca, cosindis, 在测itembase 数据量太大了 似乎python numpy的问题 不知道 看不到报错信息 vm就挂了。java的PrintWriter 最后要记得close 不然数据存在buffer里 不会flush到文件里

day 4. 照我这样做下去 真的是瞎做 没有人指导😫 今天略无进展 主要问题是数据量太大 电脑跑不动 打算用spark啦 然后再看看parameter learning的东西

day 5. 一天的开始 先来整理下各种琐碎的概念。。

apache: web server.    hadoop: apache's ds architecture, it's two main core design: HDFS & MapR(yarn: a new mapr archi). and also yarn, hbase, hive, pig. cloudera has biggest hadoop .   spark: apache's another product.

mentor的最终目的是要发paper。。可是这和初级数学建模一样的solution不值得发啊= =

(week 3放假)

day1. 前一天晚上看新闻看的失眠  结果这天一天躺在床上 什么事也没干

day2. 导致晚上又失眠。。今天任务是 刷题 backtraking刷完 看coursera

day3. function programming有点有趣。

没有记录的这几天都在失眠 我也是醉了 怎么上班了就不失眠 !!!

week 4

day1. 写好mapreduce jar包一直有问题啊 受不了

day2. 处理数据 写mapr

day3. 算法还是用多线程来处理好 写了多线程

day4. run code. mentor也太墨迹了吧 开个instance还要求那么多 自己拿ec2跑. 重看fast code的课件 parallel program真是有用

day5. 上午跷班看牙齿 医生对我没洗过牙表示震惊 原来美国这边每六个月都得做一次牙齿检查。mentor给我开了个好大的机器 20核哈哈多谢多谢 跑的超快 半小时就好了 不过打算后续步骤也先写多线程 不行再用spark

sat: 刷题 刷dp

week 5

day1. 失眠。groundtruth有问题  mentor好像pm。。。。

day2. 失眠。瞎搞搞没力气


week6

好久没记录了。。详细的都记录在google drive里。 没做好数据分析 现在从头开始做 简直是 以后记住了。知道mentor也要去siggraph 因为他有篇paper后 再也不敢吐槽他了= =算了还是偶尔吐槽下 

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容