(week1)
day1. 在paperwork 配环境 搞琐碎的事 一天就过去了。。
day2. 装了虚拟机 尼玛装了超久 讨厌用windows== 下午导数据
day3. 太久没用数据库了 非常疲惫。。今天预计完成的任务没有做完 晚上在家里写完script吧
day4. 今天吃太多了!!!没有战斗力(布朗委屈脸) 任务差不多完成啦
day5. 有点累 research就是麻烦 跟做data sci一样 还是挺喜欢上班的 感觉像在实验室一样
(week2)
day1. 不行 放了周末就不想上班了。。当我得知税后工资才两千 当我发先我才上7周的班 我。。想哭。。每天最累的是眼睛 今晚又做不进去事 这一天做了slide和数据分析
day2. phd提出一种酷炫的online learning的方法 还要做成distributed 真好玩!好想做!结果因为知识产权什么之类的问题我不能和他合作😢但是我可以用他的概念 自己写。。好 学scala!现在我的任务是 给你一杯饮料 把它变成水。。然后我们不知道什么是水 也不能花太长时间变成饮料。。看了一下午资料毫无头绪 天哪
day3. 本来想换问题 似乎mentor不愿意 那我就尽快做完这个问题。下午完成pca, cosindis, 在测itembase 数据量太大了 似乎python numpy的问题 不知道 看不到报错信息 vm就挂了。java的PrintWriter 最后要记得close 不然数据存在buffer里 不会flush到文件里
day 4. 照我这样做下去 真的是瞎做 没有人指导😫 今天略无进展 主要问题是数据量太大 电脑跑不动 打算用spark啦 然后再看看parameter learning的东西
day 5. 一天的开始 先来整理下各种琐碎的概念。。
apache: web server. hadoop: apache's ds architecture, it's two main core design: HDFS & MapR(yarn: a new mapr archi). and also yarn, hbase, hive, pig. cloudera has biggest hadoop . spark: apache's another product.
mentor的最终目的是要发paper。。可是这和初级数学建模一样的solution不值得发啊= =
(week 3放假)
day1. 前一天晚上看新闻看的失眠 结果这天一天躺在床上 什么事也没干
day2. 导致晚上又失眠。。今天任务是 刷题 backtraking刷完 看coursera
day3. function programming有点有趣。
没有记录的这几天都在失眠 我也是醉了 怎么上班了就不失眠 !!!
week 4
day1. 写好mapreduce jar包一直有问题啊 受不了
day2. 处理数据 写mapr
day3. 算法还是用多线程来处理好 写了多线程
day4. run code. mentor也太墨迹了吧 开个instance还要求那么多 自己拿ec2跑. 重看fast code的课件 parallel program真是有用
day5. 上午跷班看牙齿 医生对我没洗过牙表示震惊 原来美国这边每六个月都得做一次牙齿检查。mentor给我开了个好大的机器 20核哈哈多谢多谢 跑的超快 半小时就好了 不过打算后续步骤也先写多线程 不行再用spark
sat: 刷题 刷dp
week 5
day1. 失眠。groundtruth有问题 mentor好像pm。。。。
day2. 失眠。瞎搞搞没力气
week6
好久没记录了。。详细的都记录在google drive里。 没做好数据分析 现在从头开始做 简直是 以后记住了。知道mentor也要去siggraph 因为他有篇paper后 再也不敢吐槽他了= =算了还是偶尔吐槽下