2020-12(完成事项)

12.1-12.2 ×
1.分析spark中的执行流程 √
2.shuffleRDD的学习 (计划于12.04-12.05学习) √

12.3
3.分析spark源码 √
4.scala中的高级方法博客的书写 √

12.4-12.5
5.RDDS论文的学习 √
6.flume和kafka的重新学习(计划天数) √
7.学习视频的剩余部分,并计划spark博客的提纲 √
8.spark在数据分析中的使用(书籍的阅读) √

12.6
shuffle的学习 √
kafka第一天 √
IO流的复习任务 √
sparkSQL的学习(简单的复习) ×
对spark三个案例的优化分析 √

12.7-12.8
kafka第二天学习 √
spark core19中线程池的补充完成 早上完成 √
spark算子的简单的回顾(注意返回值的类型) √
spark on yarn 的学习 ×
kafka面试题的学习 √
spark 常用算子分析的完成(actor部分),包括repartitionsorwithpartition 早上完成 √
spark案例分析hexo的计划 √
sparkSQL的学习 √

12.9
kafka第三天学习 √
sparkSQL的学习-尚硅谷视频 √
java中级中对象的创建和销毁博客的书写(计划3天内完成) √
RangePartitioner的分析 √
sparkSQL函数的总结 √

12.10-12.11
12.10日
kafka复习完全部的内容 √
创建与销毁对象(第二天) √
spark案例的书写
hive/spark中的集合数据类型 √
分布式一致性协议(资料的查找...)
12.11日
effecttive java的学习 √
java设计模式的学习 √ (原则的学习)
java中的动态代理与反射 √
spark中的序列化问题,shuffle流程 √

12.12日
effecttive java的学习 √
第一天工作的整理 √
java中的设计模式 √

12.13日
titan项目day1 √
设计模式类图 √

12.14日
titan项目day2 √
设计模式 单例模式 √

12.15日
titan bug的解决 √

12.16-12.17日
tatan项目 day3 √
tatan项目 day4 √
一致性Hash算法 ×(12.17-12.18完成) √
HDFS中java-api的复习 (12.17-12.18完成) √
设计模式的学习
ID_MAPPING SQL实现
ID_MAPPING 图计算实现 √
spark 案例的规划与书写

test
1.fliter SQL的测试 √
2.sparkSQL操作hive权限问题的解决方案(在Environment variables处添加变量 HADOOP_USER_NAME=root) ,还有其他的方案吗
3.id mappingSQL实现方案 √
4.打包在yarn集群上运行(在shell 命令中添加集群的注意事项:要同时添加jar 和 classpath )
5.config,添加序列化器 √
6.shell 脚本学习 ×

12.18日
tatan项目 day5 √
shell 脚本 (12.19-12.20) √
java 设计模式学习 √
项目中,idmapping 新老用户的标识写完 √
评估字段的权重 √
梳理idmapping的流程 √

12.19-12.20
tatan项目 day6 √
shell脚本的学习 √
完成向集群提交任务 (未完成,由于不知道分装etl改日再写)
SQL代码的书写与分装 √
用户活跃分析SQL √
多维分析 √
拉链表的实现与梳理方案 √

12.21日
学习java设计模式
再次写一遍SQL在spark中
kafka面试题
hive中正则表达式的学习(三天学习)

12.22-12.23
学习java设计模式
spark数据分析案例的完成 √
kafka面试题
mysql hive建表的规范 √
sqoop操作指南 √
增量表和全量表的概念 √
维度建模的学习 √
完成titan项目SQL的补充 √
测试增量表的数据 √
spark优化(官网) √
对md内容的修正和理论的补充 √

12-24
spark分析流程与优化两个文档的规划
spark调优简书文章的书写 √(完成全部的调优主题) √
流程分析流程文档的书写 √
规划md的博客的结构(太乱了) √

12-25-12.26
学习Redis(安装) ×
HDFS配置文件的说明文档
ODS自定义解析字段 √
炸裂函数的使用,使用hive实现共同好友案例 √
azkaban实践 √
位图数据结构 √
大数据中查找算法: √
bloom
hash
bitmap
堆排序的思想
数据库索引

12.27
算法的学习 √
hive分区分桶表的学习
spark shuffledDD的复习√
数据驱动md的书写 √
学习Redis(迫在眉睫)
java设计模式(好几天没看了)

12.28日
java设计模式学习
spark shuffle的学习
学习zookeeper的分布式一致性协议

12.29日
归并排序和基数排序的学习 √
spark partition分析 √

解决这些面试题:
你们这些指标力度主要是在pv、uv、ip是嘛?在哪些维度上会产生?
mapreduce怎么扩大并行度:回答切片机制
spark你常用的参数设置有哪些:调优指南
take rdd √
使用sample算子的时候,三个参数分别代表什么含义?
答数据抽取是否放回,打分值,随机数种子值。是否放回有什么区别?调用的什么算法? √
索引和主键的区别:主键一定是唯一性的索引,唯一性的索引不一定就是主键
spark SQL小文件的处理...... √
coalesce cache presist 本质上是回答持久化级别的问题

12.30
数据仓库项目的补充:从flume到kafka的流程
数据仓库中机器学习部分的补充和业务部分的补充
学习java设计模式 √
学习基类 √ 完成明天使用scala实现一遍
把hive的知识再复习一遍
互联网SQL50题再写一遍 ???
一道SQL题 √

12.31-1.1日
java设计模式学习 ×
把项目补充完整,
对于项目的描述: √
把业务域的SQL给补充完整 √
把机器学习的部分给补充完成,并且把理解特征工程,做了什么
把flume-kafka-flume 学习一下 ×
row key的设计:例如手机号,如果直接以手机号为rowkey,会造成热点冲突,我们可以反转这个手机号,这会提高写的性能,但是读的性能会用所下降,但是只是查询几条的话,还是很容易的,对于rowkey的设计,我们可以采用随机数
utf-8最多三个字节所以考虑使用\111111111(字节)来占位
查询的时候发生热点问题,造成某台机子高并发,所以改用随机的random,是业务中有规律的数据变的没有规律.
增量表算错了,怎么办?作为一个中间表在某段时间重新增量计算

深入理解java虚拟机的学习(一天一课)?是否需要现在学
学习的大数据的发展概况,为什么需要这些功能
早上应该做什么?结合以后上班的环境?
学习cyc2018的算法题并总结-晚上的任务
java的复习(gude)--早上的任务
javase基础中重要的知识有哪些?集合 IO流 多线程,怎么把这些串起来
HDFS配置文件的说明文档的说明

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容