最近抽风,没事会在知乎上回答一些问题,也许是想在这个世界上多留下点痕迹吧 :) 几次看到类似这样的题目:
作为一个程序员,如何提高自己?
我经常是这么回答的:
- 看开源优秀代码,看别人是怎么写的。
- 看一些编程理论书籍,比如设计模式,重构之类的,补充理论基础。
- 看一些技术深度类的,比如从头编写一个编译器。
- 最后可以看看自己相关领域的前沿论文。
其中第1,2,3点自己都算做过一些。第4点读前沿论文,算是零星读过一些,但是远没有到自己满意的程度。最近为了兑现这个牛逼,同时也受简友 haitaoyang 的启发,在公司内发起一个《一起读Paper》的活动,准备每周读一篇论文,如果能坚持下来。。。算了,先不立flag了。
下面是我们最近准备读的一些论文,给有兴趣的同学参考一下:
- Pinot: Realtime OLAP for 530 Million Users
- F1 Query: Declarative Querying at Scale
- Column-Stores vs. Row-Stores: How Different Are They Really?
- Tenzing A SQL Implementation On The MapReduce Framework
- The Snowflake Elastic Data Warehouse
- The Volcano Optimizer Generator: Extensibility and Efficient Search
- Raft Consensus Algorithm
- A Real-time Analytical Data Store - Druid
- Sparrow: Distributed, Low Latency Scheduling
- Online, Asynchronous Schema Change in F1
- Automatic Tuning of SQL-On-Hadoop Engines on Cloud Platforms
- Orca: A Modular Query Optimizer Architecture for Big Data
- Life beyond Distributed Transactions: an Apostate’s Opinion
- ARIES: A Transaction Recovery Method Supporting Fine-Granularity Locking and Partial Rollbacks Using Write-Ahead Logging
- Repeating History Beyond ARIES
我们组是做 Data Lake Analytics 的,因此论文都是分布式系统、数据库领域的。