48 - 如何选择开源项目

  • 软件开发领域有一个流行的原则:DRY,Don’t repeat yourself
    • 翻译过来更通俗易懂:不要重复造轮子
    • 开源项目的主要目的是共享,其实就是为了让大家不要重复造轮子
    • 尤其是在互联网这样一个快速发展的领域,速度就是生命,引入开源项目可以节省大量的人力和时间,大大加快业务的发展速度
  • 开源项目虽然节省了大量的人力和时间,但带来的问题也不少,相信绝大部分技术人员都踩过开源软件的坑
    • 小的影响可能是宕机半小时
    • 大的问题可能是丢失几十万条数据,甚至灾难性的事故是全部数据都丢失
  • 虽然 DRY有原则,但重复的开源项目好多
    • 你有 MySQL,我有 PostgreSQL
    • 你有 MongoDB,我有 Cassandra
    • 你有 Memcached,我有 Redis
    • 你有 Gson,我有 Jackson
    • 你有 Angular,我有 React……
    • 总之放眼望去,其实相似的轮子很多!相似轮子太多,如何选择就成了让人头疼的问题了
  • 完全不用开源项目几乎是不可能的,架构师需要更加聪明地选择和使用开源项目
    • 形象点说:不要重复发明轮子,但要找到合适的轮子!
    • 但别忘了,如果你开的是保时捷,可别找个拖拉机的轮子

如何选择一个开源项目

  1. 聚焦是否满足业务
  • 架构师在选择开源项目时,一个头疼的问题就是相似的开源项目较多,而且后面的总是要宣称比前面的更加优秀
    • 有的架构师在选择时有点无所适从,总是会担心选择了 A 项目而错过了 B 项目
    • 这个问题的解决方式是聚焦于是否满足业务,而不需要过于关注开源项目是否优秀
  • 如果你的业务要求 1000 TPS,那么一个 20000 TPS 和 50000 TPS 的项目是没有区别的
    • 有的架构师可能会担心 TPS 不断上涨怎么办?
    • 其实不用过于担心,架构是可以不断演进的,等到真的需要这么高的时候再来架构重构,这里的设计决策遵循架构设计原则中的“合适原则”和”演化原则”
  1. 聚焦是否成熟
  • 很多新的开源项目往往都会声称自己比以前的项目更加优秀:性能更高、功能更强、引入更多新概念……
    • 看起来都很诱人,但实际上都有意无意地隐藏了一个负面的问题:更加不成熟
    • 不管多优秀的程序员写出来的项目都会有 bug,千万不要以为作者历害就没有 bug
    • Windows、Linux、MySQL 的开发者都是顶级的开发者,系统一样有很多 bug
  • 不成熟的开源项目应用到生产环境,风险极大:轻则宕机,重则宕机后重启都恢复不了,更严重的是数据丢失都找不回来
  • 所以在选择开源项目时,尽量选择成熟的开源项目,降低风险
  • 可以从这几个方面考察开源项目是否成熟:
    • 版本号:除非特殊情况,否则不要选 0.X 版本的,至少选 1.X 版本的,版本号越高越好。
    • 使用的公司数量:一般开源项目都会把采用了自己项目的公司列在主页上,公司越大越好,数量越多越好。
    • 社区活跃度:看看社区是否活跃,发帖数、回复数、问题处理速度等
  1. 聚焦运维能力
  • 大部分架构师在选择开源项目时,基本上都是聚焦于技术指标,例如性能、可用性、功能这些评估点,而几乎不会去关注运维方面的能力
    • 但如果要将项目应用到线上生产环境,则运维能力是必不可少的一环,否则一旦出问题,运维、研发、测试都只能干瞪眼
  • 你可以从这几个方面去考察运维能力:
    • 开源项目日志是否齐全:有的开源项目日志只有寥寥启动停止几行,出了问题根本无法排查。
    • 开源项目是否有命令行、管理控制台等维护工具,能够看到系统运行时的情况。
    • 开源项目是否有故障检测和恢复的能力,例如告警、切换等
  • 如果是开源库,例如 Netty 这种网络库,本身是不具备运维能力的,那么就需要在使用库的时候将一些关键信息通过日志记录下来
    • 例如在 Netty 的 Handler 里面打印一些关键日志

如何使用开源项目

  1. 深入研究,仔细测试
  • 很多人用开源项目,其实是完完全全的“拿来主义”,看了几个 Demo,把程序跑起来就开始部署到线上应用了。
    • 这就好像看了一下开车指南,知道了方向盘是转向、油门是加速、刹车是减速,然后就开车上路了,其实是非常危险的
  • Elasticsearch 的案例
    • 有团队使用了 Elasticsearch,基本上是拿来就用,倒排索引是什么都不太清楚,配置都是用默认值,跑起来就上线了
    • 结果就遇到节点 ping 时间太长,剔除异常节点太慢,导致整站访问挂掉
  • MySQL 的案例
    • 很多团队最初使用 MySQL 时,也没有怎么研究过,经常有业务部门抱怨 MySQL 太慢了
    • 但经过定位,发现最关键的几个参数(例如,innodb_buffer_pool_size、sync_binlog、innodb_log_file_size 等)都没有配置或者配置错误,性能当然会慢
  • 你可以从这几方面进行研究和测试:
    • 通读开源项目的设计文档或者白皮书,了解其设计原理。
    • 核对每个配置项的作用和影响,识别出关键配置项。
    • 进行多种场景的性能测试。
    • 进行压力测试,连续跑几天,观察 CPU、内存、磁盘 I/O 等指标波动。
    • 进行故障测试:kill、断电、拔网线、重启 100 次以上、切换等
  1. 小心应用,灰度发布
  • 假如我们做了上面的“深入研究、仔细测试”,发现没什么问题,是否就可以放心大胆地应用到线上了呢?
    • 别高兴太早,即使你的研究再深入,测试再仔细,还是要小心为妙
    • 因为再怎么深入地研究,再怎么仔细地测试,都只能降低风险,但不可能完全覆盖所有线上场景
  • 有个案例,在开源项目在应用之前有专门安排一个高手看源码、做测试,做了大约 1 个月,但最后上线还是遇到各种问题。线上生产环境的复杂度,真的不是测试能够覆盖的,必须小心谨慎。
  • 所以,不管研究多深入、测试多仔细、自信心多爆棚,时刻对线上环境和风险要有敬畏之心,小心驶得万年船。我们的经验就是先在非核心的业务上用,然后有经验后慢慢扩展
  1. 做好应急,以防万一
  • 即使我们前面的工作做得非常完善和充分,也不能认为万事大吉,尤其是刚开始使用一个开源项目,运气不好可能遇到一个之前全世界的使用者从来没遇到的 bug,导致业务都无法恢复,尤其是存储方面,一旦出现问题无法恢复,可能就是致命的打击
  • MongoDB 丢失数据
    • 某个业务使用了 MongoDB,结果宕机后部分数据丢失,无法恢复,也没有其他备份,人工恢复都没办法,只能接一个用户投诉处理一个,导致 DBA 和运维从此以后都反对用 MongoDB,即使是尝试性的
    • 虽然因为一次故障就完全反对尝试是有点反应过度了,但确实故障也给我们提了一个醒:对于重要的业务或者数据,使用开源项目时,最好有另外一个比较成熟的方案做备份,尤其是数据存储。
    • 例如,如果要用 MongoDB 或者 Redis,可以用 MySQL 做备份存储。这样做虽然复杂度和成本高一些,但关键时刻能够救命

如何基于开源项目做二次开发

  1. 保持纯洁,加以包装
  • 当我们发现开源项目有的地方不满足我们的需求时,自然会有一种去改改的冲动,但是怎么改是个大学问。一种方式是投入几个人从内到外全部改一遍,将其改造成完全符合我们业务需求。
  • 这样做有几个比较严重的问题:
    • 投入太大,一般来说,Redis 这种级别的开源项目,真要自己改,至少要投入 2 个人,搞 1 个月以上。
    • 失去了跟随原项目演进的能力:改的太多,即使原有开源项目继续演进,也无法合并了,因为差异太大。
  • 建议是不要改动原系统,而是要开发辅助系统:监控、报警、负载均衡、管理等
    • 以 Redis 为例,如果我们想增加集群功能,则不要去改动 Redis 本身的实现,而是增加一个 proxy 层来实现
    • Twitter 的 Twemproxy 就是这样做的,而 Redis 到了 3.0 后本身提供了集群功能,原有的方案简单切换到 Redis 3.0 即可
  • 如果实在想改到原有系统,怎么办呢?
    • 建议是直接给开源项目提需求或者 bug,但弊端就是响应比较缓慢,这个就要看业务紧急程度了,如果实在太急那就只能自己改了
    • 如果不是太急,建议做好备份或者应急手段即可
  1. 发明你要的轮子
  • 其实选与不选开源项目,核心还是一个成本和收益的问题,并不是说选择开源项目就一定是最优的项目,最主要的问题是:没有完全适合你的轮子!
  • 软件领域和硬件领域最大的不同就是软件领域没有绝对的工业标准
    • 不像硬件领域,你造一个尺寸与众不同的轮子,其他车都用不上,你的轮子工艺再高,质量再好也是白费
    • 软件领域可以造很多相似的轮子,基本上能到处用。例如,把缓存从 Memcached 换成 Redis,不会有太大的问题
  • 除此以外,开源项目为了能够大规模应用,考虑的是通用的处理方案,而不同的业务其实差异较大,通用方案并不一定完美适合具体的某个业务
    • 比如说 Memcached,通过一致性 Hash 提供集群功能,但是有一些业务,缓存如果有一台宕机,整个业务可能就被拖慢了,这就要求提供缓存备份的功能。
    • 但 Memcached 又没有,而 Redis 当时又没有集群功能
    • 于是投入 2~4 个人花了大约 2 个月时间基于 LevelDB 的原理,自己做了一套缓存框架支持存储、备份、集群的功能
    • 后来又在这个框架的基础上增加了跨机房同步的功能,很大程度上提升了业务的可用性水平
    • 如果完全采用开源项目,等开源项目来实现,是不可能这么快速的,甚至开源项目完全就不支持我们的需求
  • 所以,如果有资源有人有时间,投入人力去重复发明完美符合自己业务特点的轮子也是很好的选择!毕竟,很多财大气粗的公司(BAT 等)都是这样做的,否则我们也就没有那么多好用的开源项目了

小结

  • 本文从如何选、如何用和如何改三个方面,讲了如何才能用好开源项目,希望对你有所帮助
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容

  • 转自 公众号「阿里技术」 作者 李运华 2018-04-11 软件开发领域有一个流行的原则:DRY,Don’t r...
    远古冰魄阅读 215评论 0 1
  • 这个项目可以理解为针对互联网IT人打造的中文版awesome-go。已有的awesome-go项目, 汇总了很多g...
    零一间阅读 2,678评论 0 5
  • 随着蓬勃发展的开源时代的到来,为了减少开发成本,提高开发效率,越来越多的公司使用各种开源项目,作为开发者,如果能充...
    caison阅读 2,012评论 0 1
  • 导读: 开源展示了人类共同协作,成果分享的魅力,每一次技术发展都是站在巨人的肩膀上,技术诸多创新和发展往往就是基于...
    极课编程阅读 1,209评论 0 3
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 124,797评论 2 7