AI系统架构之大数据基础架构

昨天看到一个分享,来自前quora cto目前在医疗领域创业的Xavier,下图一页讲到了各个AI应用的共同点,结合香帅金融课对数据驱动的解释,可以总结如下:

1. 使用大量的数据(数据)

2. 自动化的数据处理、决策流程(动)

3. 个性化的解决方案与服务(驱)

4. 提升系统各个参与方的体验和效率

https://www.slideshare.net/SessionsEvents/xavier-amatriain-cofounder-cto-curai-at-mlconf-sf-2017/5?src=clipshare

商业上的解决方案逻辑,决定了支撑它的架构在抽象层次上也是相似的。

(1)数据基础架构

数据基础架构解决的是如何获取和处理多样化、大量的数据。

多样化,首先是支撑业务的数据是多样化的,它包括业务系统产生的结构化数据,各种数据库表定义风格迥异,都需要进入数据仓库,还有各种打点、日志、中间分析结果,仅仅支持这些数据就需要很好的数仓结构设计,例如按照基础层、中间层和应用层分层,并且按照业务主题分块,这样对入库和查找会很有帮助。

除了以上数据,还包括内部和外部的非结构化数据,例如图像、语音、网页、供应商提供的xml/json等,这些数据一方面需要跟业务数据一样来管理,另外一般还需要额外的解析,形成结构化的数据。

要解决数据量大的问题,就需要hadoop、spark、flink这样的计算系统,以及hdfs、hive、hbase、elastic search这样存储与访问系统了。

还有一点就是业务对实时性的要求越来越高,上述的数据采集、处理和应用都要能在实时或近实时完成,这就需要基于storm、spark streaming、flink来构建系统。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1、老板的奶奶,非常认真的用铁丝把雨伞绑在门把上。按她的想法是,雨伞都得藏在家里,怎么能随便放外面呢?我们说,雨伞...
    疯芝麻阅读 190评论 0 0
  • 我觉得,我并不是一个会讲故事的人,但我一定是一个会聊天的人。因为许多原因,见了许多人,遇见了许多事。在某一个下午,...
    Li金一阅读 471评论 0 0
  • 一直想和你说声青春再见。 下午五点十五分 《毛骗》终结篇看完。 晓辉进了监狱 晨曦死而复生 在箭刺进晨曦的胸口时 ...
    上官炸鸡阅读 561评论 0 1

友情链接更多精彩内容