系统架构师-知识记录(5)

数据库优化

集中式数据库优化:

  • 硬件系统:CPU,内存,网络等
  • 系统软件: 参数,进程优先级,内存,cpu使用权
  • 数据库设计: 表,视图的设计,索引的设计,SQL 语句的优化
  • 应用软件:数据库连接池
    分布式数据库优化:通信代价 参考:https://www.jianshu.com/p/8eeb31dc27ef

数据仓库和数据挖掘

数据库是原始数据,然后把这些原始数据进行二次处理,保存起来,形成数据仓库 ,可用于商业,使用仓库数据搜索查询,数据挖掘。

数据仓库和数据清理.png
数据挖掘方法.png

联邦数据库

联邦数据库.png

NoSQL(非关系型数据库)

非关系数据库.png

反规范化

任何事情走向极端必然引发新的问题, 之前提到了规范化, 第一范式,第二范式 。。。等等。都是把表进行拆分。以提高增,删,改的速度, 但是这样会降低查询的速度。因此出现了反规范。

  • 增加冗余列
  • 重新组表

大数据系统

  • Volume 数据量
  • Velocity 速度
  • Varriety 多样性
  • Value 值
大数据.png

大数据应用:
如 推荐系统:利用人们在网络上的行为数据,通过推荐系统进行处理分析,最终预测用户的下一步的行为。
chat GPT: 也是通过大数据模型和海量数据,分析上下文信息, 预测最有可能的句子,实现通用人工智能。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容