cassandra是为跨多个节点、没有单节点失败、大数据量负载系统设计的。它的架构考虑了系统和硬件可能发生的故障。Cassandra 通过在多个相似的节点构建点对点的分布式通信系统来解决这个问题,将数据分布在集群中的所有节点上。每个节点定时的和集群中其他节点通过点对点的gossip通信协议交换自身信息。每个节点上通过顺序写commit log 来记录写请求,从而实现数据的持久化。然后对数据进行索引(按照key排序),写入到一个叫memtable的内存结构中,相当于write back cache。每次memtable满了,数据就会被写到磁盘上一个SSTable的文件中。所有的写操作都自动分区、在集群中复制。Cassandra 通过compaction 任务定时合并(consolidates)SSTables,删除掉标记为tombstone的过时数据。多种repair机制来确保数据一致性。
Cassandra 是一个分区行储存的数据库,行通过primary key唯一标识。Cassandra 架构。。(这一段和About Apache Cassandra一摸一样 就不说了)。
客户端的读或写请求可以发送到集群中的任意节点上。当一个客户端通过一个请求连接到某个节点,这个节点就作为这次请求的coordinator。coordinator相当于存储这次请求数据的cassandra节点和客户端的中间代理。coordinator根据集群配置来决定应该向ring环中的哪些节点发出请求。
Key structures
Node
存储数据的地方,是Cassandra的基本构成。
datacenter
相关节点Node的集合。一个数据中心可以是一个物理的数据中心,也可以是虚拟的数据中心。不同的负载应该使用不同的数据中心,物理或者虚拟的数据中心。复制在一个数据中心内进行。使用不同的数据中心可以阻止节点被其他的负载所影响,另外可以使得(节点之间的)请求close to each other ,保证低延迟。通过设置复制参数,数据可以被写到多个数据中心。数据中心不能横跨物理位置。
Cluster
一个集群包含一个或多个数据中心,集群可以跨越物理位置(physical locations)。
Commit log
所有的数据为了持久化储存,都会先写到commit log。当所有的数据都从内存中flush到SSTables后,commit log 就可以被删除了。
SSTable
SSTable(sorted string table)是一个不可改变的数据文件(这里感觉文档写得不太对,所以不翻译)。SSTables 是append only的,顺序存储在磁盘,每个table都有各自的SSTable文件。
CQL Table
A collection of ordered columns fetched by table row.。一个table由columns和一个主键组成。
Key components for configuring Cassandra
Gossip
一个peer-to-peer的通信协议,用来发现和分享集群中节点的位置和状态信息。Gossip 信息持久化的存储在每个节点的本地磁盘中,当重启一个节点,可以通过replay该持久化文件来恢复。
Partitioner
分区器决定了哪个节点将会存储数据的第一份副本,以及如何在集群的其他节点上分布其他副本。数据的每一行由primary key唯一标识,可以直接使用partition key作为primary key ,但是也有可能使用partition key + 其他clustering 列。分区器是一个hash function,根据某行的primary key hash得到一个 token。分区器使用这个token值来决定哪些节点存储该行的副本。Murmur3Partitioner 是Cassandra新版本的默认分区策略,也是几乎所有情况下的最好分区策略。
复制因子
所有的副本跨越整个集群,复制因子为1意味着每一行只有一份副本,存储在一个节点上。复制因子为2,意味着每一行有两份副本,每一份副本在不同的节点上。所有的副本都是一样重要。没有primary或者master副本。可以为每个datacenter分别定义复制因子。通常复制因子的数量应该大于1,但是不要超过集群中的节点数量。
副本放置策略
Cassandra将副本存储在多个节点,确保数据的可靠性和故障容忍性。复制策略决定了副本放置在哪些节点上。数据的第一个副本就是第一份复制,没有什么不一样(这是啥意思?)。强烈推荐使用NetworkTopologyStrategy来部署副本,因为它可以很方便的扩展到多个数据中心。
探测(Snitch)
Snitch 是一组机器,是放在数据中心和机架中的一组机器,replication strategy就部署在这些机器上,这些机器可以决定如何放置副本。
当你创建一个集群的时候你必须配置一个snitch,所有的snitches都使用动态探测层(dynamic snitch layer),可以监测性能,为读操作选择最好的副本。snitch默认是开启的,并且在大部分部署环境下推荐使用此功能。可以在cassandra.yaml配置文件中为每个节点配置动态的snitch阈值。
默认的SimpleSnitch 不能识别数据中心和机架信息。在公有云上可以为单数据中心或者单地区的部署环境配置这样的策略。生产环境推荐使用GossipingPropertyFileSnitch,可以识别一个节点的数据中心和机架信息。通过gossip协议将信息传递给其他节点。
cassandra.yaml配置文件
集群初始化属性设置的主要配置文件,table缓存参数,属性调优、资源利用、超时设置、客户端连接、备份、安全。
默认情况下,一个节点存储数据的目录也是在cassandra.yaml文件中配置的。
在生产环境中,你可以将commitlog-directory和data_file_directories放在不同的磁盘中。
系统keyspace表属性
你可以使用客户端,比如CQL,编程来设置基于每个keyspace或者每个表的存储配置属性