Cassandra 教程(一): Cassandra 简介

Overview

Apache Cassandra 是一个大规模可扩展的分布式开源NoSQL数据库,完美适用于跨数据中心/云端的结构化数据、半结构化数据和非结构化数据,同时,Cassandra 高可用、线性可扩展、高性能、无单点。

特点

  • scalable,线性可扩展
  • fault-tolerant,且没有单点(peer-to-peer)
  • column-oriented database & partitioned row store database
  • distribution design 基于 Amazon 的 Dynamo
  • data model 基于 Google 的 Bigtable
  • 灵活的数据存储,支持结构化、半结构化、非结构化数据
  • 支持事务
  • 写性能好
  • 由 Facebook开源

数据模型

内部数据结构

Cassandra是一个column-oriented database,也就是说,不用像关系型数据库一样事先定义好列,在Cassandra中,不同行的列可以不一样。

在Cassandra中,数据模型由keyspaces、column families、primary key 和 columns组成,对比关系型数据库,如下表:

关系型数据库 Cassandra
Database Keyspace
Table CF(column family)
Primary Key Primary Key
Column Name Key / Column Name
Column Value Column Value

在Cassandra中,Primary Key包括partition key 和 cluster key两部分,其中cluster key可选,partition key确定数据行分发到哪个node,cluster key用于node内部数据排序。

对于每一个column family,不要想象成关系型数据库的表,而要想像成一个多层嵌套的排序散列表(Nested sorted map)。这样能更好地理解和设计Cassandra的数据模型。

散列表可用提供高效的键值查找,排序的散列表可提供高效的范围查找,在Cassandra里,我们可以使用primary key和column key做高效的键值查询和范围查询,而且,在Cassandra中,列的名称可以直接包含数据,也就是说,有的列可以只有列名没有列值。

Map<RowKey, SortedMap<ColumnKey, ColumnValue>>

CQL

CQL (Cassandra Query Language)是用于 Cassandra 的查询语言,可类比用于关系型数据库的SQL,注意,虽然CQL 和 SQL 看起来比较相似,但二者内部原理完全不同。

举个例子

搭建Cassandra

学习Cassandra时搭建环境最简单的方式是使用docker,可以参考镜像

例子

如下图所示,首先创建keyspaces,然后创建table,往table中插入数据,再查询该table。

例子

总结

本文简单介绍了Cassandra,并举例说明了基本的使用。下一篇将介绍Cassandra的数据模型。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1基本安装1.1在基于RHEL的系统中安装Cassandra1.1.1必要条件Ø YUM包管理器Ø Root或...
    战神汤姆阅读 4,711评论 0 4
  • 转载,觉得这篇写 SQLAlchemy Core,写得非常不错。不过后续他没写SQLAlchemy ORM... ...
    非梦nj阅读 10,847评论 1 14
  • Apache Cassandra 是一个开源的、分布式、去中心化、弹性可扩展、高可用性、容错、一致性可调、面向行的...
    梁睿坤阅读 14,781评论 2 25
  • 我每天都去南风广场玩,每天都能碰到小胖机器人。 小胖机器人是一个胖胖圆圆的机器人,我觉得它像一只白...
    小笋芽晋梓鑫阅读 3,564评论 0 0
  • ubuntu环境首先确定是否安装了Git管理工具 我选择SSH方式,比较安全方便,只需一次配置1- 使用ssh命令...
    shone阅读 4,719评论 0 6

友情链接更多精彩内容