1. DynamoDB 支持两种不同类型的主键
分区键 - 简单的主键,由一个称为分区键 的属性组成。
DynamoDB 使用分区键的值作为内部散列函数的输入。来自散列函数的输出决定了项目将存储到的分区 (DynamoDB 内部的物理存储)。
在只有分区键的表中,任何两个项目都不能有相同的分区键值
分区键和排序键 - 称为复合主键,此类型的键由两个属性组成。第一个属性是分区键,第二个属性是排序键。
DynamoDB 使用分区键值作为对内部散列函数的输入。来自散列函数的输出决定了项目将存储到的分区 (DynamoDB 内部的物理存储)。具有相同分区键的所有项目按排序键值的排序顺序存储在一起。
在具有分区键和排序键的表中,两个项目可以具有相同的分区键值,但是,这两个项目必须具有不同的排序键值。
复合主键有着更强的查询灵活性。
2. DynamoDB 支持最终一致性和强一致性读取。
最终一致性读取
当您从 DynamoDB 表中读取数据时,响应反映的可能不是刚刚完成的写入操作的结果。响应可能包含某些陈旧数据。如果您在短时间后重复读取请求,响应将返回最新的数据。
强一致性读取
当您请求强一致性读取时,DynamoDB 会返回具有最新数据的响应,从而反映来自所有已成功的之前写入操作的更新。如果网络延迟或中断,可能会无法执行强一致性读取。
3. 数据分配
如果表具有简单主键 (只有分区键),DynamoDB 将根据其分区键值存储和检索各个项目。
DynamoDB 使用分区键的值作为内部散列函数的输入值,从而将项目写入表中。散列函数的输出值决定了项目将要存储在哪个分区。
要从表中读取某个项目,您必须为该项目指定分区键值。DynamoDB 使用此值作为其散列函数的输入值,从而生成可从中找到该项目的分区。
下图显示了名为 Pets 的表,该表跨多个分区。表的主键为 AnimalType (仅显示此键属性)。在这种情况下,DynamoDB 会根据字符串 Dog 的散列值,使用其散列函数决定新项目的存储位置。请注意,项目并非按排序顺序存储的。每个项目的位置由其分区键的散列值决定。
如果表具有复合主键 (分区键和排序键),DynamoDB 将采用与数据分配:分区键中所述的方式相同的方式来计算分区键的散列值,但会按排序键值有序地将具有相同分区键的项目存储在互相紧邻的物理位置。
4. 数据库查询
DynamoDB 是一个非关系数据库。因此,它不支持表联接。如果您将现有应用程序从关系数据库迁移到 DynamoDB,则需要非规范化数据模型以消除联接需要。
GetItem 操作
DynamoDB 提供 GetItem 操作来按项目的主键检索项目。GetItem 操作非常高效,因为它提供对项目的物理位置的直接访问。
扫描表( Scan )
在 SQL 中,不带 WHERE 子句的 SELECT 语句将返回表中的每个行。在 DynamoDB 中,Scan 操作可执行相同的工作。Scan 操作还提供一个 FilterExpression 参数以丢弃您希望不在结果中出现的项目。在扫描整个表后且结果返回给您之前,应用 FilterExpression。 (建议不要对大型表这样做:即使仅返回几个匹配项目,您仍需为整个 Scan 付费。)
查询表( Query )
SQL SELECT 语句可让您查询关键列、非关键列或任意组合。WHERE 子句确定返回的行,DynamoDB Query 操作可让您以类似方式检索数据。Query 操作提供对存储数据的物理位置的快速高效访问。
可以将 Query 用于任何具有 复合主键 (分区键和排序键) 的表。您必须指定分区键的相等条件,并且可以选择性为排序键提供另一个条件。
KeyConditionExpression 参数指定要查询的键值。可使用可选 FilterExpression 在结果中的某些项目返回给您之前删除这些项目。
在 DynamoDB 中,您必须使用** ExpressionAttributeValues** 作为表达式参数 (例如,KeyConditionExpression 和 FilterExpression) 中的占位符。这类似于在关系数据库中使用绑定变量,其中,您在运行时将实际值代入 SELECT 语句。