数据元概念
数据元概念(data element concept DEC)是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由对象类和特性组成。如下图左侧:
数据元
数据元(data element,DE)
数据元是一组属性规定定义、标识、表示和允许值的数据单元。数据单元是信息的基本单位,例如住院病案首页中的病案号、姓名、入院诊断、主要诊断等都是基本的数据单元,为数据单元赋予属性就称为数据元。数据元的目的是建立标准化的数据表达、采集、存储和传输格式,以实现数据的正确表达和理解。在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。数据元是卫生信息的最基本的结构化(标准)单元,每一项医疗卫生业务信息都可由若干数据元组成,例如一张标准格式的病案首页就由100多个数据元组成。围绕一定业务主题形成的数据元集合称为数据集,数据元的实际应用通常是以基本数据集的形式实现的。
一个数据元由数据元概念和表示组成,其中表示描述数据的形式,包括值域、数据类型、表示类(可选的),必要时还包括计量单位。如下图右侧:
示例一:数据概念+值域;
【数据元】黄疸部位代码表
【数据概念】黄疸部位,黄疸是对象词,部位是特性词。
【值域】代码表是表示词。
示例二:数据概念+计量单位;
【数据元】儿童体检年龄(月)。
【数据概念】儿童体检,儿童是对象词,体检是特性词。
【值域】年龄(月)是表示词。
数据元基本模型
数据元的基本模型是由数据元概念和数据元两部分组成。
数据元概念与数据元关系
一个数据元由数据元概念和表示组成。
一个数元概念对应多个数据元。
对象
对象类是可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合。
它是我们希望采集和存储数据的事物。对象类是概念,在面向对象的模型中与类相对应,在实体-关系模型中与实体对应,
例如,患者、医生、卫生机构等。对象类可能是一般概念。当对象类所对应的对象集有两个或多个元素时,就是一般概念。患者、医生、卫生机构等都是一般概念对象类也可以是个别概念。
当对象类对应的对象集仅有一个元素时,就是个别概念,例如“北京市医疗机构”就是个别概念。
特性
特性是一个对象类的所有成员所共有的特征。它用来区别和描述对象,是对象类的特征,但不一定是本质特征,它们构成对象类的内涵。特性也是概念,对应于面向对象模型或实体-关系模型中的属性。
例如身高、体重、血压、脉搏、血型等。特性也可是一般概念或个别概念。作为个别概念的例子有:病床总数或医疗收入。
卫生健康信息数据元是卫生这一特定领域的数据元,它的概念和结构遵循通用数据元的概念和结构,但具有自身的特点。医药卫生领域包括基础医学、临床医学、公共卫生、中医药学等多个专业,其数据元的表现形式复杂,例如数字人体、医学影像、基因图谱、中医经络等,除具有通用数据元的属性外,还具有其鲜明的领域特殊性。
数据元值的表示格式中字符含义描述规则
数据元值的表示格式中字符长度描述规则
应用示例:
示例1:S字符型
AN10 固定为10个字符(相当于5个汉字)长度的字符。
AN..10 可变长度,最大为10个字符长度的字符。
AN4..10 可变长度,最小为4个最大为10个字符长度的字符。
AN..20X3可变长度,最多3行每行最大长度为20个字符长度的字符。
示例2:N数字型
N4固定长度为4位的数字。
N..4最大长度为4位的数字。
N6,2最大长度为6位的十进制小数格式(包括小数点),小数点后保留2位数字。
示例3:T日期时间型
T8采YYYYMMDD格式(8位定长)显示年月日。
T15采用YYYYMMDDThhmmss格式(15位定长)表示日时分秒。时分秒之前加大写字母“T。
如2010年1月5日8时10分9秒为20100105T081009。
资料参考:
WS/T 303-2023 卫生健康信息数据元标准化规则
WS/T 363.2-2023 卫生健康信息数据元目录 第2部分:标识