数据类型
分类数据
定类数据
例如,男/女,黑人/白人/黄种人,同性恋/异性恋。
他们是互斥,无序的。
所谓互斥,是指这些数据的状态不可能同时发生。例如,一个人无法同时是同性恋或异性恋,如果他同时具有二者的性状,则他会归于双性恋/同性恋/异性恋中。
所谓无序,是指性别、肤色、国籍等属性无法排序。
无数的苦难起源于将定序数据人为定类
定序数据
例如,考试打分 A,B,C,D,F
他们是互斥,有序的。
显然,一份考卷不能同时有A和F两个成绩。
注意,成绩是可以排序的。
数值数据
离散型数据·
例如,昨晚发生了5起车祸。
某事件发生次数的最小单位是1。
不存在“昨晚发生0.7起车祸”的可能。
连续型数据
例如,她有1.72米高。
可以这样理解,其实她有1.72013324758925769038576...米高。
她下一秒,有1.72013324758925769038577...米高。
Summary
Categorical data
Nominal data
Mutually exclusive and unordered,e.g. Male/Female
Ordinal data
Mutually exclusive and ordered,e.g. Small/Medium/Large
Numberical Data
Discrete data
Integer values, typically counts,e.g. There was 5 car accidents last night.
Continuous data
Any value in a range,e.g. She is 5 meters tall.