在Udacity学商业数据分析(描述统计学)

第一部分--认识数据

定量

定量数据是可以用数字衡量的数据,例如温度、金钱和猫咪的抓痕数。你可以将定量数据分成两组:连续数据和离散数据。离散数据只能包含特定的值。例如,交易售出的商品数量只能是正整数,你不可能购买 2.5 个枕头(或 2.5 只猫!)

连续数据可以是某个范围内的任何值,例如时间、高度或金钱。

定性

定性数据是对事物进行描述的信息,无法用数字量化,例如男性/女性和头发颜色。这些是分类数据,表示属于某个类别和组。通常,你需要按照类别对数据分组并进行对比。

数据还可以是有序数据,例如排名和在问卷调查中看到的主观量表,例如“你觉得炸玉米饼怎么样?”

1 好恶心!

2 不好吃

3 还行

4 好吃

5 很美味!

你有时候会看到有序数据被编号了(1 到 5),但是这些数字并不表示任何含义。

这些是你将看到的典型数据类型。你可能会处理图片或文字,这些内容似乎不符合上述类别。但是大部分情况下,你可以将它们转换为数字或类别。

以下是到目前为止的总结

• 定量

• 连续( 时间、高度、重量、金钱、利率、温度)

• 离散(出售的数量、会的语言数量、昨天收到的邮件数量)

• 定性

• 分类(性别、头发颜色、国家/地区、猫咪品种)

• 有序

• 排名、调查问卷问题,例如“你对猫咪有何感受?”

1 讨厌猫咪

2 不喜欢

3 保持中立

4 喜欢

5 非常喜欢


第二部分---描述数据

四个主要方面用于描述数值变量:

1 集中趋势测量

2 离散程度测量

3 分布的形状

4 异常值

我们看了集中趋势的度量

1 均值

2 中位数

3 众数

我们还看了离散程度的度量

1 值域

2 四分位差

3 标准差

4 方差


异常值

我们学习了异常值对于均值度量的影响较大,而对中位数度量的影响较小。我们学习了应该视情况处理异常值。常用技术包括:

1. 至少注意到它们的存在并确定对概括统计的影响。

2. 如果是输入错误 — 删除或改正

3. 理解它们为何存在,以及对我们想要回答的关于数据的问题的影响。

4. 当有异常值时,报告五数概括法的值通常能比均值和标准差等度量更好地体现异常值的存在。

5. 报告时要小心。知道如何提出正确的问题。


直方图和箱线图

我们还看了使用直方图和箱线图来可视化数值数据。使用可视化方式比使用概括统计能使我们更容易地识别异常值和数据分布的形状。


                                    (以上内容摘自cn.udacity.com 商业数据分析纳米项目)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343