可汗学院统计学学习笔记(1)1-16集

本系列文章为可汗学院统计学的公开课笔记,视频地址:http://open.163.com/special/Khan/khstatistics.html
视频讲的很入门浅显,挺好的

第一集:均值 中位数 众数

均值:平均数,算数平均数
均值计算:所有数字相加之和除以数字的个数
均值的意义:衡量集中趋势的方法
中位数:中间的数
中位数计算:奇数个数据为中间值,偶数个则中间两个值的均值
中位数意义:衡量集中趋势的另一种方法,是一个数字描述中间的一种方式。
众数:数据集中出现频率最多的数字

第二集:极差 中程数

极差:指的是数据集中数字分开的有多远
极差计算:数据集中最大的数 - 数据集中最小的数
极差意义:极差数值越小,数字之间就越紧密
中程数:最大数和最小数的平均值(算术平均值)
中程数意义:衡量数据的集中趋势

第三集:象形统计图

象形统计图是用象形图像表示数据的一种方式


示例图片

第四集:条形图

示例图片

第五集:线形图

线形图可以用于随时间变化的事物


示例图片

第六集:饼图

示例图片

第七集:误导人的线形图

两张线形图对比时纵坐标或横坐标的刻度设置应该以统一标准进行,不然容易产生误导。


示例图片

第八集:茎叶图

叶表示最右边的位/各位,茎代表其它位,如十位,下图很好表现了球员得分在分布中的位置以及整体数据的分布状况


示例图片

第九集:箱线图

箱线图/盒须图是为了体现中位数和散布情况
核须图会展现数据非散布情况,按照四分位进行划分,它能显示出数据的中位数在哪
首先需要对数据集中数据进行排序,找出数据集的中位数M
其次需要找到小于中位数各数的中位数M1(下四分位数)以及大于中位数各数的中位数M2(上四分位数),此时相当于将数据集划分为四个子集,盒须图是这个划分的图像表示
作盒须图大的第一件事就是显示所有数据的范围

示例图片

第十集:箱线图2

示例图片

第一四分区间/1Q…………

第十一集 统计:集中趋势

统计学分类 Statistics
描述统计学 descriptive statistics 假设有一个数据集,在不告诉别人所有数据的情况下介绍这些数据的情况,通过一些指示性数字来代表所有的数据,而无需将所有的数据都说一次。
推论统计学 inferential statics 运用数据来对事物做结论,假设从总体中得到了一些样本,只需对样本进行一些数学计算,便有可能推断出整体的总体情况
下面先从描述统计学入手:
如果提供一组数据需要我们对其进行描述,我们可能需要找到其中最能代表这组数据的个别数字,或者是一些能体现集中趋势的数字
广义的平均数:描述集中趋势的某特定数值 Average/最能代表一组数据的某个值 ,不是均值 / mean
这个广义的平均数可以是均值、中位数或众数
因为离群值的干扰,有时候众数或中位数比均值更能反应数据的集中趋势/描述这组数字

第十二集 统计:样本和总体

希腊字母μ代表总体均值 X上加一横表示样本均值

第十三集 统计:总体方差

方差记作 δ^2,即δ的平方
方差是为了更好的理解数据结构,在不放出全部数据的情况下描述数据总体
总体方差计算公式:(∑(x(i) - μ)^2) / N
直观来说,方差和标准差都可以用来衡量数据集中的数据点距离均值的远近程度

第十四集 统计:样本方差

Sn^2 为样本方差记号,下标n表示样本数为n个
Sn^2 = ∑(x(i) - 样本均值)^2/ n
上述的样本方差通常会低估总体方差,更好的总体估计方差(无偏方差)计算如下:
S(n-1)^2 = ∑(x(i) - 样本均值) ^2/ (n-1)

第十五集 统计:标准差

标准差在方差的基础上来看很简单,就是方差的平方根,总体标准差记作δ,样本的标准差记作S
为什么使用标准差
1.标准差的单位更好,比如数据单位为cm,则方差计算结果单位为cm^2,而标准差计算结果单位为cm
2.假设事物分布是钟型曲线,这可以帮助求得事物落在均值一两个标准差范围内的概率

第十六集 统计:诸方差公式

求总体方差公式可以化简为:总体所有数的平方求均值,然后减去总体均值的平方

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容