01 赤裸裸的统计学-描述性数据

1.数据分类

原始数据:数据越多,事实越模糊。
描述性数据(统计量):易于理解,简单,但传达的信息却十分有限。

2.问题

(1)哪些是评价棒球天才较重要的数据
(2)美国中产阶级的经济健康状况

3.描述性数据

例如:第二个问题的人均收入
缺点:没有考虑通货膨胀因素。美国人的收入 和 范范的人均收入有本质区别
更想知道各个阶级的

4.为何需要描述性数据

对大量数据进行归纳是处理数据时最基本的任务。描述性数据为我们提供了针对某一现象的可操作、有意义的概括。任何一种简化都会面临着被滥用的危险。(具有误导性)。

5. 描述任务:

  • 某套数据的“中间位置”,集中趋势(平均数、中位数、二四百分位数、正态分布)。
  • 百分差(绝对变化)和百分率(相对变化)的区别

6. 描述性数据特征

  • 所有指数均取决于其构成的描述性数据以及它们的权重,任何一点儿微小的变化都有可能引起结果的改变,因此,即使是最终得到的那个指数,可能是一种情况不完美但有现实意义的,也可能是完全不合理的。

7.问题解答:

  • 评价任何一个非投手运动员的3个最有价值的数据(除了年龄)
    1、上垒率 2、长打率 3、打数

  • 评价美国中产阶级的经济健康状况
    需要了解(通货膨胀调整后的)工资中位数在过去几十年中的变化,建议留意一下第二和第四百分位数人群的工资变化,这群人被认定为中产阶级的高收入和低收入人群。(区分一下:工资和收入是两个不同的概念)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容