#想写小组S2#30篇_阿檀小倪讲量化笔记

回答:如何进行描述性数据分析?

当所有数据收集回来之后,怎么样对数据进行分析?

小倪分三步骤讲解:数据大通关(讲解基本概念)操作跟着做 图标会解读

示范:

数据大通关

描述性统计研究

什么是描述性统计:

用一种比较简单的方式,呈现和概括一堆数据基本的特征。

常用的描述性统计分三个类别:

频率统计

集中量数

离散趋势

 

频率统计:计算每一种类别里究竟有多少个数据。也就是数数,数多少个。

集中量数:描述一堆数据聚拢的程度。好像要找出沙堆堆积的最高点,常用指标就是平均数,所有数据加起来的和,除以数据的个数。

离散趋势:描述一堆数据分散的程度。比如说:全距,用一组数据中最大值,减去最小数据,所得到的值。全距就描述这堆数据分散得有多宽,有多广。

 

案例:

比较三种不同读物的词汇量,那就把文本中每种等级的词汇,都列出来,就可以了,

所以频率统计是最适合这个研究的。

由于这个研究里每类读物都有28万词汇,人工来不及。

所以就用SPSS。

 

打开SPSS,首先要把分析的数据全都弄进SPSS中,即,录入。

案例中的两位学者用了range对文本词汇按照词频来排序。对于选定的28万个词汇,每个词汇都有一个编码,这就形成了一个变量,我们把这个变量叫做词汇类别。所以这一列数据就是按照单词出现的顺序,依次编码所收集到的数据,出现了一列数据。这里仅举例说明,这13个数据代表这句话里的13个单词。在这个软件最上层选项中,有一个分析按钮。点击分析,看到下拉菜单,每一种就是不同的分析方法。选择描述统计。右边菜单有不同描述统计的方法。本研究要选择频率。出现一个选择框,左边是已有的变量,右边是要进行分析的变量。把词汇类别,从左边拖拽到右边。单击右边的图表按钮。选择直方图,勾选在直方图上显示正态曲线,按继续按钮,回到上层菜单,按确定按钮。

完成数据分析,SPSS自动打开一个结果窗口,看到好几个图表。

 

第一个表:统计量的总体分析,报告一个研究中,所有数据的个数。专业术语叫:样本量。第一行,是有效数据个数,第二行是缺失数据的个数。

案例中两位学者的研究的有效值+缺失值,应该是28万多个。

 

第二个表:词汇类别。(需要重点分析)

第一列,不同类别,1000词库,2000词库,

第二列,每一种的个数。

第三列,它占总样本量的百分比。

第四列,个数占所有有效数据的比例。

第五列,累加百分比

 

1000词汇,总共6个,占所有数据13的46.2%,有效百分比 6/有效数值,因为我们这里举例中没有缺失数值,所以两个百分比一样。如果有缺失数值,通常,有效百分比比百分比略高一点。最后,累加百分比,1000词库6个单词,占46.2%。加2000词库的比例,69.2%左右。就是累加词汇。

案例中研究主要关心有效百分比,即每种词库分别占多少比例,以及从一千到两千到三千词汇,加起来总共的累加百分比,看什么时候能到98%。

 

直方图,用图片方式表示不同类别的个数。

横轴,不同类别

纵轴,个数

比如1000词汇,用1表示,其词汇总共有6个,它所代表的图形方块,就最高。

 

最后一步,就是要把答案呈现给别人,就是呈现结果。

数据分析结果——学术结果报告

 

具体来说,要遵循三个步骤。

第一步:对应问题。即,对应到具体的问题。

第二步:绘制图表。即,根据我们的问题重新绘制图表。

第三步:文字说明。即,给图片配上恰当的文字说明。

 

案例:

第一步:对应问题

研究问题1: What is the vocabulary size necessary to reach 98% coverage of text written for children?

所以我们要回答三种不同的文本中对词汇覆盖率的累加比例

什么时候能达到98%?

 

第二步:绘制图表

不能直接把SPSS的图表贴过去。要重新绘制。有三个要求:

要求:

简单:线条清晰。三线表,表里只有三条线,最上层、第一栏下、最下层

,此外,表里不要再加其他横线和竖线

 

清楚: 行列与符号 过长的词汇用缩写方式,缩写内容要在表格最下面标注。

 

明了:重要信息一定要标记。

当图表中看到达到98%的时候,就要用星号标注出来

 

第三步:文字说明

配合图表,为这些图表配上恰当的文字说明,来解释数字本身没有办法说明的问题。

说明相关数字之间的逻辑关系。

文字解说要进一步指出,

对于儿童读物、大人读物来说,至少需要10000词汇库才能覆盖98%的文本内容

对于外语学习者的分级读物:

只用3000词汇库就能覆盖98%的文本内容

对于前两种材料来说,1000词汇库只能覆盖82%和83.25%

2000词汇,只能接近90%的覆盖率

 

把这些关键数据抽取出来放在一起,加以解说,才能得出结论:

国外儿童读物确实比外语学习者的分级读物,更难一些。

 

案例中的语言表达:

介绍对应的表格

The cumulative coverage, including proper nouns and marginal words for the three corpora, is shown in Table 3.

介绍表里的数值的计算方式 即每个数值是什么含义?

The 83.25% in the top cell of School Journal is the sum of 79.57%()the coverage of the most frequent1,000 words), 3.47%(proper nouns), and 0.21% (marginal words)

列举关键数值,进行对比

Including proper nouns and marginal words, the vocabulary size required to reach 98% coverage was 10,000 word families for the School Journal and the WWC. In contrast, only 3,000 word families plus proper nouns and marginal words was necessary to reach 98% coverage of the graded readers.

 

#

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容