一、数据分析类常见问题
Q1论文为什么选择这个研究方法or模型?
如果论文中含有实证部分,那么实证分析中所用的方法/模型是导师们最喜欢提问的超高频问题。包括研究方法/模型的基本含义、算法原理、计算方式、与论文的适配情况等。
回答方向:
首先表明自己是在阅读总结了大量的相关参考文献,充分了解xx研究方法/模型的原理、作用之后,结合自己课题的研究目的,对比相同研究领域的多个方法后,才决定采用xx方法对自己的论文进行研究的。然后结合论文实证分析的内容,介绍该方法是如何应用在自己的研究中的。
这就要求你一定要对自己论文所用方法的基本原理、以及分析步骤有一定的了解,最好能用简短的几句话概括出自己对该方法的理解。有关分析方法的原理,可以在答辩前,拿出5分钟的时间阅读SPSSAU帮助手册内容,就可以大概了解每一种分析方法原理以及需要注意的关键点,而这些同时也是导师比较爱提问的点。
二元logit回归分析帮助手册示例:
Q2你如何理解论文中的某个研究方法?
这个问题的答案导师想听的一定不是书上的定义或者百度百科上拗口的解释,他想听到的一定是你自己对于该方法的认识以及理解,最好使用大白话进行解释。
回答方向:
百度百科对于因子分析的解释如下:
你可以参考SPSSAU帮助手册说明这样回答:
Q3论文数据是否可靠?是如何得到的?
如果不是纯纯纯文科生,那么论文中肯定或多或少都会有用到数据,不可能一点数据都没有。如果用到了数据,那么数据的收集和处理也都是导师喜欢提问的高频问题。
回答方向:
如果数据是自己收集的,那么如实回答即可。比如常见的收集数据方式有统计局官网等网络调查法收集整理的数据、通过问卷方式收集的数据、通过访谈调研等方式收集的数据。此类情况表述清楚即可。但是如果数据来源“不详”,那么一定要确保能够“自圆其说”,有些小改动老师可能看不出来,但是错误极其明显的,还是不要抱有侥幸心理,还想蒙混过关,所以答辩前务必自己再检查数据一遍,做到心中有数。
Q4论文样本、变量等指标是如何选取的?
样本、变量等指标选取问题,肯定不能是自己拍脑袋确定的,一定要有相关文献支撑。比较常见的问题是指标的选取是否做到完整、没有遗漏、样本选择是否合理、是否考虑了控制变量等。
回答方向:
表明自己是在查阅了相关文献后,才确定了论文中所用的几类指标。(小技巧:文献综述部分一般都会写相关方向的一些研究,可以在回答时结合文献综述部分进行举例说明,导师不会一个一个去核实文献中是否含有你所说的的变量)。但是能做每个指标的选取都有理有据是最好的。
Q5数据中异常值、缺失值等是如何处理的?
与论文数据相关的提问,除了数据的收集之外,另一个比较提问的点就是数据处理相关问题。包括数据预处理、异常值、缺失值、无效样本的处理、论文所用研究方法中数据的处理方式等几个方面。
回答方向:
可以先简单介绍一下论文收集数据中是否有异常值、缺失值、无效样本,以及各自所占的比例情况。然后针对异常值进行了怎样的处理、针对缺失值进行了怎样的处理。可以查看SPSSAU有关异常值和无效样本的帮助手册说明。
有关研究方法中数据处理方式的说明,例如熵值法通常需要进行正向化逆向化处理。可以查看相关帮助手册说明。
Q6实证分析相关专业知识的提问?
如果遇见实证分析相关专业知识的问题,那么对同学们就是比较困难的了。一般遇到这样的提问,说明你的实证部分是存在一些明显的错误的。如果在论文中比较完整介绍了实证分析的过程并且没有明显错误时,通常导师不会再提问的。
回答方向:
在答辩之前,仔细检查自己论文的实证部分,包括文字表述、操作步骤、计算公式、分析结论等是否有存在可能出错的部分,或者前后结论矛盾等非常明显的错误。如果答辩时遇到此类提问,自己不太有把握能回答的:可以试着能回答多少是多少,简单地说明自己的理解,争取导师的提示,巧妙应对。如果一点思路都没有、没办法回答的:应该大大方方的承认自己确实对这个问题没有研究清楚,并表示后面一定会认真研究这个问题。绝对不可以吞吞吐吐、抓耳挠腮、强词夺理地进行狡辩,会给导师留下非常不好的印象。
Q7论文中相关专业名词解释的提问?
需要你解释的相关专业名词一般都是你的论文中出现的。可以自己去看论文中哪些名词你不知道如何理解且可能和你专业相关的,稍加准备。
回答方向:
比如因子分析中有很多的专业名词,如KMO、Bartlett球形度检验、特征根、方差解释率等。这类研究方法中的专业名词也可以查看SPSSAU帮助手册说明,帮助手册中对于每一个第一次出现的名词都会提供通俗易懂的解释说明,帮助大家理解。如下图:
Q8图、表的格式、内容是否符合学术规范?
学术论文对于图、表的要求都比较严格。通常表格都是标准的三线表格式,表格所包含的内容也应该符合学术规范,知道什么需要展示,什么不需要展示。
回答规范:
首先说明论文是通过使用SPSS、SPSSAU、Excel、Stata等主流分析软件得到的分析结果,并且参考了相关文献的规范格式后进行整理输出的,是符合学术规范的。
如果你是用SPSSAU进行的数据分析部分,那么得到的分析表格和图片都是完全符合学术规范的。如果不是用SPSSAU进行分析的,那么也可以参考SPSSAU的输出结果进行三线表分析结果的整理。输出分析结果示例:
Q9数据分析使用什么软件进行的?
如果问到数据分析部分是使用什么软件进行的,那么基本就是答辩的送分题了,如何回答即可。目前比较本科生阶段常用的数据分析软件主要有SPSS、SPSSAU、Stata、Excel等。只要不是太小众的,无法保证数据分析结果准确性的软件即可。
二、常用方法的相关问题举例
Q1方差分析需要满足的前提条件有哪些?
从理论上讲,方差分析有两个前提条件,一是因变量Y需要满足正态性要求,二是满足方差齐检验。如果不满足,此时可使用【非参数检验】进行差异性研究。也有文献提及可将数据进行转换后使其更加接近或符合正态性,然后继续使用方差分析,所以可尝试进行数据转换,一般是对数据进行比如求对数,开根号等处理。理论上的正态分布并不存在,数据接近于正态分布更符合实际情况,因此接近正态分布的数据直接使用方差分析即可。
Q2线性回归模型是否考虑了多重共线性问题?
在多元线性回归模型中,自变量X之间线性相关的现象被称为多重共线性。如果两个自变量之间相关系数较大且接近1,则可认为回归模型中存在多重共线性问题。相关系数检验法可作为初步判断共线性的一种方法。VIF值是方差膨胀因子,反映了自变量是否存在多重共线性,可以衡量多重共线性的严重程度。一般认为VIF值大于10,则存在多重共线性问题(严格大于5)。
Q3非标准化回归系数与标准化回归系数有何区别?
非标准化回归系数:构建回归模型使用非标准化回归系数,它是方程中不同自变量对应的原始回归系数,反映了在其他自变量不变的情况下,该自变量每变化一个单位对因变量作用的大小。通过非标准化回归系数构建的回归方程,才可以对因变量进行预测。
标准化回归系数:自变量对因变量影响大小的比较是通过标准化回归系数进行比较的。标准化回归系数,是对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性。
Q4量表的可靠性怎么保证?
通过信效度分析确保量表的可靠性。信度分析用于测量样本回答结果是否可靠,即样本有没有真实作答量表类题项。 克隆巴赫信度系数如果在0.8以上,则该测验或量表的信度非常好;信度系数在0.7以上都是可以接受;如果在0.6以上,则该量表应进行修订;如果低于0.6,量表就需要重新设计题项。
效度分析用于测量题项(定量数据)设计是否合理,通过探索性因子分析方法进行验证;心中预期的变量与题项对应关系,进行因子分析后,因子与题项对应关系二者预期基本一致时,则说明具有良好效度水平。
更多问题可以参考相关研究方法SPSSAU的帮助手册说明。
三、答辩流程
①自我介绍
(包括性别、专业等,自我介绍时要举止大方、态度从容、礼貌得体。)
②答辩人陈述
(结合PPT进行论文陈述,包括论文题目、研究背景、选题目的及意义、实证分析过程、研究结论等)
③提问答辩
(答辩教师在答辩人自述完成后,针对论文内容进行提问,一般由浅入深进行提问,有问有答,采取答辩人当场作答的方式。)
④结束致谢
(答辩完成后,答辩人进行致谢,感谢导师们在毕业设计及论文写作方面给予的帮助,致谢完成后退场。)
⑤评定成绩
(所有参加答辩的学生逐一完成答辩后退场,答辩会结束。然后答辩教师举行会议,对毕业论文质量和答辩情况进行评定,最终拟定答辩成绩及评语。)
四、总结
- 在答辩之前,对照SPSSAU帮助手册,仔细看一遍论文中涉及的分析方法相关知识;
- 一定要对自己论文所用的方法、理论做到心中有数,导师提问不会脱离你的论文内容;
- 会回答的,有把握讲清楚的:可以大方简单说明理由进行答辩;
- 不太有把握讲清的、模棱两可的:可以尝试进行回答,争取导师提示,巧妙应对;
-
完全不会的:大方承认自己对该问题尚未研究清楚,后面会仔细研究。
答辩终极秘籍:
“只答不辩,问就道歉。”
道歉公式=感谢导师指出+承认自己不足+后期改进方法