0. 目录
- 摘要
- 背景
-
- 分析思路
- 3.1 查看相关学科
- 3.2 时间维度,查看心理学的发展历史
- 3.3 找到领域内的大牛
-
- 通过知网心理学博士论文看国内心理学研究
- 4.1 从时间维度分析
- 4.2 空间维度分析
- 4.3 变量关系
- 4.3.1 按相关学科统计
- 4.3.2 分析词频
- 5.通过中国社会科学引文索引分析
- 5.1 下载论文
- 5.2 使用citespace分析知识图谱
- 6.结论
1. 摘要
本文记录了使用批量下载论文,时间空间维度分析,变量关系分析,知识图谱分析等方法,了解“心理学”学科的发展,以及国内心理学研究的主要院校等宏观信息。本分析耗时14小时左右,主要使用知网论文索引,google学术论文索引,cssci学术论文索引作为原始数据进行分析。了解到心理学在国内是个年青的学科,心理学研究具有 注重人类行为的真实呈现,注重实验等特点。
2. 背景
本文的目标是对心理学产生全局认识。ch2的知识点非常多,其中批量下载论文和zotero的使用已经比较熟练了,希望通过使用citespace等工具探索更多未知领域。由于时间限制,未使用抽样阅读法等方法阅读论文,而是使用citespace和词频分析工具等对论文数据进行汇总分析。
3. 分析思路
3.1 查看相关学科
- 在美国高等教育的学科分类中查看心理学相关的学科分类
- 如上图:心理学是第42号大学科,没有上级学科,心理学的下级学科有,心理学相关学科,社会学相关学科,医学相关学科,教育相关学科,管理相关学科。
- 在分类中心理学没有上级分类,说明心理学已经成为一个独立的大学科。
- 这里的启发:通过简单的材料也能得出有用的结论。
3.2 时间维度,查看心理学的发展历史
- google 搜索 “Timeline of psychology”。
- 查看维基百科心理学时间表,心理学是在1880年后开始蓬勃发展的。标志性事件是 :1882年 心理研究学会在英国成立。心理作为学科的历史大概140年左右。
3.3 找到领域内的大牛
- google学术中直接搜索 psychology得到的东西比较杂乱,只下载了前100篇。
- 搜索psychology领域的大牛们
- 下载排名前5的大牛的论文
- 因为google学术论文不好下载,半途走开去写了个小工具,抓取google学术列表页面。
zotero抓取google学术,只抓取列表页面信息 - 排名前5的大牛有:
Albert Bandura, h 指数 191
Sigmund Freud, h 指数 261
Richard M Ryan, h 指数 165
Donald B Rubin, h 指数 128
Edward L. Deci, h 指数 142 - 用上面说的工具,不到一个小时下载了这5个大牛的所有论文,共6000篇
- 由于时间关系,先不做阅读,论文留到下个作业用继续使用
4. 通过知网心理学博士论文看国内心理学研究
- 知网有博士论文 1,243 篇,刚好达到1000篇的要求。
- 下载1,243篇论文,导入zotero
- 单从这1000 篇论文分析得出的结论会很片面,所以需要很多交叉验证。
4.1 从时间维度分析
如上图,心理学的高级研究是从2000年以后开始的,心理学在中国是个非常年青的学科。
4.2 空间维度分析
-
写了个脚本统计所有论文所属的大学,用于计算心理学的空间分布(代码在文章最后)
image.png - 如上图,心理学博士论文产出最多的院校是化东师范大学,西南大学。其他产出比较多的学校有浙江大学,天津师范大学,吉林大学,南京师范大学等。
- 其中大部分是师范类院校,而少有医学类院校,从这点可以看出,心理学与教育领域关系最为密切。
- 为了更形象地展示空间分布特性,找一个可以绘制地图上省份热度的工具[1]
image.png - 国内心理学高级的研究主要在中部地区的重庆,湖北;东部地区的上海,江苏,浙江,等地区。
4.3 变量关系
4.3.1 按相关学科统计
- 如上图,心理学与教育,哲学,医学,企业管理,政治,等领域关系密切。
- 心理学与教育领域关系最为密切。
4.3.2 分析词频
- 由于信息量太大,先用简单粗暴的方式,把1200篇论文的标题,进行中文词频分析[2]
image.png -
如上图,出现频率最高的100个词,去掉完全没用的。
image.png - 如上图,出现最多的词是:认知,情绪,记忆,神经,自我,实验,健康,青少年,大学生,等。可以看出,心理学的研究:
- 注重人类行为的真实呈现,注重实验。(实验,实证,行为)
- 研究对象多为儿童,青少年,大学生。(儿童,青少年,大学生)
- 注重人的主观感受和情绪。(情绪,视角)
- 关注类的认知,记忆,阅读等个人能力。(认知,记忆,阅读,视觉)
- 研究主题多与神经,自我 ,人格 相关。(神经,自我 ,人格)
- 受社会和文化等客观环境因素影响。(社会,文化)
- 多在在教育,管理,健康等领域进行实践。(学习,决策,健康)
5.通过 中国社会科学引文索引[3]分析
5.1 下载论文
- 在某宝买了个山寨帐号,下载论文
-
cssci 选择内容的时候不能一次清空全部,可以退出重新登录来解决,筛选条件还在。
image.png - 如上图,筛选条件为:心理学,论文,《心理科学》期刊,1998-2019年,共有5243个结果。
- 分析重点是使用citespace分析知识图谱,为了保证取样完整,把5200篇论文全下载了。
5.2 使用citespace分析知识图谱
-
citespace是个看上去很难很高大上的东西,导入论文进行测试。
image.png
image.png -
查看关键词
Modularity Q=0.94
Mean Silhouette=0.41
image.png
网络成瘾,效度,外显学习,内隐联想测试,相似性,孤独感,心理弹性,压力性生活事件。
image.png - 图片看起来有点奇怪。比较难得出有用的结论。
- citespace 水很深,弄了几个小时几能弄成这样了,还要继续学习。
- 这里的启发是:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。
结论
- 心理学在全世界是个很大的学科,心理学的的发展从1880年左右开始,到现在有140年左右。
- 心理学的资料相对开放,在各权威学术网站上均能找到大量的资料。完成本文的过程中共下载了13000多篇论文索引。
- 在中国心理学是从2000年左右开心蓬勃发展的,是个非常年轻的学科。国内心理学专业很好的院校有东师范大学,西南大学,浙江大学,天津师范大学,吉林大学,南京师范大学等。在西北部发展相对落后。
- 心理学注重人类行为的真实呈现,注重实验。研究对象多为儿童,青少年,大学生。注重人的主观感受和情绪。关注类的认知,记忆,阅读等个人能力。研究主题多与神经,自我 ,人格 相关。受社会和文化等客观环境因素影响。 多在在教育,管理,健康等领域进行实践。
- 心理学学科的研究主题非常丰富,学科分支很多,且与其他学科有大量交集,应用领域非常广泛。
- 启发1:通过简单的材料也能得出有用的结论。
- 启发2:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。
引用
[1]绘制地图上省份热度的工具
[2]中文词频分析
[3]中国社会科学引文索引
源码
- 这是一个php程序脚本,用来分析知网博士论文,按学校和作者统计总数量。
<?php
$count = $count2 = [];
for( $i=1;$i<=25;$i++){
$data = `curl -s 'http://kns.cnki.net/kns/brief/brief.aspx?curpage={$i}&RecordsPerPage=50&QueryID=6&ID=&turnpage=1&tpagemode=L&dbPrefix=CDFD&Fields=&DisplayMode=listmode&SortType=(%e8%a2%ab%e5%bc%95%e9%a2%91%e6%ac%a1%2c%27INTEGER%27)+desc&PageName=ASP.brief_result_aspx&isinEn=0' -H 'Connection: keep-alive' -H 'Upgrade-Insecure-Requests: 1' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36' -H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' -H 'Referer: http://kns.cnki.net/kns/brief/brief.aspx?curpage=7&RecordsPerPage=50&QueryID=6&ID=&turnpage=1&tpagemode=L&dbPrefix=CDFD&Fields=&DisplayMode=listmode&SortType=(%e8%a2%ab%e5%bc%95%e9%a2%91%e6%ac%a1%2c%27INTEGER%27)+desc&PageName=ASP.brief_result_aspx&isinEn=0' -H 'Accept-Encoding: gzip, deflate' -H 'Accept-Language: zh-CN,zh;q=0.9' -H 'Cookie: UM_distinctid=16870f3bd12b8-0ac3ae851afe03-8383268-144000-16870f3bd1313e; cnkiUserKey=e71f427b-3fe0-0e07-ed5e-80875e71f320; Ecp_ClientId=5190128232401324274; RsPerPage=50; Ecp_IpLoginFail=19031058.49.22.250; ASP.NET_SessionId=rkvztoo0xlajzdvawzlu4tg0; SID_kns=123122; SID_klogin=125141; SID_kinfo=125103; SID_krsnew=125134; _pk_ref=%5B%22%22%2C%22%22%2C1552371434%2C%22http%3A%2F%2Fwww.cnki.net%2F%22%5D; _pk_ses=*; DisplaySave=15; KNS_SortType=CDFD%21%28%25e8%25a2%25ab%25e5%25bc%2595%25e9%25a2%2591%25e6%25ac%25a1%252c%2527INTEGER%2527%29+desc' --compressed`;
$regex = "/cdmdNavi\">([^<]+)</";
// echo $data;
preg_match_all($regex,$data,$re);
foreach($re[1] as $v){
@$count[$v]++;
}
if(count($re[0])>0){
echo "page {$i}:",count($re[1]),"\n";
}
else{
echo $data;die;
}
$regex2 = "/knet\">([^<]+)</";
// echo $data;
preg_match_all($regex2,$data,$re2);
foreach($re2[1] as $v){
@$count2[$v]++;
}
if(count($re2[0])>0){
echo "page {$i}:",count($re2[1]),"\n";
}
else{
echo $data;die;
}
}
foreach($count as $k=>$v){
echo $k,',',$v,"\n";
}
foreach($count2 as $k=>$v){
echo $k,',',$v,"\n";
}
changelog
2019-03-10 创建,写了一小半,中间出去写了段代码,太喜欢这个作业了
2019-03-12 搜不动了,搜的东西太多了,头要炸了。论文存得太多,zotero也要炸了。
2019-03-12 主要使用citespace分析论文。先试了知网的,不能出图,再试cssci。感觉citespace水非常深,需要深入学习后才能用得得心应手,浅尝了一下还不得要领。无论怎样还是先完成作业,根据分析数据得出一些比较有用的结论。接下来几天去做进阶作业2。