欢迎大家关注 生信菌 公众号,后续内容会同步发布到微信公众号。
前言
又到了一年一度的毕业季,今年学术圈学术不端的大瓜不少,明星翟博士事件也是煽风点火,疫情使得本来就“不富裕”的论文雪上加 霜! 。今年各个院校都加大了论文查重力度,有的学校要求5%甚至更低。我所在的院校的要求是10%,虽然没有5%那么苛刻,但对于生物类学生来说,也是困难重重。
废话不多说,根据自己查重的一些经历和网上经验,跟大家分享一些经验。
1. 查重用的是什么系统?怎么选择?
大部分高校使用的是知网系统,但是,知网不提供个人检测,所有能检测的地方都是商家,根本不存在所谓的 “官网检测” 。非官网并不是不准确,某宝上的系统大多是通过渠道利用高校名额进行检测,这个还是比较准确的。个人猜测也有大佬可以copy知网库进行检测(但是检测算法要做的一模一样不容易),这个就不好说了。
目前网上比较流行的系统的敏感度:知网<万方<维普<paperXX ,也就是说知网的算法相对来说比较友好,但是并不意味着敏感度和最后的重复率是正相关的,毕竟库不一样,应该以最后学校同系统库检测为准。
目前知网中有各种检测库,目前硕博士论文检测的库是 VIP5.3 系统。
各种库中含有的论文不一样,所以大家根据自己的版本进行选择。
个人建议,先用分解系统或者paperXX查询初稿(便宜),根据结果降重后最后使用VIP5.3库进行最后的查询。
2.价格咋样?需要查哪些内容?安全不?
某宝上知网分解系统X元-5X元不等。硕博士论文论文系统1XX-2XX不等。paperXX系列1.X/千字。鱼龙混杂,自己分辨吧,我初稿用的是X元的分解系统(不要找我要链接,我怕最后不准你们打我)。
查询内容包括绪论到结论部分,不含参考文献。初稿的话建议只放文字,不要表格、图片和英文图注。尤其是引物序列!不要放,查重是按照字符算钱的!
安全不安全谁也不能保证,因为毕竟是把文章上传到了别人的系统上,如果有特别保密的内容的尽量还是等学校最后统一的查询吧。但是因为你去除了表格、图片,生物类的文章如果没有数据支撑,个人感觉别人把文字拿去也做不了什么(除非你的idea特别新!)。
3. 查询结果怎么看?
这里以我的结果为例,我是利用某宝X元的系统查询的初稿(穷学生,都是按价格排序选的)。
总的文字复制比:这个就是重复率了,硬指标。
跨语言检测结果:可以忽略,因为现在知网收录的外文文献还是比较少的,而且你是用中文写的,不太可能有很大的重复率。
去除引用文献复制比:没啥卵用。就是去掉这篇文章引用文献内容后的比例,知网一般是识别标注引号的内容。 这个比例没啥卵用是因为无论是否引用,都会算重复率,不能说你标注了引用,这段话就不会算重复率了。
去除本人已发表文献复制比,是去除和自己发表文章重复的内容后的比例。 查重时需要输入你的名字,所以根据这个会把你发表文献中的比例去除掉,大部分学校是以这个为标准进行最后计算的。
这里要主要一点, 去除本人已发表文献复制比,这个是只把和你小论文里唯一匹配的去掉,如果你的内容既和你自己也和其他人的论文有重复,这部分是不会减去的。
举个例子,如下图,这段重复和我自己的文献有很大重复,所以大部分是会被去除的,但是,也有一小部分内容是不会被去除的,因为它和大学生联合库里的其他论文是有重复的。
所以总的来说,看总的文字复制比和去除本人已发表文献复制比。学校以哪个为准就是按照哪个算。
后记
先给大家看看哪里是重复的重灾区,后续我将论文降重下来后再发一些自己降重技巧。
重灾区1:特定的名称和英文。
根据学校要求,第一次出现的重要简写和英文全称必须写上,结果就是这个样子,超长的名字+英文=重复,这就很尴尬!
重灾区2:材料
这个更难受,按要求的话试剂盒名称和型号都必须写上,这部分基本废了,很难说你用到的材料试剂别人没有过!
重灾区3:方法
你说PCR怎么写出花来?