关注我们科研菌的小伙伴,大部分都是生信的爱好者。有的已经通过生信发了不少的文章了。科研菌学术群里的小伙伴隔三差五的都在催我们出一套非肿瘤数据挖掘的课程,用他们的原话说就是“看着肿瘤发文章灌水,眼馋!”。
机缘巧合下,科研菌和丁香园达成合作准备在今年9月出一套“非肿瘤数据挖掘”的课程。关于非肿瘤数据挖掘的课程,我们从4月份就开始筹备了,到现在前前后后准备了4个多月的时间,总算是从提纲、代码和视频录制,搞定了。
链接地址:https://class.dxy.cn/clazz/course/795?sr=1&nm=hywxq&dt=20200903&pd=class&pm=hanxy
我想知道,还有小伙伴不知道数据挖掘有多好吗?
不用苦哈哈地做实验,不用一点一点收集病例资料,也不用担心评职称时医院3不认,实在是忙碌的医务工作者们发文的一项神技!
但说到数据挖掘,大家第一反应都觉得是肿瘤相关科室做的东西,那其他科室就没法通过数据挖掘发表 SCI 了吗?
当然不是!这些科室也能做数据挖掘!
GEO 数据库中有多少非肿瘤数据集?
GEO(Gene Expression Omnibus)数据库是数据挖掘必备的数据库之一,收录了世界各国研究机构提交的高通量基因表达数据,几乎所有已发表文章的高通量数据,都会关联到这个数据库中!
考虑到大部分同学挖掘数据的目的还是针对于转录组数据的,那么我们把关键词设定为 「 RNA NOT (cancer OR tumor OR carcinoma) 」,检索以后我们发现了 75692 个 series。
肿瘤相关的数据集又有多少呢?我们把关键词改为 「 RNA AND (cancer OR tumor OR carcinoma) 」搜索后,搜出来 32009 个 series。
非肿瘤的数据集是肿瘤数据集的 2 倍还多,但是数据挖掘的产出的文章量却少了很多,这意味着什么呢?
非肿瘤类目中还有很多资源等待挖掘!
目前肿瘤科僧多粥少,需要特别创新的思路或者强大的分析方法,才能得到期刊的青睐。
然鹅,很多非肿瘤方向由于相关研究很少甚至是空白的,完全可以借鉴肿瘤文章的优秀思路来分析自己挖到的数据,不做实验、快人一步发表属于自己的 SCI !