240 发简信
IP属地:浙江
  • 没有看到GQ,只有GERMQ,这个是GQ嘛?

    基因突变检测之Mutect2

    写在前面的话 今天是2021年1月3号,年底一番瞎忙活,停更了好长一段时间的简书。人生中有个很重要伯乐导师告诉我,在这个事多的工作环境下,没人愿意看你太多的废话。直奔重点才是...

  • 生信小工具专题:BBTools/BBMap Suite 的使用 (2)

    接着上一次内容继续介绍,BBTools、BBMap中的一些实用的小工具。 BBMap Read Merger 合并双末端(PE)reads,在预期中这些reads有重叠的位置...

  • 想问一下,就是一个qseqid对应多个taxid的这种,应该怎么处理呢? 应该给它归为哪个物种呢?

    宏基因组之物种注释(基于nr库)

    昨天下午捣鼓了一下宏基因组物种注释过程(基于nr库),现在将整个流程记录一下。软件需求:blast,diamond,taxonkit(安装自行百度) 构建细菌子库 blast...

  • 楼主讨论的这个是不是目标序列是同一条染色体的情况啊,如果目标序列是不同物种的不同序列,而这个指标都一样的情况该怎么办呢?

    我是想看自己的序列与哪个物种最相似,来判断有没有目标菌种存在。这种情况怎么办呀? 请陈老师指教

    「JCVI」如何筛选得到最优blast比对结果?

    JCVI,包含了太多的功能,但是我感觉好像又没有一个特别好的说明文档(小声bb,感谢唐老师的开发的好用工具) blast比对 未过滤的blast比对结果,所使用参数是:-ou...

  • 你好,请问,如果只想返回最好的一个序列结果,比如query3和query1只保留一条最好的。有没有参数设置啊,还是只能自己写代码筛选。

    如果用一致性,覆盖度,比对得分进行排序后,依旧还是有很多序列的排名一样,比如100%匹配,得分都是278. 那么应该再怎么进行筛选呢? 我是想看我的序列有多少条比对到了某个细菌上。我希望一个序列只有一个物种结果,这样就方便后续统计,这种应该怎么办呀?请洲更老师指教

    如何让BLAST返回最优的一个搜索结果,看看你没有有进坑

    大部分时候,我们都是看着别人的教程,然后尝试处理自己的数据,结果跑完了,如果和预期相符合就不会怀疑这个工具有啥问题。如果你要学习生物信息学,那么有一个信条一定要记住,不要盲目...

  • 你好,我想请问,我star比对完的bam文件,我想提取没有比对上的序列,但是samtools view -f 4那个命令不行,不知道怎么提取了。samtools flagstat unmapped_reads.bam说我百分百比对上了,但是实际上我这个样本的比对率只有16%,log文件里提示,短序列比对失败的有40%多。

    比对软件STAR的使用

    在之前的学习和练习里,比对这一步我使用过bowtie2(DNA比对)和hisat2(RNA-seq比对),现在学习另一个很火的软件:STAR。STAR能够发现非典型拼接和嵌合...

  • 你好呀,之前的推送看不到了,有其他平台的,比如公众号吗?如何筛选感兴趣的GO和KEGG进行绘图~这个推送

    KEGG数据库 | 通路结果分类展示

    在做完KEGG通路富集之后,纷繁复杂的通路映入眼帘,略微有些杂乱无章,缺乏一个有序的排列,因此,本推送依据KEGG一级类目,将不同的通路归纳总结,分类排列,使结果更加规整,帮...

  • 您好,想咨询一下,在做交叉验证之前,需要先挑选好较少的特征吗?即最终的模型特征?然后再进行交叉验证?

    56-caret包学习:模型训练与调优

    1、模型训练与参数优化 在进行建模时,需对模型的参数进行优化,在caret包中其主要函数是train。一旦定义了模型和调优参数值,就应该指定重采样的类型。目前,k折交叉验证重...

  • 老师您好,我有一个问题,在选到13作为最佳超参数后,是不是需要回到所有训练集中,再使用这个超参数后训练一个分类模型。由于超参数是13,是不是就是意味着保留13个特征对于这个模型的分类效果最好呀。这个时候是不是选择重要性前13个特征作为最终的特征,然后预测测试集呢?因为我不会python,然后这个k邻近模型也不懂,用的是R语言和随机森林的理解方式理解的,不知道有没有理解错误,请老师指正

    单一验证、k折交叉验证(特例:留一法(LOOCV))、交叉验证确定最优超参数

    一、单一验证 1、单一训练集和测试集 最简单的样本集划分就是只有训练集和测试集,而没有验证集,因此无法利用验证集反过来对模型参数进行调整。只能先给定一组超参数C,然后训练得到...

  • 一文看懂 AI 训练集、验证集、测试集(附:分割方法+交叉验证)

    数据在人工智能技术里是非常重要的!本篇文章将详细给大家介绍3种数据集:训练集、验证集、测试集。同时还会介绍如何更合理的讲数据划分为3种数据集。最后给大家介绍一种充分利用有限数...

  • 从出生到幼儿园毕业

    1998 -- 2002 | 0岁 -- 4岁 话说我也不是从出生就开始记事儿的呀,前几年关于我的事情只能靠我家人跟我讲述的了,今年过年要好好采访我的家人关于我幼儿时对...

  • 你有过“自我厌恶”吗?

    今天在看硕士与博士的区别时看到下面一段话: 对博士而言,最大的挑战其实是克服自我厌恶,然而在读硕士时很少会有这种情绪的体现。太多焦虑的博士,并非没有学术能力,而是无法克服这种...

  • 您好,请问一下,您下载mixcr的时候,使用的时候,它有要许可证吗?我这边下载了3的版本和4的版本都需要有许可证,不知道怎么回事

    mixcr3.0 软件使用

    MiXCR是一个通用的框架,处理从原始测序数据到定量clonotype的免疫组数据。 支持PE和SE的reads,考虑测序质量,纠正PCR错误,还能识别生殖系高突变。 支持部...

  • 120
    10X单细胞(10X空间转录组)数据分析之细胞过滤那些事

    hello,大家好,今天已经是五一假期的第二天,本人呢,哪也去不了,只好在家歇着,所以呢,给自己找点事做,本人93年,单身,现居天津武清,女孩子有没有想谈恋爱了,可以联系我,...

  • 太棒啦!感谢您的分享,刚好用得到。不过,请问数据多的时候怎么批量下载呢?fsatq文件链接有什么规律吗?数据太多了,一个个点好麻烦😭

    DDBJ数据库:宏转录组测序数据下载

    导读 1. DDBJ数据库简介 DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。...

  • @lele要发paper 您好,我后来也没解决,后来没用GSA的数据了。现在已经不做单细胞了

    从中国核酸数据库GSA下载单细胞数据

    第一次使用GSA大约是2018年,那一次是往该数据库上传数据。 单细胞数据呈指数增长,对一个实验室也好,对一家科研单位也好,对一个国家也好,数据的管理显得日益重要。数据管理在...