计算CDS长度

  1. 下载TCGA 基因注释文件:gencodev22
    https://gdc.cancer.gov/about-data/data-harmonization-and-generation/gdc-reference-files

  2. 安装bedtools
    conda install -c bioconda bedtools
    or conda install -c bioconda/label/cf201901 bedtools

  3. 计算
    awk -F "\t" '{if($3=="CDS"){print}}' gencode.v22.annotation.gtf|bedtools sort -i -|bedtools merge -s -i -|awk -F "\t" '{print $3-$2+1}'| awk '{sum += $1};END {print sum}'

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 生信学习笔记 linux部分功能 查看文件夹 工具 选项 可以设置鼠标功能 可以设置右键粘贴 双击这个窗口可以再打...
    Vikenn阅读 4,844评论 1 4
  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 8,488评论 2 25
  • 要求 实现这个功能的软件也很多,还是烦请大家先自己搜索几个教程,入门请统一用htseq-count,对每个样本都会...
    随缘清风_ee55阅读 5,272评论 0 1
  • 原文链接:HOPTOP转录组入门(6): reads计数-转录组-生信技能树 要求 实现这个功能的软件也很多,还是...
    酷睿_1991阅读 10,295评论 0 4
  • 新技术创业的曲线图科大讯飞创始人刘庆峰在“我有嘉宾”年会上说,任何新技术都有一个基本的发展趋势图:首先从概念导入,...
    石小沫_阅读 832评论 0 1