Avatar notebook default
16篇文章 · 3290字 · 2人关注
  • TCGA FPKM 转化为 TPM

    FPKM 一般来说不太好用,转为TPM进行后续的分析比较合适。下面是FPKM转化为TPM的R实现: 参考: RNA-Seq的Counts和FPK...

    0.9 4762 0 13
  • Hisat2+Stringtie+DESeq2 workflow in R

    前言 因为以前的分析流程要在Shell 和 R 之间切换,然后可控性还差,有点烦,正好最近有点数据要分析,干脆就重新建立一个 all in on...

  • 多个fasta文件中去除重复序列

    前言 需求:N个fasta文件,里面的序列可能有大量的重复,但是其header并不一定相同,需要把他们合并并去重。 方法一 首先用cat命令将他...

  • 比较两个fasta文件是否相同

    前言 最近碰到一个需求,比较两个fasta文件的所有序列是否一样,但是其名字无所谓是否相同,于是想了一个比较简单的办法,shell下面直接可以完...

  • Resize,w 360,h 240
    将ICGC的基因表达数据处理成表达矩阵(perl)

    小程序的目的 最近在搞ICGC的数据库,想作为TCGA数据挖掘的验证集,然后发现ICGC下下来的数据不能够直接用于分析,于是写个小的perl处理...

  • 自编SRA数据高速下载脚本

    每次在SRA上面下数据都要打命令,太烦了,于是自己写了个小shell脚本,能够快速地下载并解压SRA数据,方便使用。 主程序如下 downloa...

  • Resize,w 360,h 240
    用随机森林算法进一步筛选差异表达基因

    前言 很多时候,我们分析完差异表达基因后,发现会得到一大堆差异基因,常见的做法有降低Pvalue的阈值,挑选fold-change最大的基因,做...

  • 用TCGAbiolinks从TCGA数据下载到下游分析的学习笔记

    前言 之前一直在用RTCGA包下载数据,看着永不更新的数据,心里总觉得怪怪的,于是下定决心重新学习一个好用的包——TCGAbiolinks。这个...

    1.8 25457 47 36 1
  • bam2bw,上传ucsc可视化

    首先用tophat,hisat等比对软件生成BAM文件然后用deeptoos转化 deeptools Installation bamCover...

文集作者