从UCSC下载的ref.bed:
mammal-mouse-GRCm38/mm10-genes and gene predictions-gencode XX-basic-genome-BED-gzip-gte output
一共下载了5个files:
大小
du
行数:
wc
head:
一样
# 验证下bed是否和ensembl搭配:
选择3个转录本
1-ok
2-ok
3-ok
随机1
随机2
结论:与ensembl相同
后来注意到:
选择全面看看
在UCSC中下载
查看
结论:comprehensive比basic全面,更多!
去掉id后的版本号:
awk 'BEGIN{OFS="\t"} {gsub(/.[0-9]$/,"",$4); print $0}' mm10.gencode-vm18.compre.bed > mm10.gencode-vm18.compre.fine.bed
## geneid和genename关系下载:
第一步
第二步
点击get output:
good!
法二:
RSeQC网站下载:https://sourceforge.net/projects/rseqc/files/
查
下载ref:RseQC的bedfiles下载 - 简书