统计泛基因组基本信息

批量运行fastp

ls ../raw_rna-seq/*_1.fastq.gz  | xargs -I file basename file _1.fastq.gz | xargs -I file  sh -c "echo ' fastp -i ../raw_rna-seq/file_1.fastq.gz -I ../raw_rna-seq/file_2.fastq.gz  -o file_1.clean.fastq.gz -O file_2.clean.fastq.gz -w 10 --length_required 90' " > cmds

统计遗传距离

cat *.data | sort -g | awk 'NR==1{print "min:", $1} END{print "max:", $1}'
awk '$1=="S"{sum+=length($3)} END{print sum}'
grep WhR_A merge.haplotype40.fasta.gz.fai  | awk '{sum+=$2} END{print sum}'
rg -c "^S" *gfa
vcftools --gzvcf combined.vcf.gz  --keep-only-indels    --out combine.sv  --recode --recode-INFO-all
vcftools --gzvcf merged_rename.vcf.gz          --remove-indels          --recode          --recode-INFO-all          --out snp
python ~/split_vcf_by_length.py  sv.recode.vcf
 cut -f 3 pggb.histgrowth.node.tsv | sed -n '7,$p' > growth.list
python ~/pangenome_curve.py  growth.list  > growth.list.stats

awk -F'\t' '
  /^P/ {
    n=split($3, a, ",");
    print $2, n
  }
'  <(zcat s20k.graphs.combined.gfa.gz) >  ~/workspace/pangenome/super_sugarcane_growth/stats.node
for stats_file in *.stats; do     filename=$(basename "$stats_file");     total_aligned=$(grep "Total aligned:" "$stats_file" | awk '{print $3}');     total_primary=$(grep "Total primary:" "$stats_file" | awk '{print $3}');      alignment_rate=$(echo "scale=6; $total_aligned / $total_primary * 100" | bc);      printf  "$alignment_rate\n";  done
for f in *.bam.stats; do     perc=$(grep "mapped (" "$f" | head -n1 | awk -F'[()]' '{print $2}' | awk '{print $1}');     echo -e "${perc}"; done
grep "Total alignments" *stats | cut -f 3 -d ":"
#Overall
grep "concordantly exactly 1 time"  index.sh.o222447  | grep -oP '\(\K[0-9]+\.[0-9]+(?=%\))'
# 
grep "overall alignment rate" *map.* | grep -oP '[0-9]+\.[0-9]+(?=%)'
for i in *gam; do echo "vg stats -a ${i} > ${i}.stats";done > cmds
for i in *gam; do echo "vg view  -a ${i} | jq -c 'select(.mapping_quality | not)' | wc -l > ${i}.uniq" ;done >>cmds
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 在一个地处边境的小城,曾经面临着诸多困境。但小城的人们并未气馁,而是齐心协力走向 “足食足兵” 的发展之路。 起初...
    贪狼啸月阅读 17评论 0 0
  • 一个人被限制在自己的身体里,同样也被困在自己的意识中。 人的一切经历,最终都是在“意识”中发生的,因此意识的结构和...
    蔡莹阅读 33评论 0 1
  • 蜜桃,宛如大自然精心雕琢的珍宝。它色泽粉嫩,似少女绯红的脸颊,洋溢着青春的娇羞。轻咬一口,甜蜜的汁水在唇齿间迸发,...
    自雨自在阅读 384评论 0 5
  • 今天冥想的时候想到的一个话题,我的人生是时候向前推动一步了,无论是从我的年龄上来说,还是从数理模型上来看。 第一步...
    而立2687阅读 21评论 0 1
  • 旅游回来已经一个星期整,感觉自己还没恢复以前的状态。我的时间都去哪儿了?今天恢复了晨跑,跑前和跑的过程感觉...
    不甜的棉花糖阅读 24评论 0 2