step2 宿主基因组去除

1、软件配置KneadData

conda activate meta_qc
conda install kneaddata
# KneadData会自动安装Trimmomatic, Bowtie2等依赖

2、宿主基因组下载

# 创建数据库目录
mkdir -p genome_database
# 下载基因组数据库 (这个命令会下载并解压,需要一些时间)
kneaddata_database --download human_genome bowtie2 genome_database/#这个软件直接带的
#没有猪的基因组,KneadData 自带的 kneaddata_database --download ... 只提供少数“常用宿主”(人/鼠/狗/猫等),没有猪很正常。解决办法就是:自己准备猪参考序列并做 Bowtie2 索引
#这个和转录组通用了,可以用fa自己构建(以前做chip我写过教程),也可以去官网下载
去官网下载的.png

3、脚本跑


#!/bin/bash
db_path="/home/shpc_101389/wang_proj/genome_database/Sscrofa11.1/Sscrofa11.1"
cleandata="/home/shpc_101389/wang_proj/yang_data/cleandata"
kneaddata="/home/shpc_101389/wang_proj/yang_data/kneaddata"
mkdir -p "$kneaddata"

cd "$cleandata"
for forward_file in *_clean_1.fastq.gz; do
    base_name=${forward_file%_clean_1.fastq.gz}
    reverse_file="${base_name}_clean_2.fastq.gz"
    output_dir="${kneaddata}/${base_name}"   # 每个样本独立输出目录
    mkdir -p "$output_dir"

    echo "正在用KneadData处理样本:$base_name ..."

    kneaddata \
        -i1 "$forward_file" \
        -i2 "$reverse_file" \
        -o "$output_dir" \
        -db "$db_path" \
        -t 12 \
        -v \
        --output-prefix "$base_name" \
        --bowtie2-options "--very-sensitive --dovetail" \
        --bypass-trim \
        --remove-intermediate-output &
done

wait
echo "所有样本的KneadData分析已完成!"
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容