1、软件配置KneadData
conda activate meta_qc
conda install kneaddata
# KneadData会自动安装Trimmomatic, Bowtie2等依赖
2、宿主基因组下载
# 创建数据库目录
mkdir -p genome_database
# 下载基因组数据库 (这个命令会下载并解压,需要一些时间)
kneaddata_database --download human_genome bowtie2 genome_database/#这个软件直接带的
#没有猪的基因组,KneadData 自带的 kneaddata_database --download ... 只提供少数“常用宿主”(人/鼠/狗/猫等),没有猪很正常。解决办法就是:自己准备猪参考序列并做 Bowtie2 索引
#这个和转录组通用了,可以用fa自己构建(以前做chip我写过教程),也可以去官网下载

去官网下载的.png
3、脚本跑
#!/bin/bash
db_path="/home/shpc_101389/wang_proj/genome_database/Sscrofa11.1/Sscrofa11.1"
cleandata="/home/shpc_101389/wang_proj/yang_data/cleandata"
kneaddata="/home/shpc_101389/wang_proj/yang_data/kneaddata"
mkdir -p "$kneaddata"
cd "$cleandata"
for forward_file in *_clean_1.fastq.gz; do
base_name=${forward_file%_clean_1.fastq.gz}
reverse_file="${base_name}_clean_2.fastq.gz"
output_dir="${kneaddata}/${base_name}" # 每个样本独立输出目录
mkdir -p "$output_dir"
echo "正在用KneadData处理样本:$base_name ..."
kneaddata \
-i1 "$forward_file" \
-i2 "$reverse_file" \
-o "$output_dir" \
-db "$db_path" \
-t 12 \
-v \
--output-prefix "$base_name" \
--bowtie2-options "--very-sensitive --dovetail" \
--bypass-trim \
--remove-intermediate-output &
done
wait
echo "所有样本的KneadData分析已完成!"