BSA分析(七)——DeepBSA

本篇内容根据官方说明文档撰写,软件操作十分简单,所以内容不再特别详细的介绍。

DeepBSA是一种用于解析复杂性状的创新Bulked Segregant Analysis(BSA)软件。DeepBSA中开发了两个全新的算法,分别称为深度学习(DL)和k值(K),可以应用于至少2个被混合的群体。DeepBSA还集成了五种广泛使用的算法,分别是ED、G'、ΔSNP-index、SmoothLOD和Ridit,在文章的模拟实验中,DL的绝对偏差和信噪比都优于其他方法。最新更新的DeepBSA提供了Windows和Linux两个版本,下载链接为:http://zeasystemsbio.hzau.edu.cn/Tools。

Windows版DeepBSA

DeepBSA的运行需要R。在下载并解压DeepBSA_windows_v1.4后,用户可以进入名为deepbsa的文件夹,双击R-4.2.1-win.exe将R安装到"C:\Program Files"目录下。然后,如果R安装正确,双击deepbsa.exe,软件界面会如下所示。


image.png

输入文件

用户可以点击“打开”来加载输入文件(步骤1)。目前,仅支持标准VCF文件和相应的CSV文件(示例输入文件提供在名为Demo的文件夹中)。

注意:(1)VCF文件可选无头部,但建议仅保留染色体数据,序列区域应被删除;

(2)VCF文件中仅需要混合组数据,父本数据应被删除。同时,如果存在多个组,应根据表型进行排序;

(3)不支持压缩文件。

该软件提供输入数据的预处理功能。预处理包含内置程序来删除质量较低的SNP,并删除其读数低于自定义数字(建议自定义数字为测序覆盖度的一半)的SNP(步骤2)。此过程将花费一些时间,取决于数据大小和计算机性能。同时,可用(步骤3)

image.png

方法选择和运行

在QTL检测中提供了七种算法,用户可以选择其中一种方法(步骤4)。同时,还可以使用三个自定义参数-平滑函数、窗口大小和阈值(步骤5)

➢ 平滑函数:提供了三种拟合方法-三核平滑、LOWESS和移动平均。默认设置为三核平滑。

➢ 窗口大小:用于拟合的窗口大小。默认设置为0,表示使用loess.as()的自动调优得到的最佳参数。可选的取值范围为0-1,例如0.5表示使用50%的SNP进行局部拟合。0.1是经验值,而0的结果不好。

➢ 阈值:在拟合线超过此值时,将提取候选QTL区域。 默认设置为0,表示该阈值高出全基因组中位数三个标准偏差。 设置完后,点击"RUN"来进行QTL的定位(步骤6)

注意:只有DL和Ridit可以应用于多池数据,所以在运行来自多个池的数据时,其他方法只从VCF文件中的第一个和最后一个池获取信息。

image.png

输出结果

输出结果以两种方式呈现,如下所示——映射图和候选区域。

image.png

可以通过点击图表来查看详细信息。


image.png

同时,结果被保存在本地 deepbsa/**_Visualize_Results/文件夹中。图表以PNG PDF格式保存,QTL信息以CSV格式保存。开发者还提供了一个TXT文件,其中包含所有SNPs的位置和对应方法的值,可以用于进一步分析和绘图。

其他功能

该软件还提供了一个模拟器,通过点击名为“Simulate”的按钮生成模拟数据。可以按照以下方式自定义四个参数。

➢个体数:种群中的模拟个体,代表了下次野外实验的种群规模;

➢池数:模拟的混池数,范围从2到10;

➢比值:每个池的植株比例,因此应满足以下条件:比值*池数<1;

➢有效点数:模拟的qtl数,假设其表型变异效应(PVE)为0.1。

image.png

image.png

生成的模拟数据保存在deepbsa/ --*/中,可以直接作为下一次映射的输入数据加载。结果图如下所示:

image.png

Linux版DeepBSA

命令行也很简单,步骤和软件版类似:

#安装
wget -c http://zeasystemsbio.hzau.edu.cn/Tools/DeepBSA_linux_v1.4.tar.gz
tar -xvzf DeepBSA_linux_v1.4.tar.gz
cd DeepBSA_linux_v1.4/
./requirment.txt

#QTL mapping 
cd bin/
python3 main.py -h

#usage: main.py [-h] --i I [--m M] [--p P] [--p1 P1] [--p2 P2] [--p3 P3] [--s S] [--w W] [--t T]
 optional arguments:
  -h, --help  show this help message and exit
  --i I       The input file path(vcf/csv).
  --m M       The algorithm(DL/K/ED4/SNP/SmoothG/SmoothLOD/Ridit) used. Default is DL.
  --p P       是否预处理数据(1[True] or 0[False]). Default is True.
  --p1 P1     预处理第一步: reads支持数, 过滤低于该值的SNP位点. Default is 0.
  --p2 P2     预处理第二步: 卡方检验(1[True] or 0[False]). Default is 1[True].
  --p3 P3     预处理第三步: 连续性检验(1[True] or 0[False]). Default is 1[True].
  --s S       结果平滑处理函数选择(Tri-kernel-smooth\LOWESS\Moving Average), Defalut is LOWESS
  --w W       LOESS窗口大小。该数字的取值范围为0-1。0表示AICc最小的最佳大小. Default is 0(auto).
  --t T       阈值. Default is 0(auto)

#Data simulation
cd DeepBSA_linux_v1.4/bin/
python3 simulate_progress.py -h

#usage: simulate_progress.py [-h] --i I --p P --r R --e E --s S
 optional arguments:
  -h, --help  show this help message and exit
  --i I       individual
  --p P       pools
  --r R       ratio
  --e E       effective points
  --s S       save path

参考资料

Li Z., Chen X., Shi S., Zhang H., Wang X., Chen H., Li W., and Li L. (2022). DeepBSA: A deep-

learning algorithm improves bulked segregant analysis for dissecting complex traits. Mol. Plant.

doi: https://doi.org/10.1016/j.molp.2022.08.004.

往期回顾

BSA分析(一)——原理及发展史

BSA分析(二)——分析准备工作

BSA分析(三)——测序数据的质控

BSA分析(四)——序列比对及比对信息统计

BSA分析(五)——变异检测及样本合并

BSA分析(六)——QTLseqr包

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,252评论 6 516
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,886评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,814评论 0 361
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,869评论 1 299
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,888评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,475评论 1 312
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,010评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,924评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,469评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,552评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,680评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,362评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,037评论 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,519评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,621评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,099评论 3 378
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,691评论 2 361

推荐阅读更多精彩内容