登录注册写文章

比较两个fasta文件的相同序列，并分别输出name

三线打工人的生信日记本

比较两个fasta文件的相同序列，并分别输出name

课题组之前使用的基因组有问题，尝试更换基因组时发现序列转换很麻烦，之前的老办法是使用Tbtools中的blast，但是由于

CJ陈说blast程序有时会抽风，返回的第一个blast结果不是最好的结果而是第一个搜索到的结果
两个基因组为同一课题组发表的结果，有先后顺序，所以存在完全相同的序列
excel处理不了超长文本的查找？我使用vlookup函数查找后报错value

于是寄希望与linux

于是向chat·地球图书馆·狂言的笑话师·不动的大图书馆·万能的许愿机·知识的暴走列车·Amadeus·gpt许愿

螺旋阶梯，独角仙，废墟街道，无花果塔，独角仙，德蕾莎之道，独角仙，特异点，乔托，天使，绣球花，独角仙，特异点，秘密皇帝，跨越了无数艰辛与失败，最终我们抵达了

准备工作为

将两个基因组cds的fasta文件重命名为1和2
将他们使用tbtools转换为table
开始呼唤

祷词为：我有两个tab分割的表格文件，1.table与2.table，两表的第二列有相同的数据，需要你找出相同数据在两表中对应的第一列，并输出为csv文件

于是祂回应了：


awk -F '\t' 'NR == FNR {a[$2] = $1; next} $2 in a {print a[$2] "," $1}' 1.table 2.table > output.csv

在该文件夹中打开终端，输入wsl，愉快的一天结束了（明天再写没匹配上的序列名提取和blast吧）

这里是三线打工人的记事本，为了免得自己忘记所以记录一下，但愿我没有需要第二次用它的时候

最后编辑于：2023.10.13 23:49:01

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

重新认识TBtools，减少你的生信分析烦恼（20190422）
写在写在前面的前面或许，没有人知道TBtools到底是什么？能干啥。但是看完这个推文，或许你就知道了其中的一部分...
生信石头阅读 71,578评论 4赞 156
基于TBtools做基因家族分析教程（全）
一、写在前面 2023年4月中旬自己开始做基因家族的分析，对于这块自己没有接触过，因此也是一个挑战，没事！！！（...
生信筆記阅读 8,702评论 1赞 53
TBtools基因家族分析详细教程（1）
写在前面：非常感谢CJ开发出如此强大的TBtools工具，作者详细讲解了基因家族的分析过程和意义，课程购买地址，讲...
Y大宽阅读 165,568评论 18赞 398
生信小白如何在半年收到核心期刊录用证明顺利毕业！！！（基因家族成员进化关系的分析）
前面推文所提基本性质的分析（理化性质，基因染色体分布，基因结构、基序和保守结构域）已完成，进一步基因家族成员的进化...
Charon_7db5阅读 2,337评论 4赞 38
TBtools使用讲演课程-录屏-
TBtools是什么？目前，高通量测序已然是生物实验室的常用研究手段。数据不断积累，而解读数据的难度也越来越大。...
生信石头阅读 13,452评论 2赞 27

赞1赞

赞赏

手机看全文