写在前面
绝大多数生物信息学分析软件只接受制表符(即键盘上的 Tab)分隔的文本文件。而日常表格处理时,我们常常会使用 Excel 等软件,对应使用的是 二进制的 .xlsx 文件。直接将 .xlsx 文件设置为其他绝大多数生信软件的输入,往往只会遇到报错。
解决办法很简单,打开 Excel 文件 -> 文件另存为 -> 制表符分隔的文本文件。但这个操作存在几个问题:
- 需要专门打开 excel 文件
- Excel 文件过大时,加载需要不少时间(甚至可能出现自动换行的情况,每一行甚至格是有长度限制的)
- 如果一个 Excel 中有几个表(Sheet),那么需要另存为多次
。。。
等等问题。甚至如果你的 Excel 没有注册,那可能还得被提示要注册。多少是麻烦。 我一直有想法写个转换器,因为这个实现起来还是很简单的(毕竟不像绝大多数TBtools功能)。这几天,在协助课题组赶一个文稿,月底要投出去。遇到一个问题,即公司返回的转录组数据分析结果中,所有文件是 Excel 文件.xlsx,如下。
Emmm,那就没办法用 TBtools 做文本处理了(比如表格批量筛选,表格快速合并等等,当然也不能很好的写脚本处理)。
索性,我写了一个 TBtools 新的小插件。
Excel to Tab 插件
插件已经上线到Plugin Store,建议从高速商店下载,不了解的请参考之前的推文《Plugin | 高速版插件商店!我又有一个绝妙的 idea》。
插件使用非常简单
使用实例
批量转换表格
转换完成会有弹窗提示
当然,也支持每个Excel文件中存在多个表格,如
转换前,在excel中
转换后
接下来,就可以愉快的使用 TBtools 中大量方便的表格处理工具,也可以....直接写几个命令批量处理文件了。当然后者是我目前主要目的。
写在最后
Excel 文件批量转换成文本文件,Emmm,多少还是有用的吧。对于一些想偷懒的人。比如我,常常不太乐意打开 .xlsx 文件,毕竟只是为了另存为一次文件,不如一次 Start。