由于使用EPU收集的数据都是分布在各个square中(默认状态中)
但是我们在imput是,照片在同一个文件夹中会比较方便。
所以我一般会用
> mv ../*/*.mrc /x/
将所有的照片放到/x/中
不过用软链接的方式也许更好
> ln -s ../*/*.mrc /x/
这次的数据质量不太行,有很多照片都没有颗粒。前期只使用relion和cryoSPARC内部的参数性筛选照片后做处理,没有得到很好的重构结果,所以我打算将分析一下各个square中的可用照片数量,结合square的状态来分析我在选square的时候是否合理。
不过用什么方法来快速过一遍照片原本比较纠结,我想直接肉眼看每一张照片来判断,一开始serialEM收集且用motioncor处理的照片可以用dosef_logviewer一张张看,后来好像又不兴这个方法了(需要在收集时运行某个脚本,并保留这个信息)。后来我试过在ccpem中可以一次性显示多张照片来做筛选,但是这个软件放我电脑里一直不稳定,可能是我对环境变量和python什么一直是迷糊的状态....
后来各个电镜中心开始使用了EPU作为数据收集的软件了,而这个软件收集的时候会默认得到相应的png文件,这倒是对照片的肉眼筛选很友好。
但是我在centos的默认文件夹中用阵列模式查看照片png时又遇到问题,最多只能放大到133%的比例,还是不太能看清照片中的颗粒(主要我的蛋白也太小),然后就开始懒人方法,把屏幕比例改成300%,ok,能看清了。
原本想用diff来比较原square中的照片和剩余照片的量来分析square质量,但是搞了半天没搞懂这个命令的参数,算了还是用傻办法,按编号来记录。(EPU得到的照片文件名是真的长,很不友好)
然后就可以分析是哪个垃圾square在影响我的数据了
剃掉不好的照片后,用
> find ./ -name "*,png" >./*/good-photo.txt
将字段汇总到文件夹中,然后是利用文件编辑器中自带的替换字符功能,将罗列的文件名前加入ln -s ...和目标文件夹名。也就是制作软链接脚本,再将txt文件转成.sh文件
> mv good-photo.txt good-photo.sh
> bash ./good-photo.sh
(直接复制txt文件中的命令来执行的话,会丢失语句导致数据丢失)
好了我要用新筛的照片做2d了,bye