整体思路
与前面的测序文章相同,忘记了可以向前翻。可以说唯一的区别就是在于变异有很大不同。只要将癌细胞的变异理解,模仿,在简单修改之前的代码基本就算可以了。
癌细胞的变异
普通细胞有原癌基因和抑癌基因,在抑癌基因被破坏时,就产生了癌细胞,但正常的SNP和Indel是很难破坏基因的,除非是大量的SNP、Indel或者另外一种变异fusion。
介绍下fusion
fusion中文翻译为基因融合,然后fusion分为两种人工的和自然的。癌症的导致当然是由于自然的fusion。自然fusion有主要指染色体变异。
染色体易位
易位是指一条染色体的某一片段移接到另一条非同源染色体上,从而引起变异的现象。如果两条非同源染色体之间相互交换片段,叫做相互易位,这种易位比较常见。
染色体倒位
指某染色体的内部区段发生180°的倒转,而使该区段的原来基因顺序发生颠倒的现象。
染色体缺失
缺失是指染色体上某一区段及其带有的基因一起丢失,从而引起变异的现象。
染色体重复
染色体上增加了相同的某个区段而引起变异的现象,叫做重复。
与SNP和Indel的不同
SNP和Indel都是碱基对的变异,算是量变,而fusion则是质的变化。SNP与Indel的变异十分普遍但是危害小,fusion发生概率小但是危害大。
测序流程
参考之前的模拟Illumina测序的思路就行。