2019-08-09

环状序列(紫书例题3-6)

问题描述:
长度为n的环状串有n种表示法,分别为某个位置开始顺时针得到。CGAGTCAGCT,GAGTCAGCTC,AGTCAGCTCG等。在这些表示法中,字典序最小的称为“最小表示”。输入一个长度为n(n<=100)的环状DNA串(只包含A、C、G、T这4种字符)的一种表示法,你的任务是输出该环状串的最小表示。例如,CTCC的最小表示是CCCT,CGAGTCAGCT的最小表示为AGCTCGAGTC。


image.png

样例输入:
2
CGAGTCAGCT
CTCC

样例输出:
AGCTCGAGTC
CCCT

分析:

一开始理解这道题的时候很吃力,看了好久都不知道它想要干嘛,后面才知道原来是在一串成环的 DNA像字典排序一样找出其中最小的表示,也就是要按照字母排列寻找正确的起点。

难点:

1.当找到的起点并非是输入的DNA序列的第一个字母,怎么让“断掉“”的重新“续上”:
(起点s+增值i)%输入DNA的长度

2.当符合/不符合时,应怎么递增继续判断/切换起点:
符合时,记录当前i的值作为起点,用此起点继续跟该点以后做起点的序列作比较;不符合时,直接跳过;直到到达该DNA的结尾。

判断以不同起点的序列的字典序,从起点开始比较,当增加相同单位处的字母不同时,字母小的序列就小,相同时继续判断两序列的下一个位置字母的大小关系,直到回到原起点。

代码如下:
#include<iostream>
#include<string> 
using namespace std; 
int comp(string s,int s1,int s2){
    int num=s.size();
    for(int i=0;i<num;i++){
        if(s[(s1+i)%num]!=s[(s2+i)%num])
        return s[(s1+i)%num]>s[(s2+i)%num];
    }
    return 0;
}
int main(){
    int n;
    string dna;
    cin>>n;
    while(n--){
        cin>>dna;
        int start=0,num=dna.size();
        for(int i=1;i<num;i++){
            if(comp(dna,start,i))start=i;
        } 
        for(int i=0;i<num;i++){
            cout<<dna[(start+i)%num];
        }
        cout<<endl;
    } 
} 
运行截图

相似的,还有:

DNA序列(紫书习题3-7)

题目描述:

输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的Hamming距离为2(左数第1,4字符不同)。
输入整数m和n(4<=m<=50,4<=n<=1000),以及m个长度为n的DNA序列(只是包含字母A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。如有多解,要求为字典序最小的解。例如,对于下面5个DNA序列,最优解为TAAGATAC。


image.png
分析:

在上面那题对字典序有了了解以后,理解这道题就很简单了。所谓Hamming距离和最小意思就是跟所给出的所有序列的字符不同的位置个数总和最小,直接寻找在所有序列相同位置中出现次数最多的字符就可以找出这个序列了。又由于规定了多个解的时候,题目要求字典序最小,因此判断时可以用if-else结构按照字典顺序进行判断。

代码如下:

#include<iostream>
#include<string>
using namespace std;
int main(){
    int m,n,max,a,c,g,t;
    string dna;
    cin>>m>>n;
    char str[m][n];
    for(int i=0;i<m;++i){
        cin>>str[i];
    } 
    for(int i=0;i<n;++i){
        a=c=t=g=0;
        for(int j=0;j<m;++j){
            if(str[j][i]=='A')a++;
            else if(str[j][i]=='C')c++;
            else if(str[j][i]=='G')g++;
            else t++;
        }
        max=a;
        if(c>max)max=c;
        if(g>max)max=g;
        if(t>max)max=t;
        
        if(max==a)dna+='A';
        else if(max==c)dna+='C';
        else if(max==g)dna+='G';
        else if(max==t)dna+='T';
    }
    cout<<"\n"<<dna<<endl; 
}
运行截图
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1.dict字典 定义 字典 是一系列键—值对 。每个键 都与一个值相关联,你可以使用键来访问与之相关联的值。 与...
    棒棒糖117阅读 188评论 0 0
  • ElasticSearch 什么是ElasticSearch,根据其中文文档可以简单定义为以下三点,与传统的关系型...
    冰阔乐_b0a4阅读 112评论 0 0
  • 一、内置类属性 什么是内置类属性声明类的时候系统自动添加的属性(可能是字段也可能是对象属性) 定制当前类的对象的打...
    Wa_ngli阅读 252评论 0 0
  • 听过传染病会传染,听过自控力也会传染吗 根据大量数据跟踪发现如果你身边有某个人的体重增加了,那么你的体重增加的概率...
    baiying阅读 262评论 0 0
  • “美与悲剧向来不冲突,甚至悲剧中更能突出人性之美” 《边城》的故事本身是一个美丽的悲剧。沈从文通过自己优美的语言,...
    CHENYIFEI_阅读 378评论 1 3