字符串匹配算法之 KMP


  • 暴力破解版
/** 
* 
* @param source 母串 
* @param pattern 字串 
* @return 返回第一个匹配子串的头部位置,没有匹配返回-1 
*/
public static int violentMatcher(String source, String pattern){ 
   //获得两个字符串的长度  
   int slen = source.length();  
   int plen = pattern.length();   
   if(slen == 0)      
     return -1;   
   if(plen == 0)      
     return -1;   

   char [] sc = source.toCharArray();    
   char [] pc = pattern.toCharArray();   
   int i = 0;   
   int j= 0;   

   while (i< slen && j < plen){//j == plen 跳出循环,就找到子串       
     if(sc[i] == pc[j]){//匹配相等,都+1         
       j++;         
       i++;       
     } else {//不相等i退回j个位置再+1,j重置0        
       i=i-j+1;        
       j=0;        
     }    
   }  
  if(j == plen)     
    return i - plen;    
  else    
    return -1;
}


  • KMP版
/**
 * KMP 算法:分两个阶段,
 * 1.预处理求子串的next数组. 
 * 2.根据next数组,在不匹配时,后移相应的位数(不是暴力破解的每次后移一位)
 * @param source
 * @param pattern
 * @return
 */
public static int KMPMatcher(String source, String pattern){ 
    //获得两个字符串的长度  
    int slen = source.length()
    int plen = pattern.length();
    if(slen == 0)
        return -1;
    if(plen == 0)
        return -1;

    char [] sc = source.toCharArray();
    char [] pc = pattern.toCharArray();
    int i = 0;
    int j= 0;

    int[] next = getNext(pc); // 获得next数组

    while(i< slen && j < plen){//j == plen 跳出循环,就找到子串
        if(sc[i] == pc[j]){//匹配相等,都+1
            j++;
            i++;
        }
        else {//不相等 子串右移j-next[j]
            j = next[j];
        }
    }
    return 0;
}

//找出字符串前缀和后缀,最长的共有元素个数
private static int [] getNext(char[] s){
    int q=0,k=-1; // char数组的下标, k 最大前后缀的相同长度
    int[] next = new int[s.length];
    next[0] = -1;
    while (q < s.length-1){
        if(k == -1 || s[q] == s[k]){
            q++;
            k++;
            next[q] = k;
        }else {
            k = next[k];
        }
    }
    next[0] = 0;
    return next;
}

  • Boyer-more算法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 引言 字符串匹配一直是计算机科学领域研究和应用的热门领域,算法的改进研究一直是一个十分困难的课题。作为字符串匹配中...
    潮汐行者阅读 1,735评论 2 6
  • 在字符串系列的算法中,KMP算法属于较难的一个。实际上它的代码并不多,主要一些细节的地方难以理解,再加上书上,网上...
    zero_sr阅读 1,800评论 0 9
  • 字符串匹配算法之Sunday算法 背景 我们第一次接触字符串匹配,想到的肯定是直接用2个循环来遍历,这样代码虽然简...
    houskii阅读 10,048评论 10 25
  • 烈日下少年步履蹒跚,眼前那扇半掩的小门是少年眼里唯一的希望,他费劲最后一丝丝力气走到门前。筋疲力尽的他却怎...
    诗语远方的温度阅读 439评论 0 0
  • 这篇文写于万米高空之上,回家路上。 忘记了从什么时候开始,很是享受一个人在路上的分秒。无人聊天,不感无趣,反而多了...
    老麦Michael阅读 274评论 2 2