2018-08-21

算法题之字符串相似度

问题描述

面试阿里的时候问了我一个问题,如何求两个字符串之间的相似度,当时不知道该怎么回答,后来下来之后从网上查看才知道这是一个经典的动态规划题。
两个字符出的相似度定义为:将一个字符串转换成另一个字符串的代价(通过插入、删除、替换三种方式转换),转换的代价越高则说明两个字符串的相似度越低。

问题分析

这是一个典型的动态规划题。我们知道,可以用动态规划求解的题都有最优子结构性质,回到这个问题当中,假设source有字符串有n个字符,target字符串有m个字符,如果将问题定义为求解将source的1到n个字符转换为target的1到m个字符所需要的最少编辑次数(最小编辑距离),则子问题就可以定义为将source的1到i个字符转换为target的1到j个字符所需要的最少编辑次数,这就是本问题的最优子结构。我们用d[i,j]表示source[1...i]到target[1...j]之间的最小编辑距离,则计算d[i,j]的递推关系可以这样计算出来
source[i]==target[j]
d[i,j] = d[i-1,j-1]+0
如果source[i]!=target[j],则根据插入、删除和替换三个策略,分别计算出使用三种策略得到的编辑距离,然后取最小的一个:
d[i,j]=min(d[i-1][j]+1,d[i][j-1]+1,d[i-1,j-1]+1)
其中:
d[i][j-1]+1表示对source[i]执行插入操作后计算编辑最小距离
d[i-1][j]+1表示对source[i]执行删除操作后计算最小编辑距离
d[i-1,j-1]+1表示对source[i]替换成target[i]操作后计算最小编辑距离

代码实现

import java.util.Scanner;

public class StringSimilar {
    public static void main(String[] args){
        Scanner scan = new Scanner(System.in);
        String source = scan.nextLine();
        String target = scan.nextLine();
        System.out.println(editDistance(source,target));
        
    }
    public static int editDistance(String source,String target){
        char[] sources = source.toCharArray();
        char[] targets = target.toCharArray();
        int m = source.length();
        int n = target.length();
        int[][] distance = new int[m+1][n+1];
        int i,j;
        for(i=0;i<=m;i++){
            distance[i][0]=i;
        }
        for(j=0;j<=n;j++){
            distance[0][j]=j;
        }
        for(i=1;i<=m;i++){
            for(j=1;j<=n;j++){
                if(sources[i-1]==targets[j-1]){
                    distance[i][j]=distance[i-1][j-1];
                }else{
                    int insert = distance[i][j-1]+1;
                    int delete = distance[i-1][j]+1;
                    int replace =distance[i-1][j-1]+1;
                    distance[i][j]= Math.min(insert, delete)>replace?replace:Math.min(insert, delete);
                }
                
            }
        }
        
        return distance[m][n];
    }
}

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,320评论 0 2
  • 动态规划(Dynamic Programming) 本文包括: 动态规划定义 状态转移方程 动态规划算法步骤 最长...
    廖少少阅读 3,252评论 0 18
  • 最后一抹阳光消失在 海面 游鱼说太阳沉入了大海 飞鸟说太阳飘到了西天 海面是淡淡的 金色 孩子说那是 落日拥抱了大海
    余念一生阅读 294评论 8 5
  • 十几岁的时候,正读高中。那时候,压力比较大,做烦了习题就会胡思乱想。想小学,一放学就去操场上跳皮筋、扔沙包、玩抓人...
    何树枝阅读 213评论 0 1