首页 > 其他 > 详细

51nod 1183 编辑距离

时间:2018-11-15 20:12:26      阅读:163      评论:0      收藏:0      [点我收藏+]
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
 
 
 

输入

第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。

输出

输出a和b的编辑距离

输入样例

kitten
sitting

输出样例

3

这是一道动态规划的题目,显然两个串的长度并没有要求相同,我们需要对比任意两个字符,假设前面都已经变的相等,那么到了a[i]和b[j]的位置,如何选择呢,我们设dp[i][j]为a[i - 1]和b[j - 1]的对应情况,如果两字符相等,dp[i][j]可以设为dp[i - 1][j - 1],不需要做操作,如果不相等,就在dp[i - 1][j - 1]基础上加1,这是做的替换操作,我们还可以做插入操作和删除操作,这就建立在dp[i - 1][j]或dp[i][j - 1]的基础上了,具体怎么样我们都得取最小的编辑距离,
所以状态转移方程为dp[i][j] = min(dp[i - 1][j - 1] + (s[i - 1] == t[j - 1] ? 0 : 1),min(dp[i - 1][j],dp[i][j - 1]) + 1);
不过需要注意初始化问题,dp[0][0]设为0,两个空串的编辑距离是0的,对于dp[i][0]的编辑距离是i要么a变为空串要么b变为b变成a,操作次数都是i,同样的dp[0][j]也要初始化,如此后面的才能借用,否则是不对的。

代码:
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#define MAX 1000
#define mod 1000000000
using namespace std;

int dp[MAX + 1][MAX + 1];
char s[MAX + 1],t[MAX + 1];
int main() {
    scanf("%s%s",s,t);
    int slen = strlen(s),tlen = strlen(t);
    for(int i = 1;i <= slen;i ++) {
        dp[i][0] = i;
    }
    for(int i = 1;i <= tlen;i ++) {
        dp[0][i] = i;
    }
    for(int i = 1;i <= slen;i ++) {
        for(int j = 1;j <= tlen;j ++) {
            dp[i][j] = min(dp[i - 1][j - 1] + (s[i - 1] == t[j - 1] ? 0 : 1),min(dp[i - 1][j],dp[i][j - 1]) + 1);
        }
    }
    printf("%d",dp[slen][tlen]);
}

 



51nod 1183 编辑距离

原文:https://www.cnblogs.com/8023spz/p/9965756.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!