首页 > 编程语言 > 详细

模式串匹配算法(朴素模式匹配算法和KMP算法)

时间:2021-01-29 09:49:13      阅读:26      评论:0      收藏:0      [点我收藏+]
模式串匹配算法,由之前的朴素模式算法延伸到KMP算法,效率上提升了将近一半。朴素模式算法上是将主串中的字符与子串中的字符一一比较,然后让子串的字符不匹配的字符重新在从主串匹配完的部分匹配。这样会导致一个问题就是子串不断地回溯比较,效率低下。因而KMP算法诞生,就是改进了这一个问题。KMP算法是当匹配到不相同的字符时,将匹配下一个字符的位置交给了next数组。next数组的原理是最大字符前缀和最大字符后缀相等长度加一。大大的提高了效率。但是尽管KMP算法提高了效率,仍然有无意义的比较。因而改进KMP算法的next数组为nextval数组,从左到右依次比较是否与之前的字符相同,若相同则将相同的next值赋值到相同的字符中,这样就大大的节省了无意义的比较次数。
技术分享图片
下面看详细代码:

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#define MaxSize 255
/* run this program using the console pauser or add your own getch, system("pause") or input loop */

/**
串的顺序存储和链式存储 
由于C语言中有对串直接操作的函数,这只列举一种操作 
朴素模式匹配算法 
*/

//静态定义串的结构体(定长顺序存储)
typedef struct{
    char ch[MaxSize];//存储字符的数组 
    int length;//串的实际长度 
}SString; 

//动态方式定义串的结构体(为了避免存储密度低的问题,让结点存储多个字符) 
typedef struct StringNode{
    char ch[4];//每个结点放四个字符 
    struct StringNode *next;//指针域 
}StringNode,*String; 

//动态定义串的结构体(堆分配存储)
typedef struct{
    char *ch;//按照串长分配储存区,ch指向串的首地址 
    int length;//串的实际长度
}HString; 

//堆分配初始化
void InitHString(HString &S){
    S.ch = (char*)malloc(MaxSize*sizeof(char));
    S.length = 0;
} 

//求子串
bool SubString(SString &Sub,SString S,int pos,int len){
    //子串越界
    if(pos+len-1>S.length){
        return false;
    } 
    for(int i=pos;i<pos+len;i++){
        Sub.ch[i-pos+1] = S.ch[i];
    }
    Sub.length = len;
    return true;
}

//朴素模式匹配算法 
int Index(SString S,SString T){
    int k=1;
    int i=k,j=1;
    while(i<=S.length && j<=T.length){
        if(S.ch[i]==T.ch[j]){
            ++i;
            ++j;//继续比较后续字符 
        }else{
            k++;//检查下一个子串 
            i=k;
            j=1;
        }
    }
    if(j>T.length){
        return k;
    }else{
        return 0;
    }
}

//求模式串中next数组
void get_next(SString T,int next[]){
    int i = 0;
    int j = 0;
    next[1] = 0;
    while(i<T.length){
        if(j==0||T.ch[i]==T.ch[j]){
            ++i;
            ++j;
            //若pi=pj,则next[j+1]=next[j]+1 
            next[i] = j;
        }else{
            //否则循环继续 
            j = next[j];
        }
    }
} 

//KMP算法2 
int IndexKMP(SString S,SString T){
    int i=1,j=1;
    int next[T.length+1];
    get_next(T,next);
    while(i<=S.length && j<=T.length){
        if(j==0||S.ch[i]==T.ch[j]){
            ++i;
            ++j;//继续比较后续字符 
        }else{
            j=next[j];//模式串向右移动 
        }
    }
    if(j>T.length){
        return i-T.length;//匹配成功 
    }else{
        return 0;
    }
}

//KMP算法1
int Index(SString S,SString T,int next[]){
    int i=k,j=1;
    while(i<=S.length && j<=T.length){
        if(j==0 || S.ch[i]==T.ch[j]){
            ++i;
            ++j;//继续比较后续字符 
        }else{
            j=next[j];
        }
    }
    if(j>T.length){
        return i-T.length;
    }else{
        return 0;
    }
} 

int main(int argc, char** argv) {
    HString S;
    InitHString(S);
    return 0;
}

模式串匹配算法(朴素模式匹配算法和KMP算法)

原文:https://blog.51cto.com/14049943/2609321

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!