KMP算法
KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
算法重点:前缀表(prefix table)——>next数组
前后缀的概念:文章中字符串的前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。
后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。
前缀表中的元素:就是最长相同前后缀的长度(最长相同前后缀可以简单理解为对称的最大值)如下图:

如a,因为前后缀是不包括第一个/最后一个,所有最长相同前后缀是0
aa 最长相同前后缀都是a 所以是1
同理aabaa 是2
KMP算法基本思路
遍历两个字符串,一一比较,
当找到的不匹配的位置, 那么此时要看待查找到的字符串的前一个字符的前缀表的数值是多少,然后回退前缀表数值个位数,继续向下比较。不用再比较前面已经匹配过的字符。
pyhton实现
如例题,链接
实现 strStr() 函数。
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1 。
构建next数组(前缀表)
前缀表是对要查找的字符串构建的
a=len(needle)
b=len(haystack)
def getnext(self,a,needle):
next=['' for i in range(a)]
j,k=0,-1
next[0]=k
while(j<a-1):
if k==-1 or needle[k]==needle[j]:
k+=1
j+=1
next[j]=k
else:
k=next[k]
return next
在原串中查找
class Solution:
def strStr(self, haystack: str, needle: str) -> int:
a=len(needle)
b=len(haystack)
if a==0:
return 0
next=self.getnext(a,needle)//构建前缀表
p=-1
for j in range(b):
while p>=0 and needle[p+1]!=haystack[j]:
p=next[p]//回退
if needle[p+1]==haystack[j]:
p+=1
if p==a-1:
return j-a+1//第一个匹配的下标
return -1//没有匹配的 就返回-1
本文介绍了KMP算法的基本思想,重点在于前缀表(next数组)的构造。KMP算法通过记录已匹配文本避免从头匹配,提高字符串搜索效率。在Python中,通过构建next数组并利用其进行字符串匹配,实现strStr()函数查找目标字符串在haystack中的位置。
1030

被折叠的 条评论
为什么被折叠?



