拉勾教育中《重学数据结构与算法》第08节讲到,字符串和如何应对字符串匹配算法。
字符串
字符串(string) 是由 n 个字符组成的一个有序整体( n >= 0 )。例如,s = "BEIJING" ,s 代表这个串的串名,BEIJING 是串的值。
一些特殊的字符串:
- 空串,指含有零个字符的串。
- 空格串,只包含空格的串。它和空串是不一样的。因为空格也是字符
- 子串,串中任意连续字符组成的字符串,叫作该字符串的子串。
- 主串。例如:a = "BEI",b = "BEIJING",c = "BJINGEI" 。
a 是 b 的子串,b 是 a 的主串;
串 c 和 a 没有任何关系。
字符串匹配算法
假设要从主串 s = "goodgoogle" 中找到 t = "google" 子串。
根据我们的思考逻辑,则有:
- 从主串 s 第 1 位开始,判断 s 的第 1 个字符是否与 t 的第 1 个字符相等。
- 如果不相等,则继续判断主串的第 2 个字符是否与 t 的第1 个字符相等。直到在 s 中找到与 t 第一个字符相等的字符时,然后开始判断它之后的字符是否仍然与 t 的后续字符相等。
- 如果持续相等直到 t 的最后一个字符,则匹配成功。
- 如果发现一个不等的字符,则重新回到前面的步骤中,查找 s 中是否有字符与 t 的第一个字符相等。
例子中,s 的第1 个字符和 t 的第 1 个字符相等,则开始匹配后续。直到发现前三个字母都匹配成功,但 s 的第 4 个字母匹配失败,则回到主串继续寻找和 t 的第一个字符相等的字符。
循环到主串 s 第 5 位开始相等,并且随后的 6 个字母全匹配成功,则找到结果。
Python 代码示例
课程中原文写了 Java 版本的示例代码。
这里试试如何用Python 代码实现这个匹配过程?
涉及知识点:
- 循环,for循环或者while循环
- 判断,if…else…
- 字符串切片,s[i]
代码实现:
for 循环版本
'''
s, 主串
t, 子串
如果在主串中找到子串,则返回 True
'''
def fun(s,t):
isFind = False
for i in range(len(s)):
# 判断与子串的第一位是否相等
if(s[i] == t[0]):
jc = 0
for j in range(len(t)): # 循环子串的后续是否相等
if s[i+j] != t[j]:
break; # 不相等则跳出循环
jc=j
if jc == len(t)-1: # 找到与子串完全一致的,则完成匹配,返回True
isFind = True
return isFind
while 循环版本 @阿涛 小伙伴写的
def tins(s, t):
# 判断字符串s是否包含t,是返回True否则返回False
s_len = len(s)
t_len = len(t)
i = 0
while i < s_len:
if t_len > s_len - i:
return False
j = 0
while j < t_len:
if t[j] != s[i+j]:
break
j += 1
if j == t_len:
return True
i += 1
return False