字符串
串的存储结构
1.定长顺序存储表示
用一组地址连续的存储单元
#define MAXLEN 255
typedef struct{
char ch[MAXLEN];
int length;
}SString;
2.堆分配存储表示
仍以一组地址连续的存储单元存放,但存储空间是在程序执行过程中动态分配的
typedef struct{
char *ch;
int length;
}HString;
C语言中存在一个称为堆的自由存储区,并用malloc()和free()函数来完成动态存储管理
上述两种方式通常为高级程序设计语言采用
3.块链存储表示
采用链表方式存储串值
在具体实现时每个结点即可以存放一个字符,也可以存放多个字符。每个结点称为块,整个链表称为块链结构。
串的基本操作
StrAssign(&T, chars) "赋值操作,把串T赋值为chars"
StrCopy(&T, S)
StrEmoty(S) "判空"
StrCompare(S,T)
StrLength(S)
SubString(&Sub, S, pos, len) "求子串,用Sub返回S的第pos个字符起长度为len的子串"
Concat(&T, S1, S2) "联接"
Index(S, T, pos) "定位子串T,第pos个字符之后第一次出现的位置"
Replace(&S, T, V) "替换子串"
StrInsert(&S, pos, len) "插入子串"
StrDelete(&S, pos, len)
ClearString(&S)
DestroryString(&S)
串的模式匹配
子串的定位操作,子串通常称为模式串
int Index(SString S, SString T, int pos)
{
int i=pos, j=1;
while(i<=S.length&&j<=T.length){
if(S.ch[i]==T.ch[j]){
++i; ++j;
}
else{
i=i-j+2; j=1;
}
}
if(j>T.length) return i-T.length;
else return 0;
}
最坏时间复杂度O(nm)
改进的模式匹配算法——KMP
利用比较过的信息,i指针不需要回溯,仅将子串向后滑动一个合适的位置,并从这个位置开始和主串进行比较,这个合适的位置仅与子串本身的结构有关,而与主串无关。
前缀,后缀,部分匹配值
用上图中的next数组的话,匹配失败时去找它前一个元素的部分匹配值,这样有点不便,所以将next数组右移一位,第一位补-1,这样哪个元素匹配失败直接看它自己对应的值即可。
Move=(j-1)-next[j]
j=j-Move=j-((j-1)-next[j])=next[j]+1
有时为了使公式更加简洁,将next数组整体加1,这样j=next[j]
计算机求next数组的方法
void get_next(String T, int next[])
{
int i=1, j=0;
next[1]=0;
while(i<T.length){
if(j==0||T.ch[i]==T.ch[j]){
++i; ++j; next[i]=j;
}
else
j=next[j];
}
}
int Index_KMP(String S, String T, int next[], int pos)
{
int i=pos, j=1;
while(i<=S.length&&j<=T.length){
if(j==0||S.ch[i]==T.ch[j]){
++i;++j;
}
else
j=next[j];
}
if(j>T.length)
return i-T.length;
else
return 0;
}