从strncpy
的实现说起
第一次阅读内核源码是在网上浏览博客的时候,有个博主说strncpy
的执行效率很低,而且并不是绝对安全,也存在缓冲区溢出的风险。
先贴出来其实现,再逐行分析。
#ifndef __HAVE_ARCH_STRNCPY
/**
* strncpy - Copy a length-limited, %NUL-terminated string
* @dest: Where to copy the string to
* @src: Where to copy the string from
* @count: The maximum number of bytes to copy
*
* The result is not %NUL-terminated if the source exceeds
* @count bytes.
*
* In the case where the length of @src is less than that of
* count, the remainder of @dest will be padded with %NUL.
*
*/
char *strncpy(char *dest, const char *src, size_t count)
{
char *tmp = dest; (1)
while (count) { (2)
if ((*tmp = *src) != 0) (3)
src++; (4)
tmp++; (5)
count--; (6)
}
return dest; (7)
}
EXPORT_SYMBOL(strncpy);
#endif
首先,我们整体看一下函数的执行流程
- 行1,将tmp指向dest
- 行2,初次进入while循环时,count为dest大小
- 行3,将src的内容赋值给tmp
- 行4,如果src没有移动到字符串末尾的
\0
,则把src往后移动一个字节 - 行5,tmp向后移动一个字节
- 行6,count减1
简单来说,该函数把src的内容往dest拷贝,最多拷贝count个字节
但是这里有几个关键问题
- 如果src的长度 >= count 会发生什么?
- 如果src的长度 < count,该函数性能如何?
问题1:
如果src_len >= count,根据行2
、行3
可知,dest会被填充count字节,也就是说src的前count字节会被copy到dest,所以dest末尾并不是\0
。
问题2:
如果src_len < count,考虑边界情况,假设当前src指向字符串末尾(也就是\0
的前一个字符),则行3
把src的值赋值到tmp,行4
src往后移动一个字节,指向\0
,行5、行6,把tmp向后移动一个字节,count减1,while循环进入下一次,行3
把src的值(也就是\0
)赋值给tmp,注意观察行3
,此时if
语句值为false,src不向后移动(所以src依然指向\0
),行5、行6,tmp向后移动,count减1。再次进入下一次循环,行3
,把src的当前值(\0
)赋值给tmp,if
语句值为false,src不向后移动,tmp向后移动,count减1。所以,此情况下,该函数会使用\0
填充dest剩下的全部字节。
看看如下常用的使用方式:
char buff[1024];
const char* src = "hello world";
strncpy(buff, src, sizeof(buff));
把src内容拷贝到buff后,会将剩余的空间全部填充0,效率非常低。
char buff[5];
const char* src = "hello world";
strncpy(buff, src, sizeof(buff));
buff的长度比src长度要小,buff末尾并不是\0
,需要添加如下语句才能避免缓冲区溢出问题。
buff[sizeof(buff) - 1] = 0