很久没写博客了,那这次就写一篇稍微硬核一点的……写得有点杂乱×
数组与指针
int arr[10];
当提到arr
到底是什么的时候,一些人可能会说它是指向数组首元素的指针,即&arr[0]
。但事实上,这种说法是不对的。
数组的类型就是数组。
也就是说,arr
就是一个可以存放 10 个int
的数组,其类型为int [10]
。
但是在某些情况下,数组名会隐式类型转换为指向数组首元素的指针,例如:
std::cout << *(arr + 1);
上述代码中,arr
即被转换为了int*
,这句代码等价于:
std::cout << arr[1];
反过来,[]
运算符其实会展开成那样。说到这里,就不得不提一下,arr[1]
还可以写作1[arr]
。因为前者会展开成*(arr + 1)
,后者会展开成*(1 + arr)
,这两个当然是一样的。
数组退化为指针时,会产生一些问题,比如丢失长度信息。
int sum(int* arr) {
int length = sizeof(arr) / sizeof(int);
int s = 0;
for (int i = 0; i < length; ++i) {
s += arr[i];
}
return s;
}
上述函数的理想作用为对传入的arr
数组进行求和,但由于传入参数时,数组退化为指针,已经丢失了长度信息,所以sizeof(arr)
其实是一个int*
所占的字节数。解决这个问题的方法有很多,例如再传入该数组的长度作为第二个参数。
既然arr
是数组,那么&arr
是什么呢?
&arr
是arr
这个数组的指针,类型为int (*)[10]
。当arr
退化为指针时,其值与&arr
的值相同,不过由于它们的类型不同,对它们进行运算得到的结果也不同。我们知道,对于指针进行加减运算,其实是以该指针基类型所占的字节数为单位进行移动的。如arr + 1
,则移动了 4 字节。而&arr
的基类型为 10 个元素的int
数组,那么&arr + 1
自然会移动 40 字节。
你可能注意到int (*)[10]
中的*
是加了括号的,而这个括号也是必要的。如果不加,int* [10]
则变成了int* pointer[10]
中pointer
的类型,即有 10 个int*
元素的数组。
C++ 11
引入了“序列 for 循环”,例如:
for (auto i : arr) {
std::cout << i << " ";
}
这样做就可以遍历arr
中的每个元素。
假设你有一个奇葩的需求,比如要从arr[1]
开始遍历,而且想用序列 for 循环,那该怎么办呢?
一位同学写出了如下的代码(当然是不对的):
for (auto i : arr + 1) {
std::cout << i << " ";
}
由于对arr
进行了运算,它退化成了指针。而序列 for 循环依赖于std::begin()
与std::end()
,这两个函数仅对数组和容器有效。
指针之间是可以相互转换的。
我们可以通过恰当的类型转换来完成上述任务。
for (auto i : *(int (*)[9])(arr + 1)) {
std::cout << i << " ";
}
之前我们提到,数组首元素地址与数组地址值相同,现在我们需要从arr[1]
开始遍历,那自然,从这里开始的数组有 9 个元素,数组地址与arr[1]
地址相同,所以我们把arr + 1
这个指针转换为数组指针,再解引用,即得到了这个数组,也就可以使用序列 for 循环语句了。
虚函数表
我们知道C++
使用虚函数实现多态特性。对象中有一个虚函数表指针,而虚函数表中则存放了虚函数们的指针。有没有什么办法来验证呢?请看如下程序:
#include <iostream>
using namespace std;
class Test {
public:
virtual void fun1() {
cout << "fun1 is called" << endl;
}
virtual void fun2() {
cout << "fun2 is called" << endl;
}
};
using func = void (*)();
//typedef void (*func)();
int main() {
Test t;
cout << &t << endl;
cout << (int*)(&t) << endl;
cout << (int*)*(int*)(&t) << endl;
func f1 = (func)*((int*)*(int*)(&t) + 0);
func f2 = (func)*((int*)*(int*)(&t) + 1);
f1();
f2();
return 0;
}
为简单起见,在测试类中只有两个无参无返回值的虚函数。而func
为指向无参无返回值的函数的指针类型。
一般情况下,虚函数表指针位于对象最开始。我们假设该程序为 32 位程序,即所有地址占 4 字节。那么虚函数表指针就位于对象开始 4 字节。
(int*)(&t)
即将该对象指针转换为int*
,解引用后获得该对象开始 4 字节的数据,即虚函数表指针的值,再将该值转换为int*
,则(int*)*(int*)(&t)
就是虚函数表首元素的地址了。我们令int* p = (int*)*(int*)(&t)
,现在就可以把p
看成一个装着虚函数地址的数组了。*(p + 0)
就是该数组第一个元素,即第一个虚函数fun1
的地址,再把它转换为func
类型,到此,我们就可以成功调用fun1
了!由于p
数组是连续的,*(p + 1)
则是第二个虚函数fun2
的地址。
思考:如果是 64 位程序,会有什么不同呢?
(本文完,想到啥再补充×)