在C++ Primer的第二章里面讨论了该如何选择正确的类型,这里是些自己的看法,和书上的不全一样。
char, short, int and long
-
int
类型一般是处理器最自然的长度,所以一般无特殊需求,都使用int
来做整数运算。 - 只用
char
类型来表示可打印的字符。 - 用
unsigned char
或者#typedef unsigned char BYTE
来表示一块内存数据,比如说一个二进制文件的内容。 -
signed char
,short
和long
通常不用。
signed integer vs unsigned integer
- 任何涉及到加减乘除算数计算的情况下,都要用
signed integer
。哪怕是当时看起来没有产生负数的可能性,为了避免将来修改代码的时候混用有符号类型和无符号类型,还是建议都是用有符号类型。 - 任何涉及到左移,右移,位运算的情况下,都要使用
unsigned integer
。这个时候我们需要的变量不是一个数字,而是一堆bit
。最重要的是,如果对负数右移的时候,首位是补0还是1是编译器实现相关的,所以不能使用有符号类型。
Fixed-Precision Integer Types
除了int
和long
这样子没有规定具体大小的类型以为,C++11还有一系列固定精度的整形,定义在头文件cstdint
中,它们是int8_t int16_t int32_t int64_t
和对应的无符号类型。在这些情况下,你需要一个变量表示某个硬件上的32位的寄存器;你需要一个变量表示ipv4的地址;这些情况最好使用固定精度的整形。如果你只用个int
来表示的下,在不同的编译器下可能会大小不一样,而造成问题。
double Vs float
如果精度允许,首选float来提升程序性能。
- 在很多机器上,计算double和float的速度是一样的。比如说在x86的机器上,double和float都会被扩展成为80bits的浮点数来计算。
- 但是除了计算速度,还要考虑memory和cache的问题。double意味着需要更大的memory bandwidth,以及更大的cache压力。
- 在SIMD指令上,使用float也比double快,因为一条指令能处理更多的float数字。参考Intel 64 and IA-32 Architectures Optimization Reference Manual 里面的内容。
使用void*来表示地址类型。
- 使用unsigned int或者unsigned long来表示地址是严格禁止的,因为他们的长度不是确定。
- 使用
int32_t
或者int64_t
也不是好主意,这样就不具有32位和64位的可移植性了。 - 如果对两个指针做减法,可以
static_cast<char*>
来计算,并且使用ptrdiff_t
来保存返回值以确保可移植性。 - 如果要对地址进行位运算,那么可以使用
intptr_t
和uintptr_t
类型,这两个类型是C++11里面新引入的。他们是个足够大到保存指针的的integer类型。这样子用reinterpret_cast<intptr_t>(p1);
size_t, size_type, difference_type Or integer type
为什么需要size_t, size_type, difference_type
vector<int>::size_type size = v.size();
vector<int>::difference_type diff = v.begin() - v.end();
v.size()
具体能有多大完全是平台相关的,比如说32位CPU下,最大也只能是4G。但是64bit下就要大的多。所以如果使用int
或者long
之类的保存v.size()
的值,其可移植性不好,要么是太小无法保存其值,要么是太大浪费了效率。所以就定义了这些特别的类型。
std::size_t is the unsigned integer type of the result of the sizeof operator
difference_type provides the difference between two iterators that refer to elements within the same vector.
size_type represents the number of elements in a vector.
选择size_type还是int呢?
for (int i = 0; i < v.size(); i++); // warning in some compiler
for (vector<int>::size_type i = 0; i < v.size(); i++);
for (decltype(v.size()) i = 0; i < v.size(); i++);
个人的习惯
- 如果我在写一个跨平台,准备给很多人用的,完全无法预知要处理的数据能有多大的情况下,那么肯定不能使用
int
之类的类型。但要注意,size_type
都是无符号类型,如果后续需要进行数值运算,需要小心处理和有符号数一起计算的情况。 - 大多数情况下,我的代码的使用场景有限,我确定一个
int
肯定能够装下v.size()
,那么我就会使用int
。好处不用太关心有符号和无符号混用的问题。