(六)指针和自由存储空间
1.计算机如何存储数据
计算机程序在存储数据时必须跟踪的3种基本属性:信息存储在何处,存储的值为多少, 存储的信息是什么类型。可以使用变量名来达成这三种要求,通过变量的类型声明和名称,我们知道存储的类型,存储的地址,通过给变量初始化和赋值,我们给变量相应的内容。这里还有另外的方式可以实现这些要求(包括指针和引用),其中之一就是指针。
2.声明和初始化指针
(1)什么是指针
指针是一个变量,它存储的是值的地址,而不是值本身。引用是一个变量名,多个引用相当于多个名字。
指针名是一个地址,或者说指针就是一个储存地址的变量。通过解除引用运算符*作用于指针可以得到指针指向的地址的内容。
有两个互为逆运算的运算符,*和&,*作用于地址,得到的是变量的内容,相当于变量名。而&作用于变量名,得到的是变量的地址。定义指针用*,定义引用用&,指针是一个地址,引用是一个变量的名字。
(2)声明和初始化指针
下面的声明创建一个指针(p1)和一个 int 变量(p2 ) :int * pl , p2;
对每个指针变量名,都需要使用一个*。如果不使用,表示的是变量名,而不是指针。指针变量不仅仅是指针,而且是指向特定类型的指针。因此,声明指针的时候需要将指针指向位置处变量的类型也声明出来,如果不声明,我们无从知道指针指向的内容如何来读取。
虽然指针指向的类型会有所不同,但是一般来说,指针变量本身的大小是相同的。
可以在声明中初始化指针,但是要注意的是,初始化的是指针(地址),而不是它指向的值。比如int a;int* b=&a;将b初始化为a的地址。
3.指针的危险
创建指针时,系统只是为指针本身分配了存储空间,并没有为它所指向的位置分配空间,因此,指针如果没有初始化,我们将不知道他指向何处,这是很危险的,容易引起系统的未知的错误。
!!!!!警告:一定要在对指针应用解除引用运算符(*)之前,将指针初始化为一个确定的、适当的地址。这是关于使用指针的金科玉律。
指针和数字:要将数字值作为地址来使用,应通过强制类型转换将数字转换为适当的地址类型:比如int *pt ;pt = ( int * ) 0xB8000000; // types now match(我们尽量不要这样做,这是非常麻烦的事情,你必须确保后面的地址完全正确,而且这在不同的计算机上的意义可能是不一样的)。
4.使用new来分配内存
变量,指针和内存:变量是在编译时分配的有名称的内存,而指针只是为可以通过名称直接访问的内存提供了一个别名。指针真正的用武之地在于,在运行阶段分配未命名的内存以存储值。在这种情况下,只能通过指针来访问内存。
用new分配内存的通用格式:为一个数据对象(可以是结构,也可以是基本数据类型)获得并指定分配内存的通用格式是:
typeName * pointer_name= new typeName;
new为指针分配的内存是在程序运行的时候进行的,而不是编译的时候确定。地址本身只指出了对象存储地址的开始,而没有指出其类型(使用的字节数),也就是说new返回的仅仅是一个开始地址,需要与指针声明的指向对象的类型来配合,才能知道new出来的起始位置和终止位置。
对于指针,需要指出的另一点是,new分配的内存块通常与常规变量声明分配的内存块不同(不在同一位置)。变量nights和pd 的值都存储在被称为栈(stack)的内存区域中,而new从被称为堆(heap)或自由存储区(free store)的内存区域分配内存。
5.使用delete来释放内存
使用new分配的内存,在使用完毕后,一定要归还内存,这时候用到的是delete。使用delete时,后面要加上指向内存块的指针(这些内存块最初是用new分配的),比如delete ps(ps为一个指针):这将释放ps指向的内存,但不会删除指针 ps 本身。
注意事项:
一定要配对地使用new和 delete;否则将发生内存泄漏(memory leak)。
不能使用delete来释放声明变量所获得的内存。
尽量不要创建两个指向同一个内存块的指针。
6.静态联编和动态联编,使用new来创建动态数组
(1)静态联编和动态联编
在编译时给数组分配内存被称为静态联编(static binding);但使用new时,如果在运行阶段需要数组,则创建它;如果不需要,则不创建。这被称为动态联编(dynamic binding),动态联编的数组意味着数组是在程序运行时创建的。这种数组叫作动态数组(dynamic array)。
(2)动态数组的创建
使用new运算符来进行动态数组的创建,只需要将元素的类型和元素的数目告诉new就可以了。格式如下:int *p = new int [12];动态数组的释放:delete [] p;new运算符返回第一个元素的地址。
(3)使用new和delete 时, 应遵守以下规则:
•不要使用 delete 来释放不是new分配的内存。
•不要使用 delete 释放同一个内存块两次。
•如果使用 new[]为数组分配内存,则应使用delete[]来释放。
•如果使用 new为一个实体分配内存,则应使用delete(没有方括号)来释放。
•对空指针应用delete是安全的。
(4)使用动态数组
使用动态数组,只要把指针当作数组名使用即可。也就是说,对于第1个元素可以使用 psome[0],而不是*psome:对于第 2 个元素,可以使用 psome[1],依此类推。
数组名其实也是一个地址,将指针当做数组名来访问动态数组是简单而方便的。
但是要注意二者的区别:数组名是一个地址,它是不可以改变的,它不是一个变量,可以说数组名是一个地址常量。但是指针是一个变量,我可以改变指针的值,比如令指针pointer=pointer+1;是可以的,他也指向下一个变量,即原来的pointer[1]。另一个区别是,对数组应用sizeof运算符得到的是数组的长度,而对指针应用sizeof得到的是指针的长度,即使指针指向的是一个数组。
7.指针,数组和指针算术
(1)指针和数组
<1> 指针和数组基本等价的原因在于指针算术和C++内部处理数组的方式。将整数变量加1后,其值将增加1;但将指针变量加1后,增加的量等于它指向的类型的字节数。
<2> 还可以将一个指针减去另一个指针,获得两个指针的差。 这种运算将得到一个整数,仅当两个指针指向同一个数组〈也可以指向超出结尾的一个位置〉时,这种运算才有意义:这将得到两个元素的问隔。
<3> 多数情况下,c++将数组名解释为数组的第一个元素的地址,也就是存在如下的关系:对于数组int wages[3];则有wages == &wages [0]这样的关系。
<4> 数组表达式stacks[1],C++编译器将该表达式看作是* (stack + 1)。也正因为如此,数组和指针的处理方式才会如此相似,因为数组名就是一个地址常量,而[]运算符本身就是地址算术和解除引用运算符的结合体。
<5> !!!!!对数组名取地址时,数组名也不会被解释为其地址。数组名本身被解释为其第一个元素的地址,而对数组名应用地址运算符时,得到的是整个数组的地址(也就是默认指向的类型是整个数组这样大的空间)。
(2)指针和字符串
<1> 指针和数组的关系可以扩展到c风格的字符串
如果给 cout提供一个字符的地址,则它将从该字符开始打印,直到遇到空字符为止。在cout和多数c++表达式中,char 数组名、char指针以及用引号括起的字符串常量都被解释为字符串第一个字符的地址。一般来说,如果给cout提供一个指针,它将打印地址。 但如果指针的类型为char *,则cout将显示指向的字符串。如果要显示的是字符串的地址, 则必须将这种指针强制转换为另一种指针类型,如 int *。
<2> strcpy()函数,strncpy()的用法
strcpy()函数接受2个参数。第一个是目标地址,第二个是要复制的字符串的地址。strncpy增加了第三个参数,是要复制的最大的字符数,要注意的是,如果该函数在到达字符串结尾之前,目标内存已经用完,则它将不会添加空字符。因此,应该这样使用该函数:
strncpy ( food,”a picnic basket filled with many goodies”,19) ; food [l9]=’\0’;这样最多将19个字符复制到数组中,然后将最后一个元素设置成空字符。
8.使用new来创建动态结构
(1)使用new创建的动态结构
因为没有结构的名称,我们仅知道它的指针,因此不能用.号来访问结构中的成员变量,因此C++专门为这种情况提供了一个运算符:箭头成员运算符->来用于访问成员变量,举例:如果ps指向一个inflatable 结构,则 ps->price 是被指向的结构的 price 成员。
(2)!!!!!访问结构的两种方式
如果结构标识符是结构名,则使用句点运算符;如标识符是指向结构的指针则使用箭头运算符。
另一种访问结构成员的方法是,如果ps是指向结构的指针,则*ps就是被指向的值一一结构本身。由于*ps是一个结构,因此(*ps).price是该结构的price成员。
!!!!!注意,使用new来创建了动态结构或数组等,一定要用delete来释放空间,delete可以与new不在一个函数中,但不建议这样做,因为容易遗漏。
(3)使用cin输入
cin输入到字符数组中的方式是char a[20];cin>>a;此时输入的字符数量不要超过字符数组的容量,否则容易出问题。最好的方式是使用string类的对象来动态储存数据,不必担心数据容量的问题。
(4)c++管理内存的三种方式:
C++有3种管理数据内存的方式:自动存储、静态存储和动态存储。
在函数内部定义的常规变量使用自动存储空间,被称为自动变量,这意味着它们在所属的函数被调用时自动产生,在该函数结束时消亡。自动变量是一个局部变量,其作用域为包含它的代码块。自动变量通常存储在栈中。后进先出(LIFO)。因此,在程序执行过程中,栈将不断地增大和缩小。
静态存储是整个程序执行期间都存在的存储方式。使变量成为静态的方式有两种:一种是在函数外面定义它;另一种是在声明变量时使用关键字static。自动存储和静态存储的关键在于:这些方法严格地限制了变量的寿命。变量可能存在于程序的整个生命周期(静态变量),也可能只是在特定函数被执行时存在(自动变量)。
new和delete运算符提供了一种比自动变量和静态变量更灵活的方法。它们管理了一个内存池,这在C++中被称为自由存储空间(free store)或堆(heap)。