(二)字符串
c++有两种类型的字符串,一种是基于c语言的,另一种是c++中的string类(严格来说string类不是通常意义上的字符串,也就是数组,而是用来表示字符串的字符串类)。
1.c风格的字符串
什么是c风格字符串?c风格字符串有一个特殊的性质,以空字符(null character)结尾,空字符写作\0(实际上就是ASCII码编号为零的字符)。C风格字符串在C和C++中都是支持的。
c风格字符串的声明和初始化:采用字符数组的方式:比如char dog[4]={‘d’,’o’,’g’,’\0’}(初始化列表方法),声明了一个长度为4的字符数组,字符依次为d,o,g,\0,由于在结尾有一个\0,因此程序将这个字符数组看成是字符串(就是说字符串以\0为结尾标志);另外一种更简单的初始化方法为使用字符串常量,即将字符串用双引号引起来,上面的例子可以写成char dog[]=”dog”(这种写法相当于大括号式的初始化列表的方法{“dog”},只不过大括号形式的写法可以省略等号,这种形式不能省略等号);
2.注意的问题:
(1)用引号引起来的字符串隐式地包含了结尾的空字符\0。因此在确定存储字符串所需的最短数组长度时,别忘了将结尾的空字符计算在内(数组长度等于字符数目加一,但一般我们将这份工作交给编译器自动运行,即不加中括号里面的字符数组的长度,比如上面例子里的数组长度4,而让程序自己计算)。
(2)字符串常量不能与字符常量互换,比如“a”就不等于‘a’,因为字符串“a”隐式地包含了\0,是一个数组,更确切的说是一个字符数组的指针,而‘a’就表示a的编码,是一个字符(本质是字符的编码)。
(3)拼接字符串常量。
c++允许拼接字符串字面值,即将两个用引号括起的字符串合并为一个。事实上,任何两个由空白(空格、制表符和换行符)分隔的字符串常量都将自动拼接成一个。比如,cout <<“how are” “you”;不管中间的空白是空格符,制表符还是换行符,这两个字符串都将输出“how areyou”,注意这里没有漏写空格,程序就是会无缝连接。这里的机理就是将第一个字符串的最后面的\0去掉,然后紧跟着后一个字符串,后一个字符串末尾的\0作为整个新的字符串常量的结尾标记。
(4)字符串长度函数。有特殊的用于计算字符串长度的函数strlen(),要使用这个函数需要包含头文件cstring,即#include <cstring>(这是标准C语言函数库中的头文件)。比如:char a[]=”dog”;cout<<a;b=strlen(a);cout<<b;结果将会输出dog3(表示字符串有三个字符,当然你认为是3byte也可以,因为一个字符占用一个byte)。
(5)需要特别注意strlen()函数与sizeof运算符的区别,sizeof()返回的是整个数组(数据)的长度,而strlen返回的是字符串的长度,并且strlen()不会把结尾的\0计入长度范围。什么意思呢?举个例子:char a[]=”dog\0hello”;cout<<sizeof(a);会输出什么呢?实测的结果是10,因为sizeof()运算符把所有的字符(包括中间那个\0)和结尾的\0都算进去了,测的是整个字符数组的长度(字节byte)。而如果使用strlen()呢?结果是3,也就是计数了从开头到第一个\0的长度(因为程序会认为这就是一个字符串),并且\0还不会计算在内,因此输出的就是只有dog三个字符的长度了。
3.字符串的输入问题:
(1)用cin输入字符串时候会发生的问题:一是cin指令将空格等空白作为字符串分隔的标记,这会在输入名字等中间带有空格的字符串的时候出现问题。比如,char str[20];cin>>str;然后我输入“Ken Thompson”,程序只会在str中存储“Ken”,整个过程是这样的,当我们输入一句话然后回车的时候,这段话就会进入输入队列,cin要取得输入的时候,会从输入队列取第一个单词(遇到空白即认为是取完了一个单词),然后将其他的单词保留在输入队列,如果此时我们再用一次cin输入,程序会直接读取剩下的“Thompson”,而不会要求我们再用键盘输入新内容;二是,cin指令输入的字符串超过字符数组的字数限制怎么办。
(2)上面的第一个问题可以使用每次读取一行的字符串输入来解决,每次读入一行的字符串的输入函数为getline()和get();其实是面向行的类成员函数,都是属于cin类,可以用cin对象来调用,用法为cin.getline(a,b)。getline()函数读入后舍去回车符,而get()不舍掉回车符。
cin.getline()有两个参数。第一个参数是用来存储输入行的数组的名称,第二个参数是要读取的字符数(\0计入)(如果这个参数为20,最多读取19个字符)。用这个函数会读取到最大字符数的位置或换行符的位置,然后在最后添加空字符\0,如果最后是换行符,则换行符替换为空字符。
注意:cin对象给string对象赋值的时候会忽略回车符,但是不丢弃回车符,也就是说回车符依然存在与缓冲队列中,如果此时后面跟的是getline函数,那么很可能就会读到一个空行(只有回车的行)。
get( )的成员函数,该函数有几种变体。其中一种变体的工作方式与getline( )类似, 它们接受的参数相同,解释参数的方式也相同,并且都读取到行尾。但get不再读取并丢弃换行符,而是将其留在输入队列中。如果没有其它帮助,get()的这种用法将不能跨过换行符。使用函数cin.get(name,size);接着跟一个cin.get();就可以吃掉换行符,效果与cin.getline(name,size)读取并丢掉换行符的效果一样。上面的cin.get()函数通过不同参数类型及数目,调用的函数的效果也不相同,这就是函数的重载,这在后面函数部分会再次看到。
getline( )使用起来简单一些 ,但 get( )使得检查错误更简单些,因为我们可以通过查看下一个字符是否为回车等方式来观察字符数组是否将我们输入的字符完全容纳。可以用其中的任何一个来读取一行输入:只是应该知道,它们的行为稍有不同。
(3)空行和超过字符数时候的处理方式:
当 get( ) (不是getline())读取空行(空行不是空白行,空行指的是只有回车的行,一般是在用cin或cin.get(str,10)读取一行后留下的回车符)后将设置失效位( failbit)。这意味着接下来的输入将被阻断,可以使用命令cin.clear()来使阻断的输入继续。(这里其实可以通过每次查看标志位来查看发生了什么,比如if(cin.rdstate() == ios::failbit))或者cin.eof(),cin.fail(),cin.bad()等方式,然后来确定下一步如何做,一般在循环语句的时候使用)。
!!!!!输入字符串可能比分配的空间长: 则getline( )和 get( )将把余下的字符留在输入队列中,而 getline( )还会设置失效位,并关闭后面的输入,也就是跳过后面的所有的输入语句,直到用cin.clear()来恢复阻断位。get()函数不会这样,它只是将余下的字符当成下一行的开头,由下面的输入语句继续输入(直到回车或达到字符数限制)。所以,使用getline我们只需要查看阻断位就可以判断是不是数组容量不够,然后进行处理,并且不会破坏输入的内容;而对于get我们要使用cin.get()来查看下一个字符是不是回车来判断是否字符数组容量不够,如果不是回车的话,cin.get()本身会吃掉一个字符,造成内容的破坏(可以使用cin.peek()来不破坏地查看)。
(4)综合以上的考虑,cin对象的输入并不是特别好用,cin本身不能跨越空格;而cin.getline()和cin.get()都是以行为输入对象,而这两者又所不同,cin.getline()会吃掉回车,并且不能全部容纳整行的时候会设置失效位;cin.get()则不会去掉回车,并且读取空行之后会设置失效标志位。也就是说,cin忽略空白,只输入一个单词;cin.get();不会丢掉换行符,并且有空行的时候会阻断;而cin.getline();会丢掉换行符,是面向行来输入的,只有行太长的时候会阻断。即,有空白行,使用get要注意,有太长的行,使用getline要注意。如果是使用string对象的话,因为不用考虑长度问题,因此使用cin.getline是没有任何缺点的。