我们前面学习过输出,printf
函数,标准库提供了一次读/写一个字符的函数,其中最简单的是getchar
和putchar
,顾名思义,getchar
为得到一个字符,putchar
输出一个字符。每次调用时,getchar
函数从输入流中读取一个字符,并将其作为结果值返回,例如:
int c = getchar()
变量c中包含输入流中的下一个字符,暂时是从键盘输入。每次调用putchar()
时将打印一个字符,例如
putchar(c)
将把整型变量c的内容以字符的形式打印出来,通常是显示在屏幕上
1.5.1 字符复制
下面这个程序为复制输入,然后输出
#include <stdio.h>
/* copy input to output; 1st version */
int main()
{
int c;
c = getchar();
while (c != EOF) {
putchar(c);
c = getchar();
}
return 0;
}
其中,关系运算符!=
表示"不等于"。
char
类型专门用于存储字符型数据,占用一个字节,而任何整数型int
也可以用于存储字符型数据,因为int
一般占用四个字节,不会溢出,因为某些潜在的重要原因,我们再次使用int
类型。
在上例中,有一个特殊的字符常量EOF
(end of file,文件结束),表示输入流的结束。在输入流结束或是文件流结束,getchar
函数将会返回一个特殊值,与任何实际字符都不同,就是EOF
。我们在声明变量c
的时候,必须让它大到足以存放getchar
函数返回的任何值。之所以不把c声明成char
,是因为它必须足够大,除了能存储任何可能的字符外还要能存储文件结束符EOF
。因此必须将c
声明称int
类型。EOF
在头文件<stdio.h>
是个整形数-1
,具体数值并不重要,只要它与任何char
类型的值都不相同即可。这里使用符号常量,可以确保程序不需要依赖对应的任何特定的数值。
可以将程序精炼如下:
#include <stdio.h>
/* copy input to output; 2nd version */
int main()
{
int c;
while ((c = getchar()) != EOF)
putchar(c);
}
在该程序中,while循环语句首先读一个字符并将其赋值给c
,然后测试是否为EOF
,如果字符不是EOF
,则执行循环体,然后重复执行while
语句。当到达结尾位置(EOF)
,while
循环语句终止执行。
值得注意的是,在while ((c = getchar()) != EOF)
中,c=getchar()
两端的小括号不可省略,因为关系运算符!=
的优先级比赋值运算符=
高。
1.5.2 字符计数
下列程序用于对字符进行计数
#include <stdio.h>
/* count characters in input; 1st version */
int main()
{
long nc;
nc = 0;
while (getchar() != EOF)
++nc;
printf("%ld\n", nc);
return 0;
}
其中循环体++nc
引入了一个新的运算符++
,其功能是执行加1操作,叫做自增操作符,可以用nc = nc + 1
代替它。与自增操作符对应的为自减操作符--
。++
与--
这两个运算符既可以作为前缀操作符(++nc
),也可以作为后缀操作符(nc++
),关于这两者的区别,我们以后介绍,当然你也可以自行学习。
该字符计数程序使用long
类型的变量存放计数值,而不是使用int
,是因为long
类型要比int
大,至少会占用32位,在某些机器上,int
占用16位,所以相当小的输入都可能使int
类型的变量溢出。%ld
指示printf
函数对应的参数是long
类型。
使用double
(双精度浮点型)类型可以处理更大的数字。我们用double
和for
循环语句来展示编写此循环的另一种方式:
#include <stdio.h>
/* count characters in input; 2nd version */
int main()
{
double nc;
for (nc = 0; getchar() != EOF; ++nc)
;
printf("%.0f\n", nc);
}
对于float
与double
类型,printf
函数都使用%f
进行说明。%.0f
表示不打印小数点和小数部分。
这段程序比较特殊的是我们的循环体是空的。我们的任务都在条件测试部分和增加步长部分完成了,但是for
循环必须有一个循环体,所以我们写一条空语句;
。单独的分号称为空语句。
1.5.3 行计数
接下来的这个程序用于统计输入中的行数,判断行数的方法就是看\n
的个数
#include <stdio.h>
/* count lines in input */
int main()
{
int c, nl;
nl = 0;
while ((c = getchar()) != EOF)
if (c == '\n')
++nl;
printf("%d\n", nl);
}
在该程序中,while
循环语句的循环体是一个if
语句,它控制自增语句++nl
。if
语句先测试圆括号的条件,如果为真,就执行后面的一条语句或是大括号括起来的一组语句,这里用缩进来表示语句之间的控制关系。
双等于号==
是C语言中表示"关系"的运算符。记住:=
为赋值运算符,而==
为是否相等的关系运算符,切记!
用单引号' \n'
扩住的字符表示一个整形数,数值等于此字符在机器字符集中对应的数值,我们成为字符常量。这是较小的整形数的另一种写法。比如:'A'
是一个字符常量,在ASCII
字符集中其值为65。当然,用'A'要比用65好,以为,'A'的意义更加清晰。
字符串常量中使用的转义字符序列也是合法的字符常量,比如,'\n'代表换行符的值,在'ASCII'字符集中其值为10,应对注意,'\n'是单个字符,在表达式中不过是一个整形数而已,而"\n"
是一个仅包含一个字符的字符串常量。
1.5.4 单词计数
我们介绍的这个程序用于统计行数、单词数与字符数。这里单词的定义为,不含空格、制表符或换行符的字符序列。
#include <stdio.h>
#define IN 1 /* inside a word */
#define OUT 0 /* outside a word */
/* count lines, words, and characters in input */
int main()
{
int c, nl, nw, nc, state;
state = OUT;
nl = nw = nc = 0;
while ((c = getchar()) != EOF) {
++nc;
if (c == '\n')
++nl;
if (c == ' ' || c == '\n' || c == '\t')
state = OUT;
else if (state == OUT) {
state = IN;
++nw;
}
}
printf("%d %d %d\n", nl, nw, nc);
return 0;
}
程序执行时,每当遇见单词的第一个字符,它就作为一个新单词加以统计。state变量记录程序当前是否正正位于一个单词中,它的处置为OUT
(不在单词中),我们在这里使用了符号常量IN
与OUT
,而没有使用1与0,这样程序更易读。
以下语句
nl = nw = nc = 0;
这种赋值方式为联合赋值方式,由于赋值运算符=
的结合性为右结合,所以等价于:
n1 = (nw = (nc = 0));
运算符||
代表OR(逻辑或),所以以下语句
if (c == ' ' || c== '\n' || c == '\t')
的意义为"如果c是空格,或换行符,或制表符",与之对应的,运算符&&
代表AND(逻辑与),它比||
高一个优先级。由&&
或||
连接的表达式由左至右求值,并在求值过程中只要能判断出最终结果为真或假,就立即终止。这种特性称为短路。比如:
a = 1,b = 2;
if(a == 1 || b == 1){
printf("a为1或b为1")
}
||
只要有一个真,整个表达式的值就为真,所以比较完a==1
,即可求出表达式的值为真,所以b==1
就不会比较。
这段程序中还包括一个else
部分,它指定if
语句中的条件部分为假时所要执行的动作,一般形式为:
if(表达式)
语句1;
else
语句2;
if
后的条件为真执行语句1,为假执行语句2,语句1和语句2都可以是单条语句或是大括号括起来的多条语句。