C程序设计语言 1.5 字符输入/输出

我们前面学习过输出，printf函数，标准库提供了一次读/写一个字符的函数，其中最简单的是getchar和putchar，顾名思义，getchar为得到一个字符，putchar输出一个字符。每次调用时，getchar函数从输入流中读取一个字符，并将其作为结果值返回，例如：

int c = getchar()

变量c中包含输入流中的下一个字符，暂时是从键盘输入。每次调用putchar()时将打印一个字符，例如

putchar(c)

将把整型变量c的内容以字符的形式打印出来，通常是显示在屏幕上

1.5.1 字符复制

下面这个程序为复制输入，然后输出

#include <stdio.h>
/* copy input to output; 1st version */
int main()
{
  int c;
  c = getchar();
  while (c != EOF) {
    putchar(c);
    c = getchar();
  }
  return 0;
}

其中，关系运算符!=表示"不等于"。
char类型专门用于存储字符型数据，占用一个字节，而任何整数型int也可以用于存储字符型数据，因为int一般占用四个字节，不会溢出，因为某些潜在的重要原因，我们再次使用int类型。
在上例中，有一个特殊的字符常量EOF（end of file，文件结束），表示输入流的结束。在输入流结束或是文件流结束，getchar函数将会返回一个特殊值，与任何实际字符都不同，就是EOF。我们在声明变量c的时候，必须让它大到足以存放getchar函数返回的任何值。之所以不把c声明成char，是因为它必须足够大，除了能存储任何可能的字符外还要能存储文件结束符EOF。因此必须将c声明称int类型。EOF在头文件<stdio.h>是个整形数-1，具体数值并不重要，只要它与任何char类型的值都不相同即可。这里使用符号常量，可以确保程序不需要依赖对应的任何特定的数值。
可以将程序精炼如下：

#include <stdio.h>
/* copy input to output; 2nd version */
int main()
{
  int c;
  while ((c = getchar()) != EOF)
    putchar(c);
  }

在该程序中，while循环语句首先读一个字符并将其赋值给c，然后测试是否为EOF，如果字符不是EOF，则执行循环体，然后重复执行while语句。当到达结尾位置（EOF），while循环语句终止执行。
值得注意的是，在while ((c = getchar()) != EOF)中，c=getchar()两端的小括号不可省略，因为关系运算符!=的优先级比赋值运算符=高。

1.5.2 字符计数

下列程序用于对字符进行计数

#include <stdio.h>
/* count characters in input; 1st version */
int main()
{
  long nc;
  nc = 0;
  while (getchar() != EOF)
    ++nc;
  printf("%ld\n", nc);
  return 0;
 }

其中循环体++nc引入了一个新的运算符++，其功能是执行加1操作，叫做自增操作符，可以用nc = nc + 1代替它。与自增操作符对应的为自减操作符--。++与--这两个运算符既可以作为前缀操作符(++nc)，也可以作为后缀操作符(nc++)，关于这两者的区别，我们以后介绍，当然你也可以自行学习。
该字符计数程序使用long类型的变量存放计数值，而不是使用int，是因为long类型要比int大，至少会占用32位，在某些机器上，int占用16位，所以相当小的输入都可能使int类型的变量溢出。%ld指示printf函数对应的参数是long类型。

使用double(双精度浮点型)类型可以处理更大的数字。我们用double和for循环语句来展示编写此循环的另一种方式：

#include <stdio.h>
/* count characters in input; 2nd version */
int main()
{
  double nc;
  for (nc = 0; getchar() != EOF; ++nc)
  ;
  printf("%.0f\n", nc);
}

对于float与double类型，printf函数都使用%f进行说明。%.0f表示不打印小数点和小数部分。
这段程序比较特殊的是我们的循环体是空的。我们的任务都在条件测试部分和增加步长部分完成了，但是for循环必须有一个循环体，所以我们写一条空语句;。单独的分号称为空语句。

1.5.3 行计数

接下来的这个程序用于统计输入中的行数，判断行数的方法就是看\n的个数

#include <stdio.h>
/* count lines in input */
int main()
{
  int c, nl;
  nl = 0;
  while ((c = getchar()) != EOF)
    if (c == '\n')
      ++nl;
  printf("%d\n", nl);
}

在该程序中，while循环语句的循环体是一个if语句，它控制自增语句++nl。if语句先测试圆括号的条件，如果为真，就执行后面的一条语句或是大括号括起来的一组语句，这里用缩进来表示语句之间的控制关系。
双等于号==是C语言中表示"关系"的运算符。记住：=为赋值运算符，而==为是否相等的关系运算符，切记！
用单引号' \n'扩住的字符表示一个整形数，数值等于此字符在机器字符集中对应的数值，我们成为字符常量。这是较小的整形数的另一种写法。比如：'A'是一个字符常量，在ASCII字符集中其值为65。当然，用'A'要比用65好，以为，'A'的意义更加清晰。
字符串常量中使用的转义字符序列也是合法的字符常量，比如，'\n'代表换行符的值，在'ASCII'字符集中其值为10，应对注意，'\n'是单个字符，在表达式中不过是一个整形数而已，而"\n"是一个仅包含一个字符的字符串常量。

1.5.4 单词计数

我们介绍的这个程序用于统计行数、单词数与字符数。这里单词的定义为，不含空格、制表符或换行符的字符序列。

#include <stdio.h>
#define IN 1 /* inside a word */
#define OUT 0 /* outside a word */

/* count lines, words, and characters in input */
int main()
{
    int c, nl, nw, nc, state;
    state = OUT;
    nl = nw = nc = 0;
    while ((c = getchar()) != EOF) {
        ++nc;
        if (c == '\n')
            ++nl;
        if (c == ' ' || c == '\n' || c == '\t')
            state = OUT;
        else if (state == OUT) {
            state = IN;
            ++nw;
        }
    }
    printf("%d %d %d\n", nl, nw, nc);
    return 0;
}

程序执行时，每当遇见单词的第一个字符，它就作为一个新单词加以统计。state变量记录程序当前是否正正位于一个单词中，它的处置为OUT（不在单词中），我们在这里使用了符号常量IN与OUT，而没有使用1与0，这样程序更易读。
以下语句

nl = nw = nc = 0;

这种赋值方式为联合赋值方式，由于赋值运算符=的结合性为右结合，所以等价于：

n1 = (nw = (nc = 0));

运算符||代表OR(逻辑或)，所以以下语句

if (c == ' ' || c== '\n' || c == '\t')

的意义为"如果c是空格，或换行符，或制表符"，与之对应的，运算符&&代表AND（逻辑与），它比||高一个优先级。由&&或||连接的表达式由左至右求值，并在求值过程中只要能判断出最终结果为真或假，就立即终止。这种特性称为短路。比如：

a = 1,b = 2;
if(a == 1 || b == 1){
  printf("a为1或b为1")
}

||只要有一个真，整个表达式的值就为真，所以比较完a==1，即可求出表达式的值为真，所以b==1就不会比较。
这段程序中还包括一个else部分，它指定if语句中的条件部分为假时所要执行的动作，一般形式为：

if(表达式)
  语句1;
else
  语句2;

if后的条件为真执行语句1，为假执行语句2，语句1和语句2都可以是单条语句或是大括号括起来的多条语句。

C程序设计语言 1.5 字符输入/输出