前言
在介绍 C 语言的基本数据类型之前有必要先了解一下计算机内存以及 C 语言变量相关的知识,有关计算机内存的详细介绍请参考深入理解计算机操作系统。
一、计算机内存
计算机在执行程序时,组成程序的指令和程序所操作的数据都必须存储在某个地方,这个地方就是机器的内存,也成为主内存(main memory),或随机访问存储器(RAM)。RAM 是易失性存储器。关闭 PC 后,RAM 中的内容就会丢失。PC 把一个或多个磁盘驱动作为其永久存储器。
大多数计算机使用8位的块,或者字节(byte),作为最小的可寻址的内存单位,而不是访问内存中单独的位。内存中的每一个字节(byte)都由惟一的数字来标识,称为它的地址空间。
计算机内存的常用单位是千字节(KB)、兆字节(MB)、千兆字节(GB)和兆兆字节(TB)。这些单位的意义如下:
- KB:1KB = 1024byte;
- MB:1MB = 1024KB,即 1,048,576 byte;
- GB:1GB = 1024MB,即 1,073,741,841 byte;
- TB:1TB = 1024GB,即 1,099,511,627,776 byte;
如果 PC 有 1GB 的 RAM 那么,字节地址范围就是 0~1,073,741,841。
二、变量
变量是计算机里一块特定的内存,它是由一个或多个连续的字节组成,一般是1、2、4、8或16字节。每个变量都有一个名称,可以用该名成表示内存的这个位置,以提取它包含的数据或是存储一个新的数值。
以下程序,会显式你的薪水,假设你的薪水是10000刀/月(做梦都会笑醒)。
#include <stdio.h>
int main()
{
printf("My salary is $10000.\n");
return 0;
}
修改该程序,使之能够根据内存中的值,定制要显示的信息。这就需要使用变量。在该示例中可以分配一块叫做 salary 的内存,把值10000存储在该变量中。
#include <stdio.h>
int main()
{
int salary;
salary = 10000;
printf("My salary is $%d.\n",salary);
return 0;
}
给变量赋予的名称称为变量名,变量名可以是一个或多个大小写字母、数字和下划线(有时下划线“_”也算作字母),但要以字母为开头。变量名的命名规范这里不展开介绍。
2.1、变量声明和定义
上面的示例中,存放薪水的语句如下:
int salary;
该语句称为变量声明,它声明了变量的名称,在该示例中变量名是 salary。声明也指定了变量存储的数据类型,这里是用 int 指定,salary 用来存放一个整数。
关于 C 语言变量的声明和定义可以简单概括为:
变量定义:用于为变量分配存储空间,还可为变量指定初始值。程序中,变量有且仅有一个定义。
变量声明:用于向程序表明变量的类型和名字。
定义也是声明,extern 声明不是定义
上面的变量声明(区别使用 extern 声明)也称为变量的定义,因为它分配了一些存储空间,用来存放存储整数值,该整数可以使用变量名 salary 来引用。
下面通过赋值语句为变量 salary 指定数据,语句如下:
salary = 10000;
在该语句之前该变量包含一个垃圾值,即上次使用这块内存空间时遗留在这里的数据。以上语句是一个简单的算数赋值语句,它将等号右边的值存储到等号左边的变量中。
这里需要注意的是,变量声明要在赋值语句之前,不然无法通过编译,因为变量在声明之前是不存在的。最好在声明时就对变量进行初始化,这可以避免对初始值的怀疑,有助于追踪错误,同时也避免了使用垃圾数据。
2.2、左值和右值
左值:如果一个“表达式”可以引用到某一个对象,并且这个对象是一块内存空间且可以被检查和存储,那么这个表达式就可以作为一个左值;
右值:右值指的是引用了一个存储在某个内存地址里的数据。
从上面的两个定义可以看出,左值其实要引用一个对象,而一个对象在我们的程序中又肯定有一个名字或者可以通过一个名字访问到,所以左值又可以归纳为:
左值:表示存储在计算机内存的对象,可寻址,相当于地址值;
右值:代表的为真实值,可读,即数据值。
因为左值是一个地址值,因此可以对左值进行赋值操作,而右值本身就是同一个数据值,就不存在对一个数据值就行赋值的操作。
这里以 ++i 和 i++ 为例来分析左值和右值:
i++ 表示取 i 的地址,把它的值装入寄存器,然后增加内存中 i 的值;
++i 表示取 i 地址,增加它的内容,然后把值放在寄存器中。
看下面这个例子:
int main(int argc, char* argv[])
{
int i = 0;
printf("%d\n",i++); // 输出为 0,返回的是寄存器的值,而不是加后的值
printf("%d\n",i); // 输出为 1,返回的是内存值
printf("%d\n",++i); // 输出为 2,返回的是内存值
// i++ = 10; // 错误,i++ 运算的结果并不是 i 变量的引用,而是一个临时变量
++i = 10;
return 0;
}
三、数据类型
C 语言包含的数据类型,如下图所示:
3.1、基本数据类型
基本数据类型包含数值类型和字符类型,以 32 位系统为例,以下类型占用字节数如下。
带符号的整数类型:
类型名称 | 所占字节 |
---|---|
signed char | 1 |
short | 2 |
int | 4 |
long int | 4 |
long long int | 8 |
类型名称 | 所占字节 |
---|---|
unsigned char | 1 |
unsigned short | 2 |
unsigned int | 4 |
unsigned long int | 4 |
unsigned long long int | 8 |
有关数据类型和存储空间参看《深入理解计算机操作系统》第二章:信息的表示和处理,这里不再赘述。
3.2、sizeof 关键字
sizeof 运算符可以确定给定的类型占用多少个字节。C 语言中 sizeof 是一个关键字。表达式 sizeof(int) 会得到 int 类型的变量所占的字节数,所得到的值是一个size_t 类型的整数。size_t 在标准头文件 <stddef.h>(和其他头文件) 中定义,对应于一个基本整数类型。要注意的是在不同的中 size_t 所对应的类型可能不同,最好使用使用 size_t 类型存储 sizeof 运算符生成的值,在64位机器下,被定义为long unsigned int。
示例代码:
#include <stdio.h>
#include <stdlib.h>
int main(){
char a[30];
char *b = (char*)malloc(20*sizeof(char));
printf("sizeof(a)=%d\n",sizeof(a));
printf("sizeof(b)=%d\n",sizeof(b));
printf("sizeof(a[3])=%d\n",sizeof(a[3]));
printf("sizeof(b+3)=%d\n",sizeof(b+3));
printf("sizeof(*(b+4))=%d\n",sizeof(*(b+4)));
return 0;
}
输出结果:
sizeof(a)=30
sizeof(b)=8
sizeof(a[3])=1
sizeof(b+3)=8
sizeof(*(b+4))=1
3.3、格式化输出
上面 sizeof 的例子,就使用了输出占位符,C 语言的基本数据类型的输出占位符如下表所示:
基本类型 | 输出占位符 |
---|---|
int | %d |
short | %d |
long | %ld |
float | %f |
double | %lf |
char | %c |
字符串 | %s |
八进制 | %o |
十六进制 | %x |