socket概念
- 在Linux中的网络编程是通过socket接口来进行的。socket是一种特殊的I/O接口,它也是一种文件描述符。它是一种常用的进程之间通信机制,通过它不仅能实现本地机器上的进程之间的通信,而且通过网络能够在不同机器上的进程之间进行通信。
- 每一个socket都用一个半相关描述{协议、本地地址、本地端口}来表示;
- 一个完整的套接字则用一个相关描述{协议、本地地址、本地端口、远程地址、远程端口}来表示。
- socket也有一个类似于打开文件的函数调用,该函数返回一个整型的socket描述符,随后的连接建立、数据传输等操作都是通过socket来实现的。
- socket类型
(1)流式socket(SOCK_STREAM)
流式套接字提供可靠的、面向连接的通信流;它用于TCP协议,从而保证了数据传输的正确性和顺序性。
(2)数据报socket(SOCK_DGRAM)
数据报套接字定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证是可靠、无差错的。它使用数据报协议UDP。
(3)原始socket
原始套接字允许对底层协议如IP或ICMP进行直接访问,它功能强大但使用较为不便,主要用于一些协议的开发。 - socket信息数据结构
struct sockaddr
{
unsigned short sa_family; /*地址族*/
char sa_data[14]; /*14字节的协议地址,包含该socket的IP地址和端口号。*/
};
struct sockaddr_in
{
short int sa_family; /*地址族*/
unsigned short int sin_port; /*端口号*/
struct in_addr sin_addr; /*IP地址*/
unsigned char sin_zero[8]; /*填充0 以保持与struct sockaddr同样大小*/
}
struct socketaddr_in : struct sockaddr是通用的套接字地址;
struct sockaddr_in则是internet环境下套接字的地址形式
数据存储优先顺序的转换
- 计算机数据存储有两种字节优先顺序:高位字节优先(称为大端模式)和低位字节优先(称为小端模式)。
- Internet上数据以高位字节优先顺序在网络上传输;计算机中通常使用低位字节优先存储数据
-
因此需要对这两个字节存储优先顺序进行相互转化。函数:htons()、ntohs()、htonl()和ntohl(),分别实现网络字节序和主机字节序的转化,h代表host,n代表network,s代表short,l代表long。通常16位的端口号用s代表,而IP地址用l来代表。
地址格式转换
-
通常用户在表达地址时采用的是点分十进制表示的数值(或者是以冒号分开的十进制IPv6地址),而在通常使用的socket编程中所使用的则是二进制值,这就需要将这两个数值进行转换。这里在IPv4中用到的函数有inet_aton()、inet_addr()和inet_ntoa(),而IPv4和IPv6兼容的函数有inet_pton()和inet_ntop()。进制值。
- inet_pton()和inet_ntop()函数中p和n分别代表表达(presentation)和数值(numeric)。地址的表达格式通常是ASCII字符串,数值格式则是存放到套接字地址结构的二进制值。
- inet_ntop
原型:
const char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt);
参数说明:
af:IPv4或IPv6协议选择,分别设置成AF_INET或AF_INET6。
src:要转化的地址
dst:转化后的值
socklen_t cnt:他是所指向缓存区dst的大小,避免溢出,如果缓存区太小无法存储地址的值,则返回一个空指针。
返回值:成功返回字符串的首地址,错误返回NULL; - inet_addr
功能:将一个点分十进制的IP转换成一个长整数型数(u_long类型)
原型:in_addr_t inet_addr(const char *cp);
参数:字符串,一个点分十进制的IP地址
名字地址转换
通常,人们在使用过程中都不愿意记忆冗长的IP地址,尤其到IPv6时,地址长度多达128位,那时就更加不可能一次次记忆那么长的IP地址了。因此,使用主机名将会是很好的选择。
-
在Linux中,同样有一些函数可以实现主机名和地址的转化,最为常见的有gethostbyname()、gethostbyaddr()和getaddrinfo()等,它们都可以实现IPv4和IPv6的地址和主机名之间的转化。其中gethostbyname()是将主机名转化为IP地址,gethostbyaddr()则是逆操作,是将IP地址转化为主机名,另外getaddrinfo()还能实现自动识别IPv4地址和IPv6地址。
addrinfo结构体常见选项值
主要数据结构
struct hostent
{
char *h_name;/*正式主机名*/
char **h_aliases;/*主机别名*/
int h_addrtype;/*地址类型,可设置,不设置就默认为AF_INET*/
int h_length;/*地址字节长度,可设置4或6,不设就默认为4*/
char **h_addr_list;/*指向IPv4或IPv6的地址指针数组*/
}
struct addrinfo
{
int ai_flags;/*AI_PASSIVE, AI_CANONNAME;*/
int ai_family;/*地址族*/
int ai_socktype;/*socket类型*/
int ai_protocol;/*协议类型*/
size_t ai_addrlen;/*地址字节长度*/
char *ai_canonname;/*主机名*/
struct sockaddr *ai_addr;/*socket结构体*/
struct addrinfo *ai_next;/*下一个指针链表*/
}