php实现tftp客户端

TFTP协议介绍

TFTP（Trivial File Transfer Protocol,简单文件传输协议）

是TCP/IP协议族中的一个用来在客户端与服务器之间进行简单文件传输的协议

特点：

1,简单
2,占用资源小
3,适合传递小文件
4,适合在局域网进行传递
5,端口号为69
6,基于UDP实现

TFTP下载过程

TFTP服务器默认监听69号端口
当客户端发送“下载”请求（即读请求）时，需要向服务器的69端口发送
服务器若批准此请求,则使用一个新的、临时的 端口进行数据传输

image.png

当服务器找到需要现在的文件后，会立刻打开文件，把文件中的数据通过TFTP协议发送给客户端

如果文件的总大小较大（比如3M），那么服务器分多次发送，每次会从文件中读取512个字节的数据发送过来

因为发送的次数有可能会很多，所以为了让客户端对接收到的数据进行排序，所以在服务器发送那512个字节数据的时候，会多发2个字节的数据，用来存放序号，并且放在512个字节数据的前面，序号是从1开始的

因为需要从服务器上下载文件时，文件可能不存在，那么此时服务器就会发送一个错误的信息过来，为了区分服务发送的是文件内容还是错误的提示信息，所以又用了2个字节来表示这个数据包的功能（称为操作码），并且在序号的前

TFTP数据包的格式

操作码功能
1 读请求，即下载
2 写请求，即上传
3 表示数据包，即DATA
4 确认码，即ACK
5 错误

因为udp的数据包不安全，即发送方发送是否成功不能确定，所以TFTP协议中规定，为了让服务器知道客户端已经接收到了刚刚发送的那个数据包，所以当客户端接收到一个数据包的时候需要向服务器进行发送确认信息，即发送收到了，这样的包成为ACK(应答包)

为了标记数据已经发送完毕，所以规定，当客户端接收到的数据小于516（2字节操作码+2个字节的序号+512字节数据）时，就意味着服务器发送完毕了

TFTP数据包的格式

image.png

pack函数

string pack ( string $format [, mixed $args [, mixed $... ]] )

该函数用来将对应的参数 $args打包成二进制字符串。其中第一个参数$ format，有如下选项

Code	Description
a	以NUL字节填充字符串空白
A	以SPACE(空格)填充字符串
h	十六进制字符串，低位在前
H	十六进制字符串，高位在前
c	有符号字符
C	无符号字符
s	有符号短整型(16位，主机字节序)
S	无符号短整型(16位，主机字节序)
n	无符号短整型(16位，大端字节序)
v	无符号短整型(16位，小端字节序)
i	有符号整型(机器相关大小字节序)
I	无符号整型(机器相关大小字节序)
l	有符号长整型(32位，主机字节序)
L	无符号长整型(32位，主机字节序)
N	无符号长整型(32位，大端字节序)
V	无符号长整型(32位，小端字节序)
q	有符号长长整型(64位，主机字节序)
Q	无符号长长整型(64位，主机字节序)
J	无符号长长整型(64位，大端字节序)
P	无符号长长整型(64位，小端字节序)
f	单精度浮点型(机器相关大小)
d	双精度浮点型(机器相关大小)
x	NUL字节
X	回退一字节
Z	以NUL字节填充字符串空白(new in PHP 5.5)
@	NUL填充到绝对位置

字节序是什么？

就是字节的顺序，说白了就是多字节数据的存放顺序(一个字节显然不需要顺序)。
比如A和B分别对应的二进制表示为0100 0001、0100 0010。对于储存字符串AB，我们可以0100 0001 0100 0010也可以0100 0010 0100 0001，这个顺序就是所谓的字节序。

C语言中几种类型所占字节数

Type	Size	数值范围
布尔型 bool	1 byte	true false
有符号短整型 short [int] /signed short [int] int	2 byte	long -32768~32767
无符号短整型 unsigned short [int]	2 byte	0~65535
有符号整型 int /signed [int]int	4 byte	-2147483648~2147483647
无符号整型 unsigned [int]	4 byte	-2147483648~2147483647
有符号长整型 long [int]/signed long [int]	4 byte	-2147483648~2147483647
有符号长整型 long [int]/signed long [int]	4 byte	0~4294967295
long long	8 byte	0~18446744073709552000
有符号字符型 char/signed char	1 byte	-128~127
无符号字符型 unsigned char	1 byte	0~255
单精度浮点型 float	4 byte	-3.4E-38~3.4E+38
双精度浮点型 double	8 byte	1.7E-308~1.7E+308

高/低位字节

比如字符串AB，左高右低(我们正常的阅读顺序)，A为高字节，B为低字节

高/低地址

假设0x123456是按从高位到底位的顺序储存，内存中是这样存放的：

高地址 -> 低地址
12 -> 34 -> 56

大端字节序(网络字节序)

大端就是将高位字节放到内存的低地址端，低位字节放到高地址端。网络传输中(比如TCP/IP)低地址端(高位字节)放在流的开始，对于2个字节的字符串(AB)，传输顺序为：A(0-7bit)、B(8-15bit)。
那么小端字节序自然和大端相反。

主机字节序

表示当年机器的字节序(也就是网络字节序是确定的，而主机字节序是依机器确定的)，一般为小端字节序。

a和A(打包字符串，用NUL或者空格填充)

$string = pack('a6', 'china');
var_dump($string); //输出结果: string(6) "china",最后一个字节是不可见的NUL
echo ord($string[5]); //输出结果: 0(ASCII码中0对应的就是nul)

//A同理
$string = pack('A6', 'china');
var_dump($string); //输出结果: string(6) "china ",最后一个字节是空格
echo ord($string[5]); //输出结果: 32(ASCII码中32对应的就是空格)

image.png

附赠ASCII表一张(linux/unix下可以使用man ascii查看)

h和H

$string = pack('H3', 281);
var_dump($string); //输出结果: string(2) "("

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//输出结果: 40 16

h和H需要特殊说明一下，它们是将对应的参数看做十六进制字符然后打包。什么意思呢？比如上面的281，打包前会将281转换为0x281，因为十六进制的一位对应二进制的四位，上面的0x281只有1.5个字节，后面会默认补0变成0x2810，0x28对应的十进制为40(()，0x10对应的十进制为16(dle不可见字符)，懂了吧？不懂可以给我留言。。

c和C

$string = pack('c3', 67, 68, -1);
var_dump($string); //输出:string(3) "CD�"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//输出: 67 68 225

最后输出本能应该觉得是67 68 -1
ord获取的是字符的ASCII码(范围0-255)，这时-1(0000 0001)对应的字符将以补码的形式输出也就是255(1111 1110 + 0000 0001 = 1111 1111)

整型相关

所有的整型类型使用方法完全一样，主要注意它们的位和字节序就可以了，下面以L作为例子展示

$string = pack('L', 123456789);
var_dump($string); //输出:string(4) "�["

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//输出: 21 205 91 7

f和d

$string = pack('f', 12345.123);
var_dump($string);
//输出:string(4) "~�@F"
var_dump(unpack('f', $string)); //这里提前用到了unpack，后面会讲解
//输出:float(12345.123046875)

f和d是针对浮点数打包，至于为什么打包前是12345.123解包后是12345.123046875，这个和浮点数的储存有关系，后面可以单开一个文章讲解一下IEEE标准

x、X、Z、@

$string = pack('x'); //打包一个nul字符串
echo ord($string); //输出: 0

关于X(大写X)，试了N次，没搞明白怎么用，有清楚的童鞋可以给我留言，多谢。

$string = pack('Z2', 'abc5'); //其实就是将从Z后面的数字位置开始，全部设置为nul
var_dump($string); //输出:string(2) "a"

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//输出: 97 0

$string = pack('@4'); //我理解为填充N个nul
var_dump($string); //输出: string(4) ""

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//输出: 0 0 0 0

unpack

array unpack ( string $format , string $data )

unpack的使用相当简单，就是讲pack打包的数据解包，打包的时候用的什么参数，就用什么参数解包

php实现tftpd下载代码

<?php

$ip = $argv[1] ?? null;
$file_name = $argv[2] ?? null;
$port = 69;

if (!$ip || !$file_name) {
    die("\r\r\n输入的格式不正确,例如 php xxx.php 127.0.0.1 test.jpg\r\n");
}

$sock = socket_create(AF_INET, SOCK_DGRAM, SOL_UDP);
$sendMsg = pack('n', 1);
$sendMsg1 = pack('H*', bin2hex($file_name));
$sendMsg2 = pack('c', 0);
$sendMsg3 = pack('H*', bin2hex('octet'));
$sendMsg4 = pack('c', 0);

$send = $sendMsg . $sendMsg1 . $sendMsg2 . $sendMsg3 . $sendMsg4;
$len = strlen($send);
socket_sendto($sock, $send, $len, 0, $ip, $port);
$new_filename = time() . '.jpg';
$newfd = fopen($new_filename, 'a');
while (true) {
    $size = socket_recvfrom($sock, $result, 1024, 0, $ip, $port);
    $data1 = substr($result, 0, 2);
    $data2 = substr($result, 2, 2);
    $flg = unpack('n', $data1)[1];
    $num = unpack('n', $data2)[1];
    echo '已完成下载块：' . $num . "\r\n";
    if ($flg == 3) {
        $data3 = substr($result, 4);
        fwrite($newfd, $data3);
        $ack = pack('n', 4);
        $ack1 = pack('n', $num);
        $ack_send = $ack . $ack1;
        $ack_len = strlen($ack_send);
        socket_sendto($sock, $ack_send, $ack_len, 0, $ip, $port);
        if ($size < 516) {
            socket_close($sock);
            fclose($newfd);
            echo '完成下载';
            break;
        }
    } elseif ($flg == 5) {
        $data4 = substr($result, 4, strlen($result) - 1);
        echo '下载失败原因：' . $data4;
        socket_close($sock);
        fclose($newfd);
        if (is_file($new_filename)) unlink($new_filename);
        break;
    }
}

image.png

用抓包工具Wireshark来查看发送和接收数据

image.png