1. 创新点
1.1. 内容
利用CNN进行the complex temporal radio signal domain 的研究
1.2. 效果
相对于手动提取特征,CNN从原始数据中自动提取特征的性能好很多
2. 介绍
2.1. 机器学习的技术在CV和语音识别中运用广泛且非常好
2.2. 传统的无线电通信技术提取专家特征非常难以继续突破
2.3. 利用机器学习实现无线电通信特征提取是一个很好的方法
3. 调制识别
3.1. Dynamic Spectrum Access (DSA)
避免自己的无线电影响或被其他的无线电所影响,导致无法接受目标无线电信号
3.2. Modulation Recognition
是一个识别任务,这种识别任务基于带有噪声的接受信号,基于何种通信规范被使用,及何种频谱类型被使用,因为这三者可能会导致信号失真
3.4. Expert Cyclic-Moment Features
广泛用于调制识别和分析决策树,从而实现对调制类别进行分类
m阶统计量
n阶时变或延迟接受信号r(t)的功率
3.5. Convolutional Feature Learning
原始无线电时序信号r(t)以窗口形式输入到卷积神经网络中
r(t)样本以2xN矢量输入到2D卷积神经网络中
正交和同步抽样的IQ样本可以组成2维信号数据
4. 数据
4.1. introduction
特点
在机器学习领域有点不合适
在无线电通信领域却可以在某种时候等同于真实系统
方式
把真实语音和文本数据调制到信号中
再加入白噪声
方法
利用GUN Radio 通道模式生成数据集
利用128样本的矩形窗口再把数据集分割成一个测试集
结果
- 大约500MB的数据存储在python pickle file 中
4.2. Dataset Availability
- benchmark in the field
4.3. Dataset Parameters
11种调制类型
8中数字调制:BPSK, QPSK, 8PSK, 16QAM, 64QAM, BFSK, CPFSK, and PAM4
3种模拟调制:WB-FM, AM-SSB, AM-DSB
- 调制类别
4.4. Dataset Plots
时域中可以看到不同调制类别的的相似性和不同点,但由于脉冲整流信号的原因,无法被专家感知
频域中科院看到这些信号的功率,从设计上可以看到信号具有相同的包络,但也无法被专家感知
4.5. Modulated Information
4.6. Effects on the Modulated Signal
白噪声:硬件的温度
发射机与接收机导致码元时域偏移、采样率偏移,载波频率偏移,相位偏差
多径衰弱
4.7. Generating a dataset
实际中广泛使用的离散二进制字母表(数字调制)和连续字母表(模拟调制)
把已知的数据调制到调制解调器中,并利用GNU Radio暴露在信道中
把时序信号利用窗技术分段存储,从128采样中获得其中的64采样数据
样本信息包含
4.1. 调制数据bits
4.2. 如何被调制的
4.3. 信号在信道中传播的影响
4.4. 有关发射机和接收机设备状态和包含的随机过程的信息
5. 技术方法
5.1. introduction
CNN会自动根据时序特征学习每一种调制信号的匹配滤波器
在低SNR下能有些匹配滤波器还能放大增益
5.2. Learning Invariance
- 很多无线电通信系统恢复的过程都被认为是与线性叠加、旋转、时移、放大缩小、卷积等不变性有关的
5.3. Evaluation Network
4层CNN,2个卷积层,2个全连接层
前3层使用ReLU激活函数,最后一层使用softmax激活函数
使用正则化防止过拟合
3.1. 卷积层使用L-2范数
3.2. 第一个全连接层使用h1范数
Dropout用于预防网络单元的specialization
利用交叉熵作为损失函数
利用Adam作为优化器,此优化器是一个基于梯度下降法有效的迭代计算器
5.4. Training Complexity
- Software & Hardward
1.1. Keras with TensorFlow
1.2. NVIDIA CUDA enabled Titan X GPU
- Training
2.1. 数据个数:900,000个
batch sizes:1024
epoches:24 epochs
单个耗时:22s
总耗时:大约9min
5.5. Learned Features
看看CNN到底学到了什么特征信息
第1个卷积层:主要看I&Q通道
第2个卷积层
6. 结果
6.1. 训练数据
12M复杂样本中分为了11种调制类型
96,000样本训练,64,000样本测试和验证(每个样本的长度是128)
数据集的SNR的分布于-20dB~20dB
6.2. 训练结果
在测试集上大约获得64.4%的正确率
8PSK被误分类成QPSK, WBFM误分类成AM-DSB
6.3. 分析
6.3.1. an 8PSK symbol containing the correct bits/symbols for a certain number of subsequent symbols is indiscernible from QPSK since the QPSK constellation points are spanned by that subset of 8PSK.
6.4. 对比
SNR分别取-10dB, 0dB, 10dB
模型:决策树,3NN,SVM,CNN
6.6. 结论
SNR = -10dB: 除了CNN能够正确分类部分类别,其他的基本上不行
SNR = 0dB: 除了CNN基本上可以对大多数类分类正确,其他的基本上停留在CNN为-10dB的水平
SNR = 10dB: CNN已经在0dB时饱和了,正确率不再变化,其他的相对于自身在0dB时已经好点了,但还是不如CNN
7. 模型复杂度
7.1. 训练时间
CNN训练需要大量数据,但相对于SVM模型,在矩阵求逆中花的时间更少
7.2. 分类效率
CNN在分类时比SVM好,比DTree和GaussianNB差点
7.3. 结论
CNN在整体来说是比其他的要好点