I. INTRODUCTION
自组织网络(Self-Organizing Networks, SONs)
基站(Base Stations, BSs)
连续时间Markov链(Continuous Time Markov Chain, CTMC)
软件/硬件故障、多厂商不兼容、SON冲突,
影响网络的覆盖率和可靠度
对蜂窝网络的可靠性行为分析→基站失效率的量化模型→考虑各种故障情况
II. MODEL DEVELOPMENT
相位型分布(phase-type distribution):指数相位的卷积,无记忆性
从一个状态由于失效和恢复转移到另一个状态的时刻服从指数分布
状态空间S = {1, 2, 3},X(t)定义基站在t时刻的状态
X(t) = 1,最优状态,所有参数配置为最优值
X(t) = 2,次优状态,几个参数配置错误,性能下降
X(t) = 3,停机状态
故障分类:
(1)一般故障:发生率λt,不会造成停机,导致最优状态到次优状态,1→2
(2)关键故障:发生率λc,造成完全停机,1→3/2→3
恢复模块采用自协调框架
(1)检测到错误配置时重新配置参数为最优值
(2)重启基站软件或切换至备用硬件板
λ:Poisson过程
μ:指数分布
μdc:异常检测、诊断和补偿的时间
μc:补偿的时间
λ:arrival rate到达率=指数分布参数
μ:mean value的倒数=指数分布参数
X(t) :齐次的连续时间Markov链(CTMC)
转移概率只依赖于时间间隔
在转移到另一个状态j之前,在状态i的时间服从指数分布
III. ANALYSIS
A. Transient Analysis(瞬态分析)
绝对分布pj(t),初始分布pi(0):
状态概率向量P(t):
生成矩阵Q(转移速率):
速率矩阵R:
与生成矩阵的差异在对角线元素
均匀化(uniformization): 将CTMC简化为服从泊松过程的离散时间马尔可夫链(DTMC)
瞬态概率向量:
其中:
M足够大,误差越小,计算量太大
Kolmogorov微分方程(向前方程):
一阶齐次线性微分方程求解,得转移概率矩阵:
CK方程:
P(t)为转移概率矩阵
微分方程解得:
B. Performance Metrics
量化网络的可靠性的性能矩阵
1)Occupancy Time(占用时间)
:[0, T]时间内在状态j停留的时间期望
2)First Passage Time(首达时间)
:从状态i到状态j的首达时间期望
去掉状态j→j的行(出发状态为j)和列(到达状态为j)
ri为行和
3)Steady State Distribution(稳态分布)
r为行和
IV. NUMERICAL RESULTS
参数意义:
CaseⅠ:对照组
CaseⅡ:更高的故障率
CaseⅢ:更高效的检测和补偿
需要更高效的自修复SON函数
一般故障率极大地影响网络的可靠性
关键故障率太低,影响不大
V. UTILITY OF THE DEVELOPED MODEL : FAULT PREDICTION FRAMEWORK (FPF)
故障预测框架(Fault Predictive Framework, FPF)
基于过去的故障数据预测故障发生的概率
①根据过往故障数据估计λ和μ参数
②Q和R动态更新,相位型分布的数据拟合
④计算新的首次故障时间、停留时间及平稳分布
⑤预测值与真实值的偏差重新训练模型参数
基站的停机和衰退需要很大的检测开销,运用此模型预测首次次优状态的出现,在时间临近时进行检测和补偿,减少恢复时间