2018-10-30

开放实验作业

1.sigmoid函数与tanh函数的梯度消失:

写出函数表达式:
sigmoid函数: y_{1}=\frac{1}{1+e^{-w^{T}x-b}}
tanh函数:y_{2}=\frac{e^{2w^{T}x+2b}-1}{e^{2w^{T}x+2b}+1}
对两函数进行求导可以得到:
\frac{dy_{1}}{dx}=w\frac{e^{-w^{T}x-b}}{(1+e^{-w^{T}x-b})^{2}}
\frac{dy_{2}}{dx}=w\frac{4}{(e^{w^{T}x+b}+e^{-w^{T}x-b})^{2}}
以sigmoid函数导数的图像为例:

sigmoid.jpg

z=w^{T}x+b,当z的取值较大时,会发现两个函数的导数都会趋于0,这使得神经网络反馈进行梯度下降时十分缓慢,不利于权重的更新。举个一元多层神经网络的例子:

yiyuan.png

根据链式法则得到求导公式:
\frac{\partial J}{\partial w}=w_{2}w_{3}w_{4}\delta^{'}z_{2}\delta^{'}z_{3}\delta^{'}z_{4}\delta^{'}z_{1}

可见最终算出的权重会很小
解决办法:
1.使用ReLU函数: ReLU函数的表达式为:
y=x(x>0)
,
y=0(x<0)
,这样,当x大于0时,y关于x的导数恒为1,不会出现梯度消失的问题。

2.ReLU函数的优点与局限性,以及部分改进

ReLU函数优点:
1.在进行梯度下降时不会受到x值的影响,即梯度消失的情况不会存在。
2.输入一个阈值便可以得到一个激活值,无需进行复杂的运算。
局限性:
在训练的过程中,有一部分z取值小于0时,对应神经元将不会被激活,也就不会参与到反馈中。当训练的神经元有很多时,很多神经元会“坏死”掉。
改进:
x<0时,并不令ReLU函数值为0,而是y=kx(|k|<1),这使得负轴的信息不会全部丢失。

3.多层感知机的平方误差以及交叉熵函数:

平方误差函数:对于隐含层和输出层神经元,输入值为y'k,实际预测值为yk,则(x_{k},y_{k})累计平方误差为:
E_{k}=\frac{1}{2}\sum_{j=1}^{l}(y_{k}^{'}-y_{k})^{2}
交叉熵函数:属于输入向量(x_{k},y_{k}),得到预测值后,交叉熵损失函数为:
P=-\sum_{j=1}^{l}(y_{j}\ln{y_{j}^{'}}+(1-y_{j})\ln{(1-y_{j}^{'})}
其中,l代表输出神经元的个数。当有N个训练数据时,交叉熵函数写成:
P=-\frac{1}{N}\sum_{i=1}^{N}\sum_{j=1}^{l}(y_{j}^{(i)}\ln{y_{j}^{'(i)}}+(1-y_{j}^{(i)})\ln{(1-y_{j}^{'(i)})}
当训练集与测试集的正比例出现不一致时,可以假设系数\alpha,\beta,如果正样本以\alpha的比例进行抽样,负样本以\beta的比例进行抽样,新的函数可写为:
P=-\frac{1}{N}\sum_{j=1}^{l}\alpha y_{j}\ln{y_{j}^{'}}+\beta(1-y_{j})\ln{(1-y_{j}^{'})}

4.损失函数比较:

平方误差损失函数:在学习率一定的情况下,平方误差损失函数的梯度会随着目标的接近而减小,因此在最后的训练过程中会取到更好效果。这类函数适用于局外点不太多的情况,当存在部分点与目标值偏差较大时,使用平均绝对误差函数会更好。
交叉熵损失函数:函数值越小,预测值与实际值相同的概率越接近。该损失函数对正确的结果较为看中,例如当预测结果为(a,b,c),实际结果为(1,0,0)时,交叉熵函数值为P=-\ln{a},因此,该损失函数更多会应用于分类问题。相比较而言,平方误差损失函数应用于回归问题更好,因为他能更多照顾到错误的预测,并进行修正。

5.模型的方差与偏差关系:

模型的偏差较大时会出现欠拟合状态,模型的方差较大时会出现过拟合状态。
应用网上的一个简单图片:


偏差与方差关系

当模型开始训练时,注意到的细节较少,训练出的每个预测值都会与真实值有一定差距,这时会出现偏差较大的情况。当训练时间过长,出现过拟合的情况时,输入一组数据,因模型很复杂,只能代表训练的数据而代表不了所有数据,所以得到的结果可能与实际值差别很大,即方差较大。

6.解决模型过拟合与欠拟合:

6.1.解决模型的过拟合:

1.增加一个正则化因子,在模型预测时,目标损失函数可改写为:
P(w,x,y)=P(w,x,y)+\alpha K(w)
其中K(w)被称之为惩罚项,\alpha为大于0的常数,K(w)有不同的表示方法,取其中一种:K(w)=\frac{1}{2}|w|^{2}
在此情况下,当计算下降梯度时,表达式变为:
\nabla K(w)=2\alpha w+\nabla K(w)
w=w-\delta(\alpha w+\nabla K(w))
这样的话,权重更新时原有的权重因子影响变小,权重本身会减小到比以前更小的值,避免了梯度“一家独大”的现象。
2.适当减少分类时的物品属性或回归时的多项式最高项次数。
3.在深度神经网络学习时,可以适当让部分神经元“坏死”,每次坏死的神经元随机。我认为这种方法在神经元较多时使用,减小了模型复杂度。

6.2 .解决模型欠拟合:

1.对于离散自变量,可以增添更多参数。例如在预测物品种类时,增加物品更多的属性。
2.对于连续性自变量,可以考虑增加多项式的次数。
3.取消正则化因子。

6.3.其他训练方法:

交叉验证:先将数据集D划分为k个大小相似的互斥子集,D=D_{1}\bigcup D_{2}\bigcup D_{3}...,每次选取k-1个子集的并集作为训练集,剩下的为测试集,可以进行k次测试,返回的是k次预测结果的平均值。

7.卷积神经网络相较于MLP的优点:

在进行图像处理时,假设一幅RGB图像的长与宽皆为1000,那么图像矩阵中有1000*1000*3组数据,在进行神经网络训练时输入向量维数过大。使用CNN(卷积神经网络)可以提取图像中的有效信息,将卷积后的矩阵作为输入向量,训练复杂度更小。同时,可以通过反馈机制一步步优化filter矩阵。

编程题代码:

1.图片处理:

from PIL import Image
import numpy as np
def photo_array():
 
 I = Image.open('D:/engineer/opencv/number.jpg') 
 I.show()    
 I_array = np.array(I)
 width=np.size(I_array,0)
 height=np.size(I_array,1)
 I_array=I_array.reshape(height,width,3)
 print(I_array)
 return I_array
#该函数输出一个 行数*列数*3 的矩阵

2.函数编辑:

import math
import numpy as np
def sigmoid(weight,x,b):
     z=float(weight.dot(x)+b)
     return 1/(1+math.exp(z))

def tanh(weight,x,b):
     z=float(weight.dot(x)+b)
     return (math.exp(2*z)-1)/(math.exp(2*z)+1)

def diff_sigmoid(weight,x,b):#导数1
     diff1=weight
     z=float(weight.dot(x)+b)
     diff2=-math.exp(z)/(1+math.exp(z))**2
     return diff2*diff1

def diff_tanh(weight,x,b):#导数2
     diff1=weight
     z=float(weight.dot(x)+b)
     diff2=4/(math.exp(z)+math.exp(-z))**2
     return diff2*diff1

3.使用普通的卷积运算函数

#输入:原始矩阵,filter矩阵,卷积中心点,filter矩阵长与宽
import numpy as np
import math as mt
def filter_read(mat1,mat2,r1,c1,r2,c2):
     number=0
     for i1 in range(r2):
          for j1 in range(c2):
             number+=np.dot(mat1[r1-int((r2-1)/2)+i1][c1-int((c2-1)/2)+j1],mat2[i1][j1])
     return number#计算filter矩阵的每一通道与原矩阵通道的乘积

4.使用polling(寻找最大值)的方式卷积函数:

import numpy as np
import math as mt
def filter_read(mat,r1,c1,r2,c2):
     mat1=np.zeros([r2,c2])
     for i1 in range(r1):
          for i2 in range(c1):
               mat1[i1][i2]=mat[r1-(r2-1)/2+i1][c1-(c2-1)/2+i2]
     return mat1

5.卷积计算函数

#函数参数为,原矩阵,步长,padding长度,filter矩阵个数,filter矩阵
def cnn(origin_mat,s,p,nf,filter_cnn):
     o_row=np.size(origin_mat,0)#行数
     o_col=np.size(origin_mat,1)#列数
     f_row=np.size(filter_cnn[0],0)#filter行数
     f_col=np.size(filter_cnn[0],1)#filter列数
     
     origin1_mat=np.zeros([o_row+2*p,o_col+2*p,3])##三通道矩阵
     for h1 in range(o_row):
          for h2 in range(o_col):
               origin1_mat[h1+p][h2+p]=origin_mat[h1][h2]
     o_row=o_row+2*p#padding后的矩阵行
     o_col=o_col+2*p#padding后的列
     
     c_row=mt.floor((o_row+2*p-f_row)/s+1)
     c_col=mt.floor((o_col+2*p-f_row)/s+1)
     change_mat=np.zeros([nf,c_row,c_col])#卷积后矩阵
     start_row=int((f_row-1)/2)
     start_col=int((f_col-1)/2)#选取卷积中心
     
     for i in range(nf):
         for j1 in range(c_row-1):
              for j2 in range(c_col-1):
                   print(origin1_mat[start_row][start_col])
                
                   change_mat[i][j1][j2]=filter_read(origin1_mat,filter_cnn[i],start_row,start_col,f_row,f_col)
                   start_col+=s
              start_col=int((f_col-1)/2)
              start_row+=s#卷积中心改变,使用步长
         start_row=int((f_row-1)/2)
         start_col=int((f_col-1)/2)
     print(start_row)
     return change_mat
#实际运用
test1=np.random.randint(0,255,size=[500,500,3])
#随机生成一个图片矩阵
test_s=5
test_p=2
test_nf=3
filter_cnn=np.random.randint(0,3,size=[test_nf,3,3,3])
print(filter_cnn)
new1=cnn(test1,test_s,test_p,test_nf,filter_cnn)
print(new1)
print('新矩阵的行数:',np.size(new1,0))
print('新矩阵的列数:',np.size(new1,1))
print(

结果:


结果.png

读取图片卷积结果:


结果2.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,717评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,501评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,311评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,417评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,500评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,538评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,557评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,310评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,759评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,065评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,233评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,909评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,548评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,172评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,420评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,103评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,098评论 2 352

推荐阅读更多精彩内容