多类分类OneVsAll(吴恩达课程Octave代码用python实现)

详细代码参考github

多类分类 Multi-class Classificaition

实例:建立逻辑回归模型识别手写数字(0-9)。

1.可视化数据

识别的手写数字图片为2020*像素,每个像素值表示了该位置的灰度值。训练集中共5000个手写字,将每个手写字“拉直”,数据维度(5000,400),分类结果维度(5000, 1)

注意: Ocatave中的reshapenumpy中的reshape有点区别,它们刚好是一个转置的区别。另外数据集每行表示一个手写字,需要把长度200的向量压缩回20*20的图像,才能显示。

5000张图片中,随机选取100张进行绘制,每张中间设置一条1像素的白色边界,横向10张,纵向10张,如下图所示。由于每次都是随机,显示结果可能不一致。

数据可视化

参考代码:

def displayData(self):
    example_width = int(np.sqrt(self.pics.shape[1]))  # 每张图片的宽
    example_hight = self.pics.shape[1] // example_width

    display_rows = int(np.sqrt(self.pics.shape[0]))  # 每行显示几张图片
    display_cols = self.pics.shape[0] // display_rows
    # print(self.pics[45, :])
    display_array = np.ones((1+display_rows*(example_hight+1), 1+display_cols*(example_width+1)))*200
    curr_ex = 0  # 当前每行张数
    for i in range(display_rows):
        for j in range(display_cols):
            if curr_ex >= self.pics.shape[0]:
                break
            max_val = np.max(np.abs(self.pics[curr_ex, :]))
            display_array[1+j*(example_hight+1):(j+1)*(example_hight+1), 1+i*(example_width+1):(i+1)*(example_width+1)] = \
                self.pics[curr_ex, :].reshape((20, 20)).transpose()/max_val*255
            curr_ex += 1

        if curr_ex >= self.pics.shape[0]:
            break
    plt.xticks([])
    plt.yticks([])
    plt.imshow(display_array, cmap='gray')
    plt.show()
2.损失函数

同上节博客中损失函数没有任何区别,直接粘贴公式,注意正则化项 j是从1开始的

costJ

3.梯度函数

同样没有区别,直接写出,注意正则化项 j是从1开始的

Gradient

4.计算最优theta

使用scipy.optimize中的minimize函数,注意参数的数量,在梯度和损失函数定义的两个函数中,传入参数为4个,故minimize函数使用args=()参数,参数按照梯度和损失函数输入参数的顺序
参考代码

def lrCostFunction(self, theta, x, y, lamda):
    m = y.shape[0]
    J = (-np.dot(y.T, np.log(self.sigmoid(x.dot(theta))))-np.dot((1-y).T, np.log(1-self.sigmoid(x.dot(theta))))) / m+ (lamda*np.sum(theta[1::]**2, axis=0))/(2*m)  # 正则化是从j = 1开始的
    return J

def lrGradient(self, theta, x, y, lamda):
    m = y.shape[0]
    theta = theta.reshape((x.shape[1], 1))
    grad = np.zeros((x.shape[1], 1))
    grad[0] = np.dot(x[:, 0:1].T, (self.sigmoid(x.dot(theta))-y)) / m
    grad[1::] = np.dot(x[:, 1::].T, (self.sigmoid(x.dot(theta))-y)) / m + lamda*theta[1::] / m
    return grad

def fmini(self):
    x = np.hstack([np.ones((self.train_x.shape[0], 1)), self.train_x])  # (5000, 401)
    y = self.train_y
    # fmincg = op.fmin_cg(f=self.lrCostFunction, x0=self.init_theta, fprime=self.lrGradient, args=(x, np.array(y==(1+1), np.int), 0.1)) #报错
    self.optiTheta = np.zeros((10, 401))
    for i in range(10):
        fmini = op.minimize(fun=self.lrCostFunction, x0=self.init_theta, args=(x, np.array(y==(i+1), np.int), 0.1), method='TNC', jac=self.lrGradient)
        print("训练第%d部分"%(i+1))
        self.optiTheta[i, :] = fmini['x']
    return self.optiTheta
5.计算准确率

这里使用了两种方式:

  1. 数据集全部用来训练,然后利用求得的theta返回去计算准确率,这种情况下准确率高达96.4%;
  2. 将数据集分为training set和testing set,80%训练集,20%测试集,这种情况下准确率达到89.1%。

参考代码:

def predictOneVsAll(self):
    x = np.hstack([np.ones((self.test_x.shape[0], 1)), self.test_x])  # (1000, 401)
    position = np.argmax(self.sigmoid(x.dot(self.optiTheta.T)), axis=1) + 1
    accuracy = np.mean(position.reshape(1000, 1) == self.test_y)*100
    # print(position[:50])
    # print("100%traingset accuracy:{}".format(accuracy))  # 96.46%
    print("In 80%traing set, 20%testing set condition, accuracy is  {}".format(accuracy))  # 89.1%
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容