梯度下降求解逻辑回归python

#导入数据分析的三大件

import numpyas np

import pandasas pd

import matplotlib.pyplotas plt

data=pd.read_csv("mark.txt",header=None,names=["a","b","c"])


def sigmoid(z): return 1 / (1 + np.exp(-z))

# 预测函数模型

def model(X, theta):return sigmoid(np.dot(X,theta.T)) 


pdData.insert(0, 'Ones', 1)

# 表格转换为矩阵

orig_data = pdData.as_matrix() 

# 样本维度

cols = orig_data.shape[1]

X = orig_data[:,0:cols-1]

Y = orig_data[:,cols-1:cols]

# 给参数占位

theta = np.zeros([1, 3])


def cost(X, Y, theta):

left = np.multiply(-Y, np.log(model(X, theta)))

right = np.multiply(1 - Y, np.log(1 - model(X, theta)))

return np.sum(left - right) / (len(X))



https://blog.csdn.net/hx2017/article/details/77950086

import numpy as np import pandas as pd import matplotlib.pyplot as plt data =pd.read_csv("mark.txt",header=None,names=["Exam 1",\ "Exam 2","Admitted"]) aa=data.head() positive = data[data['Admitted'] == 1] negative = data[data['Admitted'] == 0] def sigmoid(z): return 1/(1+np.exp(-z)) def model(X,theta): return sigmoid(np.dot(X,theta.T)) data.insert(0,"ones",1) orig_data=data.as_matrix() clos = orig_data.shape[1] X=orig_data[:,0:clos-1] y=orig_data[:,clos-1:clos] theta=np.zeros([1,3]) def cost(X,y,theta): left=np.multiply(-y,np.log(model(X,theta))) right=np.multiply(1-y,np.log(1-model(X,theta))) return np.sum(left-right)/len(X) def gradient(X,y,theta): grad=np.zeros(theta.shape) error=(model(X,theta)-y).ravel() for j in range(len(theta.ravel())): term=np.multiply(error,X[:,j]) grad[0,j]=np.sum(term)/len(X) return grad # Gradient descent # 比较3中不同梯度下降方法 STOP_ITER = 0 # STOP_COST = 1 # 根据损失函数 STOP_GRAD = 2 # 根据梯度 def stopCriterion(type, value, threshold): # 设定三种不同的停止策略 if type == STOP_ITER: return value > threshold # 最近两次损失值差别不大 elif type == STOP_COST: return abs(value[-1] - value[-2]) < threshold elif type == STOP_GRAD: return np.linalg.norm(value) < threshold import numpy.random # 数据要进行洗牌 def shuffleData(data): np.random.shuffle(data) cols = data.shape[1] X = data[:, 0:cols - 1] y = data[:, cols - 1:] return X, y import time def descent(data, theta, batchSize, stopType, thresh, alpha): # 梯度下降求解 init_time = time.time() # 迭代次数 i = 0 # batch k = 0 X, y = shuffleData(data) # 计算梯度 grad = np.zeros(theta.shape) # 损失值 costs = [cost(X, y, theta)] while True: grad = gradient(X[k: k + batchSize], y[k: k + batchSize], theta) # 取batch数量个数据 k += batchSize # 大于总数据 if k >= n: k = 0 # 重新洗牌 X, y = shuffleData(data) # 参数更新 theta = theta - alpha * grad # 计算新的损失 costs.append(cost(X, y, theta)) i += 1 if stopType == STOP_ITER: value = i elif stopType == STOP_COST: value = costs elif stopType == STOP_GRAD: value = grad if stopCriterion(stopType, value, thresh): break return theta, i - 1, costs, grad, time.time() - init_time def runExpe(data, theta, batchSize, stopType, thresh, alpha): # 总数据 n = 100 # import pdb; pdb.set_trace(); theta, iter, costs, grad, dur = descent(data, theta, batchSize, stopType, thresh, alpha) name = "Original" if (data[:, 1] > 2).sum() > 1 else "Scaled" name += " data - learning rate: {} - ".format(alpha) if batchSize == n: strDescType = "Gradient" elif batchSize == 1: strDescType = "Stochastic" else: strDescType = "Mini-batch ({})".format(batchSize) name += strDescType + " descent - Stop: " if stopType == STOP_ITER: strStop = "{} iterations".format(thresh) elif stopType == STOP_COST: strStop = "costs change < {}".format(thresh) else: strStop = "gradient norm < {}".format(thresh) name += strStop print("***{}\nTheta: {} - Iter: {} - Last cost: {:03.2f} - Duration: {:03.2f}s".format( name, theta, iter, costs[-1], dur)) fig, ax = plt.subplots(figsize=(12, 4)) ax.plot(np.arange(len(costs)), costs, 'r') ax.set_xlabel('Iterations') ax.set_ylabel('Cost') ax.set_title(name.upper() + ' - Error vs. Iteration') plt.show() return theta # 不同的停止策略 # 设定迭代次数 # 选择的梯度下降方法是基于所有样本的 n = 100 # 数据总共100行 runExpe(orig_data, theta, n, STOP_ITER, thresh=5000, alpha=0.000001) # 有点爆炸。。。很不稳定,再来试试把学习率调小一些 # 速度快,但稳定性差,需要很小的学习率 # 根据损失值停止 按照损失函数的精度 # 设定阈值 1E-6, 差不多需要110 000次迭代 runExpe(orig_data, theta, n, STOP_COST, thresh=0.000001, alpha=0.001) # Mini-batch descent # 批量梯度下降 runExpe(orig_data, theta, 64, STOP_ITER, thresh=15000, alpha=0.001)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容