sklearn手写数据识别 实例

手写数据识别

数据集任务类型

  • 监督学习

    • 分类

    • 回归

  • 无监督学习

    • 聚类

    • 密度估计

    • 数据可视化

实现流程

1.模块引用

from sklearn.datasets import load_digits from sklearn 
import svm # 支持向量机的模块 
from sklearn.model_selection import train_test_split 
from sklearn.externals 
import joblib #模型保存文件对象 
import numpy as np 
import matplotlib.pyplot as plt 
#魔法函数,用于matplotlib绘制的图显示在页面里,不需要plt.show()
%matplotlib inline

2.数据加载

digits = load_digits()

3.数据探查

#查看数据集的键名 

digits.keys()

#查看手写字图片的形状 

digits.images.shape

#相当于对images对象进行了降维操作 

digits.data.shape

#查看手写字标签的形状 

digits.target.shape

#查看第一张图片 

plt.imshow(digits.images[0])
image

4.数据划分

#把数据集的数据和标签划分为训练集和测试集以及他们的标签
X_train,X_test,y_train,y_test= \
train_test_split(digits.data,digits.target,test_size=.25,random_state=42) 
X_train.shape,X_test.shape,y_train.shape,y_test.shape

5.相关SVM模型(SVC)以及预测数据

  • C:默认值是1.0

  • C越大,即对误分类的惩罚增大,泛化能力弱,趋向于对训练集全分对的情况,这样对训练集测试时准确率很高。

  • C值小,对误分类的惩罚减小,允许容错,将他们当成噪声点,泛化能力较强。

  • kernel :核函数,默认是rbf,可以是‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’

  • 线性:u'v

  • 多项式:(gammau'v + coef0)^degree

  • RBF函数:exp(-gamma|u-v|^2)

  • random_state :数据洗牌时的种子值,int值

  • sigmoid:tanh(gammau'v + coef0)

  • degree :多项式poly函数的维度,默认是3,选择其他核函数时会被忽略。

  • gamma :‘rbf’,‘poly’ 和‘sigmoid’的核函数参数。默认是’auto’,则会选择1/n_features

  • coef0 :核函数的常数项。对于‘poly’和 ‘sigmoid’有用。

  • probability :是否采用概率估计?.默认为False

  • shrinking :是否采用shrinking heuristic方法,默认为true

  • tol :停止训练的误差值大小,默认为1e-3

  • cache_size :核函数cache缓存大小,默认为200

  • class_weight :类别的权重,字典形式传递。设置第几类的参数C为weight*C(C-SVC中的C)

  • verbose :允许冗余输出?

  • max_iter :最大迭代次数。-1为无限制。

  • decision_function_shape :‘ovo’, ‘ovr’ or None, default=None3

svc = svm.SVC(C=100,gamma=0.001) 

#模型使用(选择) 

svc.fit(X_train,y_train) 

#通过分类器fit来训练模型 #测试集 ——> 预测标签 <-对比-> 真实标签 y_pred = svc.predict(X_test)

6.绘制预测的数据图像

plt.rcParams['font.sans-serif'] = ['SimHei'] 
plt.rcParams['axes.unicode_minus'] = False 
images_and_predictions = list(zip(X_test.reshape(450,8,-1),y_pred)) 
plt.figure(figsize=(14,9)) 
for i,(img,pred) in enumerate(images_and_predictions[:24],start=1):            
         plt.subplot(4,6,i,)
         plt.subplots_adjust(hspace = 0.3)    
         plt.axis('off')    
         plt.imshow(img,cmap=plt.cm.gray_r,interpolation='nearest')    
         plt.title(f'预测值:{str(pred)}')
image

7.模型保存

joblib.dump(svc,'MyDigitsModel.pkl')

读取保存的文件

joblib.load('MyDigitsModel.pkl')

后记:

有需要的朋友可以搜索微信公众号:【知音库】
同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355

推荐阅读更多精彩内容