听说js想要装tensorflow引擎之手写字识别

 MNIST手写字识别


废话不多说,先上演示https://yuanyuangong.github.io/gyytensor/dist/index.html#/home

上面这个链接请复制,打开,简书有毒

如果你家网络掉渣,就直接 git 吧!HTTPS://GITHUB.COM/YUANYUANGONG/GYYTENSOR.GIT

第一记:手写字数据形式

在开篇最前面还是先讲讲手写字识别深度学习原理。

这里测试用的手写字图片 为(28*28*1)的图像,因为只有黑 所以 像素为 1。

这张(28*28)的图,透明处为0 ,黑色处为1

当然js可不认识这么个,需要转成 一个 28*28 的二维向量矩阵。 感受一下这个二维数组,

如果 7  这个数字 都这么标准就好了,现实和残酷,我写的7是这样的,我们就需要找到不同人写的7的共同点,这就是提取特征,在我这个案例中 就用 卷积 (不要去管高等数学里的卷积,你就当是全新的一种方式,下面会讲解)的方式去提取。

第二记 卷积

先看一下tensorflow 里如何卷积的吧(再次强调不要被 卷积这个名词 带 到坑里去了,这里你就理解为 操作,没有其他意思)

卷积窗口指的是 过滤器的大小

首先,

需要过滤器的卷积窗口来取样,蓝色就(5*5)过滤器 ,在这个案例里就是5*5 的二维0,1 数组,  至于里面的值完全由tensorflow去初始化,

过滤器 

步进 strides: 1, 意味着 这个过滤器每一移动一个像素,从左到右 跑完 下移动一个像素,如下图,总需要拖多少次。

28-5 = 24  。24/1 = 24  则 24*24次  当然你也可以把步长设置为6 ,那就是 那就24/6  则4*4 =16次。不过这样你会丢失很多信息。

偷了下懒,逃过大部分帧,反正就是把整个图拖一遍。

这么个5*5的过滤器 拖了24*24 次得到 一个 24*24 的数组 g 。假设过滤器的 值为 f  ,那么 g[n][m] = f * 过滤器所拖的区域。

这里有8 个过滤器,那就得到 8个 24*24 的矩阵。 这样我们就把 7 这个图 搞了 8个特征,如果你写了一个7 ,通过 同样的 卷积,也等到 8 个24*24 的矩阵,进行比较。看看相差多少。再去优化 那8个过滤器。

当然现实里 可不会这么简单。为了进一步提高 学习效率。我们要有一些其他手段,比如吃补药。---池化

第三记  池化

poolSize , 2*2 的窗口,每次移动2 个像素 得到 6*6的矩阵。

红色框就是poolSize ,取 框住矩阵里的最大值, 1

我们一次卷积和池化还不行,多来几次 ,完整代码如下


activation 激活函数,简单 来说就是分类的,有relu  softmax 等等函数,百度去吧

第四记 flaten  和全链接层

原理什么的不重要了,flaten 就是把多维数组转成 一维数组,方便统计操作,全链接dense 就是为了分类。

先分成64类,在分成0-9 10类

 第五记 开始训练模型

第一步,数据获取,预处理。下面数MNIST手写字数据链接,不是人可以看懂的数据,所以需要预处理,通过webapi 

new Img() ,具体的我就不肺炎了,反正最后通过data.js可以获得手写字数据。

第二步,载入数据,这里,不可一个个载到模型里去跑,太慢,也不能一次性把所有数据载入,浏览器要炸的。所以分批次,

model.fit 载入数据 直到 所有数据被处理完就停止 循环,应该 内置 setIntertime 方法

ui 是用来画图的

第四步,验证模型获得 测试结果 (准确率)

第六记,UI 绘图部分

这里用canvas绘制手写字的图片,并显示预测结果。

echart显示损失率,和精确率的曲线


最后:

本人是新接触tensorflow.js的新人,还望各路大仙指点一二


上一期线性回归


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容