图片识别的新格式

其实现阶段的图像数据是最不利于分析的。因为图片从左到右,从上到下。渲染图片。图片的一堆二进制数字丝毫没有记录图片中物体的形状的电流走向。白背景黑体字最好识别是因为字体在计算机有电流走向记录。只要把白背景剔除。就剩下黑体字渲染的电流走向。跟计算机的字体记录匹配下就比较容易做到精准的识别。而一个水杯的电流走向根本在计算机没有记录,除非你绘制了水杯写进计算机,类似于把字体写进计算机的方法。所以,图片识别需要一种新的图片格式。不是从左到右,上到下渲染。是先渲染一个一个的形状,然后渲染背景之类的。这样图片数据本身就带有形状。就是把形状转成了电信号。不过这种格式占的数据空间估计很大。需要很多硬件的不断发展支持。用树莓派面包板led灯来实现下这种图片格式。例如,面包板上插了100个led灯,现在想显示一张蓝色背景跟水杯的图片。首先不能从上到下显示这张图片。树莓派的输出电流必须先流通这个水杯的形状,才能流进蓝色led渲染背景。所以电信号里就记录了水杯的形状。假设是10100110。因为如果从上到下显示一张图片,这些电信号根本无规律可言。无论后人的算法多牛逼,都无法突破这种限制。所以我觉得,大规模的图像识别其实没到时候,存储硬件还没到位,这种图片格式就没到时候推出来。不过白背景黑字体识别现在已经做得相当不错。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 发现 关注 消息 iOS 第三方库、插件、知名博客总结 作者大灰狼的小绵羊哥哥关注 2017.06.26 09:4...
    肇东周阅读 12,262评论 4 61
  • 看了很多方法,因人而已。两个int型变量a和b,不使用临时变量,交换它们的值。总结一下:Ca = a + b;b ...
    飘渺阿天阅读 2,868评论 4 0
  • 时维九月良辰,序属三秋菊香,草木衔思,沐浴熏风而隆昌。学友如云,躬逢盛会于塾堂,此值南高九秩华诞,余颇有感,遂作赋...
    Jimmy_JK阅读 1,154评论 0 0
  • Given an integer array nums, find the sum of the elements...
    Jeanz阅读 209评论 0 0
  • 一位大爷上了一辆新装的公交车。 大爷投了一块硬币。 司机说:“两块!” 大爷扇扇蒲扇子。 又抓...
    睿子peach阅读 1,693评论 0 2