早些时候买了金山办公的会员,大概一年一二百元,一是向民族软件的坚守者致敬,二是日常可以用到不少实用功能,比如稻壳的模板资源,以及PDF、图片转换成可编辑的文档。有些市场研究报告采用的是不能复制的格式,用金山会员版工具就能轻松转成文字版,识别率还相当不错。图片表格也可以直接转成电子表格,省心省力。
这两天看一下开源的cv、OCR、asr方案,才意识到,这些讯飞、达摩院、脸书、谷歌等大厂不停刷榜的领域,已经涌现了不少直接可民用的算法和模型,甚至数十行代码就可以diy一个印刷体的文字识别服务。这让人生出一种恍同隔世的感觉。
必须刷新认知,才能跟上时代的发展。