一文轻松集成华为HMS ML Kit 表格识别服务

前言

问卷调查收集是最常见的社会调查的一种方法,通常应于市场调查,信息收集等方面。但是庞大的问卷调查收集完了之后面对如此大量的数据该怎么录入,并将内容转换为电子文档呢?今天就为大家介绍通过集成华为HMS ML Kit表格识别服务来轻松实现表格录入功能。

应用场景

华为HMS ML Kit表格识别服务是利用AI技术从输入的图片中识别并返回表格结构信息(包括单元格的行列信息和坐标信息)和表格中的文本信息(包括单元格内的文本内容),支持识别中英文文本信息及标点符号。表格识别服务在日常工作场景中有广泛应用。例如,收集到大量纸质表格问卷后,可以通过该服务将识别到的问卷内容转换为电子文档,减少人工录入成本,大幅提高工作效率。

注意事项

1. 支持识别具有表格特征的表单、问卷等。

2. 暂时不支持图片中含有多张表格的识别,不支持获取表头及表尾信息。

3. 满足以下条件可达到最佳识别效果(如下示图):

开发步骤

1.  开发准备

详细的准备步骤可以参考华为开发者联盟:

https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-process-4

这里列举关键的开发步骤。

1.1  项目级gradle里配置Maven仓地址

buildscript {

   repositories {

        google()

       jcenter()

       maven {url 'https://developer.huawei.com/repo/'}

    }

   dependencies {

       ...

       classpath 'com.huawei.agconnect:agcp:1.4.1.300'

    }

}


allprojects {

   repositories {

       google()

       jcenter()

       maven {url 'https://developer.huawei.com/repo/'}

    }

}

1.2 文件头增加配置

集成SDK后,在文件头添加配置

apply plugin: 'com.android.application'

apply plugin: 'com.huawei.agconnect'


1.3 应用级gradle里配置SDK依赖

 

dependencies{

    //引入基础SDK

   implementation'com.huawei.hms:ml-computer-vision-formrecognition:2.0.4.300'

    //引入表格识别模型包

   implementation'com.huawei.hms:ml-computer-vision-formrecognition-model:2.0.4.300'

}

1.4 将以下语句添加到AndroidManifest.xml文件中,用于自动更新机器学习模型

      android:name="com.huawei.hms.ml.DEPENDENCY"

      android:value= "fr"/>

1.5 申请摄像头权限

<uses-permission android:name='android.permission.CAMERA"/>

<uses-feature android:name="android.hardware.camera"/>

2.   代码开发

2.1创建表格识别分析器。

MLFormRecognitionAnalyzerSetting setting = newMLFormRecognitionAnalyzerSetting.Factory().create();

MLFormRecognitionAnalyzer analyzer =MLFormRecognitionAnalyzerFactory.getInstance().getFormRecognitionAnalyzer(setting);


2.2通过android.graphics.Bitmap创建MLFrame对象用于分析器识别表格,支持的图片格式包括:jpg/jpeg/png,建议图片尺寸不小于960*960像素,不大于1920*1920像素。

MLFrame mlFrame = MLFrame.fromBitmap(bitmap);


2.3调用asyncAnalyseFrame异步方法或analyseFrame同步方法进行表格识别(JsonObject对象的数据结构定义请参见JsonObject)。

// asyncAnalyseFrame异步调用。

Task recognizeTask =analyzer.asyncAnalyseFrame(mlFrame);

recognizeTask.addOnSuccessListener(newOnSuccessListener() {

    @Override

    publicvoid onSuccess(JsonObject recognizeResult) {

        //识别成功。

    }

}).addOnFailureListener(new OnFailureListener() {

    @Override

    publicvoid onFailure(Exception e) {

        //识别失败。

    }

});


// analyseFrame同步调用。

SparseArray recognizeResult =analyzer.analyseFrame(mlFrame);

if (recognizeResult != null &&recognizeResult.get(0).get("retCode").getAsInt() ==MLFormRecognitionConstant.SUCCESS) {

    //识别成功。

} else {

    //识别失败。

}


2.4检测完成,停止分析器,释放检测资源。

if (analyzer != null) {

   analyzer.stop();

}

Demo


总结

华为机器学习表格识别服务为开发者提供识别图片中表格的服务,可广泛应用于问卷调查数据收集等应用场景中,代替人工录入,减少成本。


欲了解更多详情,请参阅:

华为开发者联盟官网:https://developer.huawei.com/consumer/cn/hms

获取开发指导文档:https://developer.huawei.com/consumer/cn/doc/development

参与开发者讨论请到Reddit社区:https://www.reddit.com/r/HMSCore/

下载demo和示例代码请到Github:https://github.com/HMS-Core

解决集成问题请到Stack

Overflow:https://stackoverflow.com/questions/tagged/huawei-mobile-services?tab=Newest

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容