为了举例说明如何使用几种屏幕抓取方法和它们之间的实际差异,让我们首先用抓取一个带有文本的记事本窗口,看看结果如何。以下截图就是我们在这里使用的例子。
使用 FullText 方法
正如你看到的一样,没有保留任何样式,即使你在抓取的时候隐藏记事本窗口,文本仍然会保留。这是最快速的方法。
使用 Native 方法
正如您在第一个屏幕截图中所看到的,您可以提取文本及其在屏幕上的位置,以及检索每个单词的确切位置(第二个屏幕截图)。
使用 Microsoft OCR 方法
正如您所看到的,这种输出方法的准确性不是100%,但它仍然能够保持文本的位置。获得屏幕上的精确位置(以像素为单位)也是可用的,正如您所看到的,它不是输出方法中最快的。
使用 Google OCR 方法
与微软的 Modi 一样,Google OCR 方法并不是100% 的精确,与其他方法相比花费的时间也更长。然而,它会返回文本在窗口中的位置。
现在,在黑色页面上添加一些白色文本,然后尝试抓取它。
正如你看到的一样,只有 OCR 方法能在这种场景中工作
现在让我们尝试抓取一个应用程序并查看结果。我们使用一个虚拟的费用应用程序,您可以在 这里下载 它。
如果我们抓取整个窗口,就会得到以下结果:
- FullText 模式能很好读取隐藏的文本,甚至能够读取最小化和还原按钮。
Native 不能在这个 UI 上工作,因为它并没有用到图形设备接口来渲染文本。请查阅 微软官方文档 来获取更多的信息
Microsoft OCR 工作得非常好,但是准确率仍不是 100%
- Google OCR 由于抓取的范围有点大,对这个 UI 处理得不是很好
返回目录
UiPath 常见问题及解决办法汇总
更多 UiPath 相关的资讯,请关注公众号:流程自动化机器人教程
由于简书禁止直接在文章中插入公众号二维码,请点击 这里 了解添加该公众号的细节。