18. Applicaton example: Photo OCR

Applicaton example: Photo OCR

Problem description and pipeline

Photo OCR pipeline:

  1. Text detection
  2. Character segmentation
  3. Character classification

Sliding windows

Text detection:

sliding window detection:

  • step-size/stride

Character segmentation:

1D Sliding window for character segmentation

Getting lots of data: Artificial data synthesis

  • Create new data.
  • Synthesizing data by introducing distortions
    • Distortion introduced should be representation of the type of noise/distortions in the test set.
    • Usually does not help to add purely random/meaningless noise to your data.

Ceiling analysis: What part of the pipeline to work on next

Estimating the errors due to each compoent

What part of the pipeline should you spend the most time trying to improve?

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    余生动听阅读 13,596评论 0 11
  • 彩排完,天已黑
    刘凯书法阅读 9,775评论 1 3
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 127,672评论 2 7

友情链接更多精彩内容