使用指南

OCR 工作流

了解从文件上传到结果确认的完整处理生命周期。

流程概览

在 Numora 中,处理流程可拆成五个阶段:

  1. 接入:接收用户或系统上传文件。
  2. 提取:执行 OCR 并解析目标字段。
  3. 校验:检查置信度与规则一致性。
  4. 复核:确认或修正关键值。
  5. 交付:导出数据或触发下游动作。

接入阶段

建议统一文件命名、类型分组与来源标识,便于后续追踪和排错。

提取阶段

提取结果通常包含文本与候选结构化字段。

面对多版式文档时,先按更细的文档类别分批处理,效果通常更稳定。

校验与复核

置信度和业务规则要结合使用。即使置信度高,也可能因不符合业务约束而无效。

建议重点复核:

  • 编号与引用字段。
  • 金额字段。
  • 日期字段。
  • 交易对手名称。

交付阶段

确认后的结果可进入看板、内部系统或外部平台。

建议增加日志和状态跟踪,以便失败任务可安全重试。

如果你需要查看当前内部 OCR 状态与未来对外 document.status 的映射关系,请阅读文档生命周期