使用指南
OCR 工作流
了解从文件上传到结果确认的完整处理生命周期。
流程概览
在 Numora 中,处理流程可拆成五个阶段:
- 接入:接收用户或系统上传文件。
- 提取:执行 OCR 并解析目标字段。
- 校验:检查置信度与规则一致性。
- 复核:确认或修正关键值。
- 交付:导出数据或触发下游动作。
接入阶段
建议统一文件命名、类型分组与来源标识,便于后续追踪和排错。
提取阶段
提取结果通常包含文本与候选结构化字段。
面对多版式文档时,先按更细的文档类别分批处理,效果通常更稳定。
校验与复核
置信度和业务规则要结合使用。即使置信度高,也可能因不符合业务约束而无效。
建议重点复核:
- 编号与引用字段。
- 金额字段。
- 日期字段。
- 交易对手名称。
交付阶段
确认后的结果可进入看板、内部系统或外部平台。
建议增加日志和状态跟踪,以便失败任务可安全重试。
如果你需要查看当前内部 OCR 状态与未来对外 document.status 的映射关系,请阅读文档生命周期。