功能介绍
光学字符识别 (OCR)是一种将图像中的文字内容,识别转换为可编辑文本的技术。它适用于卡证识别、财税报销、文档电子化等场景,可有效代替人工录入信息。
- 功能说明:当发起一条流程,希望能自动识别和提取上传图片中的文本信息,并将其存储为文本数据时,即可通过「光学字符识别」连接器实现。
- 典型场景:各种票面、标签、证件的自动化识别录入。
基础配置
(一)添加节点
进入流程编辑器,新增节点选择「AI」中的「光学字符识别」。
250px|700px|reset

(二)操作
即选择该节点具体要执行什么操作。
通过「光学字符识别」连接器可选择「识别图片中的文字」操作。执行该操作可识别图片中的文字,按图片中的区域划分,分段返回文本列表。
250px|700px|reset

(三)连接
目前支持 2 种集成方式:
- 默认飞书集成
- 自定义飞书集成:创建自定义飞书应用可参考 认识与配置飞书集成。
250px|700px|reset

(四)基础配置
选择待识别的图片即可。
250px|700px|reset

(五)高级配置
可以根据需要,设置操作执行失败时的重试策略:
250px|700px|reset

(六)输出变量
选择了操作后,「输出变量」会根据所选的操作事件显示接收到的事件内容,在后续节点中,我们可以引用这里的具体字段。
节点配置完成后,在流程中也会自动生成一个变量,变量中将承载触发器所选事件接收到的数据内容:
250px|700px|reset

使用案例
通过「光学字符识别」连接器识别录入产品标签
- 建立存储 OCR 识别结果的数据对象
250px|700px|reset

- 新建数据记录发起流程
- 上传待识别的图片
- OCR 连接器识别输出结果
- 循环 OCR 输出的 list 拼接为完整的识别结果
- 整体提交入库
250px|700px|reset
