多维表格批量文字识别的插件

作者：小黄鸭

推荐理由

在多维表格中，我们通常会遇到需要提取图片中文字的情况，本文来帮你搞定，一起来看看吧～

🎉先看一下效果

250px|700px|reset

一、关于我/我们

🌟首先简单介绍下自己的过往经历，或自己的团队。

我是一个喜欢折腾效率工具的UP主，也欢迎来我的视频主页了解更多：https://space.bilibili.com/15516023

二、需求分析

🌟本章节详细展开了本次所需完成需求的背景和目标，以及解题思路。

临近假期，无心工作，晚上在多维表格插件交流群里面看到有人提了个需求。

250px|700px|reset

我一看，这很简单啊，可以搞一搞嘛！

三、方案调研

🌟本章节通过调研飞书开放能力/集成平台等飞书产品能力，或其他系统对接手册，论证方案是否可行，拆解方案落地的步骤...

可能一些年轻的小伙伴还不知道，飞书开放平台有免费的OCR接口可以用。单租户20QPS，完全足够自用了。

其他的需要的API在多维表格插件的开发文档里面都可以找到多维表格插件 API。

有一个需要注意的地方，图片是不能直接获取的，需要通过getAttachmentUrl这个接口拿token换url。

四、开发流程

🌟这个环节就是最硬核的环节啦！欢迎大家尽可能多贴贴思考图、代码块，帮助其他社区小伙伴了解如何实现。

我直接fork了官方在replit上的的前端项目，可以从示例代码中大概了解到@lark-base-open/js-sdk的基本用法。

在页面初始化的时候，会获取一些必要的图表数据。

onMounted(async () => {​
    // 获取当前选中的数据表，视图​
    selection.value = await bitable.base.getSelection()​
    // 获取当前的table实例​
    table = await bitable.base.getTableById(selection.value.tableId);​
    // 当添加记录的时候，重新计算records，动态刷新图片计数器​
    table.onRecordModify((recordId, filedIds) => {​
      fetchRecords()​
    })​
    // 获取当前的view实例​
    const view = await table.getViewById(selection.value.viewId);​
    // 获取当前view的fieldMetaList，即字段信息，后续需要这个参数指定读取图片和写入文字的字段​
    fieldMetaList.value = await view.getFieldMetaList()​
  });​

按钮的响应函数：

  const run = async () => {​
    // 获取records列表​
    await fetchRecords()​
    // 按钮设置loading状态​
    loading.value = true​
    todo.value.forEach(async record => {​
      let attachmentToken = record.fields[form.attachment][0].token​
      // 获取图片地址​
      let attachmentURL = await table.getAttachmentUrl(attachmentToken)​
      // 获取识别后的文字，多行显示​
      const texts = (await imageToText(attachmentURL)).map(text => ({​
        type: IOpenSegmentType.Text,​
        text: text + '\n',​
      }))​
      // 把文字插入到表格内​
      table.setCellValue(form.text, record.recordId, texts)​
    })​
};​