文档工作流程定价支持

使用 OCR 将 PDF 转换为可编辑的 PDF

Connector ID: PDF OCR

可以使用扫描图像和文本图像创建 PDF 文件，与源图像的质量差异不大。PDF4me 的这个功能适当地使用了 OCR 方法。

方法: POST
Endpoint: /api/v2/ConvertOcrPdf

参数

文件内容Base64, Required: 映射源 PDF 文件内容来自前一个操作

文件名String, Required: 源文件名，带正确的文件扩展名

质量类型String, Required

选择质量类型。

Draft - 适用于普通 PDF，每文件消耗 1 个 API 调用
High - 适用于从图像和扫描文档生成的 PDF。每页消耗 2 个 API 调用

仅在需要时进行 OCRString, Required: 设置 ‘true’ 跳过识别，如果文本已可搜索

语言String: 指定源文件中文本的语言。仅当输出不可识别时使用

输出格式String, Required: 输出必须为字符串格式。

isAsyncboolean, Required: isAsync 必须为布尔格式。
true
false

输出

文件内容Binary: 从 PDF4me 操作输出文件内容

文件名String: 从 PDF4me 操作输出文件名

Header
Content-Type:application/json
Authorization: 请从链接复制密钥。

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "qualityType": "Draft",
  "ocrWhenNeeded": "true",
  "language": "English",
  "outputFormat": "true",
  "mergeAllSheets": true
}

PDF4me api samples

CSharp(C#): 使用 OCR 将 PDF 转换为可编辑的 PDF [C#]

Java: 使用 OCR 将 PDF 转换为可编辑的 PDF [Java]

JavaScript: 使用 OCR 将 PDF 转换为可编辑的 PDF [JavaScript]

Python: 使用 OCR 将 PDF 转换为可编辑的 PDF [Python]

Salesforce: 使用 OCR 将 PDF 转换为可编辑的 PDF [Salesforce]

n8n: 使用 OCR 将 PDF 转换为可编辑的 PDF [n8n]

Google Script: 使用 OCR 将 PDF 转换为可编辑的 PDF [Google Script]

AWS Lambda: 使用 OCR 将 PDF 转换为可编辑的 PDF [AWS Lambda]

Other Docs