API V2

使用 OCR 将 PDF 转换为可编辑的 PDF

Connector ID: PDF OCR

可以使用扫描图像和文本图像创建 PDF 文件,与源图像的质量差异不大。PDF4me 的这个功能适当地使用了 OCR 方法。

  • 方法: POST
  • Endpoint: /api/v2/ConvertOcrPdf

参数

文件内容Base64, Required

映射源 PDF 文件内容来自前一个操作

文件名String, Required

源文件名,带正确的文件扩展名

质量类型String, Required

选择质量类型。

  • Draft - 适用于普通 PDF,每文件消耗 1 个 API 调用
  • High - 适用于从图像和扫描文档生成的 PDF。每页消耗 2 个 API 调用
仅在需要时进行 OCRString, Required

设置 ‘true’ 跳过识别,如果文本已可搜索

语言String

指定源文件中文本的语言。仅当输出不可识别时使用

输出格式String, Required

输出必须为字符串格式。

isAsyncboolean, Required

isAsync 必须为布尔格式。
true
false

输出

文件内容Binary

从 PDF4me 操作输出文件内容

文件名String

从 PDF4me 操作输出文件名

Header
Content-Type:application/json
Authorization: 请从 链接 复制密钥。

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "qualityType": "Draft",
  "ocrWhenNeeded": "true",
  "language": "English",
  "outputFormat": "true",
  "mergeAllSheets": true
}

PDF4me api samples

CSharp(C#)
Java
JavaScript
Python
Salesforce
n8n
Google Script
AWS Lambda