使用 OCR 将 PDF 转换为可编辑的 PDF
Connector ID: PDF OCR
可以使用扫描图像和文本图像创建 PDF 文件,与源图像的质量差异不大。PDF4me 的这个功能适当地使用了 OCR 方法。
- 方法: POST
- Endpoint: /api/v2/ConvertOcrPdf
参数
- 文件内容Base64, Required
映射源 PDF 文件内容来自前一个操作
- 文件名String, Required
源文件名,带正确的文件扩展名
- 质量类型String, Required
选择质量类型。
- Draft - 适用于普通 PDF,每文件消耗 1 个 API 调用
- High - 适用于从图像和扫描文档生成的 PDF。每页消耗 2 个 API 调用
- 仅在需要时进行 OCRString, Required
设置 ‘true’ 跳过识别,如果文本已可搜索
- 语言String
指定源文件中文本的语言。仅当输出不可识别时使用
- 输出格式String, Required
输出必须为字符串格式。
- isAsyncboolean, Required
isAsync 必须为布尔格式。
true
false
输出
- 文件内容Binary
从 PDF4me 操作输出文件内容
- 文件名String
从 PDF4me 操作输出文件名
Header
Content-Type:application/json
Authorization: 请从 链接 复制密钥。
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"qualityType": "Draft",
"ocrWhenNeeded": "true",
"language": "English",
"outputFormat": "true",
"mergeAllSheets": true
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda