PDF OCR
创建可搜索的PDF。它对PDF的图像内容执行文本识别并使它们可搜索。这是我们的一项高级功能。需要注意的是,此操作的调用成本是文档中页数的两倍。例如,如果在5页文档上执行OCR,则调用成本将为10。
参数
- 文件File, Required
映射需要执行OCR的PDF文件。上传的文件应始终为PDF。包含文件的URL也可以作为参数传递。
- 文件名String
您可以指定文件名。否则,将从文件字段中选择名称。此字段将设置为输出文件的文件名。
- 质量类型Options, RequiredDefault: Expert
标准(草稿)- 适用于普通PDF,每个文件消耗1个API调用
专家(高)- 适用于从图像和扫描文档生成的PDF。每页消耗2个API调用
输出
- 文件Url
已执行OCR的文件
- 文件名String
不带扩展名的文件名
- 完整文件名String
带扩展名的文件名
- 文件扩展名String
文件扩展名
