文档工作流程定价支持

按表达式提取文本

使用正则表达式从PDF中提取文本。

方法: POST
端点: /api/v2/ExtractTextByExpression

参数

文件内容base64, Required: 输入文件的内容

文件名string, Required: 源PDF文件名，带.pdf扩展名

表达式string, Required: 示例 1- 我有一个 PDF（4 页）。“US” 或 “%” 这个词被多次使用。它将从输入的 PDF 文件中提取所有 “US” 或 “%”。
正则表达式 - %: #%: [^$.|?*+()

页面序列string, Required

指定页面索引作为逗号分隔值或范围来处理（例如，“0, 1, 2-” 或 “1, 2, 3-7”）。
如果未指定，默认配置将处理所有页面。输入必须为字符串格式。

输出

文本列表array of string , Required: 将显示文本列表。

Header
Content- Type:application/json
Authorization: 请从链接复制密钥。

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs