按表达式提取文本
使用正则表达式从PDF中提取文本。
- 方法: POST
- 端点: /api/v2/ExtractTextByExpression
参数
- 文件内容base64, Required
输入文件的内容
- 文件名string, Required
源PDF文件名,带.pdf扩展名
- 表达式string, Required
示例 1- 我有一个 PDF(4 页)。“US” 或 “%” 这个词被多次使用。它将从输入的 PDF 文件中提取所有 “US” 或 “%”。
正则表达式 - %: #%: [^$.|?*+()
- 页面序列string, Required
- 指定页面索引作为逗号分隔值或范围来处理(例如,“0, 1, 2-” 或 “1, 2, 3-7”)。
- 如果未指定,默认配置将处理所有页面。输入必须为字符串格式。
输出
- 文本列表array of string , Required
将显示文本列表。
Header
Content- Type:application/json
Authorization: 请从链接复制密钥。
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda