API V2

按表达式提取文本

使用正则表达式从PDF中提取文本。

  • 方法: POST
  • 端点: /api/v2/ExtractTextByExpression

参数

文件内容base64, Required

输入文件的内容

文件名string, Required

源PDF文件名,带.pdf扩展名

表达式string, Required

示例 1- 我有一个 PDF(4 页)。“US” 或 “%” 这个词被多次使用。它将从输入的 PDF 文件中提取所有 “US” 或 “%”。
正则表达式 - %: #%: [^$.|?*+()

页面序列string, Required
  • 指定页面索引作为逗号分隔值或范围来处理(例如,“0, 1, 2-” 或 “1, 2, 3-7”)。
  • 如果未指定,默认配置将处理所有页面。输入必须为字符串格式。

输出

文本列表array of string , Required

将显示文本列表。

Header
Content- Type:application/json
Authorization: 请从链接复制密钥。

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#)
Java
JavaScript
Python
Salesforce
n8n
Google Script
AWS Lambda