API V2

Extrair texto por expressão

Extrai texto de um PDF usando uma expressão regular.

  • Método: POST
  • Endpoint: /api/v2/ExtractTextByExpression

Parâmetros

Conteúdo do arquivobase64, Required

O conteúdo do arquivo de entrada

Nome do arquivostring, Required

Nome do arquivo PDF de origem com extensão .pdf

Expressãostring, Required

Exemplo 1- Tenho um PDF (4 páginas). A palavra “US” ou “%” é usada várias vezes. Extrairá todas as palavras “US” ou “%” do arquivo PDF de entrada.
Expressão regular - %: #%: [^$.|?*+()

Sequência de páginasstring, Required
  • Especifique os índices de página como valores separados por vírgulas ou intervalos para processar (por exemplo, “0, 1, 2-” ou “1, 2, 3-7”).
  • Se não especificado, a configuração padrão processa todas as páginas. A entrada deve estar no formato de cadeia de caracteres.

Saída

Lista de textoarray of string , Required

Exibirá a lista de texto.

Cabeçalho
Content- Type:application/json
Authorization: Por favor, copie a chave a partir do link.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#)
Java
JavaScript
Python
Salesforce
n8n
Google Script
AWS Lambda