Documentação Fluxos de trabalho Preços Apoiar

Extrair texto por expressão

Extrai texto de um PDF usando uma expressão regular.

Método: POST
Endpoint: /api/v2/ExtractTextByExpression

Parâmetros

Conteúdo do arquivobase64, Required: O conteúdo do arquivo de entrada

Nome do arquivostring, Required: Nome do arquivo PDF de origem com extensão .pdf

Expressãostring, Required: Exemplo 1- Tenho um PDF (4 páginas). A palavra “US” ou “%” é usada várias vezes. Extrairá todas as palavras “US” ou “%” do arquivo PDF de entrada.
Expressão regular - %: #%: [^$.|?*+()

Sequência de páginasstring, Required

Especifique os índices de página como valores separados por vírgulas ou intervalos para processar (por exemplo, “0, 1, 2-” ou “1, 2, 3-7”).
Se não especificado, a configuração padrão processa todas as páginas. A entrada deve estar no formato de cadeia de caracteres.

Saída

Lista de textoarray of string , Required: Exibirá a lista de texto.

Cabeçalho
Content- Type:application/json
Authorization: Por favor, copie a chave a partir do link.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs