Extrair texto por expressão
Extrai texto de um PDF usando uma expressão regular.
- Método: POST
- Endpoint: /api/v2/ExtractTextByExpression
Parâmetros
- Conteúdo do arquivobase64, Required
O conteúdo do arquivo de entrada
- Nome do arquivostring, Required
Nome do arquivo PDF de origem com extensão .pdf
- Expressãostring, Required
Exemplo 1- Tenho um PDF (4 páginas). A palavra “US” ou “%” é usada várias vezes. Extrairá todas as palavras “US” ou “%” do arquivo PDF de entrada.
Expressão regular - %: #%: [^$.|?*+()
- Sequência de páginasstring, Required
- Especifique os índices de página como valores separados por vírgulas ou intervalos para processar (por exemplo, “0, 1, 2-” ou “1, 2, 3-7”).
- Se não especificado, a configuração padrão processa todas as páginas. A entrada deve estar no formato de cadeia de caracteres.
Saída
- Lista de textoarray of string , Required
Exibirá a lista de texto.
Cabeçalho
Content- Type:application/json
Authorization: Por favor, copie a chave a partir do link.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda