Documentazione Flussi di lavoro Prezzi Supporto

Estrai testo per espressione

Estrae testo da PDF usando un’espressione regolare.

Metodo: POST
Endpoint: /api/v2/ExtractTextByExpression

Parametri

Contenuto del filebase64, Required: Il contenuto del file di input

Nome del filestring, Required: Nome del file PDF di origine con estensione .pdf

Espressionestring, Required: Esempio 1- Ho un PDF (4 pagine). La parola “US” o “%” viene usata più volte. Estrae tutte le parole “US” o “%” dal file PDF di input.
Espressione regolare - %: #%: [^$.|?*+()

Sequenza di paginestring, Required

Specifica gli indici di pagina come valori separati da virgole o intervalli da processare (ad esempio, “0, 1, 2-” o “1, 2, 3-7”).
Se non specificato, la configurazione predefinita processa tutte le pagine. L’input deve essere in formato stringa.

Output

Lista di testoarray of string , Required: Mostrerà la lista di testo.

Intestazione
Content- Type:application/json
Authorization: Copia la chiave dal link.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs