Dokumentation Workflows Preise Unterstützung

Text durch Ausdruck extrahieren

Extrahiert Text aus PDF mit regulärem Ausdruck.

Methode: POST
Endpunkt: /api/v2/ExtractTextByExpression

Parameter

Dateiinhaltbase64, Required: Der Inhalt der Eingabedatei

Dateinamestring, Required: Quell-PDF-Dateiname mit .pdf-Erweiterung

Ausdruckstring, Required: Beispiel 1- Ich habe ein PDF (4 Seiten). Die Wörter “US” oder “%” werden mehrmals verwendet. Es wird alle “US”-Wörter oder “%” aus dem Eingabe-PDF-Datei extrahiert.
Regulärer Ausdruck - %: #%: [^$.|?*+()

Seitenfolgestring, Required

Geben Sie Seitenindizes als durch Kommas getrennte Werte oder Bereiche an, die verarbeitet werden sollen (z. B. “0, 1, 2-” oder “1, 2, 3-7”).
Wenn nicht angegeben, wird die Standardkonfiguration alle Seiten verarbeiten. Die Eingabe muss in Zeichenfolgenformat sein.

Ausgabe

Textlistearray of string , Required: Es wird die Textliste anzeigen.

Header
Content- Type:application/json
Authorization: Bitte kopieren Sie den Schlüssel aus dem Link.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs