Text durch Ausdruck extrahieren
Extrahiert Text aus PDF mit regulärem Ausdruck.
- Methode: POST
- Endpunkt: /api/v2/ExtractTextByExpression
Parameter
- Dateiinhaltbase64, Required
Der Inhalt der Eingabedatei
- Dateinamestring, Required
Quell-PDF-Dateiname mit .pdf-Erweiterung
- Ausdruckstring, Required
Beispiel 1- Ich habe ein PDF (4 Seiten). Die Wörter “US” oder “%” werden mehrmals verwendet. Es wird alle “US”-Wörter oder “%” aus dem Eingabe-PDF-Datei extrahiert.
Regulärer Ausdruck - %: #%: [^$.|?*+()
- Seitenfolgestring, Required
- Geben Sie Seitenindizes als durch Kommas getrennte Werte oder Bereiche an, die verarbeitet werden sollen (z. B. “0, 1, 2-” oder “1, 2, 3-7”).
- Wenn nicht angegeben, wird die Standardkonfiguration alle Seiten verarbeiten. Die Eingabe muss in Zeichenfolgenformat sein.
Ausgabe
- Textlistearray of string , Required
Es wird die Textliste anzeigen.
Header
Content- Type:application/json
Authorization: Bitte kopieren Sie den Schlüssel aus dem Link.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda