Documentation Flux de travail Fixation des prix Soutien

Extraire le texte par expression

Extrait le texte d’un PDF en utilisant une expression régulière.

Méthode: POST
Endpoint: /api/v2/ExtractTextByExpression

Paramètres

Contenu du fichierbase64, Required: Le contenu du fichier d’entrée

Nom du fichierstring, Required: Nom du fichier PDF source avec l’extension .pdf

Expressionstring, Required: Exemple 1- J’ai un PDF (4 pages). Le mot “US” ou “%” est utilisé plusieurs fois. Il extraira tous les mots “US” ou “%” du fichier PDF d’entrée.
Expression régulière - %: #%: [^$.|?*+()

Séquence de pagesstring, Required

Spécifiez les indices de page comme des valeurs séparées par des virgules ou des plages à traiter (par exemple, “0, 1, 2-” ou “1, 2, 3-7”).
Si non spécifié, la configuration par défaut traite toutes les pages. L’entrée doit être au format chaîne.

Sortie

Liste de textearray of string , Required: Il affichera la liste de texte.

En-tête
Content- Type:application/json
Authorization: Veuillez copier la clé à partir du lien.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs