Extraire le texte par expression
Extrait le texte d’un PDF en utilisant une expression régulière.
- Méthode: POST
- Endpoint: /api/v2/ExtractTextByExpression
Paramètres
- Contenu du fichierbase64, Required
Le contenu du fichier d’entrée
- Nom du fichierstring, Required
Nom du fichier PDF source avec l’extension .pdf
- Expressionstring, Required
Exemple 1- J’ai un PDF (4 pages). Le mot “US” ou “%” est utilisé plusieurs fois. Il extraira tous les mots “US” ou “%” du fichier PDF d’entrée.
Expression régulière - %: #%: [^$.|?*+()
- Séquence de pagesstring, Required
- Spécifiez les indices de page comme des valeurs séparées par des virgules ou des plages à traiter (par exemple, “0, 1, 2-” ou “1, 2, 3-7”).
- Si non spécifié, la configuration par défaut traite toutes les pages. L’entrée doit être au format chaîne.
Sortie
- Liste de textearray of string , Required
Il affichera la liste de texte.
En-tête
Content- Type:application/json
Authorization: Veuillez copier la clé à partir du lien.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda