الوثائق مهام سير العمل الأسعار يدعم

استخراج النص بالتعبير

يستخرج النص من PDF باستخدام التعبير المنظم.

الطريقة: POST
النقطة النهائية: /api/v2/ExtractTextByExpression

المعاملات

محتوى الملفbase64, Required: محتوى الملف المدخل

اسم الملفstring, Required: اسم ملف PDF المصدر بامتداد .pdf

التعبيرstring, Required: مثال 1- لدي PDF واحد (4 صفحات). تم استخدام الكلمة “US” أو “%” عدة مرات. سيتم استخراج جميع الكلمات “US” أو “%” من ملف PDF المدخل.
التعبير المنظم - %: #%: [^$.|?*+()

تسلسل الصفحاتstring, Required

حدد مؤشرات الصفحات كقيم مفصولة بفواصل أو نطاقات للمعالجة (على سبيل المثال، “0, 1, 2-” أو “1, 2, 3-7”).
إذا لم يتم تحديده، يتم معالجة كافة الصفحات بواسطة التكوين الافتراضي. يجب أن يكون الإدخال بتنسيق سلسلة.

الناتج

قائمة النصarray of string , Required: سيتم عرض قائمة النص.

Header
Content- Type:application/json
Authorization: يرجى نسخ المفتاح من الرابط.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs