استخراج النص بالتعبير
يستخرج النص من PDF باستخدام التعبير المنظم.
- الطريقة: POST
- النقطة النهائية: /api/v2/ExtractTextByExpression
المعاملات
- محتوى الملفbase64, Required
محتوى الملف المدخل
- اسم الملفstring, Required
اسم ملف PDF المصدر بامتداد .pdf
- التعبيرstring, Required
مثال 1- لدي PDF واحد (4 صفحات). تم استخدام الكلمة “US” أو “%” عدة مرات. سيتم استخراج جميع الكلمات “US” أو “%” من ملف PDF المدخل.
التعبير المنظم - %: #%: [^$.|?*+()
- تسلسل الصفحاتstring, Required
- حدد مؤشرات الصفحات كقيم مفصولة بفواصل أو نطاقات للمعالجة (على سبيل المثال، “0, 1, 2-” أو “1, 2, 3-7”).
- إذا لم يتم تحديده، يتم معالجة كافة الصفحات بواسطة التكوين الافتراضي. يجب أن يكون الإدخال بتنسيق سلسلة.
الناتج
- قائمة النصarray of string , Required
سيتم عرض قائمة النص.
Header
Content- Type:application/json
Authorization: يرجى نسخ المفتاح من الرابط.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda