Dokumentasi Alur kerja Harga Mendukung

Ekstrak teks dengan ekspresi

Mengambil teks dari PDF menggunakan ekspresi reguler.

Method: POST
Endpoint: /api/v2/ExtractTextByExpression

Parameter

Konten dari filebase64, Required: Konten dari file masukan

Nama filestring, Required: Nama file PDF sumber dengan ekstensi .pdf

Ekspresistring, Required: Contoh 1- Saya memiliki satu PDF (4 halaman). Kata “US” atau “%” digunakan beberapa kali. Ini akan mengekstrak semua kata “US” atau “%” dari file PDF masukan.
Ekspresi Reguler - %: #%: [^$.|?*+()

Urutan halamanstring, Required

Tentukan indeks halaman sebagai nilai yang dipisahkan dengan koma atau rentang untuk diproses (misalnya, “0, 1, 2-” atau “1, 2, 3-7”).
Jika tidak ditentukan, konfigurasi default akan memproses semua halaman. Masukan harus dalam format string.

Keluaran

Daftar teksarray of string , Required: Ini akan menampilkan daftar teks.

Header
Content- Type:application/json
Authorization: Silahkan salin kunci dari link.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#): Extract Text by Expression[C#]

Java: Extract Text by Expression [Java]

JavaScript: Extract Text by Expression [JavaScript]

Python: Extract Text by Expression [Python]

Salesforce: Extract Text by Expression [Salesforce]

n8n: Extract Text by Expression [n8n]

Google Script: Extract Text by Expression [Google Script]

AWS Lambda: Extract Text by Expression [AWS Lambda]

Other Docs