Ekstrak teks dengan ekspresi
Mengambil teks dari PDF menggunakan ekspresi reguler.
- Method: POST
- Endpoint: /api/v2/ExtractTextByExpression
Parameter
- Konten dari filebase64, Required
Konten dari file masukan
- Nama filestring, Required
Nama file PDF sumber dengan ekstensi .pdf
- Ekspresistring, Required
Contoh 1- Saya memiliki satu PDF (4 halaman). Kata “US” atau “%” digunakan beberapa kali. Ini akan mengekstrak semua kata “US” atau “%” dari file PDF masukan.
Ekspresi Reguler - %: #%: [^$.|?*+()
- Urutan halamanstring, Required
- Tentukan indeks halaman sebagai nilai yang dipisahkan dengan koma atau rentang untuk diproses (misalnya, “0, 1, 2-” atau “1, 2, 3-7”).
- Jika tidak ditentukan, konfigurasi default akan memproses semua halaman. Masukan harus dalam format string.
Keluaran
- Daftar teksarray of string , Required
Ini akan menampilkan daftar teks.
Header
Content- Type:application/json
Authorization: Silahkan salin kunci dari link.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda