Metin ifadesiyle çıkarma
PDF’den metin çıkarma işlemi için düzenli ifade kullanır.
- Method: POST
- Endpoint: /api/v2/ExtractTextByExpression
Parametreler
- Dosya içeriğibase64, Required
Giriş dosyasının içeriği
- Dosya adıstring, Required
PDF dosya adı ile .pdf uzantısı
- İfadestring, Required
Örnek 1- Bir PDF (4 sayfa). “US” veya “%” kelimesi birkaç kez kullanılır. Giriş PDF dosyasından tüm “US” kelimesi veya “%” kelimesi çıkarılır.
Düzenli İfade - %: #%: [^$.|?*+()
- Sayfa sırasıstring, Required
- İşlenecek sayfa dizinlerini virgül ile ayrılmış değerler veya aralıklar olarak belirtin (örneğin, “0, 1, 2-” veya “1, 2, 3-7”).
- Belirtilmediğinde, varsayılan yapılandırma tüm sayfaları işler. Girişin dize formatında olması gerekir.
Çıktı
- Metin listesiarray of string , Required
Metin listesini gösterecektir.
Başlık
Content- Type:application/json
Authorization: Lütfen link adresinden anahtarı kopyalayın.
Payload
{
"docContent": "Please put PDF base64 content",
"docName": "output.pdf",
"expression": "%",
"pageSequence": "1"
}
PDF4me api samples
- CSharp(C#)
- Java
- JavaScript
- Python
- Salesforce
- n8n
- Google Script
- AWS Lambda