API V2

Metin ifadesiyle çıkarma

PDF’den metin çıkarma işlemi için düzenli ifade kullanır.

  • Method: POST
  • Endpoint: /api/v2/ExtractTextByExpression

Parametreler

Dosya içeriğibase64, Required

Giriş dosyasının içeriği

Dosya adıstring, Required

PDF dosya adı ile .pdf uzantısı

İfadestring, Required

Örnek 1- Bir PDF (4 sayfa). “US” veya “%” kelimesi birkaç kez kullanılır. Giriş PDF dosyasından tüm “US” kelimesi veya “%” kelimesi çıkarılır.
Düzenli İfade - %: #%: [^$.|?*+()

Sayfa sırasıstring, Required
  • İşlenecek sayfa dizinlerini virgül ile ayrılmış değerler veya aralıklar olarak belirtin (örneğin, “0, 1, 2-” veya “1, 2, 3-7”).
  • Belirtilmediğinde, varsayılan yapılandırma tüm sayfaları işler. Girişin dize formatında olması gerekir.

Çıktı

Metin listesiarray of string , Required

Metin listesini gösterecektir.

Başlık
Content- Type:application/json
Authorization: Lütfen link adresinden anahtarı kopyalayın.

Payload

{
  "docContent": "Please put PDF base64 content",
  "docName": "output.pdf",
  "expression": "%",
  "pageSequence": "1"
}

PDF4me api samples

CSharp(C#)
Java
JavaScript
Python
Salesforce
n8n
Google Script
AWS Lambda