
PDF dosyalarındaki PDF metinlerini açmak, içerik dizinleme, otomasyon ve veri analizi için gereklidir. Node.js için GroupDocs.Parser Cloud SDK ile ağır araçlara veya manuel ayrıştırmaya ihtiyaç duymadan basit bir RESTful API aracılığıyla PDF’lerden düz veya yapılandırılmış metinleri programlı olarak çıkarabilirsiniz.
PDF’den Metin Neden Çıkartılır??
PDF’lerden metin çıkarmak şunlar için hayati önem taşır:
- Belge yönetim veya OCR boru hatları oluşturma.
- Sözleşmelerden, faturaların ve raporların veri toplama işlemini otomatikleştirme.
- Dijital arşivler için tam metin arama etkinleştirme.
- İçeriği AI/ML modelleri için temizleme ve yapılandırma.
Aşağıdaki konuları daha ayrıntılı bir şekilde ele alalım:
- Metin Alma REST API
- PDF’den Metin Çıkarmak için Node.js Kullanma
- PDF’den Metin Çıkarma cURL ile
- Çevrimiçi Metin Çıkarıcı
Metin Çıkarma REST API
GroupDocs.Parser Cloud SDK for Node.js , GroupDocs.Parser Cloud REST API’si ile etkileşimde bulunmak için hafif, yüksek performanslı bir sargıdır. Geliştiricilerin aşağıdaki gibi yapılandırılmış veya yapılandırılmamış içerikleri çıkarmasını sağlar:
- Metin (tam belge, belirli sayfalar veya seçilen alanlar)
- Images
- Metadata
- Belge alanları
- Tablolardan veya formlardan yapılandırılmış veri
Birçok formatı destekler — PDF, Word, Excel, PowerPoint, MSG, ZIP ve daha fazlası dahil.
Ön koşullar GroupDocs.Parser Cloud SDK’sını Node.js için yükleyin:
npm install groupdocs-parser-cloud
Bir GroupDocs.Cloud Dashboard üzerinde bir hesap oluşturun, böylece kimlik doğrulama için Client ID ve Client Secret’inizi alabilirsiniz. Daha fazla bilgi için lütfen bu article ziyaret edin.
PDF’den Metin Nasıl Çekilir Node.js Kullanarak
Bu adımları izleyerek bir PDF’den metin çıkarmak için Node.js SDK’sını kullanın.
Adım 1: Konfigürasyonu Ayarla:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Adım 2: PDF Dosyası Girişi Yapılandırması: TextRequest sınıfının bir nesnesini başlatın ve TextOptions sınıfının örneğini geçirin.
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Adım 3: PDF’den Metin Çıkar: Invoke the text method, and it will return the plain text content of your PDF.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// For more examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Aşağıdaki görselde yukarıdaki kod örneğinin çıktısını görebilirsiniz:

PDF’den Metin Çıkartma cURL
Komut satırı işlemlerini tercih ediyorsanız veya bir script’e entegre etmek istiyorsanız? GroupDocs.Parser REST API’si ile cURL kullanarak metin çıkarabilirsiniz.
Adım 1 – Erişim Token’ı Oluştur:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Adım 2 – REST API aracılığıyla Görselleri Çıkar:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"Binder1.pdf\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- ile oluşturduğunuz olanı değiştirin.
cURL Kullanmanın GroupDocs.Parser API ile Faydaları
- SDK Gerekli Değil: Hızlı entegrasyon için doğrudan REST kullanın.
- Platform Agnostik: Herhangi bir işletim sistemi veya dil ile çalışır.
- CI/CD Pipeline’lar için İdeal: DevOps ortamlarında metin çıkarımını otomatikleştirin.
- Hafif: cURL dışında hiçbir kurulum yok.
Online Metin Çıkarıcı
Eğer kodsuz bir çözüm arıyorsanız, o zaman GroupDocs.Parser Cloud tarafından desteklenen Ücretsiz Çevrimiçi PDF Metin Çıkarıcı yı kullanın.

Sonuç
GroupDocs.Parser Cloud SDK for Node.js, PDF’lerden metin çıkarmayı kolaylaştırır; ister tam içerik ayrıştırma, veri madenciliği veya belge otomasyonu ihtiyacınız olsun. RESTful çağrıları ve cURL entegrasyonu ile destekleyen bu API, Node.js veya diğer ortamlar için modern, ölçeklenebilir belge işleme uygulamaları oluşturmak için idealdir.
📚 Ek Kaynaklar
Sıkça Sorulan Sorular – SSS
How do I extract images from Word?
PDF dosyalarından metin çıkarmak için GroupDocs.Parser Cloud SDKs kullanabilirsiniz. Daha fazla bilgi için lütfen bu linki ziyaret edin.
Fiyatlandırma modeli nedir?
Tek bir “kullandıkça öde” fiyatlandırma modeli sunuyoruz. Daha fazla bilgi için lütfen pricing guide adresini ziyaret edin.