Node.js'de REST API kullanarak Word Belgelerini Ayrıştırma

Çeşitli amaçlar için Word belgelerinizden metin veya resim ayıklamanız gerekebilir. Node.js uygulamalarınızda Word belgelerini kolayca ayrıştırabilir ve metni programlı olarak okuyabilirsiniz. Bir Node.js geliştiricisi olarak, DOCX dosyalarından tüm metin ve görüntüleri programlı olarak bulutta çıkarabilirsiniz. Bu makale, Node.js’de bir REST API kullanarak Word belgelerinin nasıl ayrıştırılacağına odaklanacaktır.

Bu yazıda aşağıdaki konular ele alınacaktır:

Belge Ayrıştırıcı REST API ve Node.js SDK

DOCX belgelerini ayrıştırmak için GroupDocs.Parser Cloud]2 API’sinin [Node.js SDK’sını] kullanacağım. 50’den fazla belge türünden verileri ayrıştırmanıza olanak tanır. Ayrıca, Node.js uygulamalarınızda ZIP arşivleri, OST/PST posta veri dosyaları, e-Kitaplar, biçimlendirmeler ve PDF portföyleri gibi kapsayıcıların ayrıştırılmasını da destekler. SDK’yı kullanarak bir şablonla metin, resim çıkarabilir ve verileri ayrıştırabilirsiniz. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak .NET, Java, PHP, Ruby ve Python SDK’ları sağlar.

Konsolda aşağıdaki komutu kullanarak GroupDocs.Parser Cloud’u Node.js uygulamanıza yükleyebilirsiniz:

npm install groupdocs-parser-cloud 

Lütfen belirtilen adımları izlemeden önce Müşteri Kimliğinizi ve Sırrınızı kontrol panelinden alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";

Node.js’de REST API kullanarak Word Belgelerini Ayrıştırın ve Görüntüleri Çıkarın

Aşağıda belirtilen adımları izleyerek Word belgelerinizi ayrıştırabilir ve görüntüleri programlı olarak çıkarabilirsiniz:

Belgeyi Yükle

Öncelikle Word belgesini (DOCX) aşağıda verilen kod örneğini kullanarak Buluta yükleyin:

// API'yi başlat
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
let resourcesFolder = 'C:\\Files\\sample.docx';

// dosyayı oku
fs.readFile(resourcesFolder, (err, fileStream) => {
  // dosya yükleme isteği oluştur
  let request = new groupdocs_parser_cloud.UploadFileRequest("sample.docx", fileStream, myStorage);
  // dosya yükleme
  fileApi.uploadFile(request);
});

Sonuç olarak, yüklenen DOCX dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.

Node.js kullanarak Word Belgelerinden Görüntüleri Çıkarın

Aşağıda belirtilen adımları izleyerek tüm görüntüleri Word belgelerinden kolayca çıkarabilirsiniz.

  • ParseApi’nin bir örneğini oluşturun
  • FileInfo örneğini oluşturun
  • DOCX dosyasının yolunu ayarlayın
  • ImageOptions’ın bir örneğini oluşturun
  • FileInfo’yu ImageOptions’a atayın
  • Görüntü İsteği Oluştur
  • ParseApi.images() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, bir REST API kullanarak bir DOCX dosyasından görüntülerin nasıl çıkarılacağını gösterir.

// api başlatma
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// örnek dosya bilgisi
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";

// görüntü seçeneklerini tanımla
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// resim isteği oluştur
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// görüntüleri al
let result = await parseApi.images(request);

// resimleri indirme yolunu göster
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
Node.js kullanarak Word Belgelerinden Görüntüleri Çıkarın

Node.js kullanarak Word Belgelerinden Görüntüleri Çıkarın

Ayıklanan Resimleri İndir

Yukarıdaki kod örneği, çıkarılan görüntüleri buluta kaydedecektir. Aşağıda verilen kod örneğini kullanarak bu görüntüleri indirebilirsiniz:

// api'yi başlat
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// dosya indirme isteği oluştur
let request = new groupdocs_parser_cloud.DownloadFileRequest("parser/images/sample_docx/image_0.png", myStorage);

// dosyayı indir
let response = await fileApi.downloadFile(request);

// resim dosyasını çalışma dizinine kaydet
fs.writeFile("C:\\Files\\images\\image_0.png", response, "binary", function (err) { });
console.log(response);

Node.js kullanarak Word Belgelerinden Metin Çıkarma

Aşağıda belirtilen adımları izleyerek tüm metni Word belgelerinden kolayca çıkarabilirsiniz.

  • ParseApi’nin bir örneğini oluşturun
  • FileInfo örneğini oluşturun
  • DOCX dosyasının yolunu ayarlayın
  • TextOptions’ın bir örneğini oluşturun
  • FileInfo’yu TextOptions’a atayın
  • Başlangıç sayfası numarasını ayarla
  • FormattedTextOptions’ı Tanımla
  • Metin İsteği Oluştur
  • ParseApi.text() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, bir REST API kullanarak DOCX dosyasından nasıl metin çıkarılacağını gösterir.

// api başlatma
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// örnek dosya bilgisi
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";

// metin seçeneklerini tanımla
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 1;
options.formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions({
  mode: "Html"  // extract text in HTML
});

// metin isteği oluştur
let request = new groupdocs_parser_cloud.TextRequest(options);

// metin al
let result = await parseApi.text(request);

// çıkarılan metni göster
let pages = result.pages;
pages.forEach(page => console.log(page.text));
Node.js kullanarak Word Belgelerinden Metin Çıkarma

Node.js kullanarak Word Belgelerinden Metin Çıkarma

Çevrimiçi Deneyin

Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi DOCX Ayrıştırma aracını deneyin. https://products.groupdocs.app/parser/docx

Çözüm

Bu makalede, Word belgelerini bulutta nasıl ayrıştıracağınızı öğrendiniz. Node.js’de bir REST API kullanarak DOCX dosyalarından resim ve metin çıkarmayı da öğrendiniz. Bu makale aynı zamanda bir DOCX dosyasını programlı olarak buluta nasıl yükleyeceğinizi ve buluttan görüntü dosyalarını nasıl indireceğinizi de açıkladı. Belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız