Çeşitli amaçlar için Word belgelerinizden metin veya resim ayıklamanız gerekebilir. Node.js uygulamalarınızda Word belgelerini kolayca ayrıştırabilir ve metni programlı olarak okuyabilirsiniz. Bir Node.js geliştiricisi olarak, DOCX dosyalarından tüm metin ve görüntüleri programlı olarak bulutta çıkarabilirsiniz. Bu makale, Node.js’de bir REST API kullanarak Word belgelerinin nasıl ayrıştırılacağına odaklanacaktır.
Bu yazıda aşağıdaki konular ele alınacaktır:
- Belge Ayrıştırıcı REST API ve Node.js SDK
- Node.js’de REST API kullanarak Word Belgelerini Ayrıştırın ve Görüntüleri Çıkarın
- REST API kullanarak Word Belgelerinden Metin Çıkarma
Belge Ayrıştırıcı REST API ve Node.js SDK
DOCX belgelerini ayrıştırmak için GroupDocs.Parser Cloud]2 API’sinin [Node.js SDK’sını] kullanacağım. 50’den fazla belge türünden verileri ayrıştırmanıza olanak tanır. Ayrıca, Node.js uygulamalarınızda ZIP arşivleri, OST/PST posta veri dosyaları, e-Kitaplar, biçimlendirmeler ve PDF portföyleri gibi kapsayıcıların ayrıştırılmasını da destekler. SDK’yı kullanarak bir şablonla metin, resim çıkarabilir ve verileri ayrıştırabilirsiniz. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak .NET, Java, PHP, Ruby ve Python SDK’ları sağlar.
Konsolda aşağıdaki komutu kullanarak GroupDocs.Parser Cloud’u Node.js uygulamanıza yükleyebilirsiniz:
npm install groupdocs-parser-cloud
Lütfen belirtilen adımları izlemeden önce Müşteri Kimliğinizi ve Sırrınızı kontrol panelinden alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:
global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";
const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";
Node.js’de REST API kullanarak Word Belgelerini Ayrıştırın ve Görüntüleri Çıkarın
Aşağıda belirtilen adımları izleyerek Word belgelerinizi ayrıştırabilir ve görüntüleri programlı olarak çıkarabilirsiniz:
- Word dosyasını Buluta Yükle
- Node.js kullanarak Word Belgelerinden Görüntüleri Çıkarın
- Çıkartılan görüntüleri İndir
Belgeyi Yükle
Öncelikle Word belgesini (DOCX) aşağıda verilen kod örneğini kullanarak Buluta yükleyin:
// API'yi başlat
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
let resourcesFolder = 'C:\\Files\\sample.docx';
// dosyayı oku
fs.readFile(resourcesFolder, (err, fileStream) => {
// dosya yükleme isteği oluştur
let request = new groupdocs_parser_cloud.UploadFileRequest("sample.docx", fileStream, myStorage);
// dosya yükleme
fileApi.uploadFile(request);
});
Sonuç olarak, yüklenen DOCX dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.
Node.js kullanarak Word Belgelerinden Görüntüleri Çıkarın
Aşağıda belirtilen adımları izleyerek tüm görüntüleri Word belgelerinden kolayca çıkarabilirsiniz.
- ParseApi’nin bir örneğini oluşturun
- FileInfo örneğini oluşturun
- DOCX dosyasının yolunu ayarlayın
- ImageOptions’ın bir örneğini oluşturun
- FileInfo’yu ImageOptions’a atayın
- Görüntü İsteği Oluştur
- ParseApi.images() yöntemini çağırarak sonuçları alın
Aşağıdaki kod örneği, bir REST API kullanarak bir DOCX dosyasından görüntülerin nasıl çıkarılacağını gösterir.
// api başlatma
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// örnek dosya bilgisi
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// görüntü seçeneklerini tanımla
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
// resim isteği oluştur
let request = new groupdocs_parser_cloud.ImagesRequest(options);
// görüntüleri al
let result = await parseApi.images(request);
// resimleri indirme yolunu göster
let images = result.images;
images.forEach(image => {
console.log("Image path in storage: " + image.path);
console.log("Download url: " + image.downloadUrl);
console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
Ayıklanan Resimleri İndir
Yukarıdaki kod örneği, çıkarılan görüntüleri buluta kaydedecektir. Aşağıda verilen kod örneğini kullanarak bu görüntüleri indirebilirsiniz:
// api'yi başlat
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);
// dosya indirme isteği oluştur
let request = new groupdocs_parser_cloud.DownloadFileRequest("parser/images/sample_docx/image_0.png", myStorage);
// dosyayı indir
let response = await fileApi.downloadFile(request);
// resim dosyasını çalışma dizinine kaydet
fs.writeFile("C:\\Files\\images\\image_0.png", response, "binary", function (err) { });
console.log(response);
Node.js kullanarak Word Belgelerinden Metin Çıkarma
Aşağıda belirtilen adımları izleyerek tüm metni Word belgelerinden kolayca çıkarabilirsiniz.
- ParseApi’nin bir örneğini oluşturun
- FileInfo örneğini oluşturun
- DOCX dosyasının yolunu ayarlayın
- TextOptions’ın bir örneğini oluşturun
- FileInfo’yu TextOptions’a atayın
- Başlangıç sayfası numarasını ayarla
- FormattedTextOptions’ı Tanımla
- Metin İsteği Oluştur
- ParseApi.text() yöntemini çağırarak sonuçları alın
Aşağıdaki kod örneği, bir REST API kullanarak DOCX dosyasından nasıl metin çıkarılacağını gösterir.
// api başlatma
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);
// örnek dosya bilgisi
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.docx";
// metin seçeneklerini tanımla
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 1;
options.formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions({
mode: "Html" // extract text in HTML
});
// metin isteği oluştur
let request = new groupdocs_parser_cloud.TextRequest(options);
// metin al
let result = await parseApi.text(request);
// çıkarılan metni göster
let pages = result.pages;
pages.forEach(page => console.log(page.text));
Çevrimiçi Deneyin
Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi DOCX Ayrıştırma aracını deneyin. https://products.groupdocs.app/parser/docx
Çözüm
Bu makalede, Word belgelerini bulutta nasıl ayrıştıracağınızı öğrendiniz. Node.js’de bir REST API kullanarak DOCX dosyalarından resim ve metin çıkarmayı da öğrendiniz. Bu makale aynı zamanda bir DOCX dosyasını programlı olarak buluta nasıl yükleyeceğinizi ve buluttan görüntü dosyalarını nasıl indireceğinizi de açıkladı. Belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.