Belirli senaryolarda, biçimlendirilmiş metin, metin analizi, sınıflandırma vb. gibi daha ileri işlemler için belgelerden çıkarılır. PDF ve Word gibi diğer dosya biçimleri arasında PowerPoint Sunum da metin çıkarmada kullanılır. Bu nedenle, bu makale Node.js’de PowerPoint PPT/PPTX’ten nasıl metin çıkarılacağını gösterir. PowerPoint PPT/PPTX sunumlarınızı ve metni belirli bir slayttan kolayca ayrıştırabilir veya tüm metni programlı olarak bulutta ayıklayabilirsiniz.
Bu yazıda aşağıdaki konular ele alınacaktır:
- PowerPoint PPT’den Metin Çıkarmak için Node.js Kitaplığı
- REST API kullanarak Node.js’de PowerPoint PPT/PPTX’ten Tüm Metni Çıkarın
- Node.js’de Sayfa Numarası Aralığına Göre PowerPoint PPT’den Metin Çıkarın
PowerPoint PPT’den Metin Çıkarmak için Node.js Kitaplığı
PowerPoint belgelerini ayrıştırmak için GroupDocs.Parser Cloud API’nin Node.js SDK‘sını kullanacağım. 50’den fazla desteklenen belge biçimi türünden verileri ayrıştırmanıza olanak tanır. Ayrıca, Node.js uygulamalarınızda ZIP arşivleri, OST posta veri dosyaları, e-kitaplar, biçimlendirmeler, PowerPoint ve PDF portföyleri gibi kapsayıcıların ayrıştırılmasını da destekler. SDK’yı kullanarak bir şablonla metin, resim çıkarabilir ve verileri ayrıştırabilirsiniz. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak .NET, Java, PHP, Ruby ve Python SDK’ları sağlar.
Konsolda aşağıdaki komutu kullanarak GroupDocs.Parser Cloud’u Node.js uygulamanıza yükleyebilirsiniz:
npm install groupdocs-parser-cloud
Lütfen belirtilen adımları uygulamadan önce panodan Müşteri Kimliğinizi ve Sırrınızı alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:
# http://api.groupdocs.cloud adresinden düğüm uygulamanıza Node.js SDK'yı içe aktarın
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");
// https://dashboard.groupdocs.cloud adresinden clientId ve clientSecret'i edinin (ücretsiz kayıt gereklidir).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";
REST API kullanarak Node.js’de PowerPoint PPT/PPTX’ten Tüm Metni Çıkarın
Aşağıda belirtilen basit adımları izleyerek PowerPoint Sunumlarından metin çıkarabilirsiniz:
- PowerPoint dosyasını Buluta Yükle
- Node.js kullanılarak PowerPoint sunumundan Metin Çıkarma
Dosyayı Yükle
Öncelikle, aşağıda verilen kod örneğini kullanarak PowerPoint belgesini Buluta yükleyin:
// dosyayı sistem sürücünüzden IOStream'de açın.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// dosyayı oku
fs.readFile(resourcesFolder, (err, fileStream) => {
// FileApi'yi inşa et
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
// dosya yükleme isteği oluştur
var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
// dosya yükleme
fileApi.uploadFile(request)
.then(function (response) {
console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
})
.catch(function (error) {
console.log("Error: " + error.message);
});
});
Sonuç olarak, karşıya yüklenen PowerPoint dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.
Node.js kullanarak PowerPoint Sunumundan Metin Çıkarma
Aşağıda verilen adımları izleyerek PowerPoint dosyalarındaki tüm metni kolayca programlı olarak çıkarabilirsiniz:
- İlk olarak, ParseApi‘ün bir örneğini oluşturun.
- İkinci olarak, FileInfo’nun bir örneğini oluşturun.
- Ardından, PowerPoint dosyasının yolunu ayarlayın.
- TextOptions’ın bir örneğini oluşturun.
- Ardından, FileInfo’yu TextOptions’a atayın.
- FormattedTextOptions’ın bir örneğini oluşturun.
- FormattedTextOptions modunu Düz Metin olarak ayarla
- Ardından, formattedTextOptions değeri atayın
- Şimdi, TextOptions ile bir TextRequest örneği oluşturun.
- Son olarak, TextRequest ile ParseApi.text() yöntemini çağırarak sonuçları alın.
Aşağıdaki kod örneği, Node.js’de bir REST API kullanarak PowerPoint dosyasındaki tüm metnin nasıl ayıklanacağını gösterir:
// REST API kullanarak Node.js'de PowerPoint PPT/PPTX'ten Tüm Metni Çıkarma
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// Ayrıştırma belgesi isteği oluştur
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// Sonuçları göster
console.log(response.text);
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
PowerPoint PPT’den Metni Node.js’de Sayfa Numarası Aralığına Göre Çıkarın
Aşağıda verilen adımları izleyerek bir PDF dosyasının belirli sayfalarından metni programlı olarak çıkarabilirsiniz:
- İlk olarak, bir ParseApi örneği oluşturun.
- Ardından, FileInfo’nun bir örneğini oluşturun.
- Ardından, PowerPoint PPTX dosyasının yolunu ayarlayın.
- TextOptions’ın bir örneğini oluşturun.
- Ardından, FileInfo’yu TextOptions’a atayın.
- startPageNumber ve countPagesToExtract değerlerini ayarlayın
- FormattedTextOptions’ın bir örneğini oluşturun.
- FormattedTextOptions modunu Düz Metin olarak ayarla
- Ardından, formattedTextOptions değeri atayın.
- Ayıklanacak başlangıç sayfa numarasını ve toplam sayfa sayısını ayarlayın.
- Şimdi, TextOptions ile bir TextRequest örneği oluşturun.
- Son olarak, TextRequest ile ParseApi.text() yöntemini çağırarak sonuçları alın.
Aşağıdaki kod örneği, REST API kullanılarak PowerPoint PPTX dosyasındaki belirli metnin Node.js’de sayfa numaralarına göre nasıl çıkarılacağını gösterir:
// Node.js'de Sayfa Numarası Aralığına Göre PowerPoint PPT'den Metin Çıkarma
const parse = async () => {
global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "nodejs-testing/sample-file.pptx";
let options = new groupdocs_parser_cloud.TextOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 0;
options.countPagesToExtract = 2;
let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
formattedTextOptions.mode = "PlainText";
options.formattedTextOptions = formattedTextOptions;
try {
// Ayrıştırma belgesi isteği oluştur
let request = new groupdocs_parser_cloud.TextRequest(options);
let response = await parseApi.text(request);
// Sonuçları göster
let pages = response.pages;
pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
}
catch (err) {
throw err;
}
}
parse()
.then(() => {
console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Çevrimiçi Deneyin
Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PowerPoint Ayrıştırma aracını deneyin.
Çözüm
Bu makalede, Nodejs’de PowerPoint PPT’den metin ayrıştırmayı ve ayıklamayı öğrendiniz. Şunları gördünüz:
- REST API kullanılarak Node.js’de belirli bir slayttan nasıl metin çıkarılacağı;
- Node.js’de bir PowerPoint Sunumunun tüm slaytlarından nasıl metin çıkarılacağı;
- programlı olarak bir PowerPoint dosyasını buluta yükleyin;
Ayrıca belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşim kurmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.
Bir soru sor
Çevrimiçi Metin Çıkarıcı hakkında herhangi bir sorunuz veya kafa karışıklığınız olması durumunda forumumuz aracılığıyla bize bilgi verin.
SSS
Node.js’de PowerPoint’ten nasıl metin ayıklayabilirim?
Lütfen [bu bağlantıyı] takip edin(https://blog.groupdocs.cloud/tr/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- Node.js’deki PPT dosyalarından metnin nasıl çıkarılacağına ilişkin Node.js kod parçacığını öğrenmek için in-Node.js-using-REST-API).
REST API kullanarak çevrimiçi olarak PPT belgelerinden metin nasıl çıkarılır?
Öncelikle bir ParseApi örneği oluşturun, TextOptions’ın değerlerini ayarlayın ve şimdi [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) yöntemini TextRequest ile çevrimiçi PPT dosyalarından seçilen metni ayıklamak için kullanın.
Bir PPT metin çıkarıcı ücretsiz indirme kitaplığı nasıl kurulur?
PPT dosyalarından programlı olarak metin ayıklamak için PPT metin çıkarıcısını Node.js kitaplığı yükleyebilirsiniz.
Windows’ta PPT’den çevrimdışı olarak nasıl metin ayıklayabilirim?
Windows için metin ayıklama yazılımını indirmek için lütfen bu bağlantıyı ziyaret edin. Bu metin çıkarma aracı, tek bir tıklama ile anında pencerelerdeki metni çıkaracaktır.
Ayrıca bakınız
- Node.js kullanarak PDF Dosyalarından Görüntüleri Çıkarın
- Node.js’de REST API kullanarak PDF’den Veri Çıkarma
- Python’da REST API kullanarak Word Belgelerini Ayrıştırma
- Node.js’de REST API kullanarak PDF’den Metin Çıkarın
- Node.js’de REST API kullanarak Word Belgelerini Ayrıştırma
- Python kullanarak PDF’den Belirli Verileri Çıkarın
- Python Kullanarak PDF Belgelerinden Görüntüleri Çıkarın
- Python kullanarak PDF’den Metin Çıkarma
- Python kullanarak PDF, Elektronik Tablolar, Sunumlar ve Word Belgelerinden Görüntü Çıkarın