Node.js'de PPTX

Node.js’de PowerPoint PPT/PPTX’ten Metin Çıkarma

Belirli senaryolarda, biçimlendirilmiş metin, metin analizi, sınıflandırma vb. gibi daha ileri işlemler için belgelerden çıkarılır. PDF ve Word gibi diğer dosya biçimleri arasında PowerPoint Sunum da metin çıkarmada kullanılır. Bu nedenle, bu makale Node.js’de PowerPoint PPT/PPTX’ten nasıl metin çıkarılacağını gösterir. PowerPoint PPT/PPTX sunumlarınızı ve metni belirli bir slayttan kolayca ayrıştırabilir veya tüm metni programlı olarak bulutta ayıklayabilirsiniz.

Bu yazıda aşağıdaki konular ele alınacaktır:

PowerPoint PPT’den Metin Çıkarmak için Node.js Kitaplığı

PowerPoint belgelerini ayrıştırmak için GroupDocs.Parser Cloud API’nin Node.js SDK‘sını kullanacağım. 50’den fazla desteklenen belge biçimi türünden verileri ayrıştırmanıza olanak tanır. Ayrıca, Node.js uygulamalarınızda ZIP arşivleri, OST posta veri dosyaları, e-kitaplar, biçimlendirmeler, PowerPoint ve PDF portföyleri gibi kapsayıcıların ayrıştırılmasını da destekler. SDK’yı kullanarak bir şablonla metin, resim çıkarabilir ve verileri ayrıştırabilirsiniz. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak .NET, Java, PHP, Ruby ve Python SDK’ları sağlar.

Konsolda aşağıdaki komutu kullanarak GroupDocs.Parser Cloud’u Node.js uygulamanıza yükleyebilirsiniz:

npm install groupdocs-parser-cloud

Lütfen belirtilen adımları uygulamadan önce panodan Müşteri Kimliğinizi ve Sırrınızı alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:

# http://api.groupdocs.cloud adresinden düğüm uygulamanıza Node.js SDK'yı içe aktarın
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud adresinden clientId ve clientSecret'i edinin (ücretsiz kayıt gereklidir).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

REST API kullanarak Node.js’de PowerPoint PPT/PPTX’ten Tüm Metni Çıkarın

Aşağıda belirtilen basit adımları izleyerek PowerPoint Sunumlarından metin çıkarabilirsiniz:

Dosyayı Yükle

Öncelikle, aşağıda verilen kod örneğini kullanarak PowerPoint belgesini Buluta yükleyin:

// dosyayı sistem sürücünüzden IOStream'de açın.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// dosyayı oku
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi'yi inşa et
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // dosya yükleme isteği oluştur
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // dosya yükleme
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Sonuç olarak, karşıya yüklenen PowerPoint dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.

Node.js kullanarak PowerPoint Sunumundan Metin Çıkarma

Aşağıda verilen adımları izleyerek PowerPoint dosyalarındaki tüm metni kolayca programlı olarak çıkarabilirsiniz:

  • İlk olarak, ParseApi‘ün bir örneğini oluşturun.
  • İkinci olarak, FileInfo’nun bir örneğini oluşturun.
  • Ardından, PowerPoint dosyasının yolunu ayarlayın.
  • TextOptions’ın bir örneğini oluşturun.
  • Ardından, FileInfo’yu TextOptions’a atayın.
  • FormattedTextOptions’ın bir örneğini oluşturun.
  • FormattedTextOptions modunu Düz Metin olarak ayarla
  • Ardından, formattedTextOptions değeri atayın
  • Şimdi, TextOptions ile bir TextRequest örneği oluşturun.
  • Son olarak, TextRequest ile ParseApi.text() yöntemini çağırarak sonuçları alın.

Aşağıdaki kod örneği, Node.js’de bir REST API kullanarak PowerPoint dosyasındaki tüm metnin nasıl ayıklanacağını gösterir:

// REST API kullanarak Node.js'de PowerPoint PPT/PPTX'ten Tüm Metni Çıkarma
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Ayrıştırma belgesi isteği oluştur
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Sonuçları göster
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Node.js Kullanarak PowerPoint Sunumundan Metin Çıkarma

Node.js kullanarak PowerPoint Sunumundan Metin Çıkarma

PowerPoint PPT’den Metni Node.js’de Sayfa Numarası Aralığına Göre Çıkarın

Aşağıda verilen adımları izleyerek bir PDF dosyasının belirli sayfalarından metni programlı olarak çıkarabilirsiniz:

  • İlk olarak, bir ParseApi örneği oluşturun.
  • Ardından, FileInfo’nun bir örneğini oluşturun.
  • Ardından, PowerPoint PPTX dosyasının yolunu ayarlayın.
  • TextOptions’ın bir örneğini oluşturun.
  • Ardından, FileInfo’yu TextOptions’a atayın.
  • startPageNumber ve countPagesToExtract değerlerini ayarlayın
  • FormattedTextOptions’ın bir örneğini oluşturun.
  • FormattedTextOptions modunu Düz Metin olarak ayarla
  • Ardından, formattedTextOptions değeri atayın.
  • Ayıklanacak başlangıç sayfa numarasını ve toplam sayfa sayısını ayarlayın.
  • Şimdi, TextOptions ile bir TextRequest örneği oluşturun.
  • Son olarak, TextRequest ile ParseApi.text() yöntemini çağırarak sonuçları alın.

Aşağıdaki kod örneği, REST API kullanılarak PowerPoint PPTX dosyasındaki belirli metnin Node.js’de sayfa numaralarına göre nasıl çıkarılacağını gösterir:

// Node.js'de Sayfa Numarası Aralığına Göre PowerPoint PPT'den Metin Çıkarma
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Ayrıştırma belgesi isteği oluştur
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Sonuçları göster
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Node.js'de Sayfa Numarası Aralığına Göre PowerPoint PPT'den Metin Çıkarma

Node.js’de Sayfa Numarası Aralığına Göre PowerPoint PPT’den Metin Çıkarın

Çevrimiçi Deneyin

Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PowerPoint Ayrıştırma aracını deneyin.

Çözüm

Bu makalede, Nodejs’de PowerPoint PPT’den metin ayrıştırmayı ve ayıklamayı öğrendiniz. Şunları gördünüz:

  • REST API kullanılarak Node.js’de belirli bir slayttan nasıl metin çıkarılacağı;
  • Node.js’de bir PowerPoint Sunumunun tüm slaytlarından nasıl metin çıkarılacağı;
  • programlı olarak bir PowerPoint dosyasını buluta yükleyin;

Ayrıca belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşim kurmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.

Bir soru sor

Çevrimiçi Metin Çıkarıcı hakkında herhangi bir sorunuz veya kafa karışıklığınız olması durumunda forumumuz aracılığıyla bize bilgi verin.

SSS

Node.js’de PowerPoint’ten nasıl metin ayıklayabilirim?

Lütfen [bu bağlantıyı] takip edin(https://blog.groupdocs.cloud/tr/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- Node.js’deki PPT dosyalarından metnin nasıl çıkarılacağına ilişkin Node.js kod parçacığını öğrenmek için in-Node.js-using-REST-API).

REST API kullanarak çevrimiçi olarak PPT belgelerinden metin nasıl çıkarılır?

Öncelikle bir ParseApi örneği oluşturun, TextOptions’ın değerlerini ayarlayın ve şimdi [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) yöntemini TextRequest ile çevrimiçi PPT dosyalarından seçilen metni ayıklamak için kullanın.

Bir PPT metin çıkarıcı ücretsiz indirme kitaplığı nasıl kurulur?

PPT dosyalarından programlı olarak metin ayıklamak için PPT metin çıkarıcısını Node.js kitaplığı yükleyebilirsiniz.

Windows’ta PPT’den çevrimdışı olarak nasıl metin ayıklayabilirim?

Windows için metin ayıklama yazılımını indirmek için lütfen bu bağlantıyı ziyaret edin. Bu metin çıkarma aracı, tek bir tıklama ile anında pencerelerdeki metni çıkaracaktır.

Ayrıca bakınız