PPTX di Node.js

Ekstrak Teks dari PowerPoint PPT/PPTX di Node.js

Dalam skenario tertentu, teks yang diformat diekstraksi dari dokumen untuk diproses lebih lanjut seperti analisis teks, klasifikasi, dll. Di antara format file lain seperti PDF dan Word, PowerPoint Presentasi juga digunakan dalam ekstraksi teks. Oleh karena itu, artikel ini menunjukkan cara mengekstrak teks dari PowerPoint PPT/PPTX di Node.js. Anda dapat dengan mudah menguraikan presentasi dan teks PowerPoint PPT/PPTX dari slide tertentu atau mengekstrak semua teks secara terprogram di cloud.

Topik-topik berikut akan dibahas dalam artikel ini:

Pustaka Node.js untuk Mengekstrak Teks dari PowerPoint PPT

Untuk menguraikan dokumen PowerPoint, saya akan menggunakan Node.js SDK dari GroupDocs.Parser Cloud API. Ini memungkinkan Anda mengurai data dari lebih dari 50 jenis [format dokumen] yang didukung 4. Ini juga mendukung penguraian wadah seperti ZIP arsip, OST file data email, e-books, markup, portofolio PowerPoint dan PDF di aplikasi Node.js Anda. Anda dapat mengekstrak teks, gambar, dan mengurai data dengan template menggunakan SDK. Ini juga menyediakan SDK .NET, Java, PHP, Ruby, dan Python sebagai anggota keluarga parser dokumen untuk Cloud API.

Anda dapat menginstal GroupDocs.Parser Cloud ke aplikasi Node.js Anda menggunakan perintah berikut di konsol:

npm install groupdocs-parser-cloud

Harap dapatkan ID dan Rahasia Klien Anda dari dasbor sebelum mengikuti langkah-langkah yang disebutkan. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:

# Impor Node.js SDK di aplikasi node Anda dari http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// dapatkan clientId dan clientSecret dari https://dashboard.groupdocs.cloud (diperlukan pendaftaran gratis).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Ekstrak Semua Teks dari PowerPoint PPT/PPTX di Node.js menggunakan REST API

Anda dapat mengekstrak teks dari Presentasi PowerPoint dengan mengikuti langkah-langkah sederhana yang disebutkan di bawah ini:

  • Unggah file PowerPoint ke Cloud
  • Ekstrak Teks dari presentasi PowerPoint menggunakan Node.js

Unggah File

Pertama, unggah dokumen PowerPoint ke Cloud menggunakan contoh kode yang diberikan di bawah ini:

// buka file di IOStream dari drive sistem Anda.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// membaca berkas
fs.readFile(resourcesFolder, (err, fileStream) => {
  // membangun FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // buat permintaan unggah file
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // unggah data
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Hasilnya, file PowerPoint yang diunggah akan tersedia di bagian file dasbor Anda di cloud.

Ekstrak Teks dari Presentasi PowerPoint menggunakan Node.js

Anda dapat dengan mudah mengekstrak semua teks dari file PowerPoint secara terprogram dengan mengikuti langkah-langkah berikut:

  • Pertama, buat instance dari ParseApi.
  • Kedua, buat instance FileInfo.
  • Kemudian, atur jalur ke file PowerPoint.
  • Buat instance dari TextOptions.
  • Kemudian, tetapkan FileInfo ke TextOptions.
  • Buat instance dari FormattedTextOptions.
  • Tetapkan mode FormattedTextOptions sebagai Teks Biasa
  • Selanjutnya, tetapkan nilai formattedTextOptions
  • Sekarang, buat instance dari TextRequest dengan TextOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.text() dengan TextRequest.

Contoh kode berikut menunjukkan cara mengekstrak semua teks dari file PowerPoint menggunakan REST API di Node.js:

// Cara Mengekstrak Semua Teks dari PowerPoint PPT/PPTX di Node.js menggunakan REST API
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Buat permintaan parse dokumen
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Menampilkan hasil
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Cara Mengekstrak Teks dari Presentasi PowerPoint menggunakan Node.js

Ekstrak Teks dari Presentasi PowerPoint menggunakan Node.js

Ekstrak Teks dari PowerPoint PPT menurut Rentang Nomor Halaman di Node.js

Anda dapat mengekstrak teks dari halaman tertentu dari file PDF secara terprogram dengan mengikuti langkah-langkah di bawah ini:

  • Pertama, Buat instance dari ParseApi.
  • Selanjutnya, buat instance FileInfo.
  • Kemudian, atur path ke file PowerPoint PPTX.
  • Buat instance dari TextOptions.
  • Kemudian, tetapkan FileInfo ke TextOptions.
  • Tetapkan nilai startPageNumber dan countPagesToExtract
  • Buat instance dari FormattedTextOptions.
  • Tetapkan mode FormattedTextOptions sebagai Teks Biasa
  • Selanjutnya, tetapkan nilai formattedTextOptions.
  • Tetapkan nomor halaman awal dan jumlah total halaman yang akan diekstraksi.
  • Sekarang, buat instance dari TextRequest dengan TextOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.text() dengan TextRequest.

Contoh kode berikut menunjukkan cara mengekstrak teks tertentu dari file PowerPoint PPTX berdasarkan nomor halaman di Node.js menggunakan REST API:

// Cara Mengekstrak Teks dari PowerPoint PPT dengan Rentang Nomor Halaman di Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Buat permintaan parse dokumen
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Menampilkan hasil
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Cara Mengekstrak Teks dari PowerPoint PPT dengan Rentang Nomor Halaman di Node.js

Ekstrak Teks dari PowerPoint PPT dengan Rentang Nomor Halaman di Node.js

Coba Daring

Silakan coba [alat Parsing PowerPoint online gratis] berikut 17, yang dikembangkan menggunakan API di atas.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengurai dan mengekstrak teks dari PowerPoint PPT di Nodejs. Kamu sudah melihat:

  • cara mengekstrak teks dari slide tertentu di Node.js menggunakan REST API;
  • cara mengekstrak teks dari semua slide Presentasi PowerPoint di Node.js;
  • mengunggah file PowerPoint secara terprogram ke cloud;

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Berikan pertanyaan

Jika Anda memiliki pertanyaan atau kebingungan tentang Online Text Extractor, informasikan kepada kami melalui forum kami.

FAQ

Bagaimana cara mengekstrak teks dari PowerPoint di Node.js?

Silakan ikuti [tautan ini](https://blog.groupdocs.cloud/id/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) untuk mempelajari cuplikan kode Node.js tentang cara mengekstrak teks dari file PPT di Node.js.

Bagaimana cara mengekstrak teks dari dokumen PPT online menggunakan REST API?

Pertama, buat instance ParseApi, tetapkan nilai TextOptions, dan sekarang panggil [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) dengan TextRequest untuk mengekstrak teks yang dipilih dari file PPT secara online.

Bagaimana cara menginstal pustaka unduhan gratis ekstraktor teks PPT?

Anda dapat menginstal ekstraktor teks PPT library Node.js untuk mengekstrak teks dari file PPT secara terprogram.

Bagaimana cara mengekstrak teks dari PPT offline di Windows?

Kunjungi tautan ini untuk mengunduh perangkat lunak ekstraktor teks untuk Windows. Alat ekstraktor teks ini akan mengekstrak teks di windows secara instan, dengan satu klik.

Lihat juga