PPTX у Node.js

Витягніть текст із PowerPoint PPT/PPTX у Node.js

У деяких сценаріях відформатований текст витягується з документів для подальшої обробки, як-от аналіз тексту, класифікація тощо. Серед інших форматів файлів, таких як PDF і Word, PowerPoint Presentation також використовується для вилучення тексту. Тому ця стаття демонструє, як витягти текст із PowerPoint PPT/PPTX у Node.js. Ви можете легко аналізувати свої презентації PowerPoint PPT/PPTX і текст із певного слайда або витягувати весь текст програмним шляхом у хмарі.

У цій статті будуть розглянуті такі теми:

Бібліотека Node.js для вилучення тексту з PowerPoint PPT

Для аналізу документів PowerPoint я буду використовувати Node.js SDK API GroupDocs.Parser Cloud. Він дозволяє аналізувати дані з понад 50 типів підтримуваних форматів документів. Він також підтримує розбір таких контейнерів, як архіви ZIP, OST файли поштових даних, електронні книги, розмітки, портфоліо PowerPoint і PDF у ваших програмах Node.js. Ви можете видобувати текст, зображення та аналізувати дані за шаблоном за допомогою SDK. Він також надає пакети SDK .NET, Java, PHP, Ruby та Python як члени сімейства аналізаторів документів для Cloud API.

Ви можете встановити GroupDocs.Parser Cloud у свою програму Node.js за допомогою такої команди в консолі:

npm install groupdocs-parser-cloud

Будь ласка, отримайте свій ідентифікатор клієнта та секрет на інформаційній панелі, перш ніж виконувати вказані дії. Отримавши ідентифікатор і секрет, додайте код, як показано нижче:

# Імпортуйте Node.js SDK у свою програму вузла з http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// отримати clientId і clientSecret з https://dashboard.groupdocs.cloud (потрібна безкоштовна реєстрація).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Видобудьте весь текст із PowerPoint PPT/PPTX у Node.js за допомогою REST API

Ви можете отримати текст із презентацій PowerPoint, виконавши прості кроки, наведені нижче:

Завантажте файл

По-перше, завантажте документ PowerPoint у хмару за допомогою наведеного нижче прикладу коду:

// відкрити файл у IOStream із системного диска.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// читати файл
fs.readFile(resourcesFolder, (err, fileStream) => {
  // побудувати FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // створити запит на завантаження файлу
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // завантажити файл
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

У результаті завантажений файл PowerPoint буде доступний у розділі файлів вашої інформаційної панелі в хмарі.

Витягніть текст із презентації PowerPoint за допомогою Node.js

Ви можете легко витягти весь текст із файлів PowerPoint програмним шляхом, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр ParseApi.
  • По-друге, створіть екземпляр FileInfo.
  • Потім встановіть шлях до файлу PowerPoint.
  • Створіть екземпляр TextOptions.
  • Потім призначте FileInfo TextOptions.
  • Створіть екземпляр FormattedTextOptions.
  • Установіть режим formattedTextOptions як PlainText
  • Далі призначте значення formattedTextOptions
  • Тепер створіть екземпляр TextRequest за допомогою TextOptions.
  • Нарешті, отримуйте результати, викликавши метод ParseApi.text() за допомогою TextRequest.

У наведеному нижче прикладі коду показано, як отримати весь текст із файлу PowerPoint за допомогою REST API у Node.js:

// Як витягнути весь текст із PowerPoint PPT/PPTX у Node.js за допомогою REST API
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Створити запит на аналіз документа
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Показати результати
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Як витягти текст із презентації PowerPoint за допомогою Node.js

Витягніть текст із презентації PowerPoint за допомогою Node.js

Вилучення тексту з PowerPoint PPT за діапазоном номерів сторінок у Node.js

Ви можете отримати текст із певних сторінок PDF-файлу програмним шляхом, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр ParseApi.
  • Далі створіть екземпляр FileInfo.
  • Потім встановіть шлях до файлу PowerPoint PPTX.
  • Створіть екземпляр TextOptions.
  • Потім призначте FileInfo TextOptions.
  • Установіть значення startPageNumber і countPagesToExtract
  • Створіть екземпляр FormattedTextOptions.
  • Установіть режим formattedTextOptions як PlainText
  • Далі призначте значення formattedTextOptions.
  • Встановіть номер початкової сторінки та загальну кількість сторінок для вилучення.
  • Тепер створіть екземпляр TextRequest за допомогою TextOptions.
  • Нарешті, отримуйте результати, викликаючи метод ParseApi.text() за допомогою TextRequest.

У наведеному нижче прикладі коду показано, як витягти певний текст із файлу PowerPoint PPTX за номерами сторінок у Node.js за допомогою REST API:

// Як витягти текст із PowerPoint PPT за діапазоном номерів сторінок у Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Створити запит на аналіз документа
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Показати результати
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Як витягти текст із PowerPoint PPT за діапазоном номерів сторінок у Node.js

Витягніть текст із PowerPoint PPT за діапазоном номерів сторінок у Node.js

Спробуйте онлайн

Будь ласка, спробуйте наступний безкоштовний онлайн-інструмент аналізу PowerPoint, який розроблено з використанням вищезгаданого API.

Висновок

У цій статті ви дізналися, як аналізувати та видобувати текст із PowerPoint PPT у Nodejs. Ти бачив:

  • як отримати текст із певних слайдів у Node.js за допомогою REST API;
  • як витягнути текст з усіх слайдів презентації PowerPoint у Node.js;
  • програмно завантажити файл PowerPoint у хмару;

Крім того, ви можете дізнатися більше про GroupDocs.Parser Cloud API за допомогою документації. Ми також надаємо розділ API Reference, який дозволяє візуалізувати наші API та взаємодіяти з ними безпосередньо через браузер. У разі будь-яких неясностей зв’яжіться з нами на форумі.

Задайте питання

Якщо у вас виникли запитання чи непорозуміння щодо онлайн-екстрактора тексту, повідомте нас через наш форум.

поширені запитання

Як отримати текст із PowerPoint у Node.js?

Перейдіть за [цим посиланням](https://blog.groupdocs.cloud/uk/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API), щоб дізнатися фрагмент коду Node.js, щоб витягти текст із файлів PPT у Node.js.

Як отримати текст із документів PPT онлайн за допомогою REST API?

По-перше, створіть екземпляр ParseApi, установіть значення TextOptions, а тепер викличте [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) із TextRequest для вилучення виділеного тексту з файлів PPT в Інтернеті.

Як встановити безкоштовну бібліотеку для завантаження PPT-екстрактора тексту?

Ви можете встановити екстрактор тексту PPT бібліотека Node.js, щоб програмно видобувати текст із файлів PPT.

Як отримати текст із PPT в режимі офлайн у Windows?

Перейдіть це посилання, щоб завантажити програмне забезпечення для вилучення тексту для Windows. Цей інструмент вилучення тексту миттєво витягне текст у вікнах одним клацанням миші.

Дивись також