Витягування тексту з презентації PowerPoint за допомогою API Node.js - Витягувач тексту PowerPoint

Якщо вам потрібно витягнути текст з презентацій Microsoft PowerPoint для автоматизації, архівування або індексації пошуку, Cloud SDK GroupDocs.Parser для Node.js надає хмарне рішення, яке є швидким, гнучким та легким для інтеграції. За допомогою всього кількох рядків коду ви можете витягти простий або структурований текст з .ppt та .pptx файлів без залежності від Microsoft Office.

API для вилучення тексту з PowerPoint

GroupDocs.Parser Cloud SDK for Node.js є високорівневим SDK, побудованим на потужному REST API, який дозволяє вам витягувати:

  • Текст слайду (на слайд або всю презентацію).
  • Структурований контент з таблиць.
  • Metadata.
  • Вбудовані файли або зображення.

Воно підтримує великий вибір форматів, включаючи PDF, Word, Excel, PowerPoint, MSG, ZIP та інші.

Передумови

  1. Зареєструйтесь на GroupDocs.Cloud Dashboard.
  2. Отримайте ваш Client ID та Client Secret.
  3. Встановіть SDK:
npm install groupdocs-parser-cloud

Відвідайте наступне посилання, щоб дізнатися більше про те, як отримати ваш Client ID та Client Secret для автентифікації.

Як витягти текст з PowerPoint за допомогою Node.js

Цей розділ надає деталі про те, як ми можемо програмно витягувати текст з презентації PowerPoint, використовуючи SDK Node.js.

Крок 1: Ініціалізувати конфігурацію:

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Крок 2: Налаштування інформації про файл та параметри: Ініціалізуйте об’єкт класу TextRequest і передайте екземпляр класу TextOptions.

const fileInfo = new FileInfo();
// path to PowerPoint presentation
fileInfo.filePath = "input.pptx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

Крок 3: Витягти текст з PowerPoint: Викликайте text метод, і він поверне чистий текст з презентації PowerPoint.

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});
// Для отримання додаткових прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// Введіть шлях до PowerPoint
fileInfo.filePath = "input.pptx";

// вкажіть об'єкт TextOptions
const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});

Ви можете побачити вихідні дані з наведеної вище вибірки коду на зображенні нижче:

extract powerpoint PowerPoint presentation text

Extract Text from PowerPoint via cURL

Якщо ви надаєте перевагу командним операціям або хочете інтегруватися в сценарій? Ви можете витягнути текст з документа Word, використовуючи cURL та GroupDocs.Parser REST API.

Крок 1 – Згенерувати токен доступу:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витягти текст за допомогою API запиту:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d 
    "{  
        \"FileInfo\": 
        {
            \"FilePath\": \"input.pptx\",
            \"StorageName\": \"internal\"
        }
    }"
  • Замініть на той, який ви створили.

Переваги використання cURL з API GroupDocs.Parser

  • ✅ Немає встановлення SDK.
  • ✅ Підходить для bash-скриптів або cron-завдань.
  • ✅ Працює в середовищах Linux, macOS та Windows.
  • ✅ Легкий і швидкий.

Безкоштовний Extractor тексту PowerPoint

Використовуйте наш Безкоштовний онлайн-екстрактор тексту PowerPoint, підтримуваний GroupDocs.Parser Cloud, якщо ви віддаєте перевагу варіанту без коду.

Онлайн витягувач тексту PowerPoint

Висновок

Використовуючи GroupDocs.Parser Cloud SDK для Node.js, ви можете ефективно витягувати текст з презентацій PowerPoint з мінімумом коду. SDK і REST API підтримують сучасні робочі процеси розробки — незалежно від того, чи віддаєте ви перевагу програмним SDK або легким скриптам cURL.

📚 Додаткові ресурси

Поширені запитання – FAQs

  1. Чи можу я витягти текст зі слайдів з форматуванням?
  • Так. API повертає структурований текст, що включає порядкок слайдів.
  1. Is PowerPoint required to extract content?
  • Ні. API працює в хмарі і не залежить від Microsoft Office.
  1. Яка модель ціноутворення?
  • Ми пропонуємо єдину модель ціноутворення “плати за використання”. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.
  1. Чи є безкоштовний пробний період?
  • Так. Ви можете здійснити до 150 викликів API на місяць з безкоштовним обліковим записом. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.

Рекомендувані статті