Trích xuất văn bản từ bản trình bày PowerPoint bằng cách sử dụng API Node.js - Trình trích xuất văn bản PowerPoint

Nếu bạn cần trích xuất văn bản từ các bài thuyết trình Microsoft PowerPoint cho tự động hóa, lưu trữ hoặc lập chỉ mục tìm kiếm, GroupDocs.Parser Cloud SDK cho Node.js cung cấp một giải pháp dựa trên đám mây nhanh chóng, linh hoạt và dễ tích hợp. Chỉ với vài dòng mã, bạn có thể trích xuất văn bản đơn giản hoặc có cấu trúc từ .ppt.pptx mà không cần dựa vào Microsoft Office.

API Trích xuất Văn bản PowerPoint

SDK GroupDocs.Parser Cloud cho Node.js là một SDK cấp cao được xây dựng trên một REST API mạnh mẽ cho phép bạn trích xuất:

  • Slide text (per slide or entire presentation).
  • Nội dung có cấu trúc từ bảng.
  • Metadata.
  • Tệp hoặc hình ảnh nhúng.

Nó hỗ trợ nhiều định dạng khác nhau, bao gồm PDF, Word, Excel, PowerPoint, MSG, ZIP, và nhiều hơn nữa.

Điều kiện tiên quyết

  1. Đăng ký tại GroupDocs.Cloud Dashboard.
  2. Lấy ID khách hàng và Khóa bí mật khách hàng.
  3. Cài đặt SDK:
npm install groupdocs-parser-cloud

Visit the following link to learn more about, cách để lấy Client ID và Client Secret của bạn cho xác thực .

Cách trích xuất văn bản từ PowerPoint bằng Node.js

Phần này cung cấp chi tiết về cách chúng ta có thể trích xuất văn bản từ một bài thuyết trình PowerPoint bằng cách lập trình sử dụng SDK Node.js.

Bước 1: Khởi tạo Cấu hình:

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Bước 2: Thiết lập thông tin tệp và tùy chọn: Khởi tạo một đối tượng của lớp TextRequest và truyền vào instance của lớp TextOptions.

const fileInfo = new FileInfo();
// path to PowerPoint presentation
fileInfo.filePath = "input.pptx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

Bước 3: Trích xuất văn bản từ PowerPoint: Gọi phương pháp text, và nó sẽ trả về văn bản thuần từ bài thuyết trình PowerPoint.

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});
// Để biết thêm ví dụ, vui lòng truy cập https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// Nhập đường dẫn PowerPoint
fileInfo.filePath = "input.pptx";

// chỉ định đối tượng TextOptions
const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.text(request).then(response => {
    console.log("Extracted text content:");
    console.log(response.text);
}).catch(err => {
    console.error("Error extracting text:", err);
});

Bạn có thể xem đầu ra của mẫu mã ở trên trong hình ảnh dưới đây:

extract powerpoint PowerPoint presentation text

Trích xuất văn bản từ PowerPoint qua cURL

Nếu bạn thích các thao tác trên dòng lệnh hoặc muốn tích hợp vào một tập lệnh? Bạn có thể trích xuất văn bản từ tài liệu Word bằng cách sử dụng cURL và GroupDocs.Parser REST API.

Bước 1 – Tạo mã thông báo truy cập:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Bước 2 – Trích xuất văn bản qua cuộc gọi API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d 
    "{  
        \"FileInfo\": 
        {
            \"FilePath\": \"input.pptx\",
            \"StorageName\": \"internal\"
        }
    }"
  • Thay thế bằng cái mà bạn đã tạo.

Lợi ích của việc sử dụng cURL với GroupDocs.Parser API

  • ✅ Không cần cài đặt SDK.
  • ✅ Phù hợp cho các tập lệnh bash hoặc công việc cron.
  • ✅ Hoạt động trên môi trường Linux, macOS và Windows.
  • ✅ Nhẹ và nhanh.

Free PowerPoint Text Extractor

Sử dụng Trình trích xuất văn bản PowerPoint trực tuyến miễn phí của chúng tôi được hỗ trợ bởi GroupDocs.Parser Cloud nếu bạn muốn một tùy chọn không cần mã.

Trình trích xuất văn bản PowerPoint trực tuyến

Kết luận

Sử dụng GroupDocs.Parser Cloud SDK cho Node.js, bạn có thể trích xuất văn bản từ các bài thuyết trình PowerPoint một cách hiệu quả với mã tối thiểu. SDK và REST API hỗ trợ các quy trình phát triển hiện đại — cho dù bạn thích SDK lập trình hay các tập lệnh cURL nhẹ.

📚 Tài nguyên bổ sung

Câu hỏi thường gặp – FAQs

  1. Có thể tôi trích xuất văn bản từ các slide với định dạng không?
  • Vâng. API trả về văn bản có cấu trúc bao gồm thứ tự slide.
  1. Có cần PowerPoint để trích xuất nội dung không?
  • Không. API chạy trên đám mây và không phụ thuộc vào Microsoft Office.
  1. Mô hình định giá là gì?
  • Chúng tôi cung cấp một mô hình giá thanh toán theo từng giai đoạn. Để biết thêm thông tin, vui lòng truy cập pricing guide.
  1. Có một bản dùng thử miễn phí không?
  • Có. Bạn có thể thực hiện lên tới 150 cuộc gọi API/tháng với một tài khoản dùng thử miễn phí. Để biết thêm chi tiết, vui lòng truy cập pricing guide.

Bài viết được đề xuất