Cách trích xuất các trang từ tài liệu word trực tuyến bằng Node.js

Cách trích xuất các trang từ Word DOC/DOCX trực tuyến bằng Node.js

Bạn có thể cần trích xuất các trang tài liệu word thành nhiều tài liệu theo chương trình. Bằng cách chia nhỏ tài liệu từ, bạn có thể dễ dàng trích xuất trang từ tài liệu từ và chia sẻ thông tin hoặc dữ liệu cụ thể với các bên liên quan. Là nhà phát triển Node.js, bạn có thể trích xuất tài liệu từ thành các tệp riêng biệt trực tuyến trên đám mây. Trong bài viết này, bạn sẽ tìm hiểu cách trích xuất các trang từ Word DOC/DOCX trực tuyến bằng Node.js.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

Trình trích xuất trang từ API REST trực tuyến và SDK Node.js

Để trích xuất các trang từ tài liệu Word, tôi sẽ sử dụng API Node.js SDK của GroupDocs.Merger Cloud. Đó là thư viện tải xuống miễn phí trình trích xuất trang Word trực tuyến. Nó cho phép bạn tách, kết hợp, trích xuất, xóa và sắp xếp lại một trang hoặc một tập hợp các trang từ các định dạng tài liệu được hỗ trợ của Word, Excel, PowerPoint, Bản vẽ Visio, PDFHTML.

Bạn có thể cài đặt đám mây GroupDocs.Merger để trích xuất các trang Word từ ứng dụng Node.js của mình bằng cách sử dụng lệnh sau trong bảng điều khiển:

npm install groupdocs-merger-cloud

Vui lòng lấy Mã khách hàng và Bí mật của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

# Nhập SDK Node.js trong ứng dụng nút của bạn từ http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// lấy clientId và clientSecret từ https://dashboard.groupdocs.cloud (yêu cầu đăng ký miễn phí).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Trích xuất các trang từ Word sang tài liệu mới theo số trang chính xác

Bạn có thể xuất các trang cụ thể từ tệp Word theo chương trình trên đám mây bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Tải lên tệp Word

Đầu tiên, tải tệp Word lên đám mây bằng ví dụ mã được cung cấp bên dưới:

// mở tệp trong IOStream từ ổ đĩa hệ thống của bạn.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// Đọc tài liệu
fs.readFile(resourcesFolder, (err, fileStream) => {
  // xây dựng FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // tạo yêu cầu tệp tải lên
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // cập nhật dử liệu
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Do đó, tệp Word đã tải lên sẽ có sẵn trong phần tệp trên trang tổng quan của bạn trên đám mây.

Trích xuất các trang Word bằng API REST trong Node.js

Bạn có thể dễ dàng trích xuất các trang của tệp Word theo cách lập trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của PagesApi.
  • Tạo một phiên bản của ExtractOptions.
  • Tạo một phiên bản của FileInfo.
  • Sau đó, đặt đường dẫn đến tệp Word đầu vào.
  • Tiếp theo, đặt đường dẫn đến tệp Word được giải nén.
  • Đặt số trang cụ thể trong một mảng được phân tách bằng dấu phẩy để giải nén tệp Word.
  • Tạo ExtractRequest với ExtractOptions.
  • Cuối cùng, gọi phương thức pagesApi.extract() với ExtractRequest để lấy kết quả.

Đoạn mã sau cho biết cách trích xuất các trang Word thành các tệp riêng biệt bằng API REST trong Node.js:

// Cách trích xuất các trang từ Word sang tài liệu mới theo số trang chính xác
const extractwordpages = async() => {

  // khởi tạo api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // xác định các tùy chọn trích xuất
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // tạo yêu cầu trích xuất
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // trích xuất các trang từ tệp docx
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

Tải xuống các tệp được giải nén

Mẫu mã trên sẽ lưu các tệp được phân tách trên đám mây. Bạn có thể tải chúng xuống bằng cách sử dụng mẫu mã sau:

// xây dựng FileApi để tải xuống tệp đã hợp nhất
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// tạo yêu cầu tệp donwload
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// tải xuống tệp và loại phản hồi Luồng
fileApi.downloadFile(request)
    .then(function (response) {
        // lưu tập tin trong thư mục hệ thống của bạn
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Trích xuất các trang tài liệu Word theo phạm vi trang bằng API REST trong Node.js

Bạn có thể trích xuất và lưu các trang từ Word một cách riêng biệt bằng cách cung cấp một loạt số trang theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của PagesApi.
  • Tạo một phiên bản của ExtractOptions.
  • Tạo một phiên bản của FileInfo.
  • Sau đó, đặt đường dẫn đến tệp Word đầu vào.
  • Tiếp theo, đặt đường dẫn đến tệp Word được giải nén.
  • Đặt giá trị startPageNumber và endPageNumber.
  • Sau đó, đặt rangeMode là EvenPages hoặc OddPages
  • Tạo ExtractRequest với ExtractOptions.
  • Cuối cùng, gọi phương thức pagesApi.extract() với ExtractRequest để lấy kết quả.

Đoạn mã sau cho biết cách trích xuất các trang từ Word trực tuyến bằng phạm vi trang và chế độ trang trong Node.js:

// Cách trích xuất các trang tài liệu Word theo phạm vi trang bằng API REST trong Node.js
const extractpages = async() => {

  // khởi tạo api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // xác định các tùy chọn trích xuất
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // tạo yêu cầu trích xuất
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // trích xuất các trang tệp Word
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

Cách tương tự, bạn có thể trích xuất các trang lẻ từ tài liệu Word.

Thử trực tuyến

Làm cách nào để trích xuất các trang từ tài liệu Word trực tuyến? Vui lòng thử công cụ trích xuất Word trực tuyến miễn phí sau đây để trích xuất các trang từ Word trực tuyến miễn phí. Công cụ trực tuyến miễn phí trình trích xuất trang Word này được phát triển bằng cách sử dụng API ở trên.

Phần kết luận

Trong bài viết này, bạn đã học được:

  • cách trích xuất một số trang nhất định từ tài liệu Word trực tuyến bằng API REST;
  • cách trích xuất các trang từ tài liệu Word bằng bộ lọc chế độ phạm vi và phạm vi trang;
  • tải tệp Word lên đám mây để xuất các trang đã chọn từ Word trực tuyến;
  • tải xuống và lưu một số trang Word nhất định từ đám mây;
  • cách trích xuất các trang từ Word miễn phí;

Bây giờ, bạn đã biết cách trích xuất tất cả các trang từ tài liệu Word hoặc cách lưu một số trang nhất định của Word. API cũng cho phép bạn sắp xếp lại hoặc thay thế các trang tài liệu, thay đổi hướng trang, quản lý mật khẩu tài liệu và thực hiện các thao tác khác một cách dễ dàng đối với mọi định dạng tệp được hỗ trợ. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Merge Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt.

Đặt một câu hỏi

Bạn có thể đặt câu hỏi về trình trích xuất trang từ để xuất các trang đã chọn từ Word, thông qua Diễn đàn hỗ trợ miễn phí của chúng tôi

câu hỏi thường gặp

Làm cách nào để trích xuất nhiều trang từ Word thành một tệp?

Cài đặt Thư viện JS để tách tệp Word thành nhiều trang trực tuyến theo chương trình. Bạn có thể truy cập tài liệu để biết chi tiết đầy đủ về API.

Mất bao lâu để trích xuất các trang cụ thể từ Word?

Thư viện JavaScript HTML sang Word hoạt động rất nhanh và bạn có thể trích xuất các trang từ Word được bảo vệ một cách dễ dàng trong vài giây.

Xem thêm