PPTX ใน Node.js

แยกข้อความจาก PowerPoint PPT/PPTX ใน Node.js

ในบางสถานการณ์ ข้อความที่จัดรูปแบบจะถูกแยกออกจากเอกสารเพื่อการประมวลผลเพิ่มเติม เช่น ในการวิเคราะห์ข้อความ การจัดประเภท เป็นต้น ในรูปแบบไฟล์อื่นๆ เช่น PDF และ Word นั้น PowerPoint งานนำเสนอยังใช้ในการแยกข้อความอีกด้วย ดังนั้น บทความนี้จะสาธิตวิธีแยกข้อความจาก PowerPoint PPT/PPTX ใน Node.js คุณสามารถแยกวิเคราะห์งานนำเสนอ PowerPoint PPT/PPTX และข้อความจากสไลด์ที่ต้องการได้อย่างง่ายดาย หรือแยกข้อความทั้งหมดโดยทางโปรแกรมบนคลาวด์

หัวข้อต่อไปนี้จะกล่าวถึงในบทความนี้:

Node.js Library เพื่อแยกข้อความจาก PowerPoint PPT

สำหรับการแยกวิเคราะห์เอกสาร PowerPoint ฉันจะใช้ Node.js SDK ของ GroupDocs.Parser Cloud API ช่วยให้คุณสามารถแยกวิเคราะห์ข้อมูลจาก รูปแบบเอกสาร ที่รองรับมากกว่า 50 ประเภท นอกจากนี้ยังรองรับการแยกวิเคราะห์คอนเทนเนอร์ เช่น ไฟล์เก็บถาวร ZIP ไฟล์ข้อมูลอีเมล OST e-books, มาร์กอัป พอร์ตโฟลิโอ PowerPoint และ PDF ในแอปพลิเคชัน Node.js ของคุณ คุณสามารถแยกข้อความ รูปภาพ และแยกวิเคราะห์ข้อมูลตามเทมเพลตโดยใช้ SDK นอกจากนี้ยังมี .NET, Java, PHP, Ruby และ Python SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API

คุณสามารถติดตั้ง GroupDocs.Parser Cloud ลงในแอปพลิเคชัน Node.js โดยใช้คำสั่งต่อไปนี้ในคอนโซล:

npm install groupdocs-parser-cloud

โปรด รับรหัสลูกค้าและข้อมูลลับจากแดชบอร์ด ก่อนทำตามขั้นตอนดังกล่าว เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

# นำเข้า Node.js SDK ในแอปพลิเคชันโหนดของคุณจาก http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// รับ clientId และ clientSecret จาก https://dashboard.groupdocs.cloud (ต้องลงทะเบียนฟรี)
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

แยกข้อความทั้งหมดจาก PowerPoint PPT/PPTX ใน Node.js โดยใช้ REST API

คุณสามารถแยกข้อความจากงานนำเสนอ PowerPoint โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:

อัปโหลดไฟล์

ขั้นแรก อัปโหลดเอกสาร PowerPoint ไปยัง Cloud โดยใช้ตัวอย่างโค้ดด้านล่าง:

// เปิดไฟล์ใน IOStream จากไดรฟ์ระบบของคุณ
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// อ่านไฟล์
fs.readFile(resourcesFolder, (err, fileStream) => {
  // สร้าง FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // สร้างคำขออัปโหลดไฟล์
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // อัพโหลดไฟล์
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

ด้วยเหตุนี้ ไฟล์ PowerPoint ที่อัปโหลดจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

แยกข้อความจากงานนำเสนอ PowerPoint โดยใช้ Node.js

คุณสามารถแยกข้อความทั้งหมดจากไฟล์ PowerPoint โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  • ประการแรก สร้างอินสแตนซ์ของ ParseApi
  • ประการที่สอง สร้างอินสแตนซ์ของ FileInfo
  • จากนั้นกำหนดเส้นทางไปยังไฟล์ PowerPoint
  • สร้างตัวอย่างของ TextOptions
  • จากนั้นกำหนด FileInfo ให้กับ TextOptions
  • สร้างอินสแตนซ์ของ FormattedTextOptions
  • ตั้งค่าโหมด formattedTextOptions เป็น PlainText
  • ถัดไป กำหนดค่า formattedTextOptions
  • ตอนนี้ สร้างตัวอย่างของ TextRequest ด้วย TextOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.text() ด้วย TextRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกข้อความทั้งหมดจากไฟล์ PowerPoint โดยใช้ REST API ใน Node.js:

// วิธีแยกข้อความทั้งหมดจาก PowerPoint PPT/PPTX ใน Node.js โดยใช้ REST API
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // สร้างคำขอแยกวิเคราะห์เอกสาร
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // แสดงผล
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
วิธีแยกข้อความจากงานนำเสนอ PowerPoint โดยใช้ Node.js

แยกข้อความจากงานนำเสนอ PowerPoint โดยใช้ Node.js

แยกข้อความจาก PowerPoint PPT ตามช่วงหมายเลขหน้าใน Node.js

คุณสามารถแยกข้อความจากหน้าเฉพาะของไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  • ประการแรก สร้างอินสแตนซ์ของ ParseApi
  • จากนั้น สร้างอินสแตนซ์ของ FileInfo
  • จากนั้นกำหนดเส้นทางไปยังไฟล์ PowerPoint PPTX
  • สร้างตัวอย่างของ TextOptions
  • จากนั้นกำหนด FileInfo ให้กับ TextOptions
  • ตั้งค่า startPageNumber และ countPagesToExtract
  • สร้างอินสแตนซ์ของ FormattedTextOptions
  • ตั้งค่าโหมด formattedTextOptions เป็น PlainText
  • ถัดไป กำหนดค่า formattedTextOptions.
  • ตั้งค่าหมายเลขหน้าเริ่มต้นและจำนวนหน้าทั้งหมดที่จะแยก
  • ตอนนี้ สร้างตัวอย่างของ TextRequest ด้วย TextOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.text() ด้วย TextRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกข้อความเฉพาะจากไฟล์ PowerPoint PPTX ตามหมายเลขหน้าใน Node.js โดยใช้ REST API:

// วิธีแยกข้อความจาก PowerPoint PPT ตามช่วงหมายเลขหน้าใน Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // สร้างคำขอแยกวิเคราะห์เอกสาร
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // แสดงผล
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
วิธีแยกข้อความจาก PowerPoint PPT ตามช่วงหมายเลขหน้าใน Node.js

แยกข้อความจาก PowerPoint PPT ตามช่วงหมายเลขหน้าใน Node.js

ลองออนไลน์

โปรดลองใช้ [เครื่องมือแยกวิเคราะห์ PowerPoint ออนไลน์ฟรี] ต่อไปนี้ 17 ซึ่งพัฒนาโดยใช้ API ด้านบน

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีการแยกวิเคราะห์และแยกข้อความจาก PowerPoint PPT ใน Nodejs คุณเคยเห็น:

  • วิธีแยกข้อความจากสไลด์เฉพาะใน Node.js โดยใช้ REST API
  • วิธีแยกข้อความจากสไลด์ทั้งหมดของงานนำเสนอ PowerPoint ใน Node.js
  • อัปโหลดไฟล์ PowerPoint ไปยังคลาวด์โดยทางโปรแกรม

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ นอกจากนี้ เรายังมีส่วน การอ้างอิง API ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

ถามคำถาม

ในกรณีที่คุณมีข้อสงสัยหรือสับสนเกี่ยวกับ Online Text Extractor โปรดแจ้งให้เราทราบทาง ฟอรัม

คำถามที่พบบ่อย

ฉันจะแยกข้อความจาก PowerPoint ใน Node.js ได้อย่างไร

โปรดติดตาม [ลิงก์นี้](https://blog.groupdocs.cloud/th/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- ใน Node.js-using-REST-API) เพื่อเรียนรู้ข้อมูลโค้ด Node.js สำหรับวิธีแยกข้อความจากไฟล์ PPT ใน Node.js

วิธีแยกข้อความจากเอกสาร PPT ออนไลน์โดยใช้ REST API

ขั้นแรก สร้างอินสแตนซ์ของ ParseApi ตั้งค่าของ TextOptions และเรียก [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) ด้วย TextRequest เพื่อแยกข้อความที่เลือกจากไฟล์ PPT ออนไลน์

จะติดตั้งไลบรารีดาวน์โหลดฟรีตัวแยกข้อความ PPT ได้อย่างไร

คุณสามารถติดตั้งตัวแยกข้อความ PPT ไลบรารี Node.js เพื่อแยกข้อความจากไฟล์ PPT โดยทางโปรแกรม

ฉันจะแยกข้อความจาก PPT ออฟไลน์ใน Windows ได้อย่างไร

โปรดไปที่ ลิงก์นี้ เพื่อดาวน์โหลดซอฟต์แวร์แยกข้อความสำหรับ Windows เครื่องมือแยกข้อความนี้จะแยกข้อความในหน้าต่างทันทีด้วยการคลิกเพียงครั้งเดียว

ดูสิ่งนี้ด้วย