Node.js의 PPTX

Node.js의 PowerPoint PPT/PPTX에서 텍스트 추출

특정 시나리오에서는 텍스트 분석, 분류 등과 같은 추가 처리를 위해 문서에서 형식이 지정된 텍스트가 추출됩니다. PDF 및 Word와 같은 다른 파일 형식 중에서 PowerPoint Presentation은 텍스트 추출에도 사용됩니다. 따라서 이 문서에서는 Node.js에서 PowerPoint PPT/PPTX의 텍스트를 추출하는 방법을 보여줍니다. 특정 슬라이드에서 PowerPoint PPT/PPTX 프레젠테이션 및 텍스트를 쉽게 구문 분석하거나 클라우드에서 프로그래밍 방식으로 모든 텍스트를 추출할 수 있습니다.

이 기사에서는 다음 주제에 대해 설명합니다.

PowerPoint PPT에서 텍스트를 추출하는 Node.js 라이브러리

PowerPoint 문서를 파싱하기 위해 GroupDocs.Parser Cloud API의 Node.js SDK를 사용할 것입니다. 지원되는 문서 형식의 50개 이상의 유형에서 데이터를 구문 분석할 수 있습니다. 또한 Node.js 애플리케이션에서 ZIP 아카이브, OST 메일 데이터 파일, 전자책, 마크업, PowerPoint 및 PDF 포트폴리오와 같은 컨테이너의 구문 분석을 지원합니다. SDK를 사용하여 템플릿으로 텍스트, 이미지, 파싱 데이터를 추출할 수 있습니다. 또한 Cloud API용 문서 파서 계열 구성원으로 .NET, Java, PHP, Ruby 및 Python SDK를 제공합니다.

콘솔에서 다음 명령을 사용하여 GroupDocs.Parser Cloud를 Node.js 애플리케이션에 설치할 수 있습니다.

npm install groupdocs-parser-cloud

언급된 단계를 따르기 전에 대시보드에서 클라이언트 ID와 암호를 가져오십시오. ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.

# http://api.groupdocs.cloud에서 노드 애플리케이션의 Node.js SDK 가져오기
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud에서 clientId 및 clientSecret을 가져옵니다(무료 등록 필요).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

REST API를 사용하여 Node.js의 PowerPoint PPT/PPTX에서 모든 텍스트 추출

아래에 언급된 간단한 단계에 따라 PowerPoint 프레젠테이션에서 텍스트를 추출할 수 있습니다.

파일 업로드

먼저 아래 제공된 코드 예제를 사용하여 PowerPoint 문서를 클라우드에 업로드합니다.

// 시스템 드라이브에서 IOStream의 파일을 엽니다.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// 파일 읽기
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi 구성
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // 업로드 파일 요청 생성
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // 파일 업로드
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

결과적으로 업로드된 PowerPoint 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.

Node.js를 사용하여 PowerPoint 프레젠테이션에서 텍스트 추출

아래 제공된 단계에 따라 프로그래밍 방식으로 PowerPoint 파일에서 모든 텍스트를 쉽게 추출할 수 있습니다.

  • 먼저 ParseApi의 인스턴스를 생성합니다.
  • 둘째, FileInfo의 인스턴스를 만듭니다.
  • 그런 다음 PowerPoint 파일의 경로를 설정합니다.
  • TextOptions의 인스턴스를 만듭니다.
  • 그런 다음 TextOptions에 FileInfo를 할당합니다.
  • FormattedTextOptions의 인스턴스를 만듭니다.
  • formattedTextOptions 모드를 일반 텍스트로 설정
  • 다음으로 formattedTextOptions 값을 할당합니다.
  • 이제 TextOptions를 사용하여 TextRequest의 인스턴스를 만듭니다.
  • 마지막으로 TextRequest와 함께 ParseApi.text() 메서드를 호출하여 결과를 얻습니다.

다음 코드 샘플은 Node.js에서 REST API를 사용하여 PowerPoint 파일에서 모든 텍스트를 추출하는 방법을 보여줍니다.

// REST API를 사용하여 Node.js의 PowerPoint PPT/PPTX에서 모든 텍스트를 추출하는 방법
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // 파싱 문서 요청 생성
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // 결과 표시
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Node.js를 사용하여 PowerPoint 프레젠테이션에서 텍스트를 추출하는 방법

Node.js를 사용하여 PowerPoint 프레젠테이션에서 텍스트 추출

Node.js의 페이지 번호 범위로 PowerPoint PPT에서 텍스트 추출

아래 단계에 따라 프로그래밍 방식으로 PDF 파일의 특정 페이지에서 텍스트를 추출할 수 있습니다.

  • 먼저 ParseApi의 인스턴스를 생성합니다.
  • 다음으로 FileInfo의 인스턴스를 만듭니다.
  • 그런 다음 PowerPoint PPTX 파일의 경로를 설정합니다.
  • TextOptions의 인스턴스를 만듭니다.
  • 그런 다음 TextOptions에 FileInfo를 할당합니다.
  • startPageNumber 및 countPagesToExtract 값 설정
  • FormattedTextOptions의 인스턴스를 만듭니다.
  • formattedTextOptions 모드를 일반 텍스트로 설정
  • 다음으로 formattedTextOptions 값을 할당합니다..
  • 추출할 시작 페이지 번호와 총 페이지 수를 설정합니다.
  • 이제 TextOptions를 사용하여 TextRequest의 인스턴스를 만듭니다.
  • 마지막으로 TextRequest와 함께 ParseApi.text() 메서드를 호출하여 결과를 얻습니다.

다음 코드 샘플은 REST API를 사용하여 Node.js의 페이지 번호별로 PowerPoint PPTX 파일에서 특정 텍스트를 추출하는 방법을 보여줍니다.

// Node.js의 페이지 번호 범위로 PowerPoint PPT에서 텍스트를 추출하는 방법
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // 파싱 문서 요청 생성
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // 결과 표시
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Node.js의 페이지 번호 범위로 PowerPoint PPT에서 텍스트를 추출하는 방법

Node.js의 페이지 번호 범위로 PowerPoint PPT에서 텍스트 추출

온라인 시도

위의 API를 사용하여 개발된 다음 무료 온라인 PowerPoint 구문 분석 도구를 사용해 보십시오.

결론

이 기사에서는 Nodejs의 PowerPoint PPT에서 텍스트를 구문 분석하고 추출하는 방법을 배웠습니다. 당신은 보았다:

  • REST API를 사용하여 Node.js의 특정 슬라이드에서 텍스트를 추출하는 방법
  • Node.js에서 PowerPoint 프레젠테이션의 모든 슬라이드에서 텍스트를 추출하는 방법
  • 프로그래밍 방식으로 PowerPoint 파일을 클라우드에 업로드합니다.

그 외에도 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.

질문하기

온라인 텍스트 추출기에 대한 질문이나 혼동이 있는 경우 포럼을 통해 알려주십시오.

FAQ

Node.js의 PowerPoint에서 텍스트를 어떻게 추출합니까?

[이 링크](https://blog.groupdocs.cloud/ko/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API)를 사용하여 Node.js의 PPT 파일에서 텍스트를 추출하는 방법에 대한 Node.js 코드 스니펫을 학습합니다.

REST API를 사용하여 온라인으로 PPT 문서에서 텍스트를 추출하는 방법은 무엇입니까?

먼저 ParseApi의 인스턴스를 생성하고 TextOptions의 값을 설정한 다음 이제 [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) 메서드를 TextRequest와 함께 사용하여 온라인으로 PPT 파일에서 선택한 텍스트를 추출합니다.

PPT 텍스트 추출기 무료 다운로드 라이브러리를 설치하는 방법은 무엇입니까?

PPT 텍스트 추출기Node.js 라이브러리를 설치하여 프로그래밍 방식으로 PPT 파일에서 텍스트를 추출할 수 있습니다.

Windows에서 오프라인으로 PPT의 텍스트를 어떻게 추출합니까?

Windows용 텍스트 추출기 소프트웨어를 다운로드하려면 이 링크를 방문하세요. 이 텍스트 추출기 도구는 한 번의 클릭으로 즉시 창에서 텍스트를 추출합니다.

또한보십시오