So extrahieren Sie Seiten aus einer PDF-Datei mithilfe der Rest-API in Node.js

So extrahieren Sie Seiten aus PDF Dateien mithilfe der Rest-API in Node.js

Möglicherweise müssen Sie mehrere Seiten gleichzeitig programmgesteuert aus PDF extrahieren. Durch die Trennung von PDF-Seiten können Sie bestimmte Seiten von PDF Dokumenten einfach exportieren und speichern, um sie mit den Beteiligten zu teilen. Als Node.js-Entwickler können Sie mehrere Seiten aus PDF Dokumenten in der Cloud extrahieren. In diesem Artikel zeigen wir, wie man mithilfe der Rest-API in Node.js Seiten aus einer PDF-Datei extrahiert.

Die folgenden Themen werden in diesem Artikel behandelt, um Seiten aus PDF herauszunehmen:

PDF Extractor REST API und Node.js SDK

Um Seiten aus PDF Adobe Acrobat zu extrahieren, verwende ich die API Node.js SDK von GroupDocs.Merger Cloud. Es handelt sich um eine kostenlose Online-Bibliothek zum Extrahieren von PDF-Seiten. Es ermöglicht Ihnen, eine einzelne Seite oder eine Sammlung von Seiten aus unterstützten Dokumentformaten von Word, Excel, PowerPoint zu teilen, zu kombinieren, zu extrahieren, zu entfernen und neu anzuordnen ], Visio-Zeichnungen, PDF und HTML.

Sie können die GroupDocs.Merger-Cloud installieren, um PDF-Seiten aus PDF Dateien in Ihrer Node.js-Anwendung zu extrahieren, indem Sie den folgenden Befehl in der Konsole verwenden:

npm install groupdocs-merger-cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die genannten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie den Code wie unten gezeigt ein:

# Importieren Sie das Node.js SDK in Ihre Knotenanwendung von http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// Holen Sie sich clientId und clientSecret von https://dashboard.groupdocs.cloud (kostenlose Registrierung erforderlich).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extrahieren Sie PDF-Seiten anhand exakter Seitenzahlen mithilfe der REST-API in Node.js

Sie können eine einzelne Seite aus PDF exportieren oder bestimmte Seiten aus PDF Dateien programmgesteuert in die Cloud exportieren, indem Sie die folgenden einfachen Schritte ausführen:

Laden Sie die PDF-Datei hoch

Sie können beginnen, indem Sie die PDF-Datei mithilfe des folgenden Codebeispiels in die Cloud importieren:

// Öffnen Sie die Datei in IOStream von Ihrem Systemlaufwerk.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// Datei lesen
fs.readFile(resourcesFolder, (err, fileStream) => {
  // Konstruieren Sie FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // Anfrage zum Hochladen einer Datei erstellen
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // Datei hochladen
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Die PDF-Datei ist verfügbar, wenn die Datei im Dateienbereich Ihres Dashboards in der Cloud hochgeladen wird.

Extrahieren Sie PDF-Seiten mithilfe der REST-API in Node.js

In den folgenden Schritten erfahren Sie, wie Sie Seiten programmgesteuert aus einer PDF-Datei extrahieren:

  • Erstellen Sie zunächst eine Instanz von PagesApi.
  • Erstellen Sie eine Instanz von ExtractOptions.
  • Erstellen Sie eine Instanz der FileInfo.
  • Legen Sie dann den Pfad zur Eingabe-PDF-Datei fest.
  • Als nächstes legen Sie den Pfad zur extrahierten PDF-Datei fest.
  • Legen Sie bestimmte Seitenzahlen in einem durch Kommas getrennten Array fest, um PDF Dateien zu extrahieren.
  • Erstellen Sie ExtractRequest mit ExtractOptions.
  • Rufen Sie abschließend die Methode pagesApi.extract() mit ExtractRequest auf, um Ergebnisse zu erhalten.

Der folgende Codeausschnitt zeigt, wie PDF-Seiten mithilfe der REST-API in Node.js in separate Dateien extrahiert werden:

// So extrahieren Sie PDF-Seiten anhand exakter Seitenzahlen mithilfe der REST-API in Node.js
const extractpdfpages = async () => {

  // API-Initialisierung
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // Definieren Sie Extraktionsoptionen
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // Auszugsanforderung erstellen
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // Extrahieren Sie Seiten aus einem PDF Dokument
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Laden Sie die extrahierten Dateien herunter

Das obige Codebeispiel speichert die getrennten Dateien in der Cloud. Sie können sie mit dem folgenden Codebeispiel herunterladen:

// Erstellen Sie FileApi, um die zusammengeführte Datei herunterzuladen
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// Erstellen Sie eine Download-Dateianforderung
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// Download-Datei und Antworttyp Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // Speichern Sie die Datei in Ihrem Systemverzeichnis
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extrahieren Sie Seiten aus PDF nach Seitenbereich mithilfe der REST-API in Node.js

Sie können Seiten aus einer PDF-Datei separat extrahieren und speichern, indem Sie programmgesteuert eine Reihe von Seitenzahlen angeben, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von PagesApi.
  • Erstellen Sie eine Instanz von ExtractOptions.
  • Erstellen Sie eine Instanz der FileInfo.
  • Legen Sie dann den Pfad zur Eingabe-PDF-Datei fest.
  • Als nächstes legen Sie den Pfad zur extrahierten PDF-Datei fest.
  • Legen Sie die Werte für die Startseitenzahl und die Endseitenzahl fest.
  • Legen Sie dann den RangeMode auf EvenPages oder OddPages fest
  • Erstellen Sie ExtractRequest mit ExtractOptions.
  • Rufen Sie abschließend die Methode pagesApi.extract() mit ExtractRequest auf, um Ergebnisse zu erhalten.

Das folgende Code-Snippet zeigt, wie man Seiten aus PDF online mithilfe des Seitenbereichs und des Seitenmodus in Node.js extrahiert:

// So extrahieren Sie Seiten aus PDF nach Seitenbereich mithilfe der REST-API in Node.js
const extractpages = async () => {

  // API-Initialisierung
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // Definieren Sie Extraktionsoptionen
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // Auszugsanforderung erstellen
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // Extrahieren Sie PDF-Dateiseiten
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Auf ähnliche Weise können Sie ungerade Seiten aus PDF Dokumenten extrahieren.

Versuchen Sie es online

Wie extrahiere ich Seiten aus PDF Dateien online? Bitte probieren Sie das folgende kostenlose Online-PDF-Extrahierungstool aus, um Seiten kostenlos online aus PDFs zu extrahieren. Dieses kostenlose Online-Tool zum Extrahieren von PDF-Seiten wurde unter Verwendung der oben genannten API entwickelt.

Abschluss

Wir schließen diesen Blogbeitrag hier ab. In diesem Artikel haben Sie gelernt:

  • wie man mit der REST-API bestimmte Seiten aus PDF extrahiert oder eine Seite online aus PDF extrahiert;
  • wie man Seiten aus PDF Dokumenten mithilfe des Seitenbereichs und Bereichsmodusfilters extrahiert;
  • Laden Sie eine PDF-Datei in die Cloud hoch, um ausgewählte Seiten online aus PDF zu exportieren.
  • Laden Sie bestimmte PDF-Seiten aus der Cloud herunter und speichern Sie sie.
  • wie man Seiten kostenlos aus PDF extrahiert;

Jetzt wissen Sie, wie Sie eine Seite aus einem PDF Dokument extrahieren oder bestimmte Seiten eines PDFs speichern. Mit der API können Sie außerdem Dokumentseiten neu anordnen oder ersetzen, die Seitenausrichtung ändern, Dokumentkennwörter verwalten und andere Manipulationen problemlos für jedes unterstützte Dateiformat durchführen. Außerdem können Sie mithilfe der Dokumentation mehr über die GroupDocs.Merge Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können.

Darüber hinaus empfehlen wir Ihnen, unseren Leitfaden „Erste Schritte“ zu lesen.

Darüber hinaus schreibt groupdocs.cloud regelmäßig Artikel zu neuen Themen. Bleiben Sie also bitte auf dem Laufenden, um die neuesten Updates zu erhalten.

Stelle eine Frage

Sie können Ihre Fragen zum Extrahieren von PDF Dateien stellen, um ausgewählte Seiten aus PDF zu exportieren, über unser Kostenloses Support-Forum

FAQs

Wie extrahiere ich mehrere Seiten aus einer PDF-Datei in eine Datei?

Installieren Sie die JS-Bibliothek, um PDF Dateien online programmgesteuert in mehrere Seiten aufzuteilen. Vollständige API-Details finden Sie in der Dokumentation.

Wie lange dauert es, bestimmte Seiten aus PDF zu extrahieren?

JavaScript HTML to PDF-Bibliothek arbeitet sehr schnell und Sie können Seiten aus geschützten PDFs problemlos in wenigen Sekunden extrahieren.

Siehe auch

Die beste Lektüre und Informationen finden Sie in den folgenden Artikeln: