Jak extrahovat stránky ze souboru PDF pomocí Rest API v Node.js

Jak extrahovat stránky ze souborů PDF pomocí Rest API v Node.js

Možná budete muset extrahovat více stránek z PDF najednou programově. Oddělením stránek PDF můžete snadno exportovat a uložit konkrétní stránky dokumentů PDF a sdílet je se zúčastněnými stranami. Jako vývojář Node.js můžete z dokumentů PDF v cloudu extrahovat více stránek. V tomto článku si ukážeme, jak extrahovat stránky ze souboru PDF pomocí Rest API v Node.js.

Následující témata by měla být pokryta v tomto článku, aby bylo možné vyjmout stránky z PDF:

PDF Extractor REST API a Node.js SDK

K extrahování stránek z PDF adobe acrobat budu používat Node.js SDK of GroupDocs.Merger Cloud API. Je to bezplatná knihovna ke stažení online extraktoru stránek PDF. Umožňuje rozdělit, kombinovat, extrahovat, odstraňovat a přeskupovat jednu stránku nebo kolekci stránek z podporované formáty dokumentů z Word, Excel, PowerPoint, nákresy Visio, PDF a HTML.

Cloud GroupDocs.Merger můžete nainstalovat a extrahovat stránky PDF ze souborů PDF v aplikaci Node.js pomocí následujícího příkazu v konzole:

npm install groupdocs-merger-cloud

Před provedením uvedených kroků získejte své ID klienta a tajný klíč z řídicího panelu. Jakmile budete mít své ID a tajemství, přidejte kód, jak je uvedeno níže:

# Importujte Node.js SDK do své aplikace uzlu z http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// získejte clientId a clientSecret z https://dashboard.groupdocs.cloud (je nutná bezplatná registrace).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extrahujte stránky PDF podle přesných čísel stránek pomocí REST API v Node.js

Můžete exportovat jednu stránku z PDF nebo exportovat konkrétní stránky ze souborů PDF programově v cloudu podle jednoduchých kroků uvedených níže:

Nahrajte soubor PDF

Můžete začít importem souboru PDF do cloudu pomocí příkladu kódu uvedeného níže:

// otevřete soubor v IOStream ze systémového disku.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// číst soubor
fs.readFile(resourcesFolder, (err, fileStream) => {
  // vytvořit FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // vytvořit žádost o nahrání souboru
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // nahrát soubor
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Soubor PDF bude k dispozici po nahrání souboru do sekce souborů vašeho řídicího panelu v cloudu.

Extrahujte stránky PDF pomocí REST API v Node.js

Níže uvedené kroky vás naučí, jak programově extrahovat stránky ze souboru PDF:

  • Nejprve vytvořte instanci PagesApi.
  • Vytvořte instanci ExtractOptions.
  • Vytvořte instanci souboru FileInfo.
  • Poté nastavte cestu ke vstupnímu souboru PDF.
  • Dále nastavte cestu k extrahovanému souboru PDF.
  • Chcete-li extrahovat soubory PDF, nastavte konkrétní čísla stránek v poli odděleném čárkami.
  • Vytvořte ExtractRequest pomocí ExtractOptions.
  • Nakonec zavolejte metodu pagesApi.extract() pomocí ExtractRequest, abyste získali výsledky.

Následující fragment kódu ukazuje, jak extrahovat stránky PDF do samostatných souborů pomocí REST API v Node.js:

// Jak extrahovat stránky PDF podle přesných čísel stránek pomocí REST API v Node.js
const extractpdfpages = async () => {

  // inicializace api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definovat možnosti extrahování
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // vytvořit žádost o výpis
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrahovat stránky z dokumentu pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

Stáhněte si extrahované soubory

Výše uvedená ukázka kódu uloží oddělené soubory do cloudu. Můžete si je stáhnout pomocí následující ukázky kódu:

// konstrukci FileApi ke stažení sloučeného souboru
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// vytvořit žádost o stažení souboru
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// stáhnout soubor a typ odpovědi Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // uložte soubor do svého systémového adresáře
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Extrahujte stránky z PDF podle rozsahu stránek pomocí REST API v Node.js

Stránky z PDF můžete extrahovat a uložit samostatně zadáním řady čísel stránek programově podle následujících kroků:

  • Nejprve vytvořte instanci PagesApi.
  • Vytvořte instanci ExtractOptions.
  • Vytvořte instanci souboru FileInfo.
  • Poté nastavte cestu ke vstupnímu souboru PDF.
  • Dále nastavte cestu k extrahovanému souboru PDF.
  • Nastavte číslo úvodní stránky a číslo koncové stránky.
  • Potom nastavte rangeMode na EvenPages nebo OddPages
  • Vytvořte ExtractRequest pomocí ExtractOptions.
  • Nakonec zavolejte metodu pagesApi.extract() pomocí ExtractRequest, abyste získali výsledky.

Následující fragment kódu ukazuje, jak extrahovat stránky z PDF online pomocí rozsahu stránek a režimu stránek v Node.js:

// Jak extrahovat stránky z PDF podle rozsahu stránek pomocí REST API v Node.js
const extractpages = async () => {

  // inicializace api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definovat možnosti extrahování
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // vytvořit žádost o výpis
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // extrahovat stránky souboru PDF
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

Podobným způsobem můžete extrahovat liché stránky z dokumentů PDF.

Vyzkoušejte online

Jak extrahovat stránky ze souborů PDF online? Vyzkoušejte prosím následující bezplatný online nástroj na extrahování PDF a extrahujte stránky z PDF online zdarma. Tento bezplatný online nástroj pro extraktor stránek PDF je vyvinut pomocí výše uvedeného API.

Závěr

Zde uzavíráme tento blogový příspěvek. V tomto článku jste se dozvěděli:

  • jak extrahovat určité stránky z PDF nebo extrahovat jednu stránku z PDF online pomocí REST API;
  • jak extrahovat stránky z dokumentů PDF pomocí filtru rozsahu stránek a režimu rozsahu;
  • nahrajte soubor PDF do cloudu pro export vybraných stránek z PDF online;
  • stáhnout a uložit určité stránky PDF z cloudu;
  • jak extrahovat stránky z PDF zdarma;

Nyní víte, jak extrahovat jednu stránku z dokumentu PDF nebo jak uložit určité stránky PDF. Rozhraní API vám také umožňuje změnit pořadí nebo nahradit stránky dokumentu, změnit orientaci stránky, spravovat hesla dokumentů a provádět další manipulace snadno pro jakýkoli podporovaný formát souboru. Kromě toho se můžete dozvědět více o GroupDocs.Merge Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat a pracovat s našimi API přímo prostřednictvím prohlížeče.

Dále vám doporučujeme prostudovat si naši příručku Začínáme

Kromě toho groupdocs.cloud pravidelně píše články o nových tématech. Zůstaňte proto v kontaktu pro nejnovější aktualizace.

Položit otázku

Své dotazy ohledně toho, jak extrahovat soubory PDF pro export vybraných stránek z PDF, můžete položit prostřednictvím našeho Free Support Forum

Nejčastější dotazy

Jak extrahovat více stránek z PDF do jednoho souboru?

Nainstalujte knihovnu JS pro rozdělení souborů PDF na více stránek online programově. Úplné podrobnosti API můžete navštívit dokumentaci.

Jak dlouho trvá extrahování konkrétních stránek z PDF?

Knihovna JavaScript HTML to PDF funguje velmi rychle a stránky z chráněného PDF můžete extrahovat snadno během několika sekund.

Viz také

Pro nejlepší čtení a informace navštivte následující články: