نحوه استخراج صفحات از فایل PDF با استفاده از Rest API در Node.js

نحوه استخراج صفحات از فایل های PDF با استفاده از Rest API در Node.js

ممکن است لازم باشد چندین صفحه از PDF را همزمان به صورت برنامه‌ریزی استخراج کنید. با جدا کردن صفحات PDF، می توانید به راحتی صفحات خاصی از اسناد PDF را صادر و ذخیره کنید تا با ذینفعان به اشتراک بگذارید. به عنوان یک توسعه دهنده Node.js، می توانید چندین صفحه را از اسناد PDF در فضای ابری استخراج کنید. در این مقاله نحوه استخراج صفحات از فایل PDF با استفاده از Rest API در Node.js را نشان خواهیم داد.

موضوعات زیر باید در این مقاله پوشش داده شود تا صفحات از PDF خارج شوند:

PDF Extractor REST API و Node.js SDK

برای استخراج صفحات از PDF adobe acrobat، از Node.js SDK of GroupDocs.Merger Cloud API استفاده خواهم کرد. این یک کتابخانه دانلود رایگان استخراج کننده صفحه PDF آنلاین است. به شما امکان می دهد یک صفحه یا مجموعه ای از صفحات را از فرمت های سند پشتیبانی شده از Word، Excel، PowerPoint تقسیم، ترکیب، استخراج، حذف و تنظیم مجدد کنید. ]، طراحی‌های Visio، PDF و HTML.

برای استخراج صفحات PDF از فایل های PDF در برنامه Node.js خود می توانید با استفاده از دستور زیر در کنسول، cloud GroupDocs.Merger را نصب کنید:

npm install groupdocs-merger-cloud

لطفاً قبل از انجام مراحل ذکر شده [شناسه مشتری و راز خود را از داشبورد دریافت کنید13. هنگامی که شناسه و راز خود را دریافت کردید، کد را مطابق شکل زیر اضافه کنید:

# Node.js SDK را در برنامه نود خود از http://api.groupdocs.cloud وارد کنید
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// ClientId و clientSecret را از https://dashboard.groupdocs.cloud دریافت کنید (ثبت نام رایگان لازم است).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

با استفاده از REST API در Node.js صفحات PDF را بر اساس شماره صفحات دقیق استخراج کنید

می‌توانید با دنبال کردن مراحل ساده‌ای که در زیر ذکر شده است، یک صفحه را از PDF صادر کنید یا صفحات خاصی را از فایل‌های PDF به صورت برنامه‌نویسی در فضای ابری صادر کنید:

  • آپلود فایل PDF در Cloud
  • Extract صفحات PDF با استفاده از REST API در Node.js
  • دانلود فایل های جدا شده

فایل PDF را آپلود کنید

می توانید با وارد کردن فایل PDF به ابر با استفاده از مثال کد زیر شروع کنید:

// فایل را در IOStream از درایو سیستم خود باز کنید.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.pdf';
// خواندن فایل
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi را بسازید
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // ایجاد درخواست آپلود فایل
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.pdf", fileStream, myStorage);
  // آپلود فایل
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

فایل PDF زمانی در دسترس خواهد بود که فایل در بخش فایل ها داشبورد شما در فضای ابری آپلود شود.

صفحات PDF را با استفاده از REST API در Node.js استخراج کنید

مراحل زیر به شما آموزش می دهد که چگونه به صورت برنامه نویسی صفحات را از فایل PDF استخراج کنید:

  • ابتدا یک نمونه از PagesApi ایجاد کنید.
  • یک نمونه از ExtractOptions ایجاد کنید.
  • یک نمونه از FileInfo ایجاد کنید.
  • سپس مسیر فایل PDF ورودی را تنظیم کنید.
  • سپس مسیر فایل PDF استخراج شده را تنظیم کنید.
  • شماره صفحات خاصی را در یک آرایه جدا شده با کاما برای استخراج فایل های PDF تنظیم کنید.
  • ExtractRequest را با ExtractOptions ایجاد کنید.
  • در نهایت، متد pagesApi.extract() را با ExtractRequest فراخوانی کنید تا نتیجه بگیرید.

قطعه کد زیر نحوه استخراج صفحات PDF را به فایل های جداگانه با استفاده از REST API در Node.js نشان می دهد:

// نحوه استخراج صفحات PDF بر اساس شماره صفحات دقیق با استفاده از REST API در Node.js
const extractpdfpages = async () => {

  // مقداردهی اولیه api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // گزینه های استخراج را تعریف کنید
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.pages = [2, 4, 7];
  
  try {
    // ایجاد درخواست استخراج
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // استخراج صفحات از سند pdf
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractpdfpages()
.then(() => {
  console.log("Successfully extract PDF pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file:", err);
})

فایل های استخراج شده را دانلود کنید

نمونه کد بالا فایل های جدا شده را در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر می توانید آنها را دانلود کنید:

// برای دانلود فایل ادغام شده، FileApi را بسازید
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// ایجاد درخواست فایل دانلود
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.pdf", myStorage);
// فایل دانلود و پاسخ نوع Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // فایل را در دایرکتوری سیستم خود ذخیره کنید
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.pdf", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

استخراج صفحات از PDF با استفاده از REST API در Node.js

می‌توانید با دنبال کردن مراحل زیر، صفحاتی را به‌طور جداگانه از یک PDF استخراج و ذخیره کنید.

  • ابتدا یک نمونه از PagesApi ایجاد کنید.
  • یک نمونه از ExtractOptions ایجاد کنید.
  • یک نمونه از FileInfo ایجاد کنید.
  • سپس مسیر فایل PDF ورودی را تنظیم کنید.
  • سپس مسیر فایل PDF استخراج شده را تنظیم کنید.
  • مقادیر شماره صفحه شروع و شماره صفحه پایان را تنظیم کنید.
  • سپس، rangeMode را به عنوان EvenPages یا OddPages تنظیم کنید
  • ExtractRequest را با ExtractOptions ایجاد کنید.
  • در نهایت، متد pagesApi.extract() را با ExtractRequest فراخوانی کنید تا نتیجه بگیرید.

قطعه کد زیر نحوه استخراج صفحات از PDF آنلاین با استفاده از محدوده صفحه و حالت صفحه در Node.js را نشان می دهد:

// نحوه استخراج صفحات از PDF با استفاده از REST API در Node.js
const extractpages = async () => {

  // مقداردهی اولیه api
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // گزینه های استخراج را تعریف کنید
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.pdf"; 
  options.outputPath = "nodejs-testing/output-sample-file.pdf"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // ایجاد درخواست استخراج
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // صفحات فایل PDF را استخراج کنید
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of PDF file.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from PDF file.", err);
})

به روشی مشابه، می توانید صفحات فرد را از اسناد PDF استخراج کنید.

آنلاین را امتحان کنید

چگونه صفحات را از فایل های PDF بصورت آنلاین استخراج کنیم؟ لطفاً [ابزار استخراج آنلاین رایگان PDF22 زیر را امتحان کنید تا صفحات را به صورت آنلاین از PDF استخراج کنید. این ابزار آنلاین رایگان استخراج صفحه PDF با استفاده از API فوق توسعه یافته است.

نتیجه

ما این پست وبلاگ را در اینجا به پایان می رسانیم. در این مقاله یاد گرفتید:

  • نحوه استخراج صفحات خاصی از PDF یا استخراج یک صفحه از PDF به صورت آنلاین با استفاده از REST API.
  • نحوه استخراج صفحات از اسناد PDF با استفاده از محدوده صفحه و فیلتر حالت محدوده.
  • آپلود فایل PDF در ابر برای صادرات صفحات انتخابی از PDF به صورت آنلاین.
  • صفحات خاصی از PDF را از ابر دانلود و ذخیره کنید.
  • نحوه استخراج صفحات از PDF رایگان.

اکنون، شما می دانید که چگونه یک صفحه را از یک سند PDF استخراج کنید یا چگونه صفحات خاصی از یک PDF را ذخیره کنید. API همچنین شما را قادر می سازد تا صفحات سند را مجدداً ترتیب یا جایگزین کنید، جهت صفحه را تغییر دهید، رمزهای عبور اسناد را مدیریت کنید و دستکاری های دیگر را به راحتی برای هر فرمت فایل پشتیبانی شده انجام دهید. علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Merge Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می دهیم که به شما امکان می دهد API های ما را مستقیماً از طریق مرورگر تجسم کنید و با آنها تعامل داشته باشید.

علاوه بر این، به شما توصیه می کنیم به [راهنمای شروع به کار] ما مراجعه کنید (https://docs.groupdocs.cloud/merger/getting-started/)

علاوه بر این، groupdocs.cloud به طور منظم در مورد موضوعات جدید مقاله می نویسد. بنابراین لطفا برای اطلاع از آخرین به روز رسانی ها در تماس باشید.

یه سوال بپرس

می‌توانید سؤالات خود را درباره نحوه استخراج فایل‌های PDF برای صادر کردن صفحات انتخابی از PDF، از طریق [تالار گفتمان پشتیبانی رایگان] ما بپرسید (https://forum.groupdocs.cloud/c/conversion/11)

سوالات متداول

چگونه چندین صفحه را از PDF در یک فایل استخراج کنیم؟

کتابخانه JS را برای جداسازی فایل‌های PDF به چندین صفحه آنلاین به‌صورت برنامه‌نویسی نصب کنید. برای جزئیات کامل API می‌توانید به مستندات مراجعه کنید.

استخراج صفحات خاص از PDF چقدر طول می کشد؟

کتابخانه جاوا اسکریپت HTML به PDF بسیار سریع کار می کند و می توانید صفحات را از PDF محافظت شده به راحتی در چند ثانیه استخراج کنید.

همچنین ببینید

برای بهترین مطالعه و اطلاعات، لطفاً به مقالات زیر مراجعه کنید: