Ekstrak Gambar dari File PDF menggunakan Node.js

PDF dokumen menyimpan konten termasuk gambar dan teks apa adanya. Dalam kasus tertentu, kami mungkin perlu mengekstrak gambar dari file akrobat PDF untuk digunakan kembali. Kami dapat dengan mudah mengekstrak semua gambar atau gambar dari halaman tertentu yang tertanam dalam dokumen PDF secara terprogram di cloud. Pada artikel ini, kita akan mempelajari cara mengekstrak gambar dari file PDF menggunakan REST API di Node.js.

Topik-topik berikut akan dibahas untuk mengekstrak foto dari pdf dalam artikel ini:

Image Extractor REST API dan Node.js SDK

Untuk mengekstrak gambar dari dokumen PDF, kami akan menggunakan Node.js SDK of GroupDocs.Parser Cloud API. Ini memungkinkan ekstraksi teks, gambar, dan penguraian data dengan templat dari semua format dokumen populer. Silakan instal menggunakan perintah berikut di konsol:

npm install groupdocs-parser-cloud

Harap dapatkan ID dan Rahasia Klien Anda dari dasbor sebelum mengikuti langkah-langkah yang disebutkan. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:

// Contoh kode ini menunjukkan cara menambahkan ID klien dan Rahasia Anda dalam kode.
global.clientId = '659fe7da-715b-4744-a0f7-cf469a392b73';
global.clientSecret = 'b377c36cfa28fa69960ebac6b6e36421';
global.myStorage = "";

const configuration = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
configuration.apiBaseUrl = "https://api.groupdocs.cloud";

Ekstrak Gambar dari PDF menggunakan REST API di Node.js

Kami dapat mengekstrak gambar dari dokumen PDF dengan mengikuti langkah-langkah sederhana yang disebutkan di bawah ini:

Unggah Dokumen

Pertama, kami akan mengunggah dokumen PDF yang berisi gambar ke cloud menggunakan contoh kode yang diberikan di bawah ini:

// Contoh kode ini menunjukkan cara mengunggah PDF ke cloud di node.js 
// Membangun FileApi
let fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// Jalur file masukan
let resourcesFolder = 'C:\\Files\\Parser\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // Unggah permintaan file
  let request = new groupdocs_parser_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // Unggah data
  fileApi.uploadFile(request);
});

Hasilnya, file PDF yang diunggah akan tersedia di files section dasbor di cloud. File ini tersedia untuk mengekstrak gambar dari pdf.

Ekstrak Semua Gambar dari File PDF di Node.js

Sekarang, kami akan mengekstrak semua gambar dari file PDF yang diunggah secara terprogram dengan mengikuti langkah-langkah di bawah ini:

  • Pertama, buat instance ParseApi.
  • Selanjutnya, berikan jalur file PDF yang diunggah.
  • Kemudian, tentukan ImageOptions dan tetapkan file.
  • Setelah itu, buat ImagesRequest dengan ImageOptions sebagai argumen.
  • Terakhir, ekstrak gambar dengan memanggil metode images().

Contoh kode berikut menunjukkan cara mengekstrak semua gambar dari file PDF menggunakan REST API di Node.js.

// Contoh kode ini menunjukkan cara mengekstrak semua gambar dari PDF di Node.js.
//inisialisasi api
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// Jalur file masukan
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// menentukan pilihan gambar
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// Permintaan gambar
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Ekstrak gambar
let result = await parseApi.images(request);

// Tunjukkan hasil
let images = result.images;
images.forEach(image => {
  console.log("Image path in storage: " + image.path);
  console.log("Download url: " + image.downloadUrl);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});
Ekstrak Gambar dari PDF menggunakan REST API di Node.js

Ekstrak Gambar dari PDF menggunakan REST API di Node.js

Unduh Gambar yang Diekstrak

Contoh kode di atas akan menyimpan gambar yang diekstraksi di cloud. Kita dapat mengunduh gambar-gambar ini menggunakan contoh kode yang diberikan di bawah ini:

// Contoh kode ini menunjukkan cara mengunduh gambar dari cloud menggunakan Node.js
// Bangun instance api yang diperlukan
var folderApi = groupdocs_parser_cloud.FolderApi.fromConfig(configuration);
var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(configuration);

// Dapatkan permintaan daftar file
var filesListRequest = new groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_pdf/", myStorage);

// Dapatkan daftar file
var filesList = await folderApi.getFilesList(filesListRequest);

for (var count = 0; count < filesList.value.length; count++) {
  // Unduh permintaan file
  let request = new groupdocs_parser_cloud.DownloadFileRequest(filesList.value[count].path, myStorage);

  // Unduh berkas
  let response = await fileApi.downloadFile(request);

  // Simpan file ke folder pada disk
  fs.writeFile("C:\\Files\\parser\\images\\" + filesList.value[count].name, response, "binary", function (err) { });
  console.log(response);
}

Ini adalah cara mengekspor gambar dari file pdf dan kemudian mengunduhnya dari cloud.

Simpan Gambar berdasarkan Nomor Halaman dari Dokumen PDF di Node.js

Kami dapat mengekspor gambar dari halaman khusus PDF alih-alih seluruh dokumen dengan mengikuti langkah-langkah yang diberikan di bawah ini.

  • Pertama, buat instance ParseApi.
  • Selanjutnya, berikan jalur file PDF yang diunggah.
  • Kemudian, tentukan ImageOptions dan tetapkan file.
  • Tetapkan nomor halaman awal dan jumlah total halaman tempat mengekstraksi gambar.
  • Setelah itu, buat ImagesRequest dengan ImageOptions sebagai argumen.
  • Terakhir, ekstrak gambar dengan memanggil metode images().

Contoh kode berikut menunjukkan cara mengekstrak gambar dari file pdf dengan nomor halaman dari dokumen PDF menggunakan REST API di Node.js. Silakan ikuti langkah-langkah yang disebutkan sebelumnya untuk mengunduh gambar yang diekstraksi.

// Contoh kode ini menunjukkan cara mengekstrak gambar dari halaman tertentu PDF di Node.js.
//inisialisasi api
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// Jalur file masukan
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "sample.pdf";

// Tentukan pilihan gambar
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;
options.startPageNumber = 1;      // Start page number
options.countPagesToExtract = 1;  // Total pages

// Permintaan gambar
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Ekstrak gambar
let result = await parseApi.images(request);

// Tunjukkan hasil
let pages = result.pages;
pages.forEach(page => {
  console.log("Page index: " + page.pageIndex);
  page.images.forEach(image => {
    console.log("Download url: " + image.downloadUrl);
    console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
  });
});

Ekstrak Gambar Dari Dokumen Terlampir dengan PDF di Node.js

Kami juga dapat mengekstrak gambar dari dokumen di dalam wadah, tersedia sebagai lampiran dalam file PDF, dengan mengikuti langkah-langkah di bawah ini.

  • Pertama, buat instance ParseApi.
  • Selanjutnya, berikan jalur file PDF yang diunggah.
  • Kemudian, tentukan ImageOptions dan tetapkan file.
  • Selanjutnya, tentukan ContainerItemInfo dan berikan jalur relatif dari dokumen di dalam.
  • Setelah itu, buat ImagesRequest dengan ImageOptions sebagai argumen.
  • Terakhir, ekstrak gambar dengan memanggil metode images().

Contoh kode berikut menunjukkan cara mengekstrak gambar dari dokumen di dalam dokumen PDF menggunakan REST API di Node.js. Silakan ikuti langkah-langkah yang disebutkan sebelumnya untuk mengunduh gambar yang diekstrak.

// Contoh kode ini menunjukkan cara mengekstrak gambar dari dokumen yang dilampirkan dalam PDF di Node.js.
// inisialisasi api
let parseApi = groupdocs_parser_cloud.ParseApi.fromConfig(configuration);

// Jalur file masukan
let fileInfo = new groupdocs_parser_cloud.FileInfo();
fileInfo.filePath = "PDF_with_Attachment.pdf";
fileInfo.password = "password";

// Tentukan pilihan gambar
let options = new groupdocs_parser_cloud.ImagesOptions();
options.fileInfo = fileInfo;

// Barang kontainer
options.ContainerItemInfo = new groupdocs_parser_cloud.ContainerItemInfo();
options.ContainerItemInfo.relativePath = "template-document.pdf";

// Permintaan gambar
let request = new groupdocs_parser_cloud.ImagesRequest(options);

// Ekstrak gambar
let result = await parseApi.images(request);

// Tunjukkan hasil
let images = result.images;
images.forEach(image => {
  console.log("Image path: " + image.path);
  console.log("Image format: " + image.fileFormat + ". Page index: " + image.pageIndex);
});

Coba Daring

Bagaimana cara mengekstrak gambar dari pdf gratis? Silakan coba alat Parsing PDF online gratis berikut untuk mengekstrak gambar pdf online, yang dikembangkan menggunakan API di atas. https://products.groupdocs.app/parser/pdf

Kesimpulan

Dalam artikel ini, kita telah mempelajari cara:

  • ekstrak gambar dari file PDF menggunakan Node.js di cloud;
  • unggah file PDF secara terprogram ke cloud;
  • unduh gambar yang diekstraksi dari cloud.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Lihat juga