Ekstrak Gambar dari PDF di Node.js - Ekstraktor Gambar

Dalam artikel ini, Anda akan belajar bagaimana cara secara programatik mengekstrak gambar dari PDF menggunakan Node.js dan GroupDocs.Parser Cloud REST API yang kuat. Apakah Anda sedang membangun parser konten, alat ekstraksi data, atau sistem otomatisasi dokumen, mengekstrak gambar yang嵌入 dari PDF adalah persyaratan umum. Panduan ini mencakup instalasi, penggunaan, dan potongan kode untuk ekstraksi gambar yang mudah.

Mengapa Mengambil Gambar dari PDF?

  • Ekstrak logo, infografis, dan foto yang disematkan dari PDF.
  • Automasi digitasi dokumen untuk pengarsipan dan pemrosesan data.
  • Buat pemroses PDF kustom atau jalur pengenalan gambar.
  • Alur kerja berbasis REST API — Tidak perlu perangkat lunak desktop.

Dalam artikel ini, kami akan membahas topik berikut:

API Pengolahan PDF

GroupDocs.Parser Cloud SDK for Node.js adalah pembungkus API yang ringan dan mudah diintegrasikan yang memungkinkan pengembang untuk mengekstrak konten terstruktur—seperti teks, gambar, metadata, dan bidang dokumen—from a wide variety of file formats including PDF, Word, Excel, and more.

Prasyarat Install SDK Cloud GroupDocs.Parser untuk Node.js:

npm install groupdocs-parser-cloud

Buat akun di GroupDocs.Cloud Dashboard untuk mendapatkan Client ID dan Client Secret Anda untuk autentikasi. Untuk informasi lebih lanjut, silakan kunjungi artikel.

Extract Images from PDF using Node.js

Ikuti langkah-langkah ini untuk mengembangkan pengambil gambar Anda sendiri dari PDF menggunakan API Node.js:

Langkah 1: Atur Konfigurasi.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Langkah 2: Tentukan Info File PDF dan Opsi Ekstraksi Gambar. Inisialisasi objek dari kelas ImagesRequest dan lewati instance dari kelas ImagesOptions.

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Langkah 3: Ekstrak Gambar. Panggil metode images untuk mengekstrak gambar dari file PDF.

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});
// Untuk lebih banyak contoh, silakan kunjungi https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
fileInfo.filePath = "sample.pdf";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

parserApi.images(request).then((response) => {
    console.log("Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

Anda dapat melihat keluaran dari contoh kode di atas dalam gambar di bawah:

extractor file gambar

Ekstrak Gambar dari PDF melalui cURL

Anda juga dapat mengekstrak gambar menggunakan GroupDocs.Parser REST API dan cURL.

Langkah 1 – Hasilkan Token Akses:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Langkah 2 – Ekstrak Gambar melalui REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Ganti dengan yang Anda buat.

Online Image Extractor

Jika Anda mencari solusi tanpa kode, Anda dapat menggunakan P extractor Gambar PDF Gratis yang didukung oleh GroupDocs.Parser Cloud.

Ekstraktor Gambar Daring

Kesimpulan

SDK GroupDocs.Parser Cloud untuk Node.js membuat ekstraksi gambar dari dokumen PDF menjadi cepat, dapat diskalakan, dan ramah kode. Apakah Anda sedang membangun skrip otomatisasi, crawler konten, atau alat analitik berbasis gambar, REST API ini menawarkan semuanya yang Anda butuhkan untuk mengisolasi dan mengekspor gambar secara programatis.

Siap untuk mengintegrasikannya ke dalam alur kerja Anda? Mulailah dengan panggilan API pertama Anda hari ini!

📚 Sumber Daya Tambahan

Frequently Asked Questions – FAQs

How do I extract images from Word?

Anda dapat menggunakan GroupDocs.Parser Cloud SDKs untuk mengekstrak gambar dari file PDF secara programatik. Silakan kunjungi link ini untuk rincian lebih lanjut.

Apa itu model harga?

Kami menawarkan model harga bayar sesuai penggunaan. Untuk informasi lebih lanjut, silakan kunjungi pricing guide.

Artikel Terkait