Parser di file PDF: estrai immagini da file PDF online in Java

PDF(Portable Document Format) è un formato di file ampiamente utilizzato per la condivisione e la conservazione di documenti online. Spesso contiene vari tipi di contenuti, inclusi testo, immagini, tabelle e altro. L’estrazione di contenuti specifici da file PDF, come le immagini, può essere un’attività impegnativa senza strumenti affidabili o una libreria. Uno di questi strumenti è GroupDocs.Parser Cloud SDK per Java, che fornisce un modo semplice ed efficiente per estrarre immagini da file PDF. In questo articolo, dimostreremo come estrarre immagini da file PDF in Java utilizzando l’API REST.

In questo articolo saranno trattati i seguenti argomenti:

API Java REST per separare le immagini dall’installazione di PDF e SDK

GroupDocs.Parser Cloud SDK for Java è una libreria Java potente e versatile che fornisce un modo semplice ed efficiente per analizzare ed estrarre dati da vari formati di documenti, inclusi i file PDF. Offre una vasta gamma di funzionalità per l’analisi dei documenti, consentendo agli sviluppatori di estrarre immagini, testo, metadati e altri contenuti. GroupDocs.Parser fornisce anche C#.NET, Java, PHP, Ruby e Python SDK come document parser family members per le API Cloud.

Per iniziare, devi includere GroupDocs.Parser Cloud SDK nel tuo progetto Java. Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:

Repository esperto:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dipendenza Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Successivamente, devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:

# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Come estrarre tutte le immagini dai file PDF in Java utilizzando l’API REST

Ora, scriviamo i passaggi e uno snippet di codice di esempio per estrarre immagini da file PDF utilizzando GroupDocs.Parser Cloud SDK per Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe ParseApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del documento PDF di input.
  • Quindi, crea un’istanza della classe ImagesOptions().
  • Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
  • Creare ora un’istanza della classe ImagesRequest() e passare il parametro ImagesOptions.
  • Infine, ottieni i risultati chiamando il metodo ParseApi.images() e passando il parametro ImagesRequest.

Il seguente esempio di codice mostra come estrarre tutte le immagini da un file PDF online in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Come estrarre immagini da un file PDF in Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrai immagini specifiche da file PDF in Java utilizzando il numero di pagina

In questa sezione, forniremo i passaggi e uno snippet di codice per estrarre immagini specifiche da un file PDF in modo programmatico in Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe ParseApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del documento PDF di input.
  • Quindi, crea un’istanza della classe ImagesOptions().
  • Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
  • Quindi, fornisci i valori setStartPageNumber e setCountPagesToExtract.
  • Creare ora un’istanza della classe ImagesRequest() e passare il parametro ImagesOptions.
  • Infine, ottieni risultati chiamando il metodo ParseApi.images() e passando il parametro ImagesRequest.

Il seguente esempio di codice mostra come estrarre immagini specifiche da un file PDF per intervallo di pagine in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Estrai immagini da un file PDF online per intervallo di pagine in Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrattore di immagini online gratuito

Qual è il modo migliore per estrarre immagini da PDF online gratuitamente? Prova un analizzatore di file PDF online per estrarre le immagini dai file PDF. Questo software PDF Parser è sviluppato utilizzando la libreria di parser Java come menzionato sopra.

Conclusione

In conclusione, GroupDocs.Parser Cloud SDK per Java fornisce una soluzione affidabile ed efficiente per estrarre facilmente immagini da file PDF. Quanto segue è ciò che hai imparato da questo articolo:

  • come estrarre tutte le immagini dai file PDF in modo programmatico in Java utilizzando l’API REST;
  • come estrarre immagini specifiche da documenti PDF in Java utilizzando l’API REST;
  • e strumento di estrazione di immagini online per estrarre immagini da documenti PDF.

Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub.

Infine, continuiamo a scrivere nuovi articoli di blog su diversi formati di file e ad analizzarli utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli ultimi aggiornamenti.

Fai una domanda

In caso di domande su come analizzare i documenti, non esitate a contattarci tramite il nostro forum.

Domande frequenti

Come si analizzano i file PDF utilizzando Java?

Per estrarre immagini, testo o metadati, devi prima caricare e analizzare il documento PDF utilizzando GroupDocs.Parser Cloud SDK. Questo processo comporta la specifica del percorso del file e la chiamata al metodo Parse per analizzare i file PDF.

GroupDocs.Parser Cloud SDK per Java supporta altri formati di file oltre al PDF?

Sì, oltre ai file PDF, GroupDocs.Parser Cloud SDK for Java supporta l’estrazione di immagini da vari formati di documenti, tra cui Word, Excel, PowerPoint, HTML e molti altri.

Posso estrarre tutte le immagini da un file PDF utilizzando GroupDocs.Parser Cloud SDK per Java?

Sì, puoi estrarre tutte le immagini da un file PDF utilizzando GroupDocs.Parser Cloud SDK for Java.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: