
PDF(Portable Document Format) è un formato di file ampiamente utilizzato per la condivisione e la conservazione di documenti online. Spesso contiene vari tipi di contenuto, inclusi testo, immagini, tabelle e altro ancora. Estrarre contenuti specifici dai file PDF, come le immagini, può essere un compito impegnativo senza strumenti affidabili o una libreria. Uno di questi strumenti è il GroupDocs.Parser Cloud SDK per Java, che fornisce un modo semplice ed efficiente per estrarre immagini dai file PDF. In questo articolo, dimostreremo come estrarre immagini dai file PDF in Java utilizzando REST API.
I seguenti argomenti saranno trattati in questo articolo:
- Java REST API per separare le immagini da PDF e installazione SDK
- Come estrarre tutte le immagini da file PDF in Java utilizzando REST API
- Estrai Immagini Specifiche da File PDF in Java utilizzando il Numero di Pagina
Java REST API per separare le immagini da PDF e installazione SDK
GroupDocs.Parser Cloud SDK per Java è una potente e versatile libreria Java che offre un modo semplice ed efficiente per analizzare ed estrarre dati da vari formati di documento, inclusi i file PDF. Offre un’ampia gamma di funzionalità per l’analisi dei documenti, consentendo agli sviluppatori di estrarre immagini, testo, metadati e altri contenuti. GroupDocs.Parser fornisce anche SDK per C#.NET, Java, PHP, Ruby e Python come suoi componenti della famiglia di parser di documenti per le API Cloud.
Per iniziare, è necessario includere il GroupDocs.Parser Cloud SDK nel tuo progetto Java. Puoi download il file JAR dell’API oppure installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dipendenza Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Successivamente, è necessario sign up per un account di prova gratuito o purchase a subscription plan sul sito web di GroupDocs e get your API key. Una volta ottenuti il Client Id e il Client Secret, aggiungi il seguente frammento di codice a un’applicazione basata su Java:
# Ottieni il tuo clientid e clientsecret da https://dashboard.groupdocs.cloud dopo la registrazione.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Come Estrarre Tutte le Immagini da File PDF in Java utilizzando REST API
Ora, scriviamo i passaggi e un esempio di codice per estrarre immagini da file PDF utilizzando il GroupDocs.Parser Cloud SDK per Java:
- Innanzitutto, importa le classi necessarie nel tuo file Java.
- In secondo luogo, crea un’istanza della classe ParseApi.
- In terzo luogo, crea un’istanza della FileInfo classe.
- Successivamente, imposta il percorso del documento PDF di input.
- Quindi, crea un’istanza della classe ImagesOptions().
- Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
- Ora, crea un’istanza della classe ImagesRequest() e passa il parametro ImagesOptions.
- Infine, ottieni i risultati chiamando il ParseApi.images() metodo e passando il parametro ImagesRequest.
Il seguente esempio di codice mostra come estrarre tutte le immagini da un file PDF online in Java utilizzando REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Come estrarre immagini da un file PDF in Java.
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Preparare le impostazioni
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Estrai Immagini Specifiche da File PDF in Java utilizzando il Numero di Pagina
In this section, we will provide steps and a code snippet for extracting specific images from a PDF file programmatically in Java:
- Innanzitutto, importa le classi necessarie nel tuo file Java.
- In secondo luogo, crea un’istanza della classe ParseApi.
- In terzo luogo, crea un’istanza della classe FileInfo.
- Successivamente, imposta il percorso del documento PDF di input.
- Quindi, crea un’istanza della classe ImagesOptions().
- Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
- Poi, fornire i valori di setStartPageNumber e setCountPagesToExtract.
- Ora, crea un’istanza della classe ImagesRequest() e passa il parametro ImagesOptions.
- Infine, ottieni i risultati chiamando il ParseApi.images() metodo e passando il parametro ImagesRequest.
Il seguente esempio di codice mostra come estrarre immagini specifiche da un file PDF per intervallo di pagine in Java utilizzando REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Estrai immagini da un file PDF online per intervallo di pagine in Java.
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Prepara le impostazioni
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Free Online Images Extractor
Qual è il modo migliore per estrarre immagini da PDF online gratuitamente? Prova un online PDF File parser per estrarre immagini da file PDF. Questo software PDF Parser è stato sviluppato utilizzando la libreria parser Java di cui sopra.
Conclusione
In conclusione, GroupDocs.Parser Cloud SDK per Java offre una soluzione affidabile ed efficiente per estrarre immagini da file PDF con facilità. Di seguito è riportato ciò che hai appreso da questo articolo:
- How to extract all images from PDF files programmatically in Java using REST API;
- Come estrarre immagini specifiche da documenti PDF in Java utilizzando l’API REST;
- Strumento di estrazione di immagini online per estrarre immagini da documenti PDF.
In aggiunta, puoi saperne di più sul GroupDocs.Parser Cloud API consultando la documentazione. Forniamo anche una sezione API Reference che ti consente di visualizzare e interagire con le nostre API direttamente tramite il browser. Il codice sorgente completo del Java SDK è disponibile gratuitamente su Github.
Finalmente, continuiamo a scrivere nuovi articoli nel blog su diversi formati di file e come analizzarli utilizzando REST API. Quindi, per favore, mettiti in contatto per gli ultimi aggiornamenti.
Ask a question
In caso di domande su come analizzare i documenti, non esitate a contattarci tramite il nostro forum.
FAQs
How do I parse PDF files using Java?
Per estrarre immagini, testo o metadati, è necessario prima caricare e analizzare il documento PDF utilizzando GroupDocs.Parser Cloud SDK. Questo processo implica specificare il percorso del file e chiamare il metodo Parse per analizzare i file PDF.
Does GroupDocs.Parser Cloud SDK for Java support other file formats besides PDF?
Sì, oltre ai file PDF, GroupDocs.Parser Cloud SDK per Java supporta l’estrazione di immagini da vari formati di documenti, tra cui Word, Excel, PowerPoint, HTML e molti altri.
Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?
Sì, puoi estrarre tutte le immagini da un file PDF utilizzando il GroupDocs.Parser Cloud SDK for Java.
Vedi anche
Ecco alcuni articoli correlati che potresti trovare utili: