
Il parsing dei documenti è un compito cruciale in molte industrie dove è necessaria l’estrazione dei dati da vari formati di documento. Quando si lavora con Word documenti, l’estrazione delle immagini può essere particolarmente utile in casi come l’analisi dei contenuti, il riconoscimento delle immagini o la visualizzazione dei dati. Estrarre manualmente le immagini da grandi documenti Word può richiedere molto tempo. Pertanto, automatizzare il processo di estrazione delle immagini può farti risparmiare tempo e fatica. In questo articolo, dimostreremo come estrarre immagini da documenti Word in modo programmatico in Java.
I seguenti argomenti saranno trattati in questo articolo:
- Java REST API per Estrarre Immagini da Documenti Word e Installazione SDK
- Come Estrarre Tutte le Immagini dai Documenti Word in Java utilizzando REST API
- Estrai immagini specifiche da file Word in Java utilizzando il numero di pagina
Java REST API per estrarre immagini da documenti Word e installazione SDK
GroupDocs.Parser Cloud SDK per Java è una potente libreria Java che offre un modo semplice ed efficiente per analizzare ed estrarre dati da vari formati di documento, inclusi i documenti Word. Offre una vasta gamma di funzionalità per l’analisi dei documenti, consentendo agli sviluppatori di estrarre immagini, testo, metadati e altro. GroupDocs.Parser fornisce anche C#.NET, Java, PHP, Ruby e Python SDK come membri della sua famiglia di parser di documenti per le API Cloud.
Per iniziare, è necessario includere il GroupDocs.Parser Cloud SDK nel tuo progetto Java. Puoi scaricare il file JAR dell’API oppure installarlo utilizzando Maven aggiungendo il seguente repository e la dipendenza nel file pom.xml del tuo progetto:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dipendenza Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Successivamente, è necessario registrarsi per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la propria chiave API. Una volta ottenuti il Client Id e il Client Secret, aggiungi il seguente frammento di codice a un’applicazione basata su Java:
# Ottieni il tuo clientid e clientsecret da https://dashboard.groupdocs.cloud dopo la registrazione.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Come Estrarre Tutte le Immagini da Documenti Word in Java utilizzando l’API REST
Per estrarre immagini da documenti Word in Java utilizzando il GroupDocs.Parser Cloud SDK, segui questi passaggi e un esempio di codice:
- Innanzitutto, importa le classi necessarie nel tuo file Java.
- In secondo luogo, crea un’istanza della classe ParseApi.
- In terzo luogo, crea un’istanza della classe FileInfo.
- Successivamente, imposta il percorso del documento Word di input.
- Quindi, crea un’istanza della classe ImagesOptions().
- Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
- Ora, crea un’istanza della classe ImagesRequest() e passa il parametro ImagesOptions.
- Infine, ottieni i risultati chiamando il ParseApi.images() metodo e passando il parametro ImagesRequest.
Il seguente esempio di codice mostra come estrarre tutte le immagini da un documento Word online in Java utilizzando l’API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Come estrarre immagini da un documento Word in Java.
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Prepara le impostazioni
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Estrai Immagini Specifiche da un File Word in Java utilizzando il Numero di Pagina
In this section, we will write steps and an example code snippet for extracting specific images from a Word document programmatically in Java:
- Innanzitutto, importa le classi necessarie nel tuo file Java.
- In secondo luogo, crea un’istanza della classe ParseApi.
- In terzo luogo, crea un’istanza della FileInfo classe.
- Successivamente, imposta il percorso del file Word come input.
- Quindi, crea un’istanza della classe ImagesOptions().
- Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
- Poi, fornire i valori di setStartPageNumber e setCountPagesToExtract.
- Ora, crea un’istanza della classe ImagesRequest() e passa il parametro ImagesOptions.
- Infine, ottieni i risultati chiamando il ParseApi.images() metodo e passando il parametro ImagesRequest.
Il seguente esempio di codice mostra come estrarre immagini specifiche da un file Word per intervallo di pagina in Java utilizzando l’API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Extract images from a Word file online by page range in Java.
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Preparare le impostazioni
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Estetore di Immagini Online Gratuito
Qual è il modo migliore per estrarre immagini da Word online gratuitamente? Prova un online Word document parser per estrarre immagini da Word. Questo strumento Word Parser è sviluppato utilizzando la libreria Java sopra menzionata.
Conclusione
In conclusione, GroupDocs.Parser Cloud SDK è un’eccellente soluzione per estrarre immagini da documenti Word, risparmiando tempo e sforzo garantendo risultati accurati. Quanto segue è ciò che hai imparato da questo articolo:
- how to extract all images from Word DOCX programmatically in Java using REST API;
- how to extract specific images from Word documents in Java using REST API;
- e uno strumento online per l’ estrazione di immagini per estrarre immagini dai documenti Word.
Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione API Reference che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo del Java SDK è liberamente disponibile su Github.
Finalmente, continuiamo a scrivere nuovi articoli sul blog su diversi formati di file e come analizzarli utilizzando REST API. Quindi, ti preghiamo di mettere in contatto per gli ultimi aggiornamenti.
Ask a question
In caso aveste domande su come estrarre immagini dai documenti, non esitate a contattarci tramite il nostro forum.
FAQs
Come faccio a elaborare documenti Word in Java?
Per estrarre immagini o testo, prima è necessario caricare e analizzare il documento Word utilizzando GroupDocs.Parser Cloud SDK. Questo processo comporta la specifica del percorso del file e la chiamata del metodo Parse per analizzare i documenti.
Can GroupDocs.Parser Cloud SDK estrarre immagini da altri formati di documento?
Sì, GroupDocs.Parser Cloud SDK per Java supporta l’estrazione di immagini da vari formati di documento, inclusi Word, PDF, Excel, PowerPoint e molti altri.
Can the GroupDocs.Parser Cloud SDK extract multiple images from a single Word document?
Sì, il SDK può estrarre più immagini da un singolo documento Word, fornendoti tutte le immagini contenute nel documento.
Does the GroupDocs.Parser Cloud SDK preserve the original image quality during the extraction process?
Sì, il GroupDocs.Parser Cloud SDK per Java preserva la qualità originale dell’immagine durante l’estrazione delle immagini dai documenti Word.
Vedi anche
Ecco alcuni articoli correlati che potresti trovare utili: