Parser di documenti Word: estrai immagini da file Word online in Java

L’analisi dei documenti è un’attività cruciale in molti settori in cui è richiesta l’estrazione dei dati da vari formati di documenti. Quando si lavora con documenti Word, l’estrazione di immagini può essere particolarmente utile in casi come l’analisi del contenuto, il riconoscimento di immagini o la visualizzazione di dati. L’estrazione manuale di immagini da documenti Word di grandi dimensioni può richiedere molto tempo. Pertanto, l’automazione del processo di estrazione delle immagini può farti risparmiare tempo e fatica. In questo articolo, dimostreremo come estrarre immagini da documenti Word in modo programmatico in Java.

In questo articolo saranno trattati i seguenti argomenti:

API REST Java per estrarre immagini da documenti Word e installazione SDK

GroupDocs.Parser Cloud SDK for Java è una potente libreria Java che fornisce un modo semplice ed efficiente per analizzare ed estrarre dati da vari formati di documenti, inclusi i documenti Word. Offre una vasta gamma di funzionalità per l’analisi dei documenti, consentendo agli sviluppatori di estrarre immagini, testo, metadati e altro ancora. GroupDocs.Parser fornisce anche C#.NET, Java, PHP, Ruby e Python SDK come document parser family members per le API Cloud.

Per iniziare, devi includere GroupDocs.Parser Cloud SDK nel tuo progetto Java. Puoi scaricare il file JAR dell’API o installarlo utilizzando Maven aggiungendo il seguente repository e dipendenza nel file pom.xml del tuo progetto:

Repository esperto:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Dipendenza Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Successivamente, devi iscriverti per un account di prova gratuito o acquistare un piano di abbonamento sul sito web di GroupDocs e ottenere la tua chiave API. Dopo aver ottenuto l’ID client e il segreto client, aggiungi lo snippet di codice seguente a un’applicazione basata su Java:

# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Come estrarre tutte le immagini dai documenti di Word in Java utilizzando l’API REST

Per estrarre immagini da documenti Word in Java utilizzando GroupDocs.Parser Cloud SDK, segui questi passaggi e uno snippet di codice di esempio:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe ParseApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del documento Word di input.
  • Quindi, crea un’istanza della classe ImagesOptions().
  • Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
  • Creare ora un’istanza della classe ImagesRequest() e passare il parametro ImagesOptions.
  • Infine, ottieni risultati chiamando il metodo ParseApi.images() e passando il parametro ImagesRequest.

Il seguente esempio di codice mostra come estrarre tutte le immagini da un documento Word online in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Come estrarre immagini da un documento Word in Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrai immagini specifiche da un file Word in Java utilizzando il numero di pagina

In questa sezione, scriveremo passaggi e un frammento di codice di esempio per estrarre immagini specifiche da un documento Word a livello di codice in Java:

  • Innanzitutto, importa le classi richieste nel tuo file Java.
  • In secondo luogo, crea un’istanza della classe ParseApi.
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • Successivamente, imposta il percorso del file Word come input.
  • Quindi, crea un’istanza della classe ImagesOptions().
  • Successivamente, assegna fileInfo all’opzione immagine setFileInfo.
  • Quindi, fornisci i valori setStartPageNumber e setCountPagesToExtract.
  • Creare ora un’istanza della classe ImagesRequest() e passare il parametro ImagesOptions.
  • Infine, ottieni i risultati chiamando il metodo ParseApi.images() e passando il parametro ImagesRequest.

Il seguente esempio di codice mostra come estrarre immagini specifiche da un file Word per intervallo di pagine in Java utilizzando l’API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Estrai immagini da un file Word online per intervallo di pagine in Java.
public class App {

	public static void main(String[] args) {
		
		// Crea un'istanza dell'API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Preparare le impostazioni
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Ottieni il percorso del file di output
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Estrattore di immagini online gratuito

Qual è il modo migliore per estrarre immagini da Word online gratuitamente? Prova un analizzatore di documenti Word online per estrarre immagini da Word. Questo strumento Word Parser è sviluppato utilizzando la suddetta libreria di parser Java.

Conclusione

In conclusione, GroupDocs.Parser Cloud SDK è un’ottima soluzione per estrarre immagini da documenti Word, risparmiando tempo e fatica garantendo risultati accurati. Quanto segue è ciò che hai imparato da questo articolo:

  • come estrarre tutte le immagini da Word DOCX in modo programmatico in Java utilizzando l’API REST;
  • come estrarre immagini specifiche da documenti Word in Java utilizzando l’API REST;
  • e strumento di estrazione di immagini online per estrarre immagini da documenti Word.

Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub.

Infine, continuiamo a scrivere nuovi articoli di blog su diversi formati di file e ad analizzarli utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli ultimi aggiornamenti.

Fai una domanda

In caso di domande su come estrarre le immagini dai documenti, non esitate a contattarci tramite il nostro forum.

Domande frequenti

Come posso analizzare i documenti di Word in Java?

Per estrarre immagini o testo, devi prima caricare e analizzare il documento Word utilizzando GroupDocs.Parser Cloud SDK. Questo processo comporta la specifica del percorso del file e la chiamata al metodo Parse per analizzare i documenti.

GroupDocs.Parser Cloud SDK può estrarre immagini da altri formati di documenti?

Sì, GroupDocs.Parser Cloud SDK for Java supporta l’estrazione di immagini da vari formati di documenti, tra cui Word, PDF, Excel, PowerPoint e molti altri.

GroupDocs.Parser Cloud SDK può estrarre più immagini da un singolo documento Word?

Sì, l’SDK può estrarre più immagini da un singolo documento Word, fornendoti tutte le immagini contenute nel documento.

GroupDocs.Parser Cloud SDK conserva la qualità dell’immagine originale durante il processo di estrazione?

Sì, GroupDocs.Parser Cloud SDK for Java preserva la qualità dell’immagine originale durante l’estrazione delle immagini dai documenti Word.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: