PDF o Portable Document Format è un formato popolare per la condivisione di documenti, ma può essere difficile lavorare con i PDF quando si tratta di modificare o estrarre il testo. Qui è dove devi convertire i documenti PDF in file text. La conversione di PDF in file di testo può rendere il testo più accessibile, modificabile e ricercabile. In questo post del blog, introdurremo come convertire i PDF in file di testo in modo programmatico in Java utilizzando l’API REST.
In questo tutorial verranno trattati i seguenti argomenti:
- Java PDF in Text Conversion API REST e installazione SDK
- Come convertire un documento PDF in un file TXT in Java utilizzando l’API REST
Java PDF in Text Conversion API REST - Installazione SDK
Per convertire i documenti PDF in file di testo, utilizzerò GroupDocs.Conversion Cloud SDK per Java. È una soluzione API REST indipendente dalla piattaforma per la conversione di documenti e immagini senza dipendere da alcun software di terze parti. Ti consente inoltre di convertire oltre 50 tipi di documenti e immagini di qualsiasi formato di file supportato in qualsiasi formato di cui hai bisogno. Puoi convertire rapidamente documenti da un formato all’altro come Word, PDF, PowerPoint, Excel, HTML, CAD, immagini raster, ecc.
Puoi scaricare il file JAR dell’API o installarlo utilizzando le configurazioni Maven. Aggiungi repository e dipendenza al file POM.xml del tuo progetto. Di seguito sono riportate le istruzioni per Maven:
Repository esperto:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Dipendenza Maven:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Dopo aver integrato GroupDocs.Conversion Cloud SDK nel tuo progetto Java, Iscriviti per un account. Raccogli il tuo ID client e il tuo segreto client dalla dashboard prima di iniziare a seguire i passaggi e gli esempi di codice disponibili. Inoltre, è importante controllare la documentazione API e i limiti di utilizzo prima di utilizzarla. Inserisci il codice mostrato di seguito una volta che hai il tuo ID e segreto:
# Ottieni il tuo client_id e client_secret da https://dashboard.groupdocs.cloud dopo la registrazione gratuita.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Come convertire un documento PDF in un file TXT in Java utilizzando l’API REST
Di seguito sono riportati i passaggi per convertire un PDF in un documento di testo come indicato di seguito:
Carica il file
Innanzitutto, carica il documento PDF nell’archivio cloud utilizzando lo snippet di codice come indicato di seguito:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Carica il file su Cloud Storage utilizzando Java
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API convert
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Di conseguenza, il file PDF caricato sarà disponibile nella sezione file della dashboard sul cloud.
Converti PDF in formato testo in Java
Questa sezione spiega come convertire un documento PDF in un file di testo in modo programmatico in Java seguendo i passaggi seguenti:
- Innanzitutto, crea un’istanza della classe ConvertApi.
- In secondo luogo, creare un’istanza della classe ConvertSettings.
- Successivamente, fornisci il nome dell’archivio cloud.
- Impostare il percorso del file PDF di input e il formato del file di output come “txt”.
- Quindi, crea un’istanza della classe TxtConvertOptions.
- Facoltativamente, imposta varie opzioni di conversione come setFromPage, setPagesCount, ecc.
- Ora imposta le opzioni di conversione e il percorso del file di output utilizzando l’istanza ConvertSettings.
- Successivamente, crea un’istanza della classe ConvertDocumentRequest e passa il parametro ConvertSettings.
- Infine, chiama il metodo convert\document() e passa il parametro ConvertDocumentRequest.
Il seguente frammento di codice mostra come convertire un file PDF in un file di testo in Java utilizzando l’API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Come convertire un documento PDF in un file TXT in Java utilizzando l'API REST
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API convert
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Preparare le impostazioni di conversione
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// convertire nel formato specificato
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Scarica il file convertito
L’esempio di codice precedente salverà il file di testo convertito nel cloud. Puoi scaricarlo utilizzando il seguente frammento di codice:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Scarica il file dal Cloud Storage in Java
public class App {
public static void main(String[] args) {
// Crea un'istanza dell'API convert
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Convertitore online gratuito da PDF a testo
Come convertire PDF in file di testo online gratuitamente? Prova un convertitore online da PDF a testo per creare gratuitamente un file di testo da un documento PDF. Questo convertitore è sviluppato utilizzando la suddetta API PDF in formato testo.
Conclusione
Questo ci porta alla fine di questo post sul blog. Quanto segue è ciò che hai imparato da questo articolo:
- come convertire in modo programmatico i PDF in file di testo in Java utilizzando l’API REST di GroupDocs.Conversion Cloud;
- caricare in modo programmatico il file PDF nel cloud e quindi scaricare il file di testo convertito dal cloud;
- e convertire online PDF in testo utilizzando un convertitore di testo PDF gratuito.
Inoltre, GroupDocs.Conversion Cloud REST API è uno strumento potente e facile da usare per convertire i PDF in file di testo in Java. Fornisce inoltre una sezione API Reference che consente di visualizzare e comunicare con le nostre API direttamente tramite il browser. Il codice sorgente completo di Java SDK è disponibile gratuitamente su GitHub. Controlla GroupDocs.Conversion Cloud SDK per Java Esempi qui.
Inoltre, ti invitiamo a fare riferimento alla nostra Guida introduttiva.
Infine, continuiamo a scrivere nuovi articoli sul blog sulle conversioni di diversi formati di file utilizzando l’API REST. Quindi, ti preghiamo di contattarci per aggiornamenti regolari.
Fai una domanda
Per qualsiasi domanda sul convertitore da PDF a testo, non esitare a contattarci sul supporto gratuito forum.
Domande frequenti
Come si configura l’API REST di GroupDocs.Conversion Cloud in Java?
Per configurare l’API REST di GroupDocs.Conversion Cloud in Java, dovrai iscriverti per un account, ottenere una chiave API e quindi integrare l’API nel tuo progetto Java utilizzando l’SDK fornito .
Posso convertire più documenti PDF in file di testo contemporaneamente?
Sì, puoi convertire più PDF in file di testo contemporaneamente utilizzando GroupDocs.Conversion Cloud REST API passando una serie di percorsi di file o URL.
Posso convertire PDF protetti da password in file di testo?
Sì, puoi convertire PDF protetti da password in file di testo utilizzando GroupDocs.Conversion Cloud REST API passando la password come parametro nella richiesta API.
Come convertire PDF in testo online gratuitamente?
Convertitore online di documenti PDF in testo ti consente di convertire gratuitamente PDF in testo. Si prega di seguire le istruzioni dettagliate fornite di seguito per la conversione:
- Apri convertitore online gratuito da PDF a file di testo
- Fare clic all’interno dell’area di rilascio del file per caricare un file PDF o trascinare e rilasciare un file PDF.
- Fai clic sul pulsante Converti ora, il convertitore online gratuito da PDF a testo trasformerà il PDF in un file di testo.
- Il collegamento per il download del file di testo di output sarà disponibile immediatamente dopo la conversione del file PDF in testo.
Qual è il modo migliore per convertire un PDF in un file di testo in Java?
Il modo migliore per convertire un PDF in un file di testo in Java è utilizzare una libreria o API appositamente progettata per questo scopo, come GroupDocs.Conversion Cloud REST API.
Come convertire PDF in testo su Windows?
Visita questo collegamento per scaricare un convertitore offline da PDF a file di testo per Windows. Questo convertitore da documento PDF a file di testo può essere utilizzato per convertire rapidamente PDF in testo su Windows, con un solo clic.
Guarda anche
Se vuoi approfondire argomenti correlati ti consigliamo di visitare i seguenti articoli:
- Converti EXCEL in JSON e JSON in EXCEL in Python
- Come convertire CSV in JSON e JSON in CSV in Python
- File MSG ed EML Conversione in PDF utilizzando l’API di conversione Python
- Converti documenti Word in PDF utilizzando l’API REST in Python
- Come convertire PDF in Excel in Python utilizzando l’API REST
- Converti PDF in documento Word modificabile con Python SDK
- Come convertire PDF in PPTX utilizzando un’API REST in Python
- Converti Word in Markdown e Markdown in Word in Python
- Converti file PDF in PNG e PNG in formato PDF utilizzando Java
- Come convertire PowerPoint PPT PPTX in HTML utilizzando Java