PDF oder Portable Document Format ist ein beliebtes Format zum Teilen von Dokumenten, aber es kann schwierig sein, mit PDFs zu arbeiten, wenn es um das Bearbeiten oder Extrahieren von Text geht. Hier müssen Sie PDF Dokumente in Text Dateien konvertieren. Durch das Konvertieren von PDFs in Textdateien kann der Text leichter zugänglich, bearbeitbar und durchsuchbar gemacht werden. In diesem Blogbeitrag stellen wir vor, wie man PDF Dateien mithilfe der REST-API programmgesteuert in Java in eine Textdatei konvertieren kann.
Die folgenden Themen werden in diesem Tutorial behandelt:
- Java PDF in Text Conversion REST API und SDK-Installation
- So konvertieren Sie ein PDF Dokument in eine TXT-Datei in Java mithilfe der REST-API
Java PDF in Text-Konvertierung REST API – SDK-Installation
Zum Konvertieren von PDF Dokumenten in Textdateien verwende ich GroupDocs.Conversion Cloud SDK für Java. Es handelt sich um eine plattformunabhängige REST-API-Lösung für die Dokumenten und Bildkonvertierung, ohne auf Software von Drittanbietern angewiesen zu sein. Außerdem können Sie über 50 Arten von Dokumenten und Bildern aller unterstützten Dateiformate in jedes gewünschte Format konvertieren. Sie können Dokumente schnell von einem Format in ein anderes konvertieren, z. B. Word, PDF, PowerPoint, Excel, HTML, CAD, Rasterbilder usw.
Sie können die JAR-Datei der API herunterladen oder mit Maven-Konfigurationen installieren. Fügen Sie der POM.xml-Datei Ihres Projekts ein Repository und eine Abhängigkeit hinzu. Nachfolgend finden Sie die Anweisungen für Maven:
Maven-Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven-Dependency:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Nachdem Sie das GroupDocs.Conversion Cloud SDK in Ihr Java-Projekt integriert haben, melden Sie sich für ein Konto an. Sammeln Sie Ihre Client-ID und Ihr Client-Geheimnis vom Dashboard, bevor Sie mit dem Befolgen der Schritte und verfügbaren Codebeispiele beginnen. Außerdem ist es wichtig, vor der Verwendung die API Dokumentation und die Nutzungsbeschränkungen zu überprüfen. Bitte geben Sie den unten angezeigten Code ein, sobald Sie Ihre ID und Ihr Geheimnis haben:
# Holen Sie sich nach der kostenlosen Registrierung Ihre client_id und client_secret von https://dashboard.groupdocs.cloud.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
So konvertieren Sie ein PDF Dokument in eine TXT-Datei in Java mithilfe der REST-API
Im Folgenden sind die Schritte zum Konvertieren einer PDF-Datei in ein Textdokument aufgeführt:
- Hochladen des PDF Dokuments in die Cloud
- Konvertieren PDF-Datei in Text in Java
- Herunterladen der konvertierten Datei
Laden Sie die Datei hoch
Laden Sie zunächst das PDF Dokument mit dem unten angegebenen Code-Snippet in den Cloud-Speicher hoch:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Laden Sie die Datei mit Java in den Cloud-Speicher hoch
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Konvertierungs-API
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Dadurch ist die hochgeladene PDF-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.
PDF in Java in Textformat konvertieren
In diesem Abschnitt geht es darum, wie Sie ein PDF Dokument programmgesteuert in Java in eine Textdatei konvertieren, indem Sie die folgenden Schritte ausführen:
- Erstellen Sie zunächst eine Instanz der Klasse ConvertApi.
- Zweitens erstellen Sie eine Instanz der ConvertSettings Klasse.
- Geben Sie als Nächstes den Namen des Cloud-Speichers an.
- Legen Sie den Pfad der Eingabe-PDF-Datei und das Ausgabedateiformat auf „txt“ fest.
- Erstellen Sie dann eine Instanz der TxtConvertOptions Klasse.
- Legen Sie optional verschiedene Konvertierungsoptionen wie setFromPage, setPagesCount usw. fest.
- Legen Sie nun die Konvertierungsoptionen und den Ausgabedateipfad mithilfe der ConvertSettings-Instanz fest.
- Erstellen Sie anschließend eine Instanz der Klasse „ConvertDocumentRequest“ und übergeben Sie den Parameter „ConvertSettings“.
- Rufen Sie abschließend die Methode convert\document() auf und übergeben Sie den Parameter ConvertDocumentRequest.
Der folgende Codeausschnitt zeigt, wie man eine PDF-Datei in Java mithilfe der REST-API in eine Textdatei konvertiert:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// So konvertieren Sie ein PDF Dokument in eine TXT-Datei in Java mithilfe der REST-API
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Konvertierungs-API
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Konvertierungseinstellungen vorbereiten
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// in das angegebene Format konvertieren
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Laden Sie die konvertierte Datei herunter
Das obige Codebeispiel speichert die konvertierte Textdatei in der Cloud. Sie können es mit dem folgenden Codeausschnitt herunterladen:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Laden Sie die Datei aus dem Cloud-Speicher in Java herunter
public class App {
public static void main(String[] args) {
// Erstellen Sie eine Instanz der Konvertierungs-API
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Kostenloser Online-PDF zu Text-Konverter
Wie konvertiert man online kostenlos PDF Dateien in Textdateien? Bitte probieren Sie einen Online-PDF zu Text-Konverter aus, um kostenlos eine Textdatei aus einem PDF Dokument zu erstellen. Dieser Konverter wird unter Verwendung der oben genannten PDF-in-Text-Format-API entwickelt.
Abschluss
Damit sind wir am Ende dieses Blogbeitrags angelangt. Folgendes haben Sie aus diesem Artikel gelernt:
- wie man PDFs mithilfe der GroupDocs.Conversion Cloud REST API programmgesteuert in Textdateien in Java konvertiert;
- Laden Sie die PDF-Datei programmgesteuert in die Cloud hoch und laden Sie dann die konvertierte Textdatei aus der Cloud herunter.
- und konvertieren Sie PDF online mit einem kostenlosen PDF-Textkonverter in Text.
Darüber hinaus ist die GroupDocs.Conversion Cloud REST API ein benutzerfreundliches und leistungsstarkes Tool zum Konvertieren von PDFs in Textdateien in Java. Es bietet außerdem einen Abschnitt API-Referenz, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen kommunizieren können. Der vollständige Quellcode des Java SDK ist auf Github frei verfügbar. Bitte überprüfen Sie das GroupDocs.Conversion Cloud SDK für Java Beispiele hier.
Darüber hinaus empfehlen wir Ihnen, unseren Leitfaden „Erste Schritte“ zu lesen.
Schließlich schreiben wir weiterhin neue Blogartikel über die Konvertierung verschiedener Dateiformate mithilfe der REST-API. Bitte kontaktieren Sie uns für regelmäßige Updates.
Stelle eine Frage
Bei Fragen zum PDF zu Text-Konverter können Sie uns gerne im kostenlosen Support-Forum kontaktieren.
FAQs
Wie richte ich die GroupDocs.Conversion Cloud REST API in Java ein?
Um die GroupDocs.Conversion Cloud REST API in Java einzurichten, müssen Sie sich für ein Konto anmelden, einen API-Schlüssel erhalten und dann die API mithilfe des bereitgestellten SDK in Ihr Java-Projekt integrieren. .
Kann ich mehrere PDF Dokumente gleichzeitig in Textdateien konvertieren?
Ja, Sie können mit der Cloud-REST-API GroupDocs.Conversion mehrere PDFs gleichzeitig in Textdateien konvertieren, indem Sie ein Array von Dateipfaden oder URLs übergeben.
Kann ich passwortgeschützte PDF Dateien in Textdateien konvertieren?
Ja, Sie können passwortgeschützte PDFs mit der Cloud-REST-API GroupDocs.Conversion in Textdateien konvertieren, indem Sie das Passwort als Parameter in der API-Anfrage übergeben.
Wie konvertiert man PDF kostenlos online in Text?
Mit dem Online-Konverter von PDF Dokumenten in Text27 können Sie PDF Dateien kostenlos in Text umwandeln. Bitte folgen Sie zur Konvertierung der unten aufgeführten Schritt-für-Schritt-Anleitung:
- Öffnen Sie kostenloser PDF zu Text-Dateikonverter online
- Klicken Sie in den Dateiablagebereich, um eine PDF-Datei hochzuladen, oder ziehen Sie eine PDF-Datei per Drag & Drop.
- Klicken Sie auf die Schaltfläche „Jetzt konvertieren“. Der kostenlose Online-PDF zu Text-Konverter wandelt die PDF-Datei in eine Textdatei um.
- Der Download-Link der ausgegebenen Textdatei ist sofort nach der Konvertierung der PDF-Datei in Text verfügbar.
Was ist der beste Weg, eine PDF-Datei in Java in eine Textdatei zu konvertieren?
Der beste Weg, eine PDF-Datei in Java in eine Textdatei zu konvertieren, ist die Verwendung einer speziell für diesen Zweck entwickelten Bibliothek oder API, wie z. B. der GroupDocs.Conversion Cloud REST API.
Wie konvertiert man PDF in Text unter Windows?
Bitte besuchen Sie diesen Link, um einen Offline-PDF zu Textdatei-Konverter für Windows herunterzuladen. Mit diesem PDF Dokument zu Textdatei-Konverter können Sie PDF Dateien unter Windows schnell und mit einem einzigen Klick in Text konvertieren.
Siehe auch
Wenn Sie mehr über verwandte Themen erfahren möchten, empfehlen wir Ihnen den Besuch der folgenden Artikel:
- Konvertieren Sie EXCEL in JSON und JSON in EXCEL in Python
- So konvertieren Sie CSV in JSON und JSON in CSV in Python
- Konvertierung von MSG und EML Dateien in PDF mithilfe der Python-Konvertierungs-API
- Konvertieren Sie Word Dokumente mithilfe der REST-API in Python in PDF
- So konvertieren Sie PDF in Python mithilfe der REST-API in Excel
- Konvertieren Sie PDF mit dem Python SDK in ein bearbeitbares Word Dokument
- So konvertieren Sie PDF mithilfe einer REST-API in Python in PPTX
- Konvertieren Sie Word in Markdown und Markdown in Word in Python
- Konvertieren Sie PDF Dateien in das PNG und PNG-in das PDF-Format mit Java
- So konvertieren Sie PowerPoint PPT PPTX mit Java in HTML