PDF lub Portable Document Format to popularny format udostępniania dokumentów, ale praca z plikami PDF może być trudna, jeśli chodzi o edycję lub wyodrębnianie tekstu. Tutaj musisz przekonwertować dokumenty PDF na pliki text. Konwertowanie plików PDF na pliki tekstowe może sprawić, że tekst będzie łatwiej dostępny, edytowalny i przeszukiwalny. W tym poście na blogu przedstawimy, jak programowo przekonwertować plik PDF na plik tekstowy w Javie przy użyciu interfejsu API REST.
W tym samouczku zostaną omówione następujące tematy:
- Java PDF do konwersji tekstu REST API i instalacja SDK
- Jak przekonwertować dokument PDF na plik TXT w Javie przy użyciu interfejsu API REST
Java PDF do konwersji tekstu REST API — instalacja pakietu SDK
Do konwersji dokumentów PDF na pliki tekstowe będę używał GroupDocs.Conversion Cloud SDK for Java. Jest to niezależne od platformy rozwiązanie REST API do konwersji dokumentów i obrazów bez zależności od oprogramowania innych firm. Umożliwia także konwersję ponad 50 rodzajów dokumentów i obrazów dowolnego obsługiwanego formatu pliku do dowolnego potrzebnego formatu. Możesz szybko konwertować dokumenty z jednego formatu na inny, taki jak Word, PDF, PowerPoint, Excel, HTML, CAD, obrazy rastrowe itp.
Możesz pobrać plik JAR API lub zainstalować przy użyciu konfiguracji Mavena. Dodaj repozytorium i zależności do pliku POM.xml projektu. Poniżej znajdują się instrukcje dla Mavena:
Repozytorium Mavena:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Zależność od Mavena:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Po zintegrowaniu pakietu SDK GroupDocs.Conversion Cloud z projektem Java, Zarejestruj się, aby założyć konto. Zbierz swój identyfikator klienta i klucz tajny klienta z pulpitu nawigacyjnego, zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu. Przed użyciem ważne jest również sprawdzenie dokumentacji API i ograniczeń użytkowania. Po uzyskaniu identyfikatora i tajnego kodu wprowadź poniższy kod:
# Uzyskaj identyfikator klienta i klucz klienta z https://dashboard.groupdocs.cloud po bezpłatnej rejestracji.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Jak przekonwertować dokument PDF na plik TXT w Javie przy użyciu interfejsu API REST
Poniżej przedstawiono kroki konwersji pliku PDF na dokument tekstowy, jak wspomniano poniżej:
Prześlij plik
Najpierw prześlij dokument PDF do magazynu w chmurze, korzystając z fragmentu kodu podanego poniżej:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Prześlij plik do Cloud Storage przy użyciu języka Java
public class App {
public static void main(String[] args) {
// Utwórz instancję interfejsu API konwersji
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
W rezultacie przesłany plik PDF będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego w chmurze.
Konwertuj PDF na format tekstowy w Javie
W tej sekcji opisano, jak programowo przekonwertować dokument PDF na plik tekstowy w Javie, wykonując poniższe czynności:
- Najpierw utwórz instancję klasy ConvertApi.
- Po drugie, utwórz instancję klasy ConvertSettings.
- Następnie podaj nazwę magazynu w chmurze.
- Ustaw ścieżkę wejściowego pliku PDF i format pliku wyjściowego jako „txt”.
- Następnie utwórz instancję klasy TxtConvertOptions.
- Opcjonalnie ustaw różne opcje konwersji, takie jak setFromPage, setPagesCount itp.
- Teraz ustaw opcje konwersji i ścieżkę pliku wyjściowego za pomocą instancji ConvertSettings.
- Następnie utwórz instancję klasy ConvertDocumentRequest i przekaż parametr ConvertSettings.
- Na koniec wywołaj metodę convert\document() i przekaż parametr ConvertDocumentRequest.
Poniższy fragment kodu pokazuje, jak przekonwertować plik PDF na plik tekstowy w Javie za pomocą REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Jak przekonwertować dokument PDF na plik TXT w Javie przy użyciu interfejsu API REST
public class App {
public static void main(String[] args) {
// Utwórz instancję interfejsu API konwersji
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Przygotuj ustawienia konwersji
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// przekonwertować do określonego formatu
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Pobierz przekonwertowany plik
Powyższy przykładowy kod zapisze przekonwertowany plik tekstowy w chmurze. Możesz go pobrać za pomocą następującego fragmentu kodu:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Pobierz plik z Cloud Storage w Javie
public class App {
public static void main(String[] args) {
// Utwórz instancję interfejsu API konwersji
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Darmowy internetowy konwerter plików PDF na tekst
Jak bezpłatnie przekonwertować pliki PDF na pliki tekstowe online? Wypróbuj konwerter plików PDF na tekst online, aby bezpłatnie utworzyć plik tekstowy z dokumentu PDF. Ten konwerter został opracowany przy użyciu wyżej wymienionego interfejsu API formatu PDF do formatu tekstowego.
Wniosek
To prowadzi nas do końca tego wpisu na blogu. Oto, czego dowiedziałeś się z tego artykułu:
- jak programowo konwertować pliki PDF na pliki tekstowe w Javie przy użyciu GroupDocs.Conversion Cloud REST API;
- programowo przesłać plik PDF do chmury, a następnie pobrać przekonwertowany plik tekstowy z chmury;
- i online konwertuj pliki PDF na tekst za pomocą bezpłatnego konwertera tekstu PDF.
Dodatkowo GroupDocs.Conversion Cloud REST API to łatwe w użyciu i wydajne narzędzie do konwersji plików PDF na pliki tekstowe w Javie. Zapewnia również sekcję API Reference, która umożliwia wizualizację naszych interfejsów API i komunikowanie się z nimi bezpośrednio przez przeglądarkę. Pełny kod źródłowy pakietu Java SDK jest bezpłatnie dostępny na Github. Sprawdź GroupDocs.Conversion Cloud SDK for Java Przykłady tutaj.
Ponadto zachęcamy do zapoznania się z naszym Przewodnikiem wprowadzającym.
Wreszcie, wciąż piszemy nowe artykuły na blogu na temat konwersji różnych formatów plików przy użyciu REST API. Prosimy o kontakt w celu uzyskania regularnych aktualizacji.
Zadać pytanie
W przypadku jakichkolwiek pytań dotyczących konwertera plików PDF na tekst, prosimy o kontakt na bezpłatnym wsparciu forum.
Często zadawane pytania
Jak skonfigurować GroupDocs.Conversion Cloud REST API w Javie?
Aby skonfigurować GroupDocs.Conversion Cloud REST API w Javie, musisz zarejestrować się w celu założenia konta, uzyskać klucz API, a następnie zintegrować interfejs API z projektem Java za pomocą dostarczonego pakietu SDK .
Czy mogę konwertować wiele dokumentów PDF na pliki tekstowe jednocześnie?
Tak, możesz konwertować wiele plików PDF na pliki tekstowe jednocześnie za pomocą GroupDocs.Conversion Cloud REST API, przekazując tablicę ścieżek plików lub adresów URL.
Czy mogę konwertować pliki PDF chronione hasłem na pliki tekstowe?
Tak, możesz konwertować pliki PDF chronione hasłem na pliki tekstowe za pomocą GroupDocs.Conversion Cloud REST API, przekazując hasło jako parametr w żądaniu API.
Jak bezpłatnie przekonwertować plik PDF na tekst online?
Konwerter dokumentów PDF online na tekst umożliwia bezpłatną konwersję plików PDF na tekst. Postępuj zgodnie z instrukcjami krok po kroku podanymi poniżej w celu konwersji:
- Otwórz darmowy konwerter plików PDF na pliki tekstowe online
- Kliknij wewnątrz obszaru upuszczania pliku, aby przesłać plik PDF lub przeciągnij i upuść plik PDF.
- Kliknij przycisk Konwertuj teraz, darmowy internetowy konwerter plików PDF na tekst przekształci plik PDF w plik tekstowy.
- Link do pobrania wyjściowego pliku tekstowego będzie dostępny natychmiast po przekonwertowaniu pliku PDF na tekst.
Jaki jest najlepszy sposób konwersji pliku PDF na plik tekstowy w Javie?
Najlepszym sposobem konwersji pliku PDF na plik tekstowy w Javie jest użycie biblioteki lub interfejsu API specjalnie zaprojektowanego do tego celu, takiego jak GroupDocs.Conversion Cloud REST API.
Jak przekonwertować plik PDF na tekst w systemie Windows?
Odwiedź ten link, aby pobrać konwerter offline plików PDF na pliki tekstowe dla systemu Windows. Ten konwerter plików PDF na pliki tekstowe może być używany do szybkiej konwersji plików PDF na tekst w systemie Windows za pomocą jednego kliknięcia.
Zobacz też
Jeśli chcesz dowiedzieć się o powiązanych tematach, zalecamy odwiedzenie następujących artykułów:
- Konwertuj EXCEL na JSON i JSON na EXCEL w Python
- Jak przekonwertować CSV na JSON i JSON na CSV w Python
- Pliki MSG i EML Konwersja do formatu PDF przy użyciu Python Conversion API
- Konwertuj dokumenty programu Word na format PDF za pomocą interfejsu API REST w języku Python
- Jak przekonwertować PDF do Excela w Python przy użyciu REST API
- Konwertuj PDF na edytowalny dokument Word za pomocą Python SDK
- Jak przekonwertować plik PDF na PPTX przy użyciu interfejsu API REST w języku Python
- Konwertuj Word na Markdown i Markdown na Word w Python
- Konwertuj plik PDF na format PNG i PNG na format PDF za pomocą języka Java
- Jak przekonwertować PowerPoint PPT PPTX na HTML za pomocą Java