PDF neboli Portable Document Format je oblíbený formát pro sdílení dokumentů, ale může být obtížné pracovat s PDF, pokud jde o úpravy nebo extrahování textu. Zde je potřeba převést dokumenty PDF na soubory text. Převedením souborů PDF na textové soubory lze text lépe zpřístupnit, upravit a prohledávat. V tomto příspěvku na blogu představíme, jak převést PDF na textový soubor programově v Javě pomocí REST API.
V tomto tutoriálu se budou probírat následující témata:
- Java PDF do Text Conversion REST API a instalace SDK
- Jak převést dokument PDF na soubor TXT v Javě pomocí REST API
Java PDF to Text Conversion REST API – SDK Instalace
Pro převod dokumentů PDF na textové soubory budu používat GroupDocs.Conversion Cloud SDK for Java. Jedná se o platformově nezávislé řešení REST API pro převod dokumentů a obrázků bez závislosti na softwaru třetí strany. Umožňuje také převést více než 50 typů dokumentů a obrázků jakéhokoli podporovaného formátu souboru do libovolného formátu, který potřebujete. Můžete rychle převádět dokumenty z jednoho formátu do druhého, jako je Word, PDF, PowerPoint, Excel, HTML, CAD, rastrové obrázky atd.
Můžete stáhnout soubor JAR API nebo nainstalovat pomocí konfigurací Maven. Přidejte úložiště a závislost do souboru POM.xml vašeho projektu. Níže jsou uvedeny pokyny pro Maven:
Úložiště Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Mavenova závislost:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Po integraci sady GroupDocs.Conversion Cloud SDK do vašeho projektu Java si Zaregistrujte se založte účet. Než začnete postupovat podle kroků a dostupných příkladů kódu, shromážděte své ID klienta a tajný klíč klienta z dashboard. Před použitím je také důležité zkontrolovat dokumentaci rozhraní API a limity použití. Jakmile budete mít své ID a tajemství, zadejte níže uvedený kód:
# Získejte své client_id a client_secret z https://dashboard.groupdocs.cloud po bezplatné registraci.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Jak převést dokument PDF na soubor TXT v Javě pomocí REST API
Níže jsou uvedeny kroky pro převod PDF na textový dokument:
Nahrajte soubor
Nejprve nahrajte dokument PDF do cloudového úložiště pomocí fragmentu kódu, jak je uvedeno níže:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Nahrajte soubor do cloudového úložiště pomocí Java
public class App {
public static void main(String[] args) {
// Vytvořte instanci rozhraní API pro převod
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
V důsledku toho bude nahraný soubor PDF k dispozici v sekce souborů vašeho řídicího panelu v cloudu.
Převést PDF do textového formátu v Javě
Tato část je o tom, jak převést dokument PDF na textový soubor programově v jazyce Java podle následujících kroků:
- Nejprve vytvořte instanci třídy ConvertApi.
- Za druhé vytvořte instanci třídy ConvertSettings.
- Dále zadejte název cloudového úložiště.
- Nastavte cestu vstupního souboru PDF a formát výstupního souboru jako „txt“.
- Poté vytvořte instanci třídy TxtConvertOptions třídy.
- Volitelně nastavte různé možnosti převodu, jako je setFromPage, setPagesCount atd.
- Nyní nastavte možnosti převodu a cestu k výstupnímu souboru pomocí instance ConvertSettings.
- Poté vytvořte instanci třídy ConvertDocumentRequest a předejte parametr ConvertSettings.
- Nakonec zavolejte metodu convert\document() a předejte parametr ConvertDocumentRequest.
Následující fragment kódu ukazuje, jak převést soubor PDF na textový soubor v Javě pomocí REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Jak převést dokument PDF na soubor TXT v Javě pomocí REST API
public class App {
public static void main(String[] args) {
// Vytvořte instanci rozhraní API pro převod
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Připravte nastavení převodu
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// převést do zadaného formátu
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Stáhněte si převedený soubor
Výše uvedená ukázka kódu uloží převedený textový soubor do cloudu. Můžete si jej stáhnout pomocí následujícího fragmentu kódu:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Stáhněte si soubor z cloudového úložiště v Javě
public class App {
public static void main(String[] args) {
// Vytvořte instanci rozhraní API pro převod
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Zdarma online převodník PDF na text
Jak převést PDF na textové soubory online zdarma? Vyzkoušejte prosím online převodník PDF na text a vytvořte textový soubor z dokumentu PDF zdarma. Tento převodník je vyvíjen pomocí výše zmíněného API formátu PDF do textového formátu.
Závěr
Tím se dostáváme na konec tohoto blogového příspěvku. Z tohoto článku jste se dozvěděli následující:
- jak programově převádět PDF na textové soubory v Javě pomocí GroupDocs.Conversion Cloud REST API;
- programově nahrát soubor PDF do cloudu a poté stáhnout převedený textový soubor z cloudu;
- a online převod PDF na text pomocí bezplatného textového převodníku PDF.
GroupDocs.Conversion Cloud REST API je navíc snadno použitelný a výkonný nástroj pro převod PDF na textové soubory v Javě. Poskytuje také sekci API Reference, která vám umožní vizualizovat a komunikovat s našimi API přímo prostřednictvím prohlížeče. Úplný zdrojový kód Java SDK je volně dostupný na Github. Zkontrolujte sadu GroupDocs.Conversion Cloud SDK pro Java Příklady zde.
Kromě toho vám doporučujeme, abyste si prostudovali naši příručku Začínáme.
Konečně stále píšeme nové články na blogu o převodech různých formátů souborů pomocí REST API. Proto nás prosím kontaktujte pro pravidelné aktualizace.
Položit otázku
V případě jakýchkoli dotazů ohledně převodníku PDF na text nás neváhejte kontaktovat na bezplatném fóru podpory 22.
Nejčastější dotazy
Jak nastavím GroupDocs.Conversion Cloud REST API v Javě?
Chcete-li nastavit GroupDocs.Conversion Cloud REST API v Javě, budete se muset zaregistrovat pro účet, získat klíč API a poté integrovat API do svého projektu Java pomocí poskytnuté sady SDK .
Mohu převést více dokumentů PDF na textové soubory najednou?
Ano, můžete převést více PDF na textové soubory najednou pomocí GroupDocs.Conversion Cloud REST API předáním řady cest k souborům nebo URL.
Mohu převést PDF chráněné heslem na textové soubory?
Ano, soubory PDF chráněné heslem můžete převést na textové soubory pomocí GroupDocs.Conversion Cloud REST API zadáním hesla jako parametru v požadavku API.
Jak převést PDF na text online zdarma?
Online převodník PDF dokumentů na text umožňuje zdarma převádět PDF na text. Při převodu postupujte podle níže uvedených podrobných pokynů:
- Otevřít bezplatný online převodník PDF na textový soubor
- Klepnutím do oblasti přetažení souboru nahrajte soubor PDF nebo přetáhněte soubor PDF.
- Klikněte na tlačítko Převést nyní, bezplatný online převodník PDF na text převede PDF na textový soubor.
- Odkaz na stažení výstupního textového souboru bude k dispozici okamžitě po převodu souboru PDF na text.
Jaký je nejlepší způsob, jak převést PDF na textový soubor v Javě?
Nejlepší způsob, jak převést PDF na textový soubor v Javě, je použít knihovnu nebo API speciálně navrženou pro tento účel, jako je GroupDocs.Conversion Cloud REST API.
Jak převést PDF na text ve Windows?
Navštivte tento odkaz a stáhněte si offline převodník souborů PDF na textové soubory pro Windows. Tento převodník dokumentů PDF na textový soubor lze použít k rychlému převodu PDF na text v systému Windows jediným kliknutím.
Viz také
Pokud se chcete dozvědět o souvisejících tématech, doporučujeme vám navštívit následující články:
- Převeďte EXCEL na JSON a JSON na EXCEL v Pythonu
- Jak převést CSV na JSON a JSON na CSV v Pythonu
- MSG a EML soubory Konverze do PDF pomocí Python Conversion API
- Převeďte dokumenty Word do PDF pomocí REST API v Pythonu
- Jak převést PDF do Excelu v Pythonu pomocí REST API
- Převeďte PDF na upravitelný dokument Word pomocí Python SDK
- Jak převést PDF na PPTX pomocí REST API v Pythonu
- Převeďte Word na Markdown a Markdown na Word v Pythonu
- Převeďte soubor PDF do formátu PNG a PNG do formátu PDF pomocí Java
- Jak převést PowerPoint PPT PPTX do HTML pomocí Java