Převeďte PDF na text v Javě pomocí GroupDocs.Conversion Cloud REST API.

Jak programově převést PDF na textový soubor v Javě

PDF neboli Portable Document Format je oblíbený formát pro sdílení dokumentů, ale může být obtížné pracovat s PDF, pokud jde o úpravy nebo extrahování textu. Zde je potřeba převést dokumenty PDF na soubory text. Převedením souborů PDF na textové soubory lze text lépe zpřístupnit, upravit a prohledávat. V tomto příspěvku na blogu představíme, jak převést PDF na textový soubor programově v Javě pomocí REST API.

V tomto tutoriálu se budou probírat následující témata:

Java PDF to Text Conversion REST API – SDK Instalace

Pro převod dokumentů PDF na textové soubory budu používat GroupDocs.Conversion Cloud SDK for Java. Jedná se o platformově nezávislé řešení REST API pro převod dokumentů a obrázků bez závislosti na softwaru třetí strany. Umožňuje také převést více než 50 typů dokumentů a obrázků jakéhokoli podporovaného formátu souboru do libovolného formátu, který potřebujete. Můžete rychle převádět dokumenty z jednoho formátu do druhého, jako je Word, PDF, PowerPoint, Excel, HTML, CAD, rastrové obrázky atd.

Můžete stáhnout soubor JAR API nebo nainstalovat pomocí konfigurací Maven. Přidejte úložiště a závislost do souboru POM.xml vašeho projektu. Níže jsou uvedeny pokyny pro Maven:

Úložiště Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Mavenova závislost:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Po integraci sady GroupDocs.Conversion Cloud SDK do vašeho projektu Java si Zaregistrujte se založte účet. Než začnete postupovat podle kroků a dostupných příkladů kódu, shromážděte své ID klienta a tajný klíč klienta z dashboard. Před použitím je také důležité zkontrolovat dokumentaci rozhraní API a limity použití. Jakmile budete mít své ID a tajemství, zadejte níže uvedený kód:

# Získejte své client_id a client_secret z https://dashboard.groupdocs.cloud po bezplatné registraci.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Jak převést dokument PDF na soubor TXT v Javě pomocí REST API

Níže jsou uvedeny kroky pro převod PDF na textový dokument:

Nahrajte soubor

Nejprve nahrajte dokument PDF do cloudového úložiště pomocí fragmentu kódu, jak je uvedeno níže:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Nahrajte soubor do cloudového úložiště pomocí Java
public class App {

  public static void main(String[] args) {
        
    // Vytvořte instanci rozhraní API pro převod          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

V důsledku toho bude nahraný soubor PDF k dispozici v sekce souborů vašeho řídicího panelu v cloudu.

Převést PDF do textového formátu v Javě

Tato část je o tom, jak převést dokument PDF na textový soubor programově v jazyce Java podle následujících kroků:

  • Nejprve vytvořte instanci třídy ConvertApi.
  • Za druhé vytvořte instanci třídy ConvertSettings.
  • Dále zadejte název cloudového úložiště.
  • Nastavte cestu vstupního souboru PDF a formát výstupního souboru jako „txt“.
  • Poté vytvořte instanci třídy TxtConvertOptions třídy.
  • Volitelně nastavte různé možnosti převodu, jako je setFromPage, setPagesCount atd.
  • Nyní nastavte možnosti převodu a cestu k výstupnímu souboru pomocí instance ConvertSettings.
  • Poté vytvořte instanci třídy ConvertDocumentRequest a předejte parametr ConvertSettings.
  • Nakonec zavolejte metodu convert\document() a předejte parametr ConvertDocumentRequest.

Následující fragment kódu ukazuje, jak převést soubor PDF na textový soubor v Javě pomocí REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Jak převést dokument PDF na soubor TXT v Javě pomocí REST API
public class App {

  public static void main(String[] args) {
    
    // Vytvořte instanci rozhraní API pro převod
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Připravte nastavení převodu
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // převést do zadaného formátu
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java převést PDF na textový soubor Programově v

Převeďte PDF na textový soubor programově v Javě.

Stáhněte si převedený soubor

Výše uvedená ukázka kódu uloží převedený textový soubor do cloudu. Můžete si jej stáhnout pomocí následujícího fragmentu kódu:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Stáhněte si soubor z cloudového úložiště v Javě
public class App {

  public static void main(String[] args) {
        
    // Vytvořte instanci rozhraní API pro převod          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Zdarma online převodník PDF na text

Jak převést PDF na textové soubory online zdarma? Vyzkoušejte prosím online převodník PDF na text a vytvořte textový soubor z dokumentu PDF zdarma. Tento převodník je vyvíjen pomocí výše zmíněného API formátu PDF do textového formátu.

convert pdf to text online

Závěr

Tím se dostáváme na konec tohoto blogového příspěvku. Z tohoto článku jste se dozvěděli následující:

  • jak programově převádět PDF na textové soubory v Javě pomocí GroupDocs.Conversion Cloud REST API;
  • programově nahrát soubor PDF do cloudu a poté stáhnout převedený textový soubor z cloudu;
  • a online převod PDF na text pomocí bezplatného textového převodníku PDF.

GroupDocs.Conversion Cloud REST API je navíc snadno použitelný a výkonný nástroj pro převod PDF na textové soubory v Javě. Poskytuje také sekci API Reference, která vám umožní vizualizovat a komunikovat s našimi API přímo prostřednictvím prohlížeče. Úplný zdrojový kód Java SDK je volně dostupný na Github. Zkontrolujte sadu GroupDocs.Conversion Cloud SDK pro Java Příklady zde.

Kromě toho vám doporučujeme, abyste si prostudovali naši příručku Začínáme.

Konečně stále píšeme nové články na blogu o převodech různých formátů souborů pomocí REST API. Proto nás prosím kontaktujte pro pravidelné aktualizace.

Položit otázku

V případě jakýchkoli dotazů ohledně převodníku PDF na text nás neváhejte kontaktovat na bezplatném fóru podpory 22.

Nejčastější dotazy

Jak nastavím GroupDocs.Conversion Cloud REST API v Javě?

Chcete-li nastavit GroupDocs.Conversion Cloud REST API v Javě, budete se muset zaregistrovat pro účet, získat klíč API a poté integrovat API do svého projektu Java pomocí poskytnuté sady SDK .

Mohu převést více dokumentů PDF na textové soubory najednou?

Ano, můžete převést více PDF na textové soubory najednou pomocí GroupDocs.Conversion Cloud REST API předáním řady cest k souborům nebo URL.

Mohu převést PDF chráněné heslem na textové soubory?

Ano, soubory PDF chráněné heslem můžete převést na textové soubory pomocí GroupDocs.Conversion Cloud REST API zadáním hesla jako parametru v požadavku API.

Jak převést PDF na text online zdarma?

Online převodník PDF dokumentů na text umožňuje zdarma převádět PDF na text. Při převodu postupujte podle níže uvedených podrobných pokynů:

  • Otevřít bezplatný online převodník PDF na textový soubor
  • Klepnutím do oblasti přetažení souboru nahrajte soubor PDF nebo přetáhněte soubor PDF.
  • Klikněte na tlačítko Převést nyní, bezplatný online převodník PDF na text převede PDF na textový soubor.
  • Odkaz na stažení výstupního textového souboru bude k dispozici okamžitě po převodu souboru PDF na text.

Jaký je nejlepší způsob, jak převést PDF na textový soubor v Javě?

Nejlepší způsob, jak převést PDF na textový soubor v Javě, je použít knihovnu nebo API speciálně navrženou pro tento účel, jako je GroupDocs.Conversion Cloud REST API.

Jak převést PDF na text ve Windows?

Navštivte tento odkaz a stáhněte si offline převodník souborů PDF na textové soubory pro Windows. Tento převodník dokumentů PDF na textový soubor lze použít k rychlému převodu PDF na text v systému Windows jediným kliknutím.

Viz také

Pokud se chcete dozvědět o souvisejících tématech, doporučujeme vám navštívit následující články: