PDF File Parser – Extrahujte obrázky ze souborů PDF online v Javě

PDF(Portable Document Format) je široce používaný formát souborů pro sdílení a uchovávání dokumentů online. Často obsahuje různé typy obsahu, včetně textu, obrázků, tabulek a dalších. Extrahování specifického obsahu ze souborů PDF, jako jsou obrázky, může být náročný úkol bez spolehlivých nástrojů nebo knihovny. Jedním z takových nástrojů je GroupDocs.Parser Cloud SDK for Java, který poskytuje bezproblémový a efektivní způsob extrahování obrázků ze souborů PDF. V tomto článku si ukážeme, jak extrahovat obrázky ze souborů PDF v Javě pomocí REST API.

Tento článek bude obsahovat následující témata:

Java REST API pro oddělení obrázků z PDF a instalace SDK

GroupDocs.Parser Cloud SDK for Java je výkonná a všestranná knihovna Java, která poskytuje jednoduchý a efektivní způsob, jak analyzovat a extrahovat data z různých formátů dokumentů, včetně souborů PDF. Nabízí širokou škálu funkcí pro analýzu dokumentů a umožňuje vývojářům extrahovat obrázky, text, metadata a další obsah. GroupDocs.Parser také poskytuje sady C#.NET, Java, PHP, Ruby a Python SDK jako členové rodiny analyzátorů dokumentů pro Cloud API.

Chcete-li začít, musíte do svého projektu Java zahrnout sadu GroupDocs.Parser Cloud SDK. Můžete si buď stáhnout soubor JAR API, nebo jej nainstalovat pomocí Maven přidáním následujícího úložiště a závislosti do souboru pom.xml vašeho projektu:

Úložiště Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Mavenova závislost:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Dále se musíte zaregistrovat pro bezplatný zkušební účet nebo zakoupit plán předplatného na webu GroupDocs a získat klíč API. Jakmile budete mít ID klienta a tajný klíč klienta, přidejte níže uvedený fragment kódu do aplikace založené na jazyce Java:

# Získejte své client_id a client_secret z https://dashboard.groupdocs.cloud po registraci.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Jak extrahovat všechny obrázky ze souborů PDF v Javě pomocí REST API

Nyní si napíšeme kroky a ukázkový úryvek kódu pro extrahování obrázků ze souborů PDF pomocí GroupDocs.Parser Cloud SDK pro Java:

  • Nejprve importujte požadované třídy do souboru Java.
  • Za druhé vytvořte instanci třídy ParseApi.
  • Zatřetí vytvořte instanci třídy FileInfo.
  • Dále nastavte cestu ke vstupnímu dokumentu PDF.
  • Poté vytvořte instanci třídy ImagesOptions().
  • Dále přiřaďte fileInfo k možnosti obrázku setFileInfo.
  • Nyní vytvořte instanci třídy ImagesRequest() a předejte parametr ImagesOptions.
  • Nakonec získáte výsledky voláním metody ParseApi.images() a předáním parametru ImagesRequest.

Následující ukázka kódu ukazuje, jak extrahovat všechny obrázky ze souboru PDF online v Javě pomocí REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Jak extrahovat obrázky ze souboru PDF v Javě.
public class App {

	public static void main(String[] args) {
		
		// Vytvořte instanci rozhraní API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Připravte nastavení
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Získejte cestu k výstupnímu souboru
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extrahujte konkrétní obrázky ze souborů PDF v Javě pomocí čísla stránky

V této části poskytneme kroky a úryvek kódu pro extrahování konkrétních obrázků ze souboru PDF programově v Javě:

  • Nejprve importujte požadované třídy do souboru Java.
  • Za druhé vytvořte instanci třídy ParseApi.
  • Zatřetí vytvořte instanci třídy FileInfo.
  • Dále nastavte cestu ke vstupnímu dokumentu PDF.
  • Poté vytvořte instanci třídy ImagesOptions().
  • Dále přiřaďte fileInfo k možnosti obrázku setFileInfo.
  • Poté zadejte hodnoty setStartPageNumber a setCountPagesToExtract.
  • Nyní vytvořte instanci třídy ImagesRequest() a předejte parametr ImagesOptions.
  • Nakonec získáte výsledky voláním metody ParseApi.images() a předáním parametru ImagesRequest.

Následující ukázka kódu ukazuje, jak extrahovat konkrétní obrázky ze souboru PDF podle rozsahu stránek v Javě pomocí REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extrahujte obrázky ze souboru PDF online podle rozsahu stránek v Javě.
public class App {

	public static void main(String[] args) {
		
		// Vytvořte instanci rozhraní API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Připravte nastavení
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Získejte cestu k výstupnímu souboru
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extraktor online obrázků zdarma

Jaký je nejlepší způsob, jak extrahovat obrázky z PDF online zdarma? Pro extrahování obrázků ze souborů PDF zkuste online analyzátor souborů PDF. Tento software PDF Parser je vyvíjen pomocí knihovny Java, jak je uvedeno výše.

Závěr

Na závěr, GroupDocs.Parser Cloud SDK pro Java poskytuje spolehlivé a efektivní řešení pro snadné extrahování obrázků ze souborů PDF. Z tohoto článku jste se dozvěděli následující:

  • jak extrahovat všechny obrázky ze souborů PDF programově v Javě pomocí REST API;
  • jak extrahovat konkrétní obrázky z dokumentů PDF v Javě pomocí REST API;
  • a online nástroj pro extrakci obrázků pro extrahování obrázků z dokumentů PDF.

Kromě toho se můžete dozvědět více o GroupDocs.Parser Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat naše API a pracovat s nimi přímo prostřednictvím prohlížeče. Úplný zdrojový kód Java SDK je volně dostupný na Github.

A konečně, stále píšeme nové články na blogu o různých formátech souborů a analyzujeme je pomocí REST API. Proto nás prosím kontaktujte pro nejnovější aktualizace.

Položit otázku

V případě, že máte nějaké dotazy ohledně analýzy dokumentů, neváhejte nás kontaktovat prostřednictvím našeho fóra.

Nejčastější dotazy

Jak analyzuji soubory PDF pomocí Java?

Chcete-li extrahovat obrázky, text nebo metadata, musíte nejprve načíst a analyzovat dokument PDF pomocí GroupDocs.Parser Cloud SDK. Tento proces zahrnuje zadání cesty k souboru a volání metody Parse pro analýzu souborů PDF.

Podporuje GroupDocs.Parser Cloud SDK pro Java jiné formáty souborů kromě PDF?

Ano, kromě souborů PDF podporuje GroupDocs.Parser Cloud SDK for Java extrakci obrázků z různých formátů dokumentů, včetně Wordu, Excelu, PowerPointu, HTML a mnoha dalších.

Mohu extrahovat všechny obrázky ze souboru PDF pomocí GroupDocs.Parser Cloud SDK pro Java?

Ano, všechny obrázky můžete extrahovat ze souboru PDF pomocí sady GroupDocs.Parser Cloud SDK for Java.

Viz také

Zde je několik souvisejících článků, které vám mohou pomoci: