Wyodrębnij obrazy z dokumentów PDF w Javie

PDF File Parser – Wyodrębnij obrazy z plików PDF online w Javie

PDF(Portable Document Format) to powszechnie używany format pliku do udostępniania i zachowywania dokumentów online. Często zawiera różnorodne typy treści, w tym tekst, obrazy, tabele i inne. Wydobycie określonej treści z plików PDF, takiej jak obrazy, może być trudnym zadaniem bez niezawodnych narzędzi lub biblioteki. Jednym z takich narzędzi jest GroupDocs.Parser Cloud SDK dla Java, które zapewnia płynny i wydajny sposób na wydobycie obrazów z plików PDF. W tym artykule pokażemy, jak wydobyć obrazy z plików PDF w Javie za pomocą REST API.

Następujące tematy zostaną omówione w tym artykule:

Java REST API do oddzielania obrazów od PDF i instalacja SDK
Jak wyodrębnić wszystkie obrazy z plików PDF w Javie za pomocą REST API
Extract Specific Images from PDF Files in Java using Page Number

Java REST API na separację obrazów z PDF oraz instalacja SDK

GroupDocs.Parser Cloud SDK for Java to potężna i wszechstronna biblioteka Java, która oferuje prosty i efektywny sposób na analizowanie i wyodrębnianie danych z różnych formatów dokumentów, w tym plików PDF. Oferuje szeroki zakres funkcji do analizy dokumentów, umożliwiając programistom wyodrębnianie obrazów, tekstu, metadanych i innych treści. GroupDocs.Parser oferuje również SDK dla C#.NET, Java, PHP, Ruby i Python jako swoich członków rodziny parserów dokumentów dla interfejsów API w chmurze.

Aby rozpocząć, musisz dołączyć GroupDocs.Parser Cloud SDK do swojego projektu Java. Możesz albo download plik JAR API, albo zainstalować go za pomocą Mavena, dodając następujące repozytorium i zależność do pliku pom.xml swojego projektu:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Następnie musisz sign up na bezpłatne konto próbne lub purchase a subscription plan na stronie internetowej GroupDocs i get your API key. Gdy będziesz mieć Client Id i Client Secret, dodaj poniższy fragment kodu do aplikacji opartej na Javie:

# Uzyskaj swój clientid i clientsecret z https://dashboard.groupdocs.cloud po rejestracji.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Jak wyodrębnić wszystkie obrazy z plików PDF w Javie przy użyciu REST API

Teraz napiszmy kroki oraz przykładowy fragment kodu do wyodrębniania obrazów z plików PDF za pomocą GroupDocs.Parser Cloud SDK dla Java:

Najpierw zaimportuj wymagane klasy do swojego pliku Java.
Po drugie, utwórz instancję klasy ParseApi.
Po trzecie, utwórz instancję klasy FileInfo.
Następnie ustaw ścieżkę do dokumentu PDF wejściowego.
Następnie utwórz instancję klasy ImagesOptions().
Następnie przypisz fileInfo do opcji obrazu setFileInfo.
Teraz stwórz instancję klasy ImagesRequest() i przekaż parametr ImagesOptions.
Na koniec uzyskaj wyniki, wywołując metodę ParseApi.images() i przekazując parametr ImagesRequest.

Następujący przykład kodu pokazuje, jak wyodrębnić wszystkie obrazy z pliku PDF online w Javie, używając interfejsu API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// How to extract images from a PDF file in Java.
public class App {

	public static void main(String[] args) {
		
		// Utwórz instancję interfejsu API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Przygotuj ustawienia
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Wyodrębnij konkretne obrazy z plików PDF w Java za pomocą numeru strony

W tej sekcji przedstawimy kroki oraz fragment kodu do programowego wyodrębniania konkretnych obrazów z pliku PDF w języku Java:

Najpierw zaimportuj wymagane klasy do swojego pliku Java.
Po drugie, utwórz instancję klasy ParseApi.
Po trzecie, utwórz instancję klasy FileInfo.
Następnie ustaw ścieżkę do dokumentu PDF wejściowego.
Następnie utwórz instancję klasy ImagesOptions().
Następnie przypisz fileInfo do opcji obrazu setFileInfo.
Następnie podaj wartości setStartPageNumber i setCountPagesToExtract.
Teraz stwórz instancję klasy ImagesRequest() i przekaż parametr ImagesOptions.
Na koniec uzyskaj wyniki, wywołując metodę ParseApi.images() i przekazując parametr ImagesRequest.

Następujący przykład kodu pokazuje, jak wyodrębnić konkretne obrazy z pliku PDF w zakresie stron w Javie, używając REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// Extract images from a PDF file online by page range in Java.
public class App {

	public static void main(String[] args) {
		
		// Utwórz instancję interfejsu API Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Przygotuj ustawienia
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Darmowy internetowy ekstraktor obrazów

Jak najlepszy sposób na wyodrębnienie obrazów z pliku PDF online za darmo? Spróbuj online PDF File parser, aby wyodrębnić obrazy z plików PDF. Oprogramowanie PDF Parser zostało opracowane przy użyciu Java, jak wspomniano powyżej w bibliotece parsera.

Wniosek

Podsumowując, GroupDocs.Parser Cloud SDK dla Java oferuje niezawodne i efektywne rozwiązanie do łatwego wyodrębniania obrazów z plików PDF. Oto czego nauczyłeś się z tego artykułu:

How to extract all images from PDF files programmatically in Java using REST API;
How to extract specific images from PDF documents in Java using REST API;
Narzędzie online do wyodrębniania obrazów z dokumentów PDF.

Dodatkowo, możesz dowiedzieć się więcej o GroupDocs.Parser Cloud API, korzystając z dokumentacji. Oferujemy także sekcję API Reference, która pozwala wizualizować i interactować z naszymi API bezpośrednio przez przeglądarkę. Pełny kod źródłowy SDK Java jest dostępny za darmo na Github.

Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.

Zadaj pytanie

W przypadku jakichkolwiek pytań dotyczących analizy dokumentów, prosimy o kontakt z nami za pośrednictwem naszego forum.

FAQs

How do I parse PDF files using Java?

Aby wyodrębnić obrazy, tekst lub metadane, najpierw musisz załadować i sparsować dokument PDF, używając GroupDocs.Parser Cloud SDK. Proces ten polega na określeniu ścieżki do pliku i wywołaniu metody Parse, aby sparsować pliki PDF.

Does GroupDocs.Parser Cloud SDK for Java support other file formats besides PDF?

Tak, oprócz plików PDF, GroupDocs.Parser Cloud SDK for Java wspiera ekstrakcję obrazów z różnych formatów dokumentów, w tym Word, Excel, PowerPoint, HTML i wielu innych.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

Tak, możesz wyodrębnić wszystkie obrazy z pliku PDF, używając GroupDocs.Parser Cloud SDK for Java.

Zobacz także

Oto kilka powiązanych artykułów, które mogą okazać się pomocne:

Java REST API na separację obrazów z PDF oraz instalacja SDK#

Jak wyodrębnić wszystkie obrazy z plików PDF w Javie przy użyciu REST API#

Wyodrębnij konkretne obrazy z plików PDF w Java za pomocą numeru strony#

Darmowy internetowy ekstraktor obrazów#

Wniosek#

Zadaj pytanie#

FAQs#

Zobacz także#