
Analiza dokumentów jest kluczowym zadaniem w wielu branżach, w których wymagana jest ekstrakcja danych z różnych formatów dokumentów. Pracując z Word dokumentami, ekstrakcja obrazów może być szczególnie przydatna w takich przypadkach jak analiza treści, rozpoznawanie obrazów czy wizualizacja danych. Ręczne wyodrębnianie obrazów z dużych dokumentów Word może być czasochłonne. Dlatego automatyzacja procesu ekstrakcji obrazów może zaoszczędzić czas i wysiłek. W tym artykule pokażemy, jak programowo wyodrębnić obrazy z dokumentów Word w Java.
Następujące tematy będą omówione w tym artykule:
- Java REST API do wyodrębniania obrazów z dokumentów Word i instalacja SDK
- Jak wyodrębnить wszystkie obrazy z dokumentów Word w Javie za pomocą REST API
- Wyodrębnij konkretne obrazy z pliku Word w Javie za pomocą numeru strony
Java REST API do wyodrębniania obrazów z dokumentów Word oraz instalacja SDK
GroupDocs.Parser Cloud SDK for Java to potężna biblioteka Java, która zapewnia prosty i efektywny sposób na analizę i ekstrakcję danych z różnych formatów dokumentów, w tym dokumentów Word. Oferuje szeroki zakres funkcji do parsowania dokumentów, umożliwiając programistom ekstrakcję obrazów, tekstu, metadanych i nie tylko. GroupDocs.Parser zapewnia także C#.NET, Java, PHP, Ruby i Python SDK jako członków swojej rodziny parserów dokumentów dla interfejsów API w chmurze.
Aby rozpocząć, musisz dołączyć GroupDocs.Parser Cloud SDK do swojego projektu Java. Możesz albo pobrać plik JAR API, albo zainstalować go za pomocą Mavena, dodając następujące repozytorium i zależność do pliku pom.xml swojego projektu:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
Następnie musisz sign up na darmowe konto próbne lub purchase a subscription plan na stronie internetowej GroupDocs i get your API key. Gdy już masz Client Id i Client Secret, dodaj poniższy fragment kodu do aplikacji opartej na Javie:
# Uzyskaj swój clientid i clientsecret z https://dashboard.groupdocs.cloud po rejestracji.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Jak wyodrębnić wszystkie obrazy z dokumentów Word w Javie za pomocą REST API
Aby wyodrębnić obrazy z dokumentów Word w Javie za pomocą GroupDocs.Parser Cloud SDK, wykonaj następujące kroki oraz przykład kodu:
- Najpierw zaimportuj wymagane klasy do swojego pliku Java.
- Po drugie, utwórz instancję klasy ParseApi.
- Po trzecie, utwórz instancję klasy FileInfo.
- Następnie ustaw ścieżkę do dokumentu Word.
- Następnie stwórz instancję klasy ImagesOptions().
- Następnie przypisz fileInfo do opcji obrazu setFileInfo.
- Teraz stwórz instancję klasy ImagesRequest() i przekaż parametr ImagesOptions.
- Na koniec, uzyskaj wyniki, wywołując metodę ParseApi.images() i przekazując parametr ImagesRequest.
Poniższy przykład kodu pokazuje, jak wyodrębnić wszystkie obrazy z dokumentu Word online w Javie, używając interfejsu API REST:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// How to extract images from a Word document in Java.
public class App {
public static void main(String[] args) {
// Utwórz instancję interfejsu API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Przygotuj ustawienia
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Wyodrębnij konkretne obrazy z pliku Word w Javie, korzystając z numeru strony
W tej sekcji napiszemy kroki oraz przykładowy fragment kodu do programatycznego wyodrębniania konkretnych obrazów z dokumentu Word w języku Java:
- Najpierw zaimportuj wymagane klasy do swojego pliku Java.
- Po drugie, utwórz instancję klasy ParseApi.
- Po trzecie, utwórz instancję klasy FileInfo.
- Następnie ustaw ścieżkę do pliku Word jako wejście.
- Następnie stwórz instancję klasy ImagesOptions().
- Następnie przypisz fileInfo do opcji obrazu setFileInfo.
- Następnie podaj wartości setStartPageNumber i setCountPagesToExtract.
- Teraz stwórz instancję klasy ImagesRequest() i przekaż parametr ImagesOptions.
- W końcu uzyskaj wyniki, wywołując metodę ParseApi.images() i przekazując parametr ImagesRequest.
Poniższy przykład kodu pokazuje, jak wyodrębnić konkretne obrazy z pliku Word w zakresie stron w Javie za pomocą REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// Wyodrębnij obrazy z pliku Word online według zakresu stron w Javie.
public class App {
public static void main(String[] args) {
// Utwórz instancję API Parse
ParseApi apiInstance = new ParseApi(configuration);
try {
// Przygotuj ustawienia
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Darmowy internetowy extractor obrazów
What is the best way to extract images from Word online for free? Please try an online Word document parser to extract images from Word. This Word Parser tool is developed using the above-mentioned Java parser library.
Wniosek
W podsumowaniu, GroupDocs.Parser Cloud SDK jest doskonałym rozwiązaniem do wyodrębniania obrazów z dokumentów Word, oszczędzając czas i wysiłek przy jednoczesnym zapewnieniu dokładnych wyników. Poniżej znajduje się to, czego nauczyłeś się z tego artykułu:
- how to extract all images from Word DOCX programmatically in Java using REST API;
- how to extract specific images from Word documents in Java using REST API;
- i narzędzie do ekstrakcji obrazów online do wydobywania obrazów z dokumentów Word.
Dodatkowo, możesz dowiedzieć się więcej o GroupDocs.Parser Cloud API, korzystając z documentation. Oferujemy również sekcję API Reference, która umożliwia wizualizację i interakcję z naszymi API bezpośrednio przez przeglądarkę. Pełny kod źródłowy Java SDK jest dostępny bezpłatnie na Github.
Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.
Ask a question
W przypadku jakichkolwiek pytań dotyczących wyodrębniania obrazów z dokumentów, prosimy o kontakt z nami za pośrednictwem naszego forum.
FAQs
Jak mogę analizować dokumenty Word w Javie?
Aby wyodrębnić obrazy lub tekst, najpierw musisz załadować i sparsować dokument Word przy użyciu GroupDocs.Parser Cloud SDK. Proces ten obejmuje określenie ścieżki do pliku i wywołanie metody Parse, aby sparsować dokumenty.
Can GroupDocs.Parser Cloud SDK extract images from other document formats?
Tak, GroupDocs.Parser Cloud SDK for Java wspiera ekstrakcję obrazów z różnych formatów dokumentów, w tym Word, PDF, Excel, PowerPoint i wielu innych.
Can the GroupDocs.Parser Cloud SDK extract multiple images from a single Word document?
Tak, SDK może wyodrębnić wiele obrazów z jednego dokumentu Word, dostarczając Ci wszystkie obrazy zawarte w dokumencie.
Czy zestaw SDK GroupDocs.Parser Cloud zachowuje oryginalną jakość obrazu podczas procesu ekstrakcji?
Tak, GroupDocs.Parser Cloud SDK for Java zachowuje oryginalną jakość obrazu podczas wyodrębniania obrazów z dokumentów Word.
Zobacz także
Oto kilka powiązanych artykułów, które mogą okazać się pomocne: