Snažíte se extrahovat konkrétní stránky z dokumentu Word v Javě? Při práci s velkými dokumenty aplikace Word může být extrahování konkrétních stránek z velkého dokumentu aplikace Word náročný úkol. Naštěstí vám GroupDocs.Merger Cloud SDK pro Java pomáhá tento proces usnadnit. V tomto článku prozkoumáme, jak extrahovat stránky ze souboru Word v Javě pomocí GroupDocs.Merger Cloud SDK pro Javu.
Tento článek bude obsahovat následující témata:
- Java REST API pro extrahování stránek dokumentu Word - instalace SDK
- Extrahujte stránky z dokumentů aplikace Word v Javě pomocí přesných čísel stránek
- Extrahujte stránky ze souborů Word v Javě pomocí rozsahu čísel stránek
Java REST API pro extrahování stránek dokumentu Word – instalace SDK
GroupDocs.Merger Cloud SDK for Java je výkonné rozhraní API, které umožňuje vývojářům slučovat, rozdělovat, měnit pořadí, extrahovat a manipulovat s dokumenty a soubory v cloudu. Poskytuje snadný, spolehlivý a rychlý způsob správy stránek dokumentů a jejich obsahu. Je kompatibilní s nejpopulárnějšími formáty souborů, jako jsou PDF, Word, Excel, HTML, PowerPoint a mnoho dalších. Tato výkonná SDK se snadno používá a lze ji integrovat do aplikace založené na jazyku Java, aby se automatizoval proces manipulace se soubory.
Můžete si buď stáhnout soubor JAR API, nebo jej nainstalovat pomocí Maven přidáním následujícího úložiště a závislosti do souboru pom.xml vašeho projektu:
Úložiště Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Mavenova závislost:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-merger-cloud</artifactId>
<version>23.2</version>
<scope>compile</scope>
</dependency>
Nyní se musíte zaregistrovat pro bezplatný zkušební účet nebo zakoupit plán předplatného na webu GroupDocs, abyste získali svůj klíč API. Jakmile budete mít ID klienta a tajný klíč klienta, přidejte níže uvedený fragment kódu do aplikace založené na jazyce Java:
# Získejte své client_id a client_secret z https://dashboard.groupdocs.cloud po registraci.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Extrahujte stránky z dokumentů aplikace Word v Javě pomocí přesných čísel stránek
Nyní, když jsme nastavili naše prostředí, podívejme se, jak používat GroupDocs.Merger Cloud SDK pro Java k extrahování stránek z dokumentu aplikace Word. Zde jsou kroky:
Nahrajte soubory
Nejprve nahrajte dokument Word do cloudu pomocí příkladu kódu uvedeného níže:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Nahrajte soubor do cloudového úložiště pomocí Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.docx");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.docx", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
V důsledku toho bude nahraný soubor aplikace Word dostupný v sekce souborů vašeho řídicího panelu v cloudu.
Extrahujte stránky z dokumentů aplikace Word v Javě
V této části probereme kroky a ukázkový úryvek kódu, jak extrahovat stránky z dokumentu Word pomocí GroupDocs.Merger Cloud SDK pro Java:
- Nejprve importujte požadované třídy do souboru Java.
- Za druhé vytvořte instanci třídy PagesApi.
- Zatřetí vytvořte instanci třídy FileInfo.
- Poté nastavte cestu ke zdrojovému vstupnímu souboru.
- Nyní vytvořte instanci třídy ExtractOptions().
- Poté definujte kolekci setFileInfo, setOutputPath a setPages ve formátu pole.
- Nyní vytvořte instanci třídy ExtractRequest() a předejte parametr ExtractOptions.
- Nakonec extrahujte stránky DOCX voláním metody extract() PagesApi a předáním parametru ExtractRequest.
Následující fragment kódu ukazuje, jak extrahovat stránky dokumentu Word do nového souboru v Javě pomocí REST API:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Extrahujte stránky z dokumentu Word v Javě pomocí přesných čísel stránek.
public class App {
public static void main(String[] args) {
// Vytvořte instanci rozhraní API stránek.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Připravte nastavení
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.docx");
options.setPages(Arrays.asList(3, 5, 7));
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Získejte cestu k výstupnímu souboru
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Stáhnout soubor
Výše uvedená ukázka kódu uloží extrahované stránky dokumentů aplikace Word do cloudu. Můžete si jej stáhnout pomocí následující ukázky kódu:
package com.groupdocsdev.classes;
import java.io.File;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Stáhněte si soubor z cloudového úložiště pomocí Java
public class App {
public static void main(String[] args) {
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\multipage-documents\\output-sample-file.docx", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.out.println("Expected response type is downloadFile: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extrahujte stránky ze souborů Word v Javě pomocí rozsahu čísel stránek
V této části poskytneme kroky a příklad úryvku kódu, jak extrahovat konkrétní stránky z dokumentu aplikace Word podle přesného rozsahu čísel stránek:
- Nejprve importujte požadované třídy do souboru Java.
- Za druhé vytvořte instanci třídy PagesApi.
- Zatřetí vytvořte instanci třídy FileInfo.
- Poté nastavte cestu ke zdrojovému vstupnímu souboru.
- Nyní vytvořte instanci třídy ExtractOptions().
- Poté definujte možnosti extrahování setFileInfo, setOutputPath, setStartPageNumber a setEndPageNumber.
- Dále nastavte možnosti stránky setRangeMode na EVENPAGES.
- Nyní vytvořte instanci třídy ExtractRequest() a předejte parametr ExtractOptions.
- Nakonec extrahujte stránky voláním metody extract() PagesApi a předáním parametru ExtractRequest.
Následující fragment kódu ukazuje, jak extrahovat stránky souboru Word použitím rozsahu a režimu stránek pomocí Java:
package com.groupdocsdev.classes;
import java.util.Arrays;
import com.groupdocs.cloud.merger.client.*;
import com.groupdocs.cloud.merger.model.*;
import com.groupdocs.cloud.merger.model.requests.*;
import com.groupdocs.cloud.merger.api.*;
import com.groupdocs.cloud.merger.client.ApiException;
// Extrahujte stránky ze souboru aplikace Word v Javě pomocí rozsahu čísel stránek.
public class App {
public static void main(String[] args) {
// Vytvořte instanci rozhraní API stránek.
PagesApi apiInstance = new PagesApi(configuration);
try {
// Připravte nastavení
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ExtractOptions options = new ExtractOptions();
options.setFileInfo(fileInfo);
options.setOutputPath("java-testing/output-sample-file.docx");
options.setStartPageNumber(1);
options.setEndPageNumber(10);
options.setRangeMode(PageOptions.RangeModeEnum.EVENPAGES);
ExtractRequest request = new ExtractRequest(options);
DocumentResult response = apiInstance.extract(request);
// Získejte cestu k výstupnímu souboru
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Zdarma online extraktor dokumentů Word
Jak extrahovat stránky dokumentu Word zdarma? Chcete-li zdarma extrahovat konkrétní stránky z dokumentů aplikace Word, vyzkoušejte online extraktor stránek aplikace Word. Tento online nástroj pro extrakci stránek Word je vyvinut pomocí výše uvedených rozhraní Groupdocs.Merger Cloud API.
Závěr
Na závěr, GroupDocs.Merger Cloud SDK pro Java je skvělou volbou, která může vývojářům pomoci extrahovat stránky z dokumentů Wordu online. V tomto článku jste se naučili následující:
- jak extrahovat stránky z dokumentů aplikace Word podle čísla stránky pomocí Java;
- programově nahrávat a stahovat dokument Word do cloudu;
- extrahovat stránky Word DOCX v Javě pomocí přesného rozsahu čísel stránek;
- a extrahujte stránky z Wordu zdarma pomocí online nástroje pro extrakci stránek Wordu.
Kromě toho také poskytujeme sekci Reference API, která vám umožní vizualizovat a komunikovat s našimi rozhraními API přímo prostřednictvím prohlížeče. Úplný zdrojový kód Java SDK je volně dostupný na Github. Zkontrolujte prosím sadu GroupDocs.Merger Cloud SDK pro Java Příklady zde.
Kromě toho vám doporučujeme, abyste se řídili naší příručkou Začínáme, kde najdete podrobné kroky a použití rozhraní API.
Konečně stále píšeme nové blogové příspěvky o různých operacích s dokumenty pomocí REST API. Proto se prosím ozvěte pro pravidelné aktualizace.
Položit otázku
Máte-li jakékoli dotazy ohledně extrahování stránek dokumentu, neváhejte se nás zeptat na Free Support Forum.
Nejčastější dotazy
Jak extrahuji stránky z dokumentu Word online v Javě?
Pomocí GroupDocs.Merger Cloud SDK for Java můžete extrahovat stránky ze souboru aplikace Word a zefektivnit tak svůj pracovní postup.
Mohu extrahovat konkrétní stránky pomocí REST API?
Ano, můžete zadat číslo stránky ve formátu pole pro extrahování konkrétních stránek pomocí GroupDocs.Merger Cloud SDK for Java.
Jaké formáty souborů podporuje GroupDocs.Merger Cloud SDK pro Java?
GroupDocs.Merger Cloud SDK pro Java podporuje široký rozsah formátů souborů, včetně Wordu, Excelu, JPG, PowerPointu, PDF, HTML a mnoha dalších.
Mohu extrahovat více stránek ze souboru Word pomocí GroupDocs.Merger Cloud SDK pro Java?
Ano, můžete extrahovat více stránek z dokumentu Word pomocí GroupDocs.Merger Cloud SDK for Java zadáním rozsahu stránek, které chcete extrahovat.
Viz také
Zde je několik souvisejících článků, které by vám mohly pomoci:
- Rozdělte dokumenty aplikace Word do samostatných souborů v Javě
- Jak sloučit dokumenty Word (DOC, DOCX) v Javě
- Jak rozdělit snímky PowerPoint PPT nebo PPTX v Pythonu
- Extrahujte konkrétní stránky z PDF pomocí Pythonu
- Extrahujte stránky z dokumentů aplikace Word pomocí rozhraní Rest API
- Sloučení souborů PowerPoint PPT/PPTX online pomocí REST API
- Jak rozdělit dokumenty aplikace Word do samostatných souborů pomocí Node.js
- Sloučit soubory PowerPoint do jednoho v Javě | Sloučení dokumentů Java
- Java Document Splitting API - Rozdělte PDF do více souborů v Javě