使用 GroupDocs.Conversion Cloud REST API 將 PDF 轉換為 Java 中的文本。

如何在 Java 中以編程方式將 PDF 轉換為文本文件

PDF 或便攜式文檔格式是一種流行的文檔共享格式,但在編輯或提取文本時可能很難使用 PDF。這是您需要將 PDF 文檔轉換為 文本 文件的地方。將 PDF 轉換為文本文件可以使文本更易於訪問、編輯和搜索。在這篇博文中,我們將介紹如何使用 REST API 在 Java 中以編程方式將 PDF 轉換為文本文件。

本教程將涵蓋以下主題:

Java PDF 到文本轉換 REST API - SDK 安裝

為了將 PDF 文檔轉換為文本文件,我將使用 GroupDocs.Conversion Cloud SDK for Java。它是一個獨立於平台的 REST API 解決方案,用於文檔和圖像轉換,不依賴於任何第 3 方軟件。它還允許您將任何 支持的文件格式 的 50 多種文檔和圖像轉換為您需要的任何格式。您可以快速將文檔從一種格式轉換為另一種格式,如 Word、PDF、PowerPoint, Excel、HTML、CAD、光柵圖像等。

您可以下載 API 的 JAR 文件或使用 Maven 配置進行安裝。將存儲庫和依賴項添加到項目的 POM.xml 文件中。以下是 Maven 的說明:

Maven 存儲庫:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 依賴項:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

將 GroupDocs.Conversion Cloud SDK 集成到您的 Java 項目後,註冊 一個帳戶。在您開始執行步驟和可用代碼示例之前,從 儀表板 收集您的客戶端 ID 和客戶端密碼。此外,在使用前檢查 API 文檔 和使用限制也很重要。獲得 ID 和密碼後,請輸入下面顯示的代碼:

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取您的 client_id 和 client_secret。

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

如何使用 REST API 在 Java 中將 PDF 文檔轉換為 TXT 文件

以下是將 PDF 轉換為文本文檔的步驟,如下所述:

上傳文件

首先,使用下面給出的代碼片段將 PDF 文檔上傳到雲存儲:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 上傳文件到雲存儲
public class App {

  public static void main(String[] args) {
        
    // 創建轉換 API 的實例          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

因此,上傳的 PDF 文件將在雲端儀表板的 文件部分 中可用。

在 Java 中將 PDF 轉換為文本格式

本節介紹如何按照以下步驟在 Java 中以編程方式將 PDF 文檔轉換為文本文件:

  • 首先,創建一個 ConvertApi 類的實例。
  • 其次,創建 ConvertSettings 類的一個實例。
  • 接下來,提供雲存儲名稱。
  • 設置輸入PDF文件路徑和輸出文件格式為“txt”。
  • 然後,創建 TxtConvertOptions 類的實例。
  • 或者,設置各種轉換選項,如 setFromPage、setPagesCount 等。
  • 現在,使用 ConvertSettings 實例設置轉換選項和輸出文件路徑。
  • 之後,創建 ConvertDocumentRequest 類實例並傳遞 ConvertSettings 參數。
  • 最後,調用 convert\document() 方法並傳遞 ConvertDocumentRequest 參數。

以下代碼片段顯示瞭如何使用 REST API 將 PDF 文件轉換為 Java 中的文本文件:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// 如何使用 REST API 在 Java 中將 PDF 文檔轉換為 TXT 文件
public class App {

  public static void main(String[] args) {
    
    // 創建轉換 API 的實例
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // 準備轉換設置
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // 轉換為指定格式
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java以編程方式將PDF轉換為文本文件

在 Java 中以編程方式將 PDF 轉換為文本文件。

下載轉換後的文件

上面的代碼示例會將轉換後的文本文件保存到雲端。您可以使用以下代碼片段下載它:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 從雲存儲下載文件
public class App {

  public static void main(String[] args) {
        
    // 創建轉換 API 的實例          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

免費在線 PDF 到文本轉換器

如何免費在線將 PDF 轉換為文本文件?請嘗試使用在線 PDF 到文本轉換器 從 PDF 文檔免費創建文本文件。此轉換器是使用上述 PDF 轉換為文本格式的 API 開發的。

convert pdf to text online

結論

這使我們結束了這篇博文。以下是您從本文中學到的內容:

  • 如何使用 GroupDocs.Conversion Cloud REST API 以編程方式將 PDF 轉換為 Java 中的文本文件;
  • 以編程方式將 PDF 文件上傳到雲端,然後從雲端下載轉換後的文本文件;
  • 並使用免費的 PDF 文本轉換器在線將 PDF 轉換為文本。

此外,GroupDocs.Conversion Cloud REST API 是一種易於使用且功能強大的工具,用於將 PDF 轉換為 Java 中的文本文件。它還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之通信。 Java SDK 的完整源代碼可在 Github 上免費獲得。請查看 GroupDocs.Conversion Cloud SDK for Java 此處示例

此外,我們鼓勵您參考我們的入門指南

最後,我們繼續撰寫有關使用 REST API 進行不同文件格式轉換的新博客文章。因此,請聯繫我們以獲取定期更新。

問一個問題

有關 PDF 到文本轉換器的任何疑問,請隨時通過免費支持 論壇 與我們聯繫。

常見問題

如何在 Java 中設置 GroupDocs.Conversion Cloud REST API?

要在 Java 中設置 GroupDocs.Conversion Cloud REST API,您需要註冊一個帳戶,獲取 API 密鑰,然後使用提供的 SDK 將 API 集成到您的 Java 項目中.

我可以一次將多個 PDF 文檔轉換為文本文件嗎?

是的,您可以使用 GroupDocs.Conversion Cloud REST API 通過傳入一組文件路徑或 URL 將多個 PDF 一次轉換為文本文件。

我可以將受密碼保護的 PDF 轉換為文本文件嗎?

是的,您可以使用 GroupDocs.Conversion Cloud REST API 將密碼作為參數傳遞到 API 請求中,從而將受密碼保護的 PDF 轉換為文本文件。

如何免費在線將 PDF 轉換為文本?

在線 PDF 文檔到文本轉換器 允許您免費將 PDF 轉換為文本。請按照下面給出的分步說明進行轉換:

  • 打開免費的在線 PDF 到文本文件轉換器
  • 在文件放置區域內單擊以上傳 PDF 文件或拖放 PDF 文件。
  • 單擊“立即轉換”按鈕,免費的在線 PDF 到文本轉換器會將 PDF 轉換為文本文件。
  • 將 PDF 文件轉換為文本後,輸出文本文件的下載鏈接將立即可用。

在 Java 中將 PDF 轉換為文本文件的最佳方法是什麼?

在 Java 中將 PDF 轉換為文本文件的最佳方法是使用專門為此目的設計的庫或 API,例如 GroupDocs.Conversion Cloud REST API。

如何在 Windows 上將 PDF 轉換為文本?

請訪問 此鏈接 下載適用於 Windows 的離線 PDF 到文本文件轉換器。此 PDF 文檔到文本文件轉換器可用於在 Windows 上快速將 PDF 轉換為文本,只需單擊一下。

也可以看看

如果您想了解相關主題,我們建議您訪問以下文章: