使用 GroupDocs.Conversion Cloud REST API 将 PDF 转换为 Java 中的文本。

如何在 Java 中以编程方式将 PDF 转换为文本文件

PDF 或便携式文档格式是一种流行的文档共享格式,但在编辑或提取文本时可能很难使用 PDF。这是您需要将 PDF 文档转换为 文本 文件的地方。将 PDF 转换为文本文件可以使文本更易于访问、编辑和搜索。在这篇博文中,我们将介绍如何使用 REST API 在 Java 中以编程方式将 PDF 转换为文本文件。

本教程将涵盖以下主题:

Java PDF 到文本转换 REST API - SDK 安装

为了将 PDF 文档转换为文本文件,我将使用 GroupDocs.Conversion Cloud SDK for Java。它是一个独立于平台的 REST API 解决方案,用于文档和图像转换,不依赖于任何第 3 方软件。它还允许您将任何 支持的文件格式 的 50 多种文档和图像转换为您需要的任何格式。您可以快速将文档从一种格式转换为另一种格式,如 Word、PDF、PowerPoint, Excel、HTML、CAD、光栅图像等。

您可以下载 API 的 JAR 文件或使用 Maven 配置进行安装。将存储库和依赖项添加到项目的 POM.xml 文件中。以下是 Maven 的说明:

Maven 存储库:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 依赖项:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

将 GroupDocs.Conversion Cloud SDK 集成到您的 Java 项目后,注册 一个帐户。在您开始执行步骤和可用代码示例之前,从 仪表板 收集您的客户端 ID 和客户端密码。此外,在使用前检查 API 文档 和使用限制也很重要。获得 ID 和密码后,请输入下面显示的代码:

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

如何使用 REST API 在 Java 中将 PDF 文档转换为 TXT 文件

以下是将 PDF 转换为文本文档的步骤,如下所述:

上传文件

首先,使用下面给出的代码片段将 PDF 文档上传到云存储:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 上传文件到云存储
public class App {

  public static void main(String[] args) {
        
    // 创建转换 API 的实例          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

因此,上传的 PDF 文件将在云端仪表板的 文件部分 中可用。

在 Java 中将 PDF 转换为文本格式

本节介绍如何按照以下步骤在 Java 中以编程方式将 PDF 文档转换为文本文件:

  • 首先,创建一个 ConvertApi 类的实例。
  • 其次,创建 ConvertSettings 类的一个实例。
  • 接下来,提供云存储名称。
  • 设置输入PDF文件路径和输出文件格式为“txt”。
  • 然后,创建 TxtConvertOptions 类的实例。
  • 或者,设置各种转换选项,如 setFromPage、setPagesCount 等。
  • 现在,使用 ConvertSettings 实例设置转换选项和输出文件路径。
  • 之后,创建 ConvertDocumentRequest 类实例并传递 ConvertSettings 参数。
  • 最后,调用 convert\document() 方法并传递 ConvertDocumentRequest 参数。

以下代码片段显示了如何使用 REST API 将 PDF 文件转换为 Java 中的文本文件:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// 如何使用 REST API 在 Java 中将 PDF 文档转换为 TXT 文件
public class App {

  public static void main(String[] args) {
    
    // 创建转换 API 的实例
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // 准备转换设置
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // 转换为指定格式
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java以编程方式将PDF转换为文本文件

在 Java 中以编程方式将 PDF 转换为文本文件。

下载转换后的文件

上面的代码示例会将转换后的文本文件保存到云端。您可以使用以下代码片段下载它:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 从云存储下载文件
public class App {

  public static void main(String[] args) {
        
    // 创建转换 API 的实例          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

免费在线 PDF 到文本转换器

如何免费在线将 PDF 转换为文本文件?请尝试使用在线 PDF 到文本转换器 从 PDF 文档免费创建文本文件。此转换器是使用上述 PDF 转换为文本格式的 API 开发的。

convert pdf to text online

结论

这使我们结束了这篇博文。以下是您从本文中学到的内容:

  • 如何使用 GroupDocs.Conversion Cloud REST API 以编程方式将 PDF 转换为 Java 中的文本文件;
  • 以编程方式将 PDF 文件上传到云端,然后从云端下载转换后的文本文件;
  • 并使用免费的 PDF 文本转换器在线将 PDF 转换为文本。

此外,GroupDocs.Conversion Cloud REST API 是一种易于使用且功能强大的工具,用于将 PDF 转换为 Java 中的文本文件。它还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之通信。 Java SDK 的完整源代码可在 Github 上免费获得。请查看 GroupDocs.Conversion Cloud SDK for Java 此处示例

此外,我们鼓励您参考我们的入门指南

最后,我们继续撰写有关使用 REST API 进行不同文件格式转换的新博客文章。因此,请联系我们以获取定期更新。

问一个问题

有关 PDF 到文本转换器的任何疑问,请随时通过免费支持 论坛 与我们联系。

常见问题

如何在 Java 中设置 GroupDocs.Conversion Cloud REST API?

要在 Java 中设置 GroupDocs.Conversion Cloud REST API,您需要注册一个帐户,获取 API 密钥,然后使用提供的 SDK 将 API 集成到您的 Java 项目中.

我可以一次将多个 PDF 文档转换为文本文件吗?

是的,您可以使用 GroupDocs.Conversion Cloud REST API 通过传入一组文件路径或 URL 将多个 PDF 一次转换为文本文件。

我可以将受密码保护的 PDF 转换为文本文件吗?

是的,您可以使用 GroupDocs.Conversion Cloud REST API 将密码作为参数传递到 API 请求中,从而将受密码保护的 PDF 转换为文本文件。

如何免费在线将 PDF 转换为文本?

在线 PDF 文档到文本转换器 允许您免费将 PDF 转换为文本。请按照下面给出的分步说明进行转换:

  • 打开免费的在线 PDF 到文本文件转换器
  • 在文件放置区域内单击以上传 PDF 文件或拖放 PDF 文件。
  • 单击“立即转换”按钮,免费的在线 PDF 到文本转换器会将 PDF 转换为文本文件。
  • 将 PDF 文件转换为文本后,输出文本文件的下载链接将立即可用。

在 Java 中将 PDF 转换为文本文件的最佳方法是什么?

在 Java 中将 PDF 转换为文本文件的最佳方法是使用专门为此目的设计的库或 API,例如 GroupDocs.Conversion Cloud REST API。

如何在 Windows 上将 PDF 转换为文本?

请访问 此链接 下载适用于 Windows 的离线 PDF 到文本文件转换器。此 PDF 文档到文本文件转换器可用于在 Windows 上快速将 PDF 转换为文本,只需单击一下。

也可以看看

如果您想了解相关主题,我们建议您访问以下文章: