GroupDocs.Conversion Cloud REST API を使用して、PDF を Java のテキストに変換します。

Java でプログラムによって PDF をテキスト ファイルに変換する方法

PDF(Portable Document Format) はドキュメントを共有するための一般的な形式ですが、テキストの編集や抽出となると PDF を操作するのが難しい場合があります。ここでは、PDF ドキュメントを テキスト ファイルに変換する必要があります。 PDF をテキスト ファイルに変換すると、テキストにアクセスしやすく、編集しやすく、検索しやすくなります。このブログ投稿では、REST API を使用して Java でプログラム的に PDF をテキスト ファイルに変換する方法を紹介します。

このチュートリアルでは次のトピックについて説明します。

Java PDF からテキストへの変換 REST API - SDK インストール

PDF ドキュメントをテキスト ファイルに変換するには、GroupDocs.Conversion Cloud SDK for Java を使用します。これは、サードパーティ ソフトウェアに依存せずにドキュメントと画像を変換できる、プラットフォームに依存しない REST API ソリューションです。また、サポートされているファイル形式 の 50 種類以上のドキュメントと画像を必要な形式に変換することもできます。ドキュメントをある形式から Word、PDF、PowerPoint, Excel、HTML、CAD、ラスター イメージなどの別の形式にすばやく変換できます。

API の JAR ファイルをダウンロードすることも、Maven 設定を使用してインストールすることもできます。リポジトリと依存関係をプロジェクトの POM.xml ファイルに追加します。 Maven の手順は次のとおりです。

Maven リポジトリ:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven の依存関係:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

GroupDocs.Conversion Cloud SDK を Java プロジェクトに統合した後、アカウントを サインアップします。手順と利用可能なコード例を開始する前に、ダッシュボード からクライアント ID とクライアント シークレットを収集してください。また、使用する前に API ドキュメント と使用制限を確認することが重要です。 ID とシークレットを取得したら、以下に示すコードを入力してください。

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

REST API を使用して Java で PDF ドキュメントを TXT ファイルに変換する方法

以下で説明するように、PDF をテキスト文書に変換する手順は次のとおりです。

ファイルをアップロードする

まず、以下に示すコード スニペットを使用して、PDF ドキュメントをクラウド ストレージにアップロードします。

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Java を使用してファイルをクラウド ストレージにアップロードする
public class App {

  public static void main(String[] args) {
        
    // 変換 API のインスタンスを作成する          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

その結果、アップロードされた PDF ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Java で PDF をテキスト形式に変換

このセクションでは、以下の手順に従って、Java でプログラムによって PDF ドキュメントをテキスト ファイルに変換する方法について説明します。

  • まず、ConvertApiクラスのインスタンスを作成します。
  • 次に、ConvertSettings クラスのインスタンスを作成します。
  • 次に、クラウド ストレージ名を指定します。
  • 入力PDFファイルのパスと出力ファイル形式を「txt」に設定します。
  • 次に、TxtConvertOptions クラスのインスタンスを作成します。
  • 必要に応じて、setFromPage、setPagesCount などのさまざまな変換オプションを設定します。
  • 次に、ConvertSettings インスタンスを使用して、変換オプションと出力ファイルのパスを設定します。
  • その後、ConvertDocumentRequest クラスのインスタンスを作成し、ConvertSettings パラメーターを渡します。
  • 最後に、convert\document() メソッドを呼び出し、ConvertDocumentRequest パラメーターを渡します。

次のコード スニペットは、REST API を使用して Java で PDF ファイルをテキスト ファイルに変換する方法を示しています。

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// REST APIを使用してJavaでPDFドキュメントをTXTファイルに変換する方法
public class App {

  public static void main(String[] args) {
    
    // 変換 API のインスタンスを作成する
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // 変換設定を準備する
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // 指定された形式に変換する
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java でプログラム的に PDF をテキスト ファイルに変換

Java でプログラム的に PDF をテキスト ファイルに変換します。

変換されたファイルをダウンロードする

上記のコード サンプルは、変換されたテキスト ファイルをクラウドに保存します。次のコード スニペットを使用してダウンロードできます。

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Java でクラウド ストレージからファイルをダウンロードする
public class App {

  public static void main(String[] args) {
        
    // 変換 API のインスタンスを作成する          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

無料のオンライン PDF からテキスト コンバーター

オンラインで無料でPDFをテキストファイルに変換するにはどうすればよいですか? PDF ドキュメントからテキスト ファイルを無料で作成するには、オンライン PDF からテキスト コンバーター をお試しください。このコンバータは、上記の PDF をテキスト形式に変換する API を使用して開発されています。

convert pdf to text online

結論

これでこのブログ投稿は終わりになります。この記事から学んだことは次のとおりです。

  • GroupDocs.Conversion Cloud REST API を使用してプログラムで PDF を Java のテキスト ファイルに変換する方法。
  • プログラムによって PDF ファイルをクラウドにアップロードし、変換されたテキスト ファイルをクラウドからダウンロードします。
  • 無料の PDF テキスト コンバーターを使用して PDF をテキストにオンライン変換します。

さらに、GroupDocs.Conversion Cloud REST API は、PDF を Java のテキスト ファイルに変換するための使いやすく強力なツールです。また、API リファレンス セクションも提供されており、ブラウザーを通じて直接 API を視覚化して通信できるようになります。 Java SDK の完全なソース コードは Github で無料で入手できます。 Java 用 GroupDocs.Conversion Cloud SDK 例はこちら を確認してください。

さらに、スタート ガイド を参照することをお勧めします。

最後に、私たちは REST API を使用したさまざまなファイル形式の変換に関する新しいブログ記事を書き続けています。したがって、定期的な更新についてはご連絡ください。

質問する

PDF からテキストへのコンバーターに関するご質問は、無料サポート フォーラム までお気軽にお問い合わせください。

よくある質問

Java で GroupDocs.Conversion Cloud REST API を設定するにはどうすればよいですか?

Java で GroupDocs.Conversion Cloud REST API を設定するには、アカウントに サインアップし、API キーを取得して、提供された SDKを使用して API を Java プロジェクトに統合する必要があります。 。

複数の PDF ドキュメントを一度にテキスト ファイルに変換できますか?

はい、GroupDocs.Conversion Cloud REST API を使用してファイル パスまたは URL の配列を渡すことで、複数の PDF を一度にテキスト ファイルに変換できます。

パスワードで保護された PDF をテキスト ファイルに変換できますか?

はい、GroupDocs.Conversion Cloud REST API を使用して、API リクエストのパラメーターとしてパスワードを渡すことで、パスワードで保護された PDF をテキスト ファイルに変換できます。

オンラインで無料でPDFをテキストに変換するにはどうすればよいですか?

オンライン PDF ドキュメント トゥ テキスト コンバーター を使用すると、PDF をテキストに無料で変換できます。変換については、以下の段階的な手順に従ってください。

  • オンラインで無料の PDF からテキスト ファイルへのコンバーター を開きます。
  • ファイル ドロップ領域内をクリックして PDF ファイルをアップロードするか、PDF ファイルをドラッグ アンド ドロップします。
  • 「今すぐ変換」ボタンをクリックすると、無料のオンライン PDF からテキストへのコンバーターが PDF をテキスト ファイルに変換します。
  • PDF ファイルをテキストに変換すると、出力テキスト ファイルのダウンロード リンクがすぐに利用できるようになります。

Java で PDF をテキスト ファイルに変換する最良の方法は何ですか?

Java で PDF をテキスト ファイルに変換する最良の方法は、GroupDocs.Conversion Cloud REST API など、この目的のために特別に設計された ライブラリまたは API を使用することです。

Windows で PDF をテキストに変換するにはどうすればよいですか?

Windows 用のオフライン PDF からテキスト ファイルへのコンバーターをダウンロードするには、このリンク にアクセスしてください。この PDF ドキュメントからテキスト ファイルへのコンバーターを使用すると、Windows 上でワンクリックで PDF をテキストにすばやく変換できます。

関連項目

関連トピックについて知りたい場合は、次の記事を参照することをお勧めします。