Python 開発者は、アプリケーションに PDF から Word へのドキュメント変換機能を提供するようユーザーから要求されることがあります。 Adobe Acrobat なしで PDF ドキュメントを編集するのは非常に難しいためです。また、ユーザーは PDF ドキュメント内のテキスト、表、画像、その他のコンテンツを編集する必要があります。この要件に対する解決策は、PDF ドキュメントを編集可能な Word ドキュメントに変換することです。ただし、プログラム的にはそれほど単純ではないことはご存知でしょう。幸いなことに、モジュールがあります。 GroupDocs.Conversion Cloud SDK for Python を使用すると、数行の Python コードで PDF を編集可能な Word ドキュメントに簡単に変換できます。
PDF から Word - 変換 API と Python SDK GroupDocs.Conversion Cloud は、ツールやソフトウェアに依存しない、プラットフォームに依存しないドキュメントと画像の変換ソリューションです。あらゆるサポートされているファイル形式の画像とドキュメントを迅速かつ確実に変換できます。すべての一般的なプログラミング言語の SDK をソース コードと実際のサンプルとともに提供します。これにより、開発者は基盤となる REST API 呼び出しを気にせずに、GroupDocs.Conversion Cloud をアプリケーション内で直接使用できるようになります。この記事では、PDF から Word への変換に Python SDK を使用します。
Python で PDF を編集可能な DOCX に変換する方法 ここでは Python 3.7.4 を使用しますが、Python 2.7、3.4、またはそれ以降の任意のバージョンを使用できます。コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。
GroupDocs.Conversion Cloud を使用して Python で PDF ドキュメントからテキストを抽出する
PDF (Portable Document Format) は、ドキュメントの表示と交換に使用される最も重要で広く使用されているファイル形式の 1 つです。 Python 開発者として、テキスト分析に Python を使用して PDF ドキュメントからテキストを抽出し、別の形式でエクスポートしたいというシナリオが数多くあります。この投稿では、GroupDocs.Conversion Cloud SDK for Python を使用して PDF ドキュメントからテキストを正確に抽出する方法を説明します。
GroupDocs.Conversion Cloud は、サードパーティ アプリケーションに依存せずにドキュメントと画像を変換する、プラットフォームに依存しない REST API ソリューションです。 50 種類以上のドキュメントをある形式から別の形式に変換します。 Python を含むすべての一般的なプログラミング言語用の SDK が提供されているため、開発者は基盤となる REST API 呼び出しを気にすることなく、アプリケーションで API を直接使用できます。
コードを開始しましょう:
GroupDocs.Conversion クラウド パッケージをインストールする まず最初に、次のコマンドで pypi から groupdocs-conversion-cloud パッケージをインストールします。
>pip インストール groupdocs-conversion-cloud
Python PDF テキスト抽出の例 PDF ドキュメントからテキストを抽出するには、次の手順に従います。
groupdocs.cloud に無料でサインアップ to get your AppSID and AppKey Python モジュールを作成し、次のコードをコピーしてその中に貼り付けます。 PDF ドキュメントのテキストを抽出するためにデフォルトのオプションを使用しました。テキスト形式の変換オプションを使用すると、特定のページのテキストを抽出することもできます。 # インポートモジュール import groupdocs_conversion_cloud # https://dashboard.
PDF ドキュメントを最適化する信頼性の高い RESTful API ソリューション
GroupDocs.Conversion Cloud は、ドキュメントと画像の変換ソリューションです。これにより、開発者は、標準の REST API 呼び出しを使用して完全に制御しながら、任意のプラットフォーム上のアプリケーションにドキュメント変換機能を追加できるようになります。この記事では、PDF ドキュメントを最適化する方法について説明します。機能の完全なリストについては、GroupDocs.Convesion Cloud にアクセスしてください。
PDF ドキュメントには追加データが含まれる場合があります。 PDF ファイルのサイズを小さくすると、ネットワーク転送とストレージを最適化できます。これは、Web ページでの公開、ソーシャル ネットワークでの共有、電子メールでの送信、またはストレージへのアーカイブに特に便利です。 GroupDocs.Conversion Cloud を使用して PDF ドキュメントを Web 用に最適化したり、PDF ファイルのサイズを最適化したりする方法を簡単に説明します。次の例では cURL を使用します。基礎となる REST API 呼び出しを気にせずに、お気に入りのプログラミング言語の SDK を使用できます。
PDF ドキュメントを Web 用に最適化 最適化 (Web 用の線形化) とは、Web ブラウザを使用したオンライン閲覧に適した PDF ファイルを作成するプロセスを指します。線形化された PDF ファイルは、インターネット経由でより速く読み込まれます。線形化された PDF ファイルには、バイト ストリーミング サーバーが PDF ファイルを一度に 1 ページずつダウンロードできるようにする情報が含まれているためです。サーバー上でバイト ストリーミングが無効になっている場合、または PDF ファイルがリニアライズされていない場合は、表示する前に PDF ファイル全体をダウンロードする必要があります。 Web 表示用に PDF ファイルを最適化するには、cURL API コマンドを確認します。
PDF を Web 用に最適化する
// PDF ドキュメントを Web 用に最適化する curl -X POST "https://api.
GroupDocs.Conversion Cloud V2 の紹介
GroupDocs Cloud は、GroupDocs.Conversion Cloud REST API の V2 バージョンを発表できることを嬉しく思います。これはすべて新しい API バージョンであり、V1 と比較して簡素化された直感的なアプローチが採用されています。新しい API では、アーキテクチャが改善され、ドキュメント変換タスクのメソッドとオプションが減りました。このバージョンの API には、重要な部分であるクラウド ストレージを操作するためのメソッドが含まれています。 詳細。
新着情報 GroupDocs.Conversion Cloud V2 の API メソッドは 4 つのセクションに分かれています。変換 API セクションには、ドキュメント変換のメソッドが含まれています。ファイル API セクションには、ファイルをアップロード、ダウンロード、コピー、移動、削除するメソッドがあります。クラウド ストレージでフォルダーを作成、コピー、移動、削除するメソッドがフォルダー API セクションに追加されました。また、Storage APIにはストレージ情報やファイル情報を取得するメソッドが含まれています。
次のいくつかの段落では、GroupDocs.Viewer Cloud V2 の特徴と機能について説明します。
使い方 このデジタル時代において、ドキュメント変換サービスは組織にとって不可欠なニーズとなっています。ビジネスプロセスでは、目的に応じてさまざまな文書形式のドキュメントが必要になります。したがって、開発者は、ドキュメント変換ツールを開発するための効率的で信頼性の高いソリューションを探しているかもしれません。 GroupDocs.Conversion クラウド REST API は、65 以上のドキュメント形式の変換をサポートします。これにより、アプリケーションにドキュメント変換機能をシームレスに統合できます。
ドキュメントを別のドキュメント形式に変換し、同時に透かしを追加する方法を簡単かつ迅速に説明します。この例では、REST API リクエストに cURL を使用しています。 GroupDocs.Viewer Cloud API をお気に入りのプラットフォームで直接使用するには、利用可能な SDK の完全なリストを確認してください。
さあ、始めましょう… DOCX ファイルを PDF に変換し、次のように透かしテキストを追加します。
認証コードを取得する
GroupDocs.Conversion クラウド REST API は、JWT(JSON Web Token) 認証をサポートします。
次世代 GroupDocs.Conversion Cloud 18.6 で導入された PDF リソースの最適化とブックマーク オプション
次世代 GroupDocs.Conversion Cloud 18.6 毎月リリースを発表できることを嬉しく思います。このリリースでは、PDF 変換機能に新しいオプションが導入されるとともに、「無効な URL の戻り」に関する重要なバグ修正が導入されています。このバージョンでは、API 機能の使用状況をより深く理解できるよう、PHP と .NET SDK も更新しました。この API は、ドキュメント変換機能を利用するためにアプリケーションと統合できます。詳細については、ここ をクリックしてください。
新機能 - GroupDocs.Conversion クラウド GroupDocs.Conversion Cloud API 18.6 バージョンには、リソースの最適化、ブックマーク オプション、グレースケール PDF 作成などを制御する、Word、Cells、XPS からの PDF ドキュメント変換の新しいオプションが含まれています。 GroupDocs.Conversion Cloud API は、ほぼすべての主要なドキュメントと画像形式の変換をサポートしています。そしてから。現在のリリースでの主な変更点のいくつかを以下に示します。詳細については、GitHub にアクセスして更新された SDK を入手してください。
PDF への変換時に線形化された PDF を作成するオプション Word から PDF および XPS に変換するときに、ブックマーク レベル、見出しレベル、展開レベルを指定します セルからの変換を制御するためのオプション PDF への変換時のリソース最適化のオプション グレースケール PDF に変換するオプション 変換の結果、無効な URL が返される - 修正 GroupDocs.Conversion クラウド API リソース API の使用を開始して作業するには、次の API リソースにアクセスしてください。
GroupDocs.Conversion クラウド API の概要 GroupDocs.