ドキュメントを結合および分割するための REST API ソリューション - GroupDocs.Merger Cloud
GroupDocs REST API がドキュメント操作 API のリーダーとしての地位を確立するために、私たちは日常のユースケースに合わせた新機能と API の導入に懸命に取り組んでいます。以前に発表したように、GroupDocs REST API コレクションに新しい REST API を追加する作業を進めています。 GroupDocs.Merger Cloud の最初のバージョンをリリースできることを嬉しく思います。これは、プラグインやソフトウェアをインストールすることなく、あらゆるプラットフォームで幅広いドキュメント形式を結合および分割できるユニバーサル REST API ソリューションです。
GroupDocs.Merger Cloud とは何ですか? ドキュメントを操作する際、ドキュメントを 1 つのファイルに結合することが一般的な要件となる場合があります。情報量が多くない場合は、内容を直接コピー&ペーストできます。しかし、そうでない場合はどうなるでしょうか?文書を確実かつ正確に結合できる自動化されたソリューションが必要です。 GroupDocs.Merger Cloud は、複数のドキュメントを結合できるだけでなく、サポートされている幅広い種類のドキュメントにわたって単一のドキュメント構造を操作できる REST API です。開発者は、ドキュメント結合ソリューションのアプリケーションでこれを使用できます。すべての一般的なファイル形式をサポートします。サポートされるファイル タイプには、PDF、Microsoft Word ドキュメント、Excel スプレッドシート、PowerPoint プレゼンテーション、プレーン テキストおよび書式設定されたテキスト、およびサポートされるドキュメント形式の長いリストが含まれます。
GroupDocs.Merger Cloud の最初のバージョンでサポートされている機能の完全なリストは次のとおりです。
文書操作
ドキュメントに参加する
ドキュメントの分割
ドキュメントプレビュー
ドキュメントページの操作
ページの移動
ページの削除
ページの回転
ページを切り替える
ページの抽出
ページの向きを変更する
ドキュメントセキュリティ運用
文書情報の抽出
セキュリティと認証 GroupDocs.Merger Cloud REST API はセキュリティで保護されており、JSONweb トークン認証 によるアプリ アクセス キー ID (アプリ SID) とアプリ シークレット (アプリ キー) を使用した認証が必要です。 groupdocs.
Python SDK を使用して PDF を編集可能な Word ドキュメントに変換する
Python 開発者は、アプリケーションに PDF から Word へのドキュメント変換機能を提供するようユーザーから要求されることがあります。 Adobe Acrobat なしで PDF ドキュメントを編集するのは非常に難しいためです。また、ユーザーは PDF ドキュメント内のテキスト、表、画像、その他のコンテンツを編集する必要があります。この要件に対する解決策は、PDF ドキュメントを編集可能な Word ドキュメントに変換することです。ただし、プログラム的にはそれほど単純ではないことはご存知でしょう。幸いなことに、モジュールがあります。 GroupDocs.Conversion Cloud SDK for Python を使用すると、数行の Python コードで PDF を編集可能な Word ドキュメントに簡単に変換できます。
PDF から Word - 変換 API と Python SDK GroupDocs.Conversion Cloud は、ツールやソフトウェアに依存しない、プラットフォームに依存しないドキュメントと画像の変換ソリューションです。あらゆるサポートされているファイル形式の画像とドキュメントを迅速かつ確実に変換できます。すべての一般的なプログラミング言語の SDK をソース コードと実際のサンプルとともに提供します。これにより、開発者は基盤となる REST API 呼び出しを気にせずに、GroupDocs.Conversion Cloud をアプリケーション内で直接使用できるようになります。この記事では、PDF から Word への変換に Python SDK を使用します。
Python で PDF を編集可能な DOCX に変換する方法 ここでは Python 3.7.4 を使用しますが、Python 2.7、3.4、またはそれ以降の任意のバージョンを使用できます。コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。
GroupDocs.Merger Cloud が間もなく開始されます!
ドキュメント管理アプリケーションを開発していて、アプリケーション内でドキュメントをマージするための API を探していますか?オプションの検索は終了したはずです。 GroupDocs は、新しいクラウド API、GroupDocs.Merger Cloud をリリースする予定です。これにより、開発者はサードパーティのプラグインに依存せずに、どのプラットフォームでも同じ形式の複数のドキュメントを高精度かつ忠実にマージできるようになります。またはアプリケーション。新しい API が提供する注目すべき機能には、ドキュメントの結合、ドキュメントの分割、ドキュメント ページの移動、ドキュメント ページの回転、ドキュメント ページの抽出などがあります。
今後の GroupDocs.Merger Cloud API の概要を以下で共有します。以下の機能に限定されるものではありませんが、今後も API に便利な新機能や新しいファイル形式のサポートを追加していきます。
特徴 文書操作
ドキュメントを結合する
分割ドキュメント
ドキュメントのプレビュー
ドキュメントページの操作
ページの移動
ページの削除
ページを回転する
ページを切り替える
ページの抽出
ページの向きを変更する
ドキュメントセキュリティ運用
文書情報の抽出
サポートされている形式 GroupDocs.Merger クラウド REST API は、次のファイル形式をサポートしています。
フォーマット
説明
ドキュメント
Microsoft Word文書
DOCX
Microsoft WordのオープンXMLドキュメント
DOCM
Word Open XML マクロ有効ドキュメント
DOT
Wordドキュメントテンプレート
DOTX
Word オープン XML ドキュメント テンプレート
DOTM
Word Open XML マクロ有効ドキュメント テンプレート
RTF
リッチテキスト形式ファイル
GroupDocs.Conversion Cloud を使用して Python で PDF ドキュメントからテキストを抽出する
PDF (Portable Document Format) は、ドキュメントの表示と交換に使用される最も重要で広く使用されているファイル形式の 1 つです。 Python 開発者として、テキスト分析に Python を使用して PDF ドキュメントからテキストを抽出し、別の形式でエクスポートしたいというシナリオが数多くあります。この投稿では、GroupDocs.Conversion Cloud SDK for Python を使用して PDF ドキュメントからテキストを正確に抽出する方法を説明します。
GroupDocs.Conversion Cloud は、サードパーティ アプリケーションに依存せずにドキュメントと画像を変換する、プラットフォームに依存しない REST API ソリューションです。 50 種類以上のドキュメントをある形式から別の形式に変換します。 Python を含むすべての一般的なプログラミング言語用の SDK が提供されているため、開発者は基盤となる REST API 呼び出しを気にすることなく、アプリケーションで API を直接使用できます。
コードを開始しましょう:
GroupDocs.Conversion クラウド パッケージをインストールする まず最初に、次のコマンドで pypi から groupdocs-conversion-cloud パッケージをインストールします。
>pip インストール groupdocs-conversion-cloud
Python PDF テキスト抽出の例 PDF ドキュメントからテキストを抽出するには、次の手順に従います。
groupdocs.cloud に無料でサインアップ to get your AppSID and AppKey Python モジュールを作成し、次のコードをコピーしてその中に貼り付けます。 PDF ドキュメントのテキストを抽出するためにデフォルトのオプションを使用しました。テキスト形式の変換オプションを使用すると、特定のページのテキストを抽出することもできます。 # インポートモジュール import groupdocs_conversion_cloud # https://dashboard.
PDF ドキュメントを最適化する信頼性の高い RESTful API ソリューション
GroupDocs.Conversion Cloud は、ドキュメントと画像の変換ソリューションです。これにより、開発者は、標準の REST API 呼び出しを使用して完全に制御しながら、任意のプラットフォーム上のアプリケーションにドキュメント変換機能を追加できるようになります。この記事では、PDF ドキュメントを最適化する方法について説明します。機能の完全なリストについては、GroupDocs.Convesion Cloud にアクセスしてください。
PDF ドキュメントには追加データが含まれる場合があります。 PDF ファイルのサイズを小さくすると、ネットワーク転送とストレージを最適化できます。これは、Web ページでの公開、ソーシャル ネットワークでの共有、電子メールでの送信、またはストレージへのアーカイブに特に便利です。 GroupDocs.Conversion Cloud を使用して PDF ドキュメントを Web 用に最適化したり、PDF ファイルのサイズを最適化したりする方法を簡単に説明します。次の例では cURL を使用します。基礎となる REST API 呼び出しを気にせずに、お気に入りのプログラミング言語の SDK を使用できます。
PDF ドキュメントを Web 用に最適化 最適化 (Web 用の線形化) とは、Web ブラウザを使用したオンライン閲覧に適した PDF ファイルを作成するプロセスを指します。線形化された PDF ファイルは、インターネット経由でより速く読み込まれます。線形化された PDF ファイルには、バイト ストリーミング サーバーが PDF ファイルを一度に 1 ページずつダウンロードできるようにする情報が含まれているためです。サーバー上でバイト ストリーミングが無効になっている場合、または PDF ファイルがリニアライズされていない場合は、表示する前に PDF ファイル全体をダウンロードする必要があります。 Web 表示用に PDF ファイルを最適化するには、cURL API コマンドを確認します。
PDF を Web 用に最適化する
// PDF ドキュメントを Web 用に最適化する curl -X POST "https://api.