日本

GroupDocs.Conversion Cloud を使用して Python で PDF ドキュメントからテキストを抽出する

PDF (Portable Document Format) は、ドキュメントの表示と交換に使用される最も重要で広く使用されているファイル形式の 1 つです。 Python 開発者として、テキスト分析に Python を使用して PDF ドキュメントからテキストを抽出し、別の形式でエクスポートしたいというシナリオが数多くあります。この投稿では、GroupDocs.Conversion Cloud SDK for Python を使用して PDF ドキュメントからテキストを正確に抽出する方法を説明します。 GroupDocs.Conversion Cloud は、サードパーティ アプリケーションに依存せずにドキュメントと画像を変換する、プラットフォームに依存しない REST API ソリューションです。 50 種類以上のドキュメントをある形式から別の形式に変換します。 Python を含むすべての一般的なプログラミング言語用の SDK が提供されているため、開発者は基盤となる REST API 呼び出しを気にすることなく、アプリケーションで API を直接使用できます。 コードを開始しましょう: GroupDocs.Conversion クラウド パッケージをインストールする まず最初に、次のコマンドで pypi から groupdocs-conversion-cloud パッケージをインストールします。 >pip インストール groupdocs-conversion-cloud Python PDF テキスト抽出の例 PDF ドキュメントからテキストを抽出するには、次の手順に従います。 groupdocs.cloud に無料でサインアップ to get your AppSID and AppKey Python モジュールを作成し、次のコードをコピーしてその中に貼り付けます。 PDF ドキュメントのテキストを抽出するためにデフォルトのオプションを使用しました。テキスト形式の変換オプションを使用すると、特定のページのテキストを抽出することもできます。 # インポートモジュール import groupdocs_conversion_cloud # https://dashboard.
· ティラル・アハマド · 1 分

PDF ドキュメントを最適化する信頼性の高い RESTful API ソリューション

GroupDocs.Conversion Cloud は、ドキュメントと画像の変換ソリューションです。これにより、開発者は、標準の REST API 呼び出しを使用して完全に制御しながら、任意のプラットフォーム上のアプリケーションにドキュメント変換機能を追加できるようになります。この記事では、PDF ドキュメントを最適化する方法について説明します。機能の完全なリストについては、GroupDocs.Convesion Cloud にアクセスしてください。 PDF ドキュメントには追加データが含まれる場合があります。 PDF ファイルのサイズを小さくすると、ネットワーク転送とストレージを最適化できます。これは、Web ページでの公開、ソーシャル ネットワークでの共有、電子メールでの送信、またはストレージへのアーカイブに特に便利です。 GroupDocs.Conversion Cloud を使用して PDF ドキュメントを Web 用に最適化したり、PDF ファイルのサイズを最適化したりする方法を簡単に説明します。次の例では cURL を使用します。基礎となる REST API 呼び出しを気にせずに、お気に入りのプログラミング言語の SDK を使用できます。 PDF ドキュメントを Web 用に最適化 最適化 (Web 用の線形化) とは、Web ブラウザを使用したオンライン閲覧に適した PDF ファイルを作成するプロセスを指します。線形化された PDF ファイルは、インターネット経由でより速く読み込まれます。線形化された PDF ファイルには、バイト ストリーミング サーバーが PDF ファイルを一度に 1 ページずつダウンロードできるようにする情報が含まれているためです。サーバー上でバイト ストリーミングが無効になっている場合、または PDF ファイルがリニアライズされていない場合は、表示する前に PDF ファイル全体をダウンロードする必要があります。 Web 表示用に PDF ファイルを最適化するには、cURL API コマンドを確認します。 PDF を Web 用に最適化する // PDF ドキュメントを Web 用に最適化する curl -X POST "https://api.
· ティラル・アハマド · 1 分

GroupDocs.Conversion Cloud V2 の紹介

GroupDocs Cloud は、GroupDocs.Conversion Cloud REST API の V2 バージョンを発表できることを嬉しく思います。これはすべて新しい API バージョンであり、V1 と比較して簡素化された直感的なアプローチが採用されています。新しい API では、アーキテクチャが改善され、ドキュメント変換タスクのメソッドとオプションが減りました。このバージョンの API には、重要な部分であるクラウド ストレージを操作するためのメソッドが含まれています。 詳細。 新着情報 GroupDocs.Conversion Cloud V2 の API メソッドは 4 つのセクションに分かれています。変換 API セクションには、ドキュメント変換のメソッドが含まれています。ファイル API セクションには、ファイルをアップロード、ダウンロード、コピー、移動、削除するメソッドがあります。クラウド ストレージでフォルダーを作成、コピー、移動、削除するメソッドがフォルダー API セクションに追加されました。また、Storage APIにはストレージ情報やファイル情報を取得するメソッドが含まれています。 次のいくつかの段落では、GroupDocs.Viewer Cloud V2 の特徴と機能について説明します。 使い方 このデジタル時代において、ドキュメント変換サービスは組織にとって不可欠なニーズとなっています。ビジネスプロセスでは、目的に応じてさまざまな文書形式のドキュメントが必要になります。したがって、開発者は、ドキュメント変換ツールを開発するための効率的で信頼性の高いソリューションを探しているかもしれません。 GroupDocs.Conversion クラウド REST API は、65 以上のドキュメント形式の変換をサポートします。これにより、アプリケーションにドキュメント変換機能をシームレスに統合できます。 ドキュメントを別のドキュメント形式に変換し、同時に透かしを追加する方法を簡単かつ迅速に説明します。この例では、REST API リクエストに cURL を使用しています。 GroupDocs.Viewer Cloud API をお気に入りのプラットフォームで直接使用するには、利用可能な SDK の完全なリストを確認してください。 さあ、始めましょう… DOCX ファイルを PDF に変換し、次のように透かしテキストを追加します。 認証コードを取得する GroupDocs.Conversion クラウド REST API は、JWT(JSON Web Token) 認証をサポートします。
· ティラル・アハマド · 1 分

次世代 GroupDocs.Conversion Cloud 18.6 で導入された PDF リソースの最適化とブックマーク オプション

次世代 GroupDocs.Conversion Cloud 18.6 毎月リリースを発表できることを嬉しく思います。このリリースでは、PDF 変換機能に新しいオプションが導入されるとともに、「無効な URL の戻り」に関する重要なバグ修正が導入されています。このバージョンでは、API 機能の使用状況をより深く理解できるよう、PHP と .NET SDK も更新しました。この API は、ドキュメント変換機能を利用するためにアプリケーションと統合できます。詳細については、ここ をクリックしてください。 新機能 - GroupDocs.Conversion クラウド GroupDocs.Conversion Cloud API 18.6 バージョンには、リソースの最適化、ブックマーク オプション、グレースケール PDF 作成などを制御する、Word、Cells、XPS からの PDF ドキュメント変換の新しいオプションが含まれています。 GroupDocs.Conversion Cloud API は、ほぼすべての主要なドキュメントと画像形式の変換をサポートしています。そしてから。現在のリリースでの主な変更点のいくつかを以下に示します。詳細については、GitHub にアクセスして更新された SDK を入手してください。 PDF への変換時に線形化された PDF を作成するオプション Word から PDF および XPS に変換するときに、ブックマーク レベル、見出しレベル、展開レベルを指定します セルからの変換を制御するためのオプション PDF への変換時のリソース最適化のオプション グレースケール PDF に変換するオプション 変換の結果、無効な URL が返される - 修正 GroupDocs.Conversion クラウド API リソース API の使用を開始して作業するには、次の API リソースにアクセスしてください。 GroupDocs.Conversion クラウド API の概要 GroupDocs.
· ムハマド・リズワン · 1 分

次世代 GroupDocs.Conversion Cloud 18.4 のドキュメント ストリームからサポートされているすべての変換形式を取得する

次世代 GroupDocs.Conversion Cloud 18.4 REST API パブリック リリースを発表できることを嬉しく思います。これはメンテナンス リリース リリースであり、API 機能をより深く理解するための PHP および .NET SDK の更新に加え、ドキュメント変換パフォーマンスのいくつかの改善が含まれています。この API は、ドキュメント変換機能を利用するためにアプリケーションと統合できます。詳細については、ここ をクリックしてください。 GroupDocs.Conversion Cloud - 改善と修正 当社のクラウド向けドキュメント変換 API は、ほぼすべての主要なドキュメントと画像形式の変換をサポートしています。この月次リリースでは、サポートされているドキュメント形式に対してドキュメント ストリームから変換を行うための PHP および .NET SDK の単体テストが導入されています。現在のリリースでの主な変更点のいくつかを以下に示します。詳細については、GitHub にアクセスして更新された SDK を入手してください。 ドキュメント ストリームから可能な変換を取得するための追加の単体テストを .NET および PHP SDK に追加しました。 GroupDocs.Conversion for Cloud の Swagger 仕様の改善 単一のマルチパート MIME ボディを含むリクエストを処理できない - 修正 GroupDocs.Conversion クラウド API リソース API の使用を開始して作業するには、次の API リソースにアクセスしてください。 GroupDocs.Conversion クラウド API の概要 GroupDocs.Conversion クラウド API オンライン ドキュメント GroupDocs.
· ムハマド・リズワン · 1 分

次世代 GroupDocs.Conversion Cloud 18.3 での PHP SDK の紹介

次世代 GroupDocs.Conversion Cloud 18.3 REST API の一般公開リリースを発表できることをうれしく思います。このリリースでは、パフォーマンスと PHP SDK が強化され、いくつかのバグ修正も行われています。この API は、アプリケーションでドキュメント変換機能を利用するために使用できます。詳細については、ここ をクリックしてください。 GroupDocs.Conversion Cloud - 改善と修正 GroupDocs.Conversion Cloud は、ほぼすべての主要なドキュメントと画像形式の、ドキュメント全体、ページごと、またはページのカスタム範囲の Word、Cell、Html、PDF、スライド、画像形式への変換をサポートする REST API です。現在のリリースでの主な変更点は次のとおりです。詳細については、リリース ノート を参照してください。 GroupDocs.Conversion Cloud 用 PHP SDK の紹介 一部の API メソッドはエラー 401 を返します 可能なすべての変換を取得すると無効な応答が返されます GroupDocs.Conversion クラウド - PHP SDK このバージョンでは、GroupDocs.Conversion Cloud PHP SDK が導入されています。これは REST API のラッパーであり、PHP 5.5 以降で GroupDocs.Conversion Cloud REST API を迅速かつ簡単に操作できるようになり、強力な型と IDE のハイライトのすべての利点が得られます。ディストリビューションは Packagist で、ソース コードは GitHub で入手できます。 GroupDocs.Conversion クラウド API リソース API の使用を開始して作業するには、次の API リソースにアクセスしてください。
· ムハマド・リズワン · 1 分

次世代 GroupDocs.Conversion クラウド API の最初のリリースを発表

次世代 GroupDocs.Conversion Cloud 17.12 REST API は、開発者コミュニティが少ない労力で生産性を向上できるようにするため、GroupDocs チームの熱心な努力と献身により一般公開用にリリースされました。 GroupDocs.Conversion Cloud は、プラットフォームに依存しないドキュメント変換 REST API であり、あらゆる開発言語と統合できます。この API をアプリケーションで使用すると、完璧なパフォーマンスとドキュメント変換機能を利用できます。 50 を超えるドキュメントおよび画像形式をサポートしています。詳細については、ここ をクリックしてください。 GroupDocs.Conversion クラウド - 機能 GroupDocs.Conversion Cloud は、50 を超えるドキュメントと画像形式を、ドキュメント全体、ページごと、またはページのカスタム範囲で Word、Cell、Html、PDF、スライド、画像形式に変換するための REST API です。主な特徴は以下の通りです。詳細については、リリース ノート を参照してください。 PDF ドキュメントの変換 Wordドキュメント変換 セルのドキュメント変換 スライドドキュメントの変換 HTMLドキュメントの変換 画像ファイルの変換 簡単な変換の例 ドキュメントを他の サポートされている形式 にすばやく変換できます。ここでは、GroupDocs.Conversion Cloud API を使用した DOCX から PDF への変換の簡単な例を示します。 cURL の例 **Request** `curl -v "https://api.groupdocs.cloud/v1.0/conversion/quick?outPath=conversions%2F&appsid=XXXX&signature=XXX-XX" -H "content-type: application/json" -X POST -d "{'format':'pdf','sourceFile':{'folder':'conversions','name':'sample.docx'}}"` **Response** `{ "href": "https://api.groupdocs.cloud/v1.0/conversion/storage/file/conversions/sample.pdf", "rel": "self", "type": null, "title": null }` ここをクリックして API Explorer でこれを試してください。
· ムハマド・リズワン · 2 分

次世代の GroupDocs.Conversion クラウドが間もなく登場

次世代 GroupDocs.Conversion Cloud REST API の最初のリリースが数日以内にリリースされることをお知らせいたします。 GroupDocs.Conversion Cloud は、プラットフォームに依存しないドキュメント操作 REST API であり、あらゆる言語で使用できます。これは、簡単なリクエストのセットを使用して、シームレスなパフォーマンスとドキュメント変換機能の利用を実現するために、アプリケーションと統合できるようになる予定です。 はじめに - GroupDocs.Conversion クラウド GroupDocs.Conversion Cloud REST API を使用すると、サポートされている多くのドキュメントを別のドキュメントまたは画像形式に変換したり、透かしを入れたり、変換されたドキュメントの解像度や品質設定を設定するオプションを使用したりできます。 機能 - GroupDocs.Conversion クラウド GroupDocs.Conversion Cloud REST API は、50 を超えるドキュメントと画像形式を、ドキュメント全体、ページごと、またはストレージ URL とストリーム出力を使用したページのカスタム範囲について、Word、Cell、Html、PDF、スライド、画像形式に変換することをサポートします。 サポートされている機能:GroupDocs.Conversion クラウド REST API は、次のような多くの機能をサポートします。 ストレージ URL とストリーム出力を使用した PDF ドキュメント変換 ストレージ URL とストリーム出力を使用した Word ドキュメント変換 ストレージ URL とストリーム出力を使用したセルのドキュメント変換 ストレージ URL とストリーム出力を使用したスライド ドキュメントの変換 ストレージ URL とストリーム出力を使用した HTML ドキュメント変換 ストレージ URL とストリーム出力を使用した画像ファイルの変換 ページに透かしを入れる ページごとまたはページのカスタム範囲を変換する 該当する場合、出力ドキュメントの解像度と品質を指定する 出力形式がサポートされている場合、出力ドキュメントをパスワードで保護する セキュリティと認証 GroupDocs.Conversion Cloud は、安全な REST API です。 URL 署名または OAuth 2.
· ムハマド・リズワン · 1 分

GroupDocs.Conversion for Java など (GroupDocs より) (2016 年 11 月)

月刊ニュースレター 2016 年 11 月 Java 向け次世代 GroupDocs.Conversion の紹介 GroupDocs チームは、50 以上のドキュメント形式間でドキュメントを変換するための完全なバックエンド API である次世代 GroupDocs.Conversion for Java をリリースできることを嬉しく思います。 API を使用すると、Java 開発者はドキュメントをサポートされているさまざまな形式に変換できます。 API は UI に依存せず、追加のツールやサービスは必要ないため、開発者は既存のプロジェクトにも API を統合できます。 30 日間無料の トライアル ライセンス を取得して、フル モードで GroupDocs.Conversion for Java をお試しください。 製品ニュース 次世代の GroupDocs.Annotation for Java 3.1.0 がリリースされました Team GroupDocs は、Java 3.1.0 用の次世代 GroupDocs.Annotation を導入できることを嬉しく思います。すべての次世代 GroupDocs 3.x 製品と同様、GroupDocs.Annotation for Java 3.1.0 は、開発者があらゆる種類のアプリケーションを簡単に作成できるようにする UI レス API です。 詳細についてはこの記事をご覧ください。 GroupDocs.Signature for .NET 16.10.0 は、より多くの形式での保存をサポートします GroupDocs.Signature for .
· ムハンマド・サビル · 2 分

GroupDocs.Conversion for .NET とニュースのスポットライト、2014 年 9 月

月刊ニュースレター 2014 年 9 月 信頼性の高いファイル変換 API が必要ですか? 形式間でのファイルの変換は、それほど難しいことではありません。やりたいことは、レイアウトと書式を保持したまま、ある形式を別の形式に変換することだけです。 GroupDocs.Conversion for .NET を使用すると、まさにそれが実現します。 50 を超える形式間で変換し、毎回高忠実度の結果を実現します。サポートされている形式には、Microsoft Windows Office ファイル、AutoCAD、PDF、および画像ファイルが含まれます。独自のインフラストラクチャで API をホストすることで、ファイルのセキュリティとコンプライアンスを完全に制御できます。 [![](https://blog.groupdocs.com/wp-content/uploads/sites/4/2014/08/actionButton September14.png)](http://groupdocs.com/Community/files/8/. net-libraries/groupdocsconversionfor.net/default.aspx) ![](https://blog.groupdocs.com/wp-content/uploads/sites/4/2014/08/graphic September14.png) 製品ニュース .NET ライブラリ用の GroupDocs.Viewer 複数シートの Microsoft Excel ドキュメントのタブ付きビュー。 Microsoft Excel および PowerPoint ドキュメントの表示が高速化されました。 Microsoft ExcelドキュメントのHTMLベースの表示が強化されました。 JavaScript を取り除き、画像に変換せずに HTML ファイルを表示します。 さまざまな改善と修正。 Java ライブラリ用の GroupDocs.Viewer Java 2.4.0 用の GroupDocs.Viewer。 JDK 1.6 での Microsoft Visio ファイルのサポート。 新しいアップロード パス パラメーター。 ファイル変換の速度が向上しました。 さまざまな改善と修正。 .NET ライブラリの GroupDocs.Annotation GroupDocs.Annotation のストレージ スキーマの自動アップグレード。 高度な元に戻す/やり直し機能。 注釈 PDF エクスポートの改善。 さまざまな改善と修正。 Java ライブラリの GroupDocs.
· · 2 分