書式を失わずに PDF を HTML に変換する方法

プログラムで PDF を HTML に変換する方法

PDF(Portable Document Format) は、グラフィック、テキスト、3D モデル、画像などを含む安全なドキュメント形式です。PDF 形式は圧縮されており、他の共有可能なファイル形式よりも小さくなります。 HTML は、広く使用されているプレーンテキストの軽量マークアップ言語です。すべてのブラウザでサポートされており、読み込みが高速です。 PDF と HTML はどちらのファイル形式もアクセシビリティに優れていますが、Web 経由で情報を提供するには一般的に HTML の方が優れています。そこで、この記事では、Node.js でオンラインで PDF を HTML に変換する方法を説明します。

この記事では次のトピックについて説明します。

PDF から HTML ページへの変換 REST API と Node.js SDK

GroupDocs.Conversion の Node.js SDK は、オンラインで PDF から HTML への変換を可能にするオンライン NodeJS 変換ライブラリです。これは、プラットフォームに依存しないライブラリおよびドキュメント変換ソリューションです。サポートされているファイル形式のドキュメントや画像を必要な形式にシームレスに変換できます。 Word、PowerPoint, Excel、PDF、HTML、CAD、ラスター画像など、50 種類以上のドキュメントや画像を簡単に変換できます。また、.NET、Java、PHP、Ruby、Android、Python SDK もサポートしています。 Cloud API の ドキュメント変換ファミリー メンバー

GroupDocs.Conversion Cloud は、Node.js コンソールで次のコマンドを使用してインストールできます。

npm install groupdocs-conversion-cloud

次に、手順と利用可能なコード例に従う前に、ダッシュボード からクライアント ID とクライアント シークレットを取得します。 ID とシークレットを取得したら、以下に示すコードを追加してください。

# http://api.groupdocs.cloud から Node.js SDK をノード アプリケーションにインポートします
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// https://dashboard.groupdocs.cloud から clientId と clientSecret を取得します (無料の登録が必要です)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

REST API を使用して Node.js で PDF を HTML 形式に変換する方法

以下に示す手順により、Nodejs を使用して PDF ファイルを HTML に変換できるようになります。

  1. PDFファイルをクラウドにアップロード
  2. 変換 PDFファイルをHTML形式に変換
  3. ダウンロード変換されたHTMLファイル

PDF ファイルをアップロードする

次のコード サンプルを使用して、PDF ファイルをクラウドにアップロードできます。

// システム ドライブから IOStream 内のファイルを開きます。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// ファイルを読み取る
fs.readFile(resourcesFolder, (err, fileStream) => {
  // FileApi を構築する
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // アップロードファイルリクエストの作成
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // ファイルをアップロードする
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

アップロードされた PDF ファイルは、ダッシュボードの ファイル セクション で利用できます。

Node.js で PDF を HTML ドキュメントに変換する

この Node.js ライブラリを使用した PDF から HTML への変換は、数行のソース コードで完了します。次の手順とコード スニペットに従うことができます。

  • ConvertApi のインスタンスを作成します。
  • ConvertSettings のインスタンスを作成する
  • ストレージ名と入力PDFファイルのパスを設定します
  • 次に、形式に「html」を割り当てます
  • ここで、出力 HTML ファイルのパスを指定します。
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • 最後に、ConvertDocumentRequest で convertDocument() メソッドを呼び出して変換します。

次のコード例は、REST API を使用して Nodejs で PDF を HTML にオンラインで変換する方法を示しています。

// REST APIを使用してNode.jsでPDFをHTML形式に変換する方法
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // 変換ドキュメントリクエストの作成
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

変換されたファイルをダウンロードする

上記のコードサンプルは、変換された HTML ファイルをクラウドに保存します。これで、Node.js を使用して PDF を HTML 形式に変換する方法がわかりました。次に、次のコード サンプルを使用して HTML ファイルをダウンロードします。

// 変換されたファイルをダウンロードするための FileApi を構築する
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// ダウンロードファイルリクエストの作成
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// ダウンロード ファイルと応答タイプ ストリーム
fileApi.downloadFile(request)
    .then(function (response) {
        // ファイルをシステムディレクトリに保存します
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

REST APIを使用してNode.jsでPDFの特定のページをHTMLに変換する

次の手順とコード スニペットに従って、いくつかの詳細設定を使用して Node.js アプリケーションで PDF を HTML に変換できます。

以下の手順に従ってください。

  • まず、ConvertApiのインスタンスを作成します。
  • ConvertSettings のインスタンスを作成する
  • ストレージ名と入力PDFファイルのパスを設定します
  • 次に、形式に「html」を割り当てます
  • HtmlConvertOptions クラスのインスタンスを作成する
  • fromPage、pagesCount、fixedLayout などのさまざまな変換オプションを設定します。
  • ここで、出力変換オプションと HTML ファイル パスを指定します。
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • 最後に、ConvertDocumentRequest で convertDocument() メソッドを呼び出して変換します。

次のコード例は、詳細オプションを使用して Node.js で PDF を HTML に変換する方法を示しています。

// REST APIを使用してNode.jsでPDFの特定のページをHTMLに変換する方法
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // ドキュメント変換リクエストの作成
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

無料のオンライン PDF から HTML コンバーター

オンラインで無料でPDFをHTML形式に変更するにはどうすればよいですか?以下の オンラインで無料の PDF から HTML へのコンバーター をお試しください。このオンライン PDF から HTML5 へのコンバーターは、上記の API を使用して開発されており、オンラインで PDF を HTML テーブルにすばやく変換できます。

結論

PDF および HTML ファイルは、データの保存と送信に広く使用されています。そこで、この記事では、Node.js アプリケーションで PDF を HTML 形式に変換する方法について説明しました。これで次のことが分かりました。

  • REST API を使用して Node.js で PDF を HTML 形式に変換する方法。
  • REST APIを使用してNode.jsでPDFの特定のページをHTMLに変換する方法
  • 無料のオンライン PDF から HTML へのオンライン コンバーター。

さらに、ドキュメント、または GitHub で入手可能なサンプルを使用して、GroupDocs.Conversion Cloud API の詳細を学ぶことができます。また、Web ブラウザで API を直接操作できる API リファレンス セクションも提供しています。 入門ページ をご覧ください。

さらに、Groupdocs.cloud も新しいトピックで更新を続けています。したがって、常に最新の情報を入手してください。

質問する

PDF から HTML への Node.js コンバーターに関するご質問は、無料サポート フォーラム を通じてお気軽にお問い合わせください。

よくある質問

Node.js で PDF を HTML に変換するにはどうすればよいですか?

このリンク に従って、JavaScript を使用して HTML から PDF を迅速かつ便利に生成する方法のコード スニペットを学習してください。

REST APIを使用してHTML Node.jsからPDFを生成するにはどうすればよいですか?

ConvertApi, のインスタンスを作成し、変換設定の値を設定し、ConvertDocumentRequest で convertDocument メソッドを呼び出して PDF を生成します。 HTML ファイルから。

オンラインで無料でPDFをHTMLに変換するにはどうすればよいですか?

無料のオンライン PDF to HTML コード コンバーター を使用すると、PDF を HTML ファイル形式に迅速かつ簡単に変換できます。変換が完了したら、HTML ファイルをダウンロードできます。

オフラインで PDF を HTML に変換するにはどうすればよいですか?

Windows で無料の PDF から HTML へのコンバータ ソフトウェアをダウンロードするには、このリンク にアクセスしてください。このオンライン PDF から HTML コンバーターの無料ダウンロード ソフトウェアを使用すると、Windows でワンクリックで PDF を HTML にすばやく変換できます。

関連項目

詳細については、次の記事を読むことをお勧めします。