PDF в HTM

Разработка конвертера PDF в HTML с помощью C# .NET.

Возможность конвертировать документы PDF в формат HTML необходима для различных целей, таких как веб-разработка или управление контентом. Независимо от того, являетесь ли вы разработчиком, стремящимся улучшить доступность веб-сайта, или создателем контента, желающим перепрофилировать PDF-контент для онлайн-потребления, освоение процесса преобразования PDF в HTML с помощью C# .NET может значительно упростить ваш рабочий процесс и повысить эффективность. В этой статье мы рассмотрим все детали преобразования PDF в HTML с использованием .NET REST API, охватывая все: от основных концепций до передовых методов.

В этой статье рассматриваются следующие темы:

REST API для преобразования PDF в HTML

GroupDocs.Conversion Cloud SDK для .NET предоставляет надежное и универсальное решение для плавного преобразования PDF-документов в формат HTML. SDK также предоставляет расширенные возможности настройки, позволяющие указать параметры преобразования, такие как диапазон страниц, качество изображения и структуру выходного файла, в соответствии с вашими конкретными требованиями. Чтобы использовать SDK, первым шагом является его установка. Итак, найдите GroupDocs.Conversion-Cloud в диспетчере пакетов NuGet и нажмите кнопку «Установить». Другой вариант — выполнить следующую команду в консоли диспетчера пакетов.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

После успешной установки REST API убедитесь, что у вас есть учетные данные API (т. е. идентификатор клиента и секрет клиента).Вы можете посетить это короткое руководство, чтобы узнать, как получить учетные данные API.

Преобразование PDF в HTML с помощью C# .NET

В следующем разделе подробно объясняется, как мы можем использовать мощные возможности Cloud SDK и программно автоматизировать задачу преобразования PDF в HTML с помощью C# .NET.

  1. Создайте экземпляр класса «Конфигурация», куда мы передаем учетные данные клиента в качестве аргументов.
var configurations = new Configuration(clientId, clientSecret1);
  1. Инициализируйте ConvertApi, куда мы передаем объект конфигурации в качестве входного аргумента.
var apiInstance = new ConvertApi(configurations);
  1. Загрузите входной PDF-файл в облачное хранилище, передав имя входного PDF-документа.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Создайте экземпляр ConvertSettings, где мы укажем имя входного PDF-файла, выходной формат как «html» и имя результирующего HTML-файла.
var settings = new ConvertSettings{...}
  1. Вызовите API ConvertDocumentRequest для преобразования PDF в формат HTML. После успешного преобразования полученный HTML-код сохраняется в облачном хранилище.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Дополнительные примеры можно найти на https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet.
// Получите учетные данные API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Создайте экземпляр класса Configuration и инициализируйте его с помощью идентификатора клиента и секрета клиента. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Определите значение ApiBaseUrl, чтобы установить базовый URL-адрес API конвертера HTML в PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Инициализируйте экземпляр класса ConvertApi с помощью объекта класса Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// загрузить HTML-файл с локального диска             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // создать экземпляр FileApi
    var fileUpload = new FileApi(configurations);
    // загрузить входной PDF-файл в облачное хранилище
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // создайте ConvertSettings, где мы определим входной PDF-файл и имя для результирующего HTML.
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Вызовите метод ConvertDocument для программного преобразования PDF в HTML.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // распечатать сообщение об успехе
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF в HTML.

Изображение: — Предварительный просмотр преобразования PDF в HTML.

Образец PDF-файла, использованного в приведенном выше примере, можно загрузить по адресу input.pdf.

Преобразование PDF в веб-страницу с помощью команд cURL

Преобразование PDF в HTML с помощью команд GroupDocs.Conversion Cloud и cURL предлагает удобное решение с поддержкой сценариев для автоматизации задач преобразования документов. Одним из ключевых преимуществ этого подхода является его простота и легкость интеграции в существующие рабочие процессы и конвейеры автоматизации. С помощью всего лишь нескольких простых команд вы можете инициировать процесс преобразования и управлять им без необходимости использования сложного кода или дополнительных библиотек.

Первым шагом в этом подходе является получение ваших персонализированных учетных данных (ключ приложения и SID приложения) и создание токена доступа JWT. Как только у нас будет токен JWT, выполните следующую команду cURL, чтобы преобразовать PDF в формат HTML. Следующая команда добавляет образец строки в качестве водяного знака, но это необязательно.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Замените sourceFile на имя входного PDF-файла, доступного в облачном хранилище, resultantFile на имя выходного HTML-формата, который нужно сгенерировать, а accessToken на токен JWT, сгенерированный выше. После успешного преобразования полученный файл сохраняется в облачном хранилище.

Если вы хотите сохранить полученный HTML-код на локальном диске, используйте следующую команду.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Бесплатное приложение для преобразования PDF в HTML

Вы можете рассмотреть возможность использования нашего бесплатного, легкого и сверхэффективного Конвертера PDF в HTML, разработанного на основе GroupDocs.Conversion API.

бесплатное приложение PDF в HTML

Полезные ссылки

Заключение

В заключение, независимо от того, решите ли вы использовать GroupDocs.Conversion Cloud SDK для .NET или интегрировать GroupDocs.Conversion Cloud с командами cURL, преобразование PDF в HTML станет простым и эффективным процессом. Оба подхода предлагают универсальные решения для автоматизации задач преобразования документов, позволяя вам легко преодолеть разрыв между форматами PDF и HTML. В целом, независимо от того, предпочитаете ли вы удобство SDK или гибкость команд cURL, оба подхода позволяют вам эффективно конвертировать PDF в HTML и с уверенностью оптимизировать рабочие процессы обработки документов.

Статьи по Теме

Мы настоятельно рекомендуем посетить следующие ссылки, чтобы узнать больше о: