PDF в HTM

Розробіть конвертер PDF у HTML за допомогою C# .NET.

Можливість конвертувати документи PDF у формат HTML необхідна для різноманітних цілей, наприклад для веб-розробки чи керування вмістом. Незалежно від того, чи ви розробник, який прагне покращити доступність веб-сайту, чи творець вмісту, який хоче перепрофілювати PDF-вміст для використання в Інтернеті, опанування процесу перетворення PDF у HTML за допомогою C# .NET може значно спростити ваш робочий процес і підвищити ефективність. У цій статті ми вивчимо всі деталі перетворення PDF у HTML за допомогою .NET REST API, охоплюючи все, від основних понять до просунутих методів.

Ця стаття охоплює такі теми:

REST API для перетворення PDF у HTML

GroupDocs.Conversion Cloud SDK for .NET надає надійне та універсальне рішення для легкого перетворення документів PDF у формат HTML. SDK також надає розширені параметри налаштування, що дозволяє вказати такі параметри перетворення, як діапазон сторінок, якість зображення та структура вихідного файлу відповідно до ваших конкретних вимог. Щоб використовувати SDK, першим кроком є його встановлення. Отже, знайдіть GroupDocs.Conversion-Cloud у менеджері пакетів NuGet і натисніть кнопку «Встановити». Іншим варіантом є виконання наступної команди в консолі менеджера пакетів.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Після успішного встановлення REST API переконайтеся, що у вас є облікові дані API (наприклад, ідентифікатор клієнта та секрет клієнта).Ви можете відвідати цей короткий підручник, щоб дізнатися, як отримати облікові дані API.

Перетворення PDF на HTML за допомогою C# .NET

У наступному розділі пояснюється, як ми можемо використовувати потужні можливості Cloud SDK і програмно автоматизувати завдання перетворення PDF у HTML за допомогою C# .NET.

  1. Створіть екземпляр класу Configuration, де ми передаємо облікові дані клієнта як аргументи.
var configurations = new Configuration(clientId, clientSecret1);
  1. Ініціалізуйте ConvertApi, де ми передаємо об’єкт конфігурації як вхідний аргумент.
var apiInstance = new ConvertApi(configurations);
  1. Завантажте вхідний PDF-файл у хмарне сховище, передаючи ім’я для вхідного PDF-документа.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Створіть екземпляр ConvertSettings, де ми вказуємо ім’я для вхідного PDF, вихідний формат як html і ім’я для результуючого HTML-файлу.
var settings = new ConvertSettings{...}
  1. Викличте API ConvertDocumentRequest, щоб конвертувати PDF у формат HTML. Після успішного перетворення отриманий HTML зберігається в хмарному сховищі.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Більше прикладів на https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Отримайте свої облікові дані API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Створіть екземпляр класу конфігурації та ініціалізуйте його ідентифікатором клієнта та секретом клієнта. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Визначте значення ApiBaseUrl, щоб установити базову URL-адресу API конвертера HTML у PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Ініціалізуйте екземпляр класу ConvertApi об’єктом класу Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// завантажити файл HTML з локального диска             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // створити екземпляр FileApi
    var fileUpload = new FileApi(configurations);
    // завантажити вхідний PDF-файл у хмарне сховище
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // створити ConvertSettings, де ми визначаємо вхідний PDF і назву для результуючого HTML
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Викличте метод ConvertDocument для програмного перетворення PDF у HTML.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // повідомлення про успішний друк
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF в HTML.

Зображення: попередній перегляд перетворення PDF у HTML.

Зразок PDF-файлу, використаного у наведеному вище прикладі, можна завантажити з input.pdf.

Перетворення PDF на веб-сторінку за допомогою команд cURL

Конвертація PDF у HTML за допомогою GroupDocs.Conversion Cloud і команд cURL пропонує зручне рішення з можливістю сценарію для автоматизації завдань перетворення документів. Однією з ключових переваг цього підходу є його простота та легкість інтеграції в існуючі робочі процеси та конвеєри автоматизації. За допомогою лише кількох простих команд ви можете ініціювати процес перетворення та керувати ним без потреби у складному коді чи додаткових бібліотеках.

Першим кроком у цьому підході є отримання ваших персоналізованих облікових даних (ключ програми та SID програми) і генерація маркера доступу JWT. Отримавши маркер JWT, виконайте наступну команду cURL, щоб перетворити PDF у формат HTML. Наступна команда додає зразок рядка як водяний знак, але це необов’язково.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Замініть sourceFile на назву вхідного PDF-файлу, доступного в хмарному сховищі, resultantFile на назву вихідного HTML-формату, який буде згенеровано, а accessToken на маркер JWT, згенерований вище. Після успішного перетворення отриманий файл зберігається в хмарному сховищі.

Якщо ви хочете зберегти отриманий HTML на локальному диску, скористайтеся такою командою.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Безкоштовна програма для перетворення PDF у HTML

Ви можете скористатися нашим безкоштовним, легким і надефективним конвертером PDF у HTML, розробленим на основі GroupDocs.Conversion API.

безкоштовна програма для конвертування pdf в html

корисні посилання

Висновок

Підсумовуючи, якщо ви вирішите використовувати GroupDocs.Conversion Cloud SDK для .NET чи інтегрувати GroupDocs.Conversion Cloud із командами cURL, конвертація PDF у HTML стане безперебійним та ефективним процесом. Обидва підходи пропонують універсальні рішення для автоматизації завдань перетворення документів, дозволяючи вам легко подолати розрив між форматами PDF і HTML. Загалом, незалежно від того, віддаєте перевагу зручності SDK чи гнучкості команд cURL, обидва підходи дозволять вам ефективно конвертувати PDF у HTML і впевнено оптимізувати робочі процеси обробки документів.

Схожі статті

Ми наполегливо рекомендуємо відвідати такі посилання, щоб дізнатися більше про: