конвертер pdf в html

Разработайте конвертер PDF в HTML с использованием Java REST API.

Конвертация PDF документов в формат HTML имеет важное значение для веб-разработки, управления контентом и улучшения доступности. Независимо от того, нужно ли вам отображать документы онлайн или перерабатывать контент для веб-приложений, конвертация PDF в HTML с помощью Java REST API предоставляет простое и эффективное решение. В этой статье мы рассмотрим пошаговый процесс преобразования PDF файлов в формат HTML с использованием GroupDocs.Conversion Cloud SDK для Java.

Эта статья охватывает следующие темы:

REST API для преобразования PDF в HTML

GroupDocs.Conversion Cloud SDK for Java предлагает надежное и гибкое решение для конвертации PDF-документов в формат HTML с высокой точностью. API сохраняет структуру документа, изображения и форматирование, одновременно позволяя настраивать диапазон страниц, выходную структуру и качество изображений.

Установка

Для установки GroupDocs.Conversion Cloud SDK для Java добавьте следующую зависимость Maven:

<repository>
    <id>repository.groupdocs.cloud</id>
    <name>repository.groupdocs.cloud</name>
    <url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>24.2.0</version>
</dependency>

Убедитесь, что у вас есть действительные учетные данные API (Client ID и Client Secret).Следуйте этому tutorial, чтобы получить их.

Конвертировать PDF в HTML с использованием Java

Следуйте этим шагам, чтобы автоматизировать преобразование PDF в HTML на Java:

  1. Инициализируйте Configuration с учетными данными API:
Configuration configuration = new Configuration(clientId, clientSecret);
  1. Создайте экземпляр ConvertApi:
ConvertApi convertApi = new ConvertApi(configuration);
  1. Загрузите входной PDF файл в облачное хранилище:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
  1. Создайте экземпляр класса ConvertSettings, где мы определяем имя входного PDF, формат вывода как html и имя результирующего файла:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
  1. Выполните конвертацию PDF в PPT, используя класс ConvertDocumentRequest, в который мы передаем объект ConvertSettings в качестве аргумента:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// Больше примеров на  https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Получите свои учетные данные API 
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";

// Создайте экземпляр класса Configuration и инициализируйте его с помощью Client ID и Client Secret
Configuration configuration = new Configuration(clientId, clientSecret);
// Определите базовый URL API для операции конвертации PDF в HTML файл.
configuration.setApiBaseUrl("https://api.groupdocs.cloud");

// Инициализируйте экземпляр ConvertApi с объектом Configuration
ConvertApi convertApi = new ConvertApi(configuration);

ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
    
// Вызовите API ConvertDocument для конвертации PDF в HTML.
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
    
// Проверьте ответ и распечатайте сообщение об успехе
if (response != null && response.equals("OK")) {
    System.out.println("The PDF to HTML file conversion completed successfully!");
}
бесплатный pdf в html онлайн

Изображение: - Предварительный просмотр конвертации PDF в HTML.

Скачайте образец PDF-файла, использованного в приведенном выше примере, по ссылке input.pdf.

Конвертировать PDF в веб-страницу с использованием команд cURL

Для пользователей командной строки, GroupDocs.Conversion Cloud API позволяет конвертировать PDF в HTML через команды cURL, что делает автоматизацию бесшовной.

  • Сгенерируйте JWT Access Token с вашими учетными данными.
  • Запустите следующую команду cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{finalOutput}\"}"

Замените sourceFile, resultantFile и accessToken на фактические значения.

  • Если у вас есть необходимость сохранить результирующий HTML файл на локальный диск, тогда выполните следующую команду cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "myFinaloutput.html"

Попробуйте наш бесплатный конвертер PDF в HTML

Используйте наш PDF to HTML Converter для быстрого и эффективного онлайн-преобразования.

Бесплатный конвертер PDF в PPT онлайн

Полезные ссылки

Заключение

Будь то использование GroupDocs.Conversion Cloud SDK для Java или команд cURL, оба подхода обеспечивают быстрый, точный и гибкий способ конвертации PDF в HTML. С облачной обработкой, высокой настройкой и удобным для разработчиков API, GroupDocs.Conversion Cloud упрощает конвертацию документов. Попробуйте наш Java SDK сегодня для бесшовной автоматизации конвертации PDF в HTML!

Рекомендуемые статьи

Мы настоятельно рекомендуем ознакомиться с следующими статьями: