
Разработайте конвертер PDF в HTML с использованием Java REST API.
Конвертация PDF документов в формат HTML имеет важное значение для веб-разработки, управления контентом и улучшения доступности. Независимо от того, нужно ли вам отображать документы онлайн или перерабатывать контент для веб-приложений, конвертация PDF в HTML с помощью Java REST API предоставляет простое и эффективное решение. В этой статье мы рассмотрим пошаговый процесс преобразования PDF файлов в формат HTML с использованием GroupDocs.Conversion Cloud SDK для Java.
Эта статья охватывает следующие темы:
- REST API для конвертации PDF в HTML
- Конвертируйте PDF в HTML с помощью Java
- Преобразование PDF в веб-страницу с помощью команд cURL
REST API для преобразования PDF в HTML
GroupDocs.Conversion Cloud SDK for Java предлагает надежное и гибкое решение для конвертации PDF-документов в формат HTML с высокой точностью. API сохраняет структуру документа, изображения и форматирование, одновременно позволяя настраивать диапазон страниц, выходную структуру и качество изображений.
Установка
Для установки GroupDocs.Conversion Cloud SDK для Java добавьте следующую зависимость Maven:
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>24.2.0</version>
</dependency>
Убедитесь, что у вас есть действительные учетные данные API (Client ID и Client Secret).Следуйте этому tutorial, чтобы получить их.
Конвертировать PDF в HTML с использованием Java
Следуйте этим шагам, чтобы автоматизировать преобразование PDF в HTML на Java:
- Инициализируйте
Configuration
с учетными данными API:
Configuration configuration = new Configuration(clientId, clientSecret);
- Создайте экземпляр
ConvertApi
:
ConvertApi convertApi = new ConvertApi(configuration);
- Загрузите входной PDF файл в облачное хранилище:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
- Создайте экземпляр класса
ConvertSettings
, где мы определяем имя входного PDF, формат вывода какhtml
и имя результирующего файла:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
- Выполните конвертацию PDF в PPT, используя класс
ConvertDocumentRequest
, в который мы передаем объектConvertSettings
в качестве аргумента:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// Больше примеров на https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Получите свои учетные данные API
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";
// Создайте экземпляр класса Configuration и инициализируйте его с помощью Client ID и Client Secret
Configuration configuration = new Configuration(clientId, clientSecret);
// Определите базовый URL API для операции конвертации PDF в HTML файл.
configuration.setApiBaseUrl("https://api.groupdocs.cloud");
// Инициализируйте экземпляр ConvertApi с объектом Configuration
ConvertApi convertApi = new ConvertApi(configuration);
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
// Вызовите API ConvertDocument для конвертации PDF в HTML.
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
// Проверьте ответ и распечатайте сообщение об успехе
if (response != null && response.equals("OK")) {
System.out.println("The PDF to HTML file conversion completed successfully!");
}
Изображение: - Предварительный просмотр конвертации PDF в HTML.
Скачайте образец PDF-файла, использованного в приведенном выше примере, по ссылке input.pdf.
Конвертировать PDF в веб-страницу с использованием команд cURL
Для пользователей командной строки, GroupDocs.Conversion Cloud API позволяет конвертировать PDF в HTML через команды cURL, что делает автоматизацию бесшовной.
- Сгенерируйте JWT Access Token с вашими учетными данными.
- Запустите следующую команду cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{finalOutput}\"}"
Замените sourceFile, resultantFile и accessToken на фактические значения.
- Если у вас есть необходимость сохранить результирующий HTML файл на локальный диск, тогда выполните следующую команду cURL:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "myFinaloutput.html"
Попробуйте наш бесплатный конвертер PDF в HTML
Используйте наш PDF to HTML Converter для быстрого и эффективного онлайн-преобразования.
Полезные ссылки
Заключение
Будь то использование GroupDocs.Conversion Cloud SDK для Java или команд cURL, оба подхода обеспечивают быстрый, точный и гибкий способ конвертации PDF в HTML. С облачной обработкой, высокой настройкой и удобным для разработчиков API, GroupDocs.Conversion Cloud упрощает конвертацию документов. Попробуйте наш Java SDK сегодня для бесшовной автоматизации конвертации PDF в HTML!
Рекомендуемые статьи
Мы настоятельно рекомендуем ознакомиться с следующими статьями: