PDF или Portable Document Format — это популярный формат для обмена документами, но работать с PDF-файлами может быть сложно, когда дело доходит до редактирования или извлечения текста. Здесь вам нужно конвертировать PDF-документы в файлы text. Преобразование PDF-файлов в текстовые файлы может сделать текст более доступным, доступным для редактирования и поиска. В этом сообщении блога мы расскажем, как программно конвертировать PDF в текстовый файл на Java с использованием REST API.
В этом уроке будут рассмотрены следующие темы:
- Преобразование Java PDF в текст REST API и установка SDK
- Как преобразовать документ PDF в файл TXT в Java с помощью REST API
Преобразование Java PDF в текст REST API — установка SDK
Для преобразования PDF-документов в текстовые файлы я буду использовать GroupDocs.Conversion Cloud SDK для Java. Это независимое от платформы решение REST API для преобразования документов и изображений без использования какого-либо стороннего программного обеспечения. Он также позволяет конвертировать более 50 типов документов и изображений любого поддерживаемого формата файлов в любой нужный вам формат. Вы можете быстро конвертировать документы из одного формата в другой, например Word, PDF, PowerPoint, Excel, HTML, CAD, растровые изображения и т. д.
Вы можете скачать JAR-файл API или установить его, используя конфигурации Maven. Добавьте репозиторий и зависимость в файл POM.xml вашего проекта. Ниже приведены инструкции для Maven:
Репозиторий Мавена:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Зависимость Мейвена:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
После интеграции SDK GroupDocs.Conversion Cloud в проект Java Зарегистрируйтесь для получения учетной записи. Соберите свой идентификатор клиента и секрет клиента на панели инструментов, прежде чем приступать к выполнению шагов и доступных примеров кода. Кроме того, перед его использованием важно проверить документацию по API и ограничения на использование. Пожалуйста, введите код, показанный ниже, как только вы получите свой идентификатор и секрет:
# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Как преобразовать PDF-документ в файл TXT на Java с помощью REST API
Ниже приведены шаги для преобразования PDF в текстовый документ, как указано ниже:
- Загрузить документ PDF в облако
- Конвертировать PDF-файл в текст на Java
- Скачать преобразованный файл
Загрузить файл
Во-первых, загрузите документ PDF в облачное хранилище, используя фрагмент кода, как показано ниже:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Загрузить файл в облачное хранилище с помощью Java
public class App {
public static void main(String[] args) {
// Создайте экземпляр API преобразования
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
В результате загруженный PDF-файл будет доступен в разделе файлов вашей панели управления в облаке.
Преобразование PDF в текстовый формат в Java
Этот раздел посвящен тому, как программно преобразовать PDF-документ в текстовый файл на Java, выполнив следующие действия:
- Во-первых, создайте экземпляр класса ConvertApi.
- Во-вторых, создайте экземпляр класса ConvertSettings.
- Затем укажите имя облачного хранилища.
- Установите путь к входному файлу PDF и формат выходного файла как «txt».
- Затем создайте экземпляр класса TxtConvertOptions.
- При желании установите различные параметры преобразования, такие как setFromPage, setPagesCount и т. д.
- Теперь установите параметры преобразования и путь к выходному файлу с помощью экземпляра ConvertSettings.
- После этого создайте экземпляр класса ConvertDocumentRequest и передайте параметр ConvertSettings.
- Наконец, вызовите метод convert\document() и передайте параметр ConvertDocumentRequest.
В следующем фрагменте кода показано, как преобразовать PDF-файл в текстовый файл на Java с помощью REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Как преобразовать PDF-документ в файл TXT на Java с помощью REST API
public class App {
public static void main(String[] args) {
// Создайте экземпляр API преобразования
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Подготовьте настройки конвертации
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// преобразовать в указанный формат
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Загрузите преобразованный файл
Приведенный выше пример кода сохранит преобразованный текстовый файл в облаке. Вы можете скачать его, используя следующий фрагмент кода:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Скачать файл из облачного хранилища на Java
public class App {
public static void main(String[] args) {
// Создайте экземпляр API преобразования
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Бесплатный онлайн-конвертер PDF в текст
Как конвертировать PDF в текстовые файлы онлайн бесплатно? Попробуйте онлайн-конвертер PDF в текст, чтобы бесплатно создать текстовый файл из документа PDF. Этот конвертер разработан с использованием вышеупомянутого API PDF в текстовый формат.
Заключение
Это подводит нас к концу этого сообщения в блоге. Вот что вы узнали из этой статьи:
- как программно преобразовать PDF-файлы в текстовые файлы на Java с помощью GroupDocs.Conversion Cloud REST API;
- программно загрузить PDF-файл в облако, а затем загрузить преобразованный текстовый файл из облака;
- и онлайн конвертировать PDF в текст с помощью бесплатного конвертера текста PDF.
Кроме того, GroupDocs.Conversion Cloud REST API — это простой в использовании и мощный инструмент для преобразования PDF-файлов в текстовые файлы на Java. Он также содержит раздел Справочник по API, который позволяет вам визуализировать и взаимодействовать с нашими API напрямую через браузер. Полный исходный код Java SDK находится в свободном доступе на Github. Пожалуйста, проверьте GroupDocs.Conversion Cloud SDK для Java Примеры здесь.
Кроме того, мы рекомендуем вам обратиться к нашему Руководству по началу работы.
Наконец, мы продолжаем писать новые статьи в блоге о преобразовании различных форматов файлов с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.
Задайте вопрос
По любым вопросам о конвертере PDF в текст обращайтесь к нам на бесплатную службу поддержки форум.
Часто задаваемые вопросы
Как настроить REST API GroupDocs.Conversion Cloud в Java?
Чтобы настроить REST API GroupDocs.Conversion Cloud на Java, вам потребуется зарегистрироваться для создания учетной записи, получить ключ API, а затем интегрировать API в свой проект Java с помощью предоставленного SDK. .
Могу ли я преобразовать несколько PDF-документов в текстовые файлы одновременно?
Да, вы можете одновременно преобразовать несколько PDF-файлов в текстовые файлы с помощью GroupDocs.Conversion Cloud REST API, передав массив путей к файлам или URL-адресов.
Могу ли я преобразовать защищенный паролем PDF в текстовые файлы?
Да, вы можете конвертировать PDF-файлы, защищенные паролем, в текстовые файлы с помощью GroupDocs.Conversion Cloud REST API, передав пароль в качестве параметра в запросе API.
Как конвертировать PDF в текст онлайн бесплатно?
Онлайн-конвертер PDF-документов в текст позволяет бесплатно конвертировать PDF-файлы в текст. Пожалуйста, следуйте пошаговым инструкциям, приведенным ниже для конвертации:
- Откройте бесплатный конвертер PDF в текстовый файл онлайн
- Щелкните внутри области перетаскивания файла, чтобы загрузить файл PDF, или перетащите файл PDF.
- Нажмите кнопку «Преобразовать сейчас», бесплатный онлайн-конвертер PDF в текст преобразует PDF в текстовый файл.
- Ссылка для скачивания выходного текстового файла будет доступна сразу после преобразования PDF-файла в текст.
Каков наилучший способ конвертировать PDF в текстовый файл на Java?
Лучший способ преобразовать PDF в текстовый файл на Java — использовать библиотеку или API, специально предназначенную для этой цели, например GroupDocs.Conversion Cloud REST API.
Как преобразовать PDF в текст в Windows?
Посетите эта ссылка, чтобы загрузить автономный конвертер PDF в текстовый файл для Windows. Этот конвертер PDF-документа в текстовый файл можно использовать для быстрого преобразования PDF-файла в текст в Windows одним щелчком мыши.
Смотрите также
Если вы хотите узнать о связанных темах, мы рекомендуем вам посетить следующие статьи:
- Преобразование EXCEL в JSON и JSON в EXCEL в Python
- Как преобразовать CSV в JSON и JSON в CSV в Python
- Преобразование файлов MSG и EML в PDF с использованием API преобразования Python
- Преобразование документов Word в PDF с помощью REST API в Python
- Как конвертировать PDF в Excel в Python с помощью REST API
- Преобразование PDF в редактируемый документ Word с помощью Python SDK
- Как конвертировать PDF в PPTX с помощью REST API в Python
- Преобразование Word в Markdown и Markdown в Word в Python
- Преобразование файла PDF в формат PNG и PNG в формат PDF с помощью Java
- Как конвертировать PowerPoint PPT PPTX в HTML с помощью Java