PDF або Portable Document Format — популярний формат для обміну документами, але працювати з PDF-файлами може бути складно, коли потрібно редагувати або видобувати текст. Тут вам потрібно перетворити PDF-документи на текст файли. Перетворення PDF-файлів на текстові може зробити текст більш доступним, доступним для редагування та пошуку. У цій публікації блогу ми представимо, як програмно конвертувати PDF у текстовий файл на Java за допомогою REST API.
У цьому посібнику розглядатимуться такі теми:
- Інсталяція REST API для перетворення Java PDF у текст і SDK
- Як конвертувати PDF-документ у файл TXT у Java за допомогою REST API
Java PDF into Text Conversion REST API – встановлення SDK
Для перетворення документів PDF у текстові файли я буду використовувати GroupDocs.Conversion Cloud SDK для Java. Це незалежне від платформи рішення REST API для перетворення документів і зображень без використання програмного забезпечення сторонніх розробників. Він також дозволяє конвертувати понад 50 типів документів і зображень будь-якого підтримуваного формату файлу у будь-який потрібний формат. Ви можете швидко конвертувати документи з одного формату в інший, як-от Word, PDF, PowerPoint, Excel, HTML, CAD, растрові зображення тощо.
Ви можете завантажити JAR-файл API або встановити за допомогою конфігурацій Maven. Додайте репозиторій і залежність до файлу POM.xml вашого проекту. Нижче наведено інструкції для Maven:
Репозиторій Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Залежність Maven:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Після інтеграції GroupDocs.Conversion Cloud SDK у ваш проект Java зареєструйтеся, щоб створити обліковий запис. Зберіть свій ідентифікатор клієнта та секрет клієнта з інформаційної панелі, перш ніж почати виконувати кроки та доступні приклади коду. Крім того, важливо перевірити документацію API і обмеження використання перед його використанням. Будь ласка, введіть наведений нижче код, коли ви отримаєте свій ідентифікатор і секрет:
# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після безкоштовної реєстрації.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Як конвертувати PDF-документ у файл TXT у Java за допомогою REST API
Нижче наведено кроки для перетворення PDF-файлу на текстовий документ, як зазначено нижче.
- Завантажте документ PDF у хмару
- Перетворити PDF-файл у текстовий на Java
- Завантажити конвертований файл
Завантажте файл
По-перше, завантажте PDF-документ у хмарне сховище за допомогою фрагмента коду, наведеного нижче:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Завантажте файл у хмарне сховище за допомогою Java
public class App {
public static void main(String[] args) {
// Створіть екземпляр API перетворення
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
У результаті завантажений PDF-файл буде доступний у розділі файлів вашої інформаційної панелі в хмарі.
Перетворення PDF у текстовий формат у Java
У цьому розділі розповідається про те, як програмно перетворити PDF-документ у текстовий файл на Java, виконавши наведені нижче дії.
- По-перше, створіть екземпляр класу ConvertApi.
- По-друге, створіть екземпляр класу ConvertSettings.
- Далі введіть назву хмарного сховища.
- Встановіть шлях до вхідного файлу PDF і формат вихідного файлу як «txt».
- Потім створіть екземпляр класу TxtConvertOptions.
- За бажанням можна встановити різні параметри перетворення, наприклад setFromPage, setPagesCount тощо.
- Тепер встановіть параметри перетворення та шлях до вихідного файлу за допомогою екземпляра ConvertSettings.
- Після цього створіть екземпляр класу ConvertDocumentRequest і передайте параметр ConvertSettings.
- Нарешті, викличте метод convert\document() і передайте параметр ConvertDocumentRequest.
У наступному фрагменті коду показано, як перетворити PDF-файл у текстовий файл у Java за допомогою REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Як конвертувати PDF-документ у файл TXT у Java за допомогою REST API
public class App {
public static void main(String[] args) {
// Створіть екземпляр API перетворення
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Підготуйте параметри конвертації
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// конвертувати у вказаний формат
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Завантажте конвертований файл
Наведений вище зразок коду збереже перетворений текстовий файл у хмарі. Ви можете завантажити його за допомогою такого фрагмента коду:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Завантажте файл із хмарного сховища на Java
public class App {
public static void main(String[] args) {
// Створіть екземпляр API перетворення
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Безкоштовний онлайн-конвертер PDF у текст
Як конвертувати PDF у текстові файли онлайн безкоштовно? Спробуйте онлайн-конвертер PDF-текст, щоб безкоштовно створити текстовий файл із PDF-документа. Цей конвертер розроблено з використанням вищезгаданого API PDF у текстовий формат.
Висновок
Це підійшло до кінця цієї публікації в блозі. Ось що ви дізналися з цієї статті:
- як програмно конвертувати PDF-файли в текстові файли на Java за допомогою GroupDocs.Conversion Cloud REST API;
- програмно завантажити PDF-файл у хмару, а потім завантажити перетворений текстовий файл із хмари;
- і онлайн конвертувати PDF у текст за допомогою безкоштовного конвертера тексту PDF.
Крім того, GroupDocs.Conversion Cloud REST API є простим у використанні та потужним інструментом для перетворення PDF-файлів у текстові файли на Java. Він також містить розділ API Reference, який дозволяє візуалізувати наші API та спілкуватися з ними безпосередньо через браузер. Повний вихідний код Java SDK є у вільному доступі на Github. Будь ласка, перевірте GroupDocs.Conversion Cloud SDK для Java Приклади тут.
Крім того, радимо вам переглянути наш Посібник із початку роботи.
Нарешті, ми продовжуємо писати нові статті в блозі про перетворення різних форматів файлів за допомогою REST API. Тому зв’яжіться з нами, щоб регулярно отримувати оновлення.
Задайте питання
Якщо у вас виникли запитання щодо конвертера PDF у текст, зв’яжіться з нами на безкоштовному [форумі] підтримки 22.
поширені запитання
Як налаштувати GroupDocs.Conversion Cloud REST API на Java?
Щоб налаштувати GroupDocs.Conversion Cloud REST API у Java, вам потрібно буде зареєструватися для облікового запису, отримати ключ API, а потім інтегрувати API у свій проект Java за допомогою наданого SDK .
Чи можу я конвертувати декілька документів PDF у текстові файли одночасно?
Так, ви можете конвертувати кілька PDF-файлів у текстові файли одночасно за допомогою GroupDocs.Conversion Cloud REST API, передаючи масив шляхів до файлів або URL-адрес.
Чи можу я конвертувати захищені паролем PDF у текстові файли?
Так, ви можете конвертувати захищені паролем PDF-файли в текстові файли за допомогою GroupDocs.Conversion Cloud REST API, передавши пароль як параметр у запиті API.
Як конвертувати PDF в текст онлайн безкоштовно?
Онлайн-конвертатор документів PDF у текст дозволяє безкоштовно конвертувати PDF у текст. Будь ласка, дотримуйтеся наведених нижче покрокових інструкцій для перетворення:
- Відкрийте безкоштовний конвертер файлів PDF у текстовий онлайн
- Клацніть усередині області падіння файлу, щоб завантажити файл PDF, або перетягніть файл PDF.
- Натисніть кнопку «Перетворити зараз», безкоштовний онлайн-конвертер PDF у текст перетворить PDF у текстовий файл.
- Посилання для завантаження вихідного текстового файлу буде доступним миттєво після перетворення PDF-файлу на текст.
Який найкращий спосіб конвертувати PDF у текстовий файл у Java?
Найкращий спосіб конвертувати PDF-файл у текстовий файл у Java — це використовувати бібліотеку або API, спеціально розроблену для цієї мети, наприклад GroupDocs.Conversion Cloud REST API.
Як конвертувати PDF у текст у Windows?
Будь ласка, перейдіть це посилання, щоб завантажити автономний конвертер PDF-файлу в текстовий файл для Windows. Цей конвертер PDF-документів у текстові файли можна використовувати для швидкого перетворення PDF-файлів у текст у Windows одним клацанням миші.
Дивись також
Якщо ви хочете дізнатися про пов’язані теми, рекомендуємо вам переглянути такі статті:
- Перетворіть EXCEL на JSON і JSON на EXCEL у Python
- Як конвертувати CSV у JSON і JSON у CSV у Python
- Перетворення файлів MSG і EML у PDF за допомогою Python Conversion API
- Перетворюйте документи Word у PDF за допомогою REST API у Python
- Як конвертувати PDF у Excel на Python за допомогою REST API
- Перетворіть PDF на редагований документ Word за допомогою Python SDK
- Як конвертувати PDF у PPTX за допомогою REST API у Python
- Перетворіть Word у Markdown і Markdown у Word у Python
- Перетворіть файл PDF у формат PNG і PNG у формат PDF за допомогою Java
- Як конвертувати PowerPoint PPT PPTX у HTML за допомогою Java