Convert PDF to text in Java with GroupDocs.Conversion Cloud REST API.

How to Convert PDF to Text File Programmatically in Java

PDF або Portable Document Format — популярний формат для обміну документами, але працювати з PDF-файлами може бути складно, коли потрібно редагувати або видобувати текст. Тут вам потрібно перетворити PDF-документи на текст файли. Перетворення PDF-файлів на текстові може зробити текст більш доступним, доступним для редагування та пошуку. У цій публікації блогу ми представимо, як програмно конвертувати PDF у текстовий файл на Java за допомогою REST API.

У цьому посібнику розглядатимуться такі теми:

Java PDF into Text Conversion REST API – встановлення SDK

Для перетворення документів PDF у текстові файли я буду використовувати GroupDocs.Conversion Cloud SDK для Java. Це незалежне від платформи рішення REST API для перетворення документів і зображень без використання програмного забезпечення сторонніх розробників. Він також дозволяє конвертувати понад 50 типів документів і зображень будь-якого підтримуваного формату файлу у будь-який потрібний формат. Ви можете швидко конвертувати документи з одного формату в інший, як-от Word, PDF, PowerPoint, Excel, HTML, CAD, растрові зображення тощо.

Ви можете завантажити JAR-файл API або встановити за допомогою конфігурацій Maven. Додайте репозиторій і залежність до файлу POM.xml вашого проекту. Нижче наведено інструкції для Maven:

Репозиторій Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Залежність Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Після інтеграції GroupDocs.Conversion Cloud SDK у ваш проект Java зареєструйтеся, щоб створити обліковий запис. Зберіть свій ідентифікатор клієнта та секрет клієнта з інформаційної панелі, перш ніж почати виконувати кроки та доступні приклади коду. Крім того, важливо перевірити документацію API і обмеження використання перед його використанням. Будь ласка, введіть наведений нижче код, коли ви отримаєте свій ідентифікатор і секрет:

# Отримайте свій client_id і client_secret на https://dashboard.groupdocs.cloud після безкоштовної реєстрації.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Як конвертувати PDF-документ у файл TXT у Java за допомогою REST API

Нижче наведено кроки для перетворення PDF-файлу на текстовий документ, як зазначено нижче.

Завантажте файл

По-перше, завантажте PDF-документ у хмарне сховище за допомогою фрагмента коду, наведеного нижче:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Завантажте файл у хмарне сховище за допомогою Java
public class App {

  public static void main(String[] args) {
        
    // Створіть екземпляр API перетворення          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

У результаті завантажений PDF-файл буде доступний у розділі файлів вашої інформаційної панелі в хмарі.

Перетворення PDF у текстовий формат у Java

У цьому розділі розповідається про те, як програмно перетворити PDF-документ у текстовий файл на Java, виконавши наведені нижче дії.

  • По-перше, створіть екземпляр класу ConvertApi.
  • По-друге, створіть екземпляр класу ConvertSettings.
  • Далі введіть назву хмарного сховища.
  • Встановіть шлях до вхідного файлу PDF і формат вихідного файлу як «txt».
  • Потім створіть екземпляр класу TxtConvertOptions.
  • За бажанням можна встановити різні параметри перетворення, наприклад setFromPage, setPagesCount тощо.
  • Тепер встановіть параметри перетворення та шлях до вихідного файлу за допомогою екземпляра ConvertSettings.
  • Після цього створіть екземпляр класу ConvertDocumentRequest і передайте параметр ConvertSettings.
  • Нарешті, викличте метод convert\document() і передайте параметр ConvertDocumentRequest.

У наступному фрагменті коду показано, як перетворити PDF-файл у текстовий файл у Java за допомогою REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Як конвертувати PDF-документ у файл TXT у Java за допомогою REST API
public class App {

  public static void main(String[] args) {
    
    // Створіть екземпляр API перетворення
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Підготуйте параметри конвертації
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // конвертувати у вказаний формат
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java програмно конвертує PDF у текстовий файл

Програмно конвертуйте PDF у текстовий файл у Java.

Завантажте конвертований файл

Наведений вище зразок коду збереже перетворений текстовий файл у хмарі. Ви можете завантажити його за допомогою такого фрагмента коду:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Завантажте файл із хмарного сховища на Java
public class App {

  public static void main(String[] args) {
        
    // Створіть екземпляр API перетворення          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Безкоштовний онлайн-конвертер PDF у текст

Як конвертувати PDF у текстові файли онлайн безкоштовно? Спробуйте онлайн-конвертер PDF-текст, щоб безкоштовно створити текстовий файл із PDF-документа. Цей конвертер розроблено з використанням вищезгаданого API PDF у текстовий формат.

convert pdf to text online

Висновок

Це підійшло до кінця цієї публікації в блозі. Ось що ви дізналися з цієї статті:

  • як програмно конвертувати PDF-файли в текстові файли на Java за допомогою GroupDocs.Conversion Cloud REST API;
  • програмно завантажити PDF-файл у хмару, а потім завантажити перетворений текстовий файл із хмари;
  • і онлайн конвертувати PDF у текст за допомогою безкоштовного конвертера тексту PDF.

Крім того, GroupDocs.Conversion Cloud REST API є простим у використанні та потужним інструментом для перетворення PDF-файлів у текстові файли на Java. Він також містить розділ API Reference, який дозволяє візуалізувати наші API та спілкуватися з ними безпосередньо через браузер. Повний вихідний код Java SDK є у вільному доступі на Github. Будь ласка, перевірте GroupDocs.Conversion Cloud SDK для Java Приклади тут.

Крім того, радимо вам переглянути наш Посібник із початку роботи.

Нарешті, ми продовжуємо писати нові статті в блозі про перетворення різних форматів файлів за допомогою REST API. Тому зв’яжіться з нами, щоб регулярно отримувати оновлення.

Задайте питання

Якщо у вас виникли запитання щодо конвертера PDF у текст, зв’яжіться з нами на безкоштовному [форумі] підтримки 22.

поширені запитання

Як налаштувати GroupDocs.Conversion Cloud REST API на Java?

Щоб налаштувати GroupDocs.Conversion Cloud REST API у Java, вам потрібно буде зареєструватися для облікового запису, отримати ключ API, а потім інтегрувати API у свій проект Java за допомогою наданого SDK .

Чи можу я конвертувати декілька документів PDF у текстові файли одночасно?

Так, ви можете конвертувати кілька PDF-файлів у текстові файли одночасно за допомогою GroupDocs.Conversion Cloud REST API, передаючи масив шляхів до файлів або URL-адрес.

Чи можу я конвертувати захищені паролем PDF у текстові файли?

Так, ви можете конвертувати захищені паролем PDF-файли в текстові файли за допомогою GroupDocs.Conversion Cloud REST API, передавши пароль як параметр у запиті API.

Як конвертувати PDF в текст онлайн безкоштовно?

Онлайн-конвертатор документів PDF у текст дозволяє безкоштовно конвертувати PDF у текст. Будь ласка, дотримуйтеся наведених нижче покрокових інструкцій для перетворення:

  • Відкрийте безкоштовний конвертер файлів PDF у текстовий онлайн
  • Клацніть усередині області падіння файлу, щоб завантажити файл PDF, або перетягніть файл PDF.
  • Натисніть кнопку «Перетворити зараз», безкоштовний онлайн-конвертер PDF у текст перетворить PDF у текстовий файл.
  • Посилання для завантаження вихідного текстового файлу буде доступним миттєво після перетворення PDF-файлу на текст.

Який найкращий спосіб конвертувати PDF у текстовий файл у Java?

Найкращий спосіб конвертувати PDF-файл у текстовий файл у Java — це використовувати бібліотеку або API, спеціально розроблену для цієї мети, наприклад GroupDocs.Conversion Cloud REST API.

Як конвертувати PDF у текст у Windows?

Будь ласка, перейдіть це посилання, щоб завантажити автономний конвертер PDF-файлу в текстовий файл для Windows. Цей конвертер PDF-документів у текстові файли можна використовувати для швидкого перетворення PDF-файлів у текст у Windows одним клацанням миші.

Дивись також

Якщо ви хочете дізнатися про пов’язані теми, рекомендуємо вам переглянути такі статті: