Преобразование PDF в текст на Java с помощью GroupDocs.Conversion Cloud REST API.

Как программно преобразовать PDF в текстовый файл в Java

PDF или Portable Document Format — это популярный формат для обмена документами, но работать с PDF-файлами может быть сложно, когда дело доходит до редактирования или извлечения текста. Здесь вам нужно конвертировать PDF-документы в файлы text. Преобразование PDF-файлов в текстовые файлы может сделать текст более доступным, доступным для редактирования и поиска. В этом сообщении блога мы расскажем, как программно конвертировать PDF в текстовый файл на Java с использованием REST API.

В этом уроке будут рассмотрены следующие темы:

Преобразование Java PDF в текст REST API — установка SDK

Для преобразования PDF-документов в текстовые файлы я буду использовать GroupDocs.Conversion Cloud SDK для Java. Это независимое от платформы решение REST API для преобразования документов и изображений без использования какого-либо стороннего программного обеспечения. Он также позволяет конвертировать более 50 типов документов и изображений любого поддерживаемого формата файлов в любой нужный вам формат. Вы можете быстро конвертировать документы из одного формата в другой, например Word, PDF, PowerPoint, Excel, HTML, CAD, растровые изображения и т. д.

Вы можете скачать JAR-файл API или установить его, используя конфигурации Maven. Добавьте репозиторий и зависимость в файл POM.xml вашего проекта. Ниже приведены инструкции для Maven:

Репозиторий Мавена:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Зависимость Мейвена:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

После интеграции SDK GroupDocs.Conversion Cloud в проект Java Зарегистрируйтесь для получения учетной записи. Соберите свой идентификатор клиента и секрет клиента на панели инструментов, прежде чем приступать к выполнению шагов и доступных примеров кода. Кроме того, перед его использованием важно проверить документацию по API и ограничения на использование. Пожалуйста, введите код, показанный ниже, как только вы получите свой идентификатор и секрет:

# Получите свой client_id и client_secret с https://dashboard.groupdocs.cloud после бесплатной регистрации.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Как преобразовать PDF-документ в файл TXT на Java с помощью REST API

Ниже приведены шаги для преобразования PDF в текстовый документ, как указано ниже:

Загрузить файл

Во-первых, загрузите документ PDF в облачное хранилище, используя фрагмент кода, как показано ниже:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Загрузить файл в облачное хранилище с помощью Java
public class App {

  public static void main(String[] args) {
        
    // Создайте экземпляр API преобразования          
    FileApi apiInstance = new FileApi(configuration);
    try {
      File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
      UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
      FilesUploadResult response = apiInstance.uploadFile(request);
      System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

В результате загруженный PDF-файл будет доступен в разделе файлов вашей панели управления в облаке.

Преобразование PDF в текстовый формат в Java

Этот раздел посвящен тому, как программно преобразовать PDF-документ в текстовый файл на Java, выполнив следующие действия:

  • Во-первых, создайте экземпляр класса ConvertApi.
  • Во-вторых, создайте экземпляр класса ConvertSettings.
  • Затем укажите имя облачного хранилища.
  • Установите путь к входному файлу PDF и формат выходного файла как «txt».
  • Затем создайте экземпляр класса TxtConvertOptions.
  • При желании установите различные параметры преобразования, такие как setFromPage, setPagesCount и т. д.
  • Теперь установите параметры преобразования и путь к выходному файлу с помощью экземпляра ConvertSettings.
  • После этого создайте экземпляр класса ConvertDocumentRequest и передайте параметр ConvertSettings.
  • Наконец, вызовите метод convert\document() и передайте параметр ConvertDocumentRequest.

В следующем фрагменте кода показано, как преобразовать PDF-файл в текстовый файл на Java с помощью REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Как преобразовать PDF-документ в файл TXT на Java с помощью REST API
public class App {

  public static void main(String[] args) {
    
    // Создайте экземпляр API преобразования
    ConvertApi apiInstance = new ConvertApi(configuration);
          
    try {
       
      // Подготовьте настройки конвертации
      ConvertSettings settings = new ConvertSettings();
      settings.setStorageName(MyStorage);
      settings.setFilePath("java-testing/input-sample-file.pdf");
      settings.setFormat("txt");
      
      TxtConvertOptions convertOptions = new TxtConvertOptions();
      convertOptions.setFromPage(3);
      convertOptions.setPagesCount(5);
        
      settings.setConvertOptions(convertOptions);
      settings.setOutputPath("java-testing/output-sample-file.txt");
    
      // преобразовать в указанный формат
      List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
      System.out.println("Document converted successfully: " + response);
      
    } catch (ApiException e) {
      System.err.println("Exception while calling Java API: ");
      e.printStackTrace();
    }
  }
}
Java конвертировать PDF в текстовый файл программно в

Преобразование PDF в текстовый файл программно на Java.

Загрузите преобразованный файл

Приведенный выше пример кода сохранит преобразованный текстовый файл в облаке. Вы можете скачать его, используя следующий фрагмент кода:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Скачать файл из облачного хранилища на Java
public class App {

  public static void main(String[] args) {
        
    // Создайте экземпляр API преобразования          
    FileApi apiInstance = new FileApi(configuration);
    try {
      DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
      File response = apiInstance.downloadFile(request);
      System.err.println("Expected response type is File: " + response.length());
    } catch (ApiException e) {
      System.err.println("Exception while calling FileApi:");
      e.printStackTrace();
    }
    
  }
}

Бесплатный онлайн-конвертер PDF в текст

Как конвертировать PDF в текстовые файлы онлайн бесплатно? Попробуйте онлайн-конвертер PDF в текст, чтобы бесплатно создать текстовый файл из документа PDF. Этот конвертер разработан с использованием вышеупомянутого API PDF в текстовый формат.

convert pdf to text online

Заключение

Это подводит нас к концу этого сообщения в блоге. Вот что вы узнали из этой статьи:

  • как программно преобразовать PDF-файлы в текстовые файлы на Java с помощью GroupDocs.Conversion Cloud REST API;
  • программно загрузить PDF-файл в облако, а затем загрузить преобразованный текстовый файл из облака;
  • и онлайн конвертировать PDF в текст с помощью бесплатного конвертера текста PDF.

Кроме того, GroupDocs.Conversion Cloud REST API — это простой в использовании и мощный инструмент для преобразования PDF-файлов в текстовые файлы на Java. Он также содержит раздел Справочник по API, который позволяет вам визуализировать и взаимодействовать с нашими API напрямую через браузер. Полный исходный код Java SDK находится в свободном доступе на Github. Пожалуйста, проверьте GroupDocs.Conversion Cloud SDK для Java Примеры здесь.

Кроме того, мы рекомендуем вам обратиться к нашему Руководству по началу работы.

Наконец, мы продолжаем писать новые статьи в блоге о преобразовании различных форматов файлов с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.

Задайте вопрос

По любым вопросам о конвертере PDF в текст обращайтесь к нам на бесплатную службу поддержки форум.

Часто задаваемые вопросы

Как настроить REST API GroupDocs.Conversion Cloud в Java?

Чтобы настроить REST API GroupDocs.Conversion Cloud на Java, вам потребуется зарегистрироваться для создания учетной записи, получить ключ API, а затем интегрировать API в свой проект Java с помощью предоставленного SDK. .

Могу ли я преобразовать несколько PDF-документов в текстовые файлы одновременно?

Да, вы можете одновременно преобразовать несколько PDF-файлов в текстовые файлы с помощью GroupDocs.Conversion Cloud REST API, передав массив путей к файлам или URL-адресов.

Могу ли я преобразовать защищенный паролем PDF в текстовые файлы?

Да, вы можете конвертировать PDF-файлы, защищенные паролем, в текстовые файлы с помощью GroupDocs.Conversion Cloud REST API, передав пароль в качестве параметра в запросе API.

Как конвертировать PDF в текст онлайн бесплатно?

Онлайн-конвертер PDF-документов в текст позволяет бесплатно конвертировать PDF-файлы в текст. Пожалуйста, следуйте пошаговым инструкциям, приведенным ниже для конвертации:

  • Откройте бесплатный конвертер PDF в текстовый файл онлайн
  • Щелкните внутри области перетаскивания файла, чтобы загрузить файл PDF, или перетащите файл PDF.
  • Нажмите кнопку «Преобразовать сейчас», бесплатный онлайн-конвертер PDF в текст преобразует PDF в текстовый файл.
  • Ссылка для скачивания выходного текстового файла будет доступна сразу после преобразования PDF-файла в текст.

Каков наилучший способ конвертировать PDF в текстовый файл на Java?

Лучший способ преобразовать PDF в текстовый файл на Java — использовать библиотеку или API, специально предназначенную для этой цели, например GroupDocs.Conversion Cloud REST API.

Как преобразовать PDF в текст в Windows?

Посетите эта ссылка, чтобы загрузить автономный конвертер PDF в текстовый файл для Windows. Этот конвертер PDF-документа в текстовый файл можно использовать для быстрого преобразования PDF-файла в текст в Windows одним щелчком мыши.

Смотрите также

Если вы хотите узнать о связанных темах, мы рекомендуем вам посетить следующие статьи: