PDF atau Portable Document Format adalah format populer untuk berbagi dokumen, tetapi mungkin sulit untuk bekerja dengan PDF saat mengedit atau mengekstraksi teks. Di sinilah Anda perlu mengonversi dokumen PDF menjadi file teks. Mengonversi PDF ke file teks dapat membuat teks lebih mudah diakses, diedit, dan dicari. Dalam posting blog ini, kami akan memperkenalkan cara mengonversi PDF ke file teks secara terprogram di Java menggunakan REST API.
Topik-topik berikut akan dibahas dalam tutorial ini:
- Java PDF menjadi Text Conversion REST API dan Instalasi SDK
- Cara Mengonversi Dokumen PDF ke File TXT di Java menggunakan REST API
Java PDF menjadi API REST Konversi Teks - Instalasi SDK
Untuk mengonversi dokumen PDF menjadi file teks, saya akan menggunakan GroupDocs.Conversion Cloud SDK for Java. Ini adalah solusi REST API platform-independen untuk konversi dokumen dan gambar tanpa bergantung pada perangkat lunak pihak ketiga. Ini juga memungkinkan Anda untuk mengonversi 50+ jenis dokumen dan gambar dari [format file yang didukung] apa pun 6 ke format apa pun yang Anda butuhkan. Anda dapat dengan cepat mengonversi dokumen dari satu format ke format lain seperti Word, PDF, PowerPoint, Excel, HTML, CAD, gambar raster, dll.
Anda dapat mengunduh file JAR API atau menginstal menggunakan konfigurasi Maven. Tambahkan repositori dan dependensi ke file POM.xml proyek Anda. Di bawah ini adalah instruksi untuk Maven:
Repositori Maven:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Ketergantungan Maven:
<dependency>
<groupId>com.groupdocs</groupId
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>23.4</version>
<scope>compile</scope>
</dependency>
Setelah mengintegrasikan GroupDocs.Conversion Cloud SDK ke proyek Java Anda, Daftar untuk mendapatkan akun. Kumpulkan ID Klien dan Rahasia Klien Anda dari dashboard sebelum Anda mulai mengikuti langkah-langkah dan contoh kode yang tersedia. Selain itu, penting untuk memeriksa dokumentasi API dan batas penggunaan sebelum menggunakannya. Silakan masukkan kode yang ditunjukkan di bawah ini setelah Anda memiliki ID dan rahasia Anda:
# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran gratis.
String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
Cara Mengonversi Dokumen PDF ke File TXT di Java menggunakan REST API
Berikut ini adalah langkah-langkah untuk mengonversi PDF ke dokumen teks seperti yang disebutkan di bawah ini:
Unggah File
Pertama, unggah dokumen PDF ke penyimpanan cloud menggunakan potongan kode seperti yang diberikan di bawah ini:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Unggah File ke Cloud Storage menggunakan Java
public class App {
public static void main(String[] args) {
// Buat instance API konversi
FileApi apiInstance = new FileApi(configuration);
try {
File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
FilesUploadResult response = apiInstance.uploadFile(request);
System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Hasilnya, file PDF yang diunggah akan tersedia di bagian file dasbor Anda di cloud.
Ubah PDF menjadi Format Teks di Java
Bagian ini adalah tentang cara mengonversi dokumen PDF ke file teks secara terprogram di Java dengan mengikuti langkah-langkah di bawah ini:
- Pertama, buat instance dari kelas ConvertApi.
- Kedua, buat instance dari kelas ConvertSettings.
- Selanjutnya, berikan nama penyimpanan cloud.
- Tetapkan jalur file PDF masukan dan format file keluaran sebagai “txt”.
- Kemudian, buat instance kelas TxtConvertOptions.
- Secara opsional, setel berbagai opsi konversi seperti setFromPage, setPagesCount, dll.
- Sekarang, atur opsi konversi dan jalur file keluaran menggunakan instance ConvertSettings.
- Setelah itu, buat instance kelas ConvertDocumentRequest dan berikan parameter ConvertSettings.
- Terakhir, panggil metode convert\document() dan berikan parameter ConvertDocumentRequest.
Cuplikan kode berikut menunjukkan cara mengonversi file PDF ke file teks di Java menggunakan REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;
// Cara Mengonversi Dokumen PDF ke File TXT di Java menggunakan REST API
public class App {
public static void main(String[] args) {
// Buat instance API konversi
ConvertApi apiInstance = new ConvertApi(configuration);
try {
// Siapkan pengaturan konversi
ConvertSettings settings = new ConvertSettings();
settings.setStorageName(MyStorage);
settings.setFilePath("java-testing/input-sample-file.pdf");
settings.setFormat("txt");
TxtConvertOptions convertOptions = new TxtConvertOptions();
convertOptions.setFromPage(3);
convertOptions.setPagesCount(5);
settings.setConvertOptions(convertOptions);
settings.setOutputPath("java-testing/output-sample-file.txt");
// mengkonversi ke format yang ditentukan
List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
System.out.println("Document converted successfully: " + response);
} catch (ApiException e) {
System.err.println("Exception while calling Java API: ");
e.printStackTrace();
}
}
}
Unduh File yang Dikonversi
Contoh kode di atas akan menyimpan file teks yang dikonversi ke cloud. Anda dapat mengunduhnya menggunakan cuplikan kode berikut:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.io.File;
// Unduh File dari Cloud Storage di Java
public class App {
public static void main(String[] args) {
// Buat instance API konversi
FileApi apiInstance = new FileApi(configuration);
try {
DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.txt", MyStorage, null);
File response = apiInstance.downloadFile(request);
System.err.println("Expected response type is File: " + response.length());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Konverter PDF ke Teks Online Gratis
Bagaimana cara mengonversi file PDF ke teks online secara gratis? Silakan coba online PDF to text converter untuk membuat file teks dari dokumen PDF secara gratis. Konverter ini dikembangkan menggunakan PDF yang disebutkan di atas ke dalam API format teks.
Kesimpulan
Ini membawa kita ke akhir posting blog ini. Berikut ini adalah apa yang telah Anda pelajari dari artikel ini:
- cara mengonversi PDF menjadi file teks secara terprogram di Java menggunakan GroupDocs.Conversion Cloud REST API;
- unggah file PDF ke cloud secara terprogram dan kemudian unduh file teks yang dikonversi dari cloud;
- dan konversi online PDF ke teks menggunakan konverter teks PDF gratis.
Selain itu, GroupDocs.Conversion Cloud REST API adalah alat yang mudah digunakan dan andal untuk mengonversi PDF ke file teks di Java. Ini juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berkomunikasi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github. Harap periksa SDK Cloud GroupDocs.Conversion untuk Java Contoh di sini.
Selain itu, kami mendorong Anda untuk merujuk ke [Panduan Memulai] kami21.
Terakhir, kami terus menulis artikel blog baru tentang berbagai konversi format file menggunakan REST API. Jadi, silakan hubungi untuk pembaruan rutin.
Berikan pertanyaan
Untuk pertanyaan apa pun tentang konverter PDF ke teks, jangan ragu untuk menghubungi kami di [forum] dukungan gratis 22.
FAQ
Bagaimana cara menyiapkan GroupDocs.Conversion Cloud REST API di Java?
Untuk menyiapkan GroupDocs.Conversion Cloud REST API di Java, Anda perlu mendaftar untuk mendapatkan akun, mendapatkan kunci API, lalu mengintegrasikan API ke dalam proyek Java Anda menggunakan SDK yang disediakan .
Bisakah saya mengonversi banyak dokumen PDF menjadi file teks sekaligus?
Ya, Anda dapat mengonversi beberapa PDF menjadi file teks sekaligus menggunakan GroupDocs.Conversion Cloud REST API dengan meneruskan array jalur file atau URL.
Bisakah saya mengonversi PDF yang dilindungi kata sandi ke file teks?
Ya, Anda dapat mengonversi PDF yang dilindungi kata sandi menjadi file teks menggunakan GroupDocs.Conversion Cloud REST API dengan meneruskan kata sandi sebagai parameter dalam permintaan API.
Bagaimana cara mengonversi PDF ke teks online secara gratis?
Konverter dokumen PDF ke teks online memungkinkan Anda mengonversi PDF ke teks secara gratis. Silakan ikuti petunjuk langkah demi langkah yang diberikan di bawah ini untuk konversi:
- Buka konverter file PDF ke teks gratis online
- Klik di dalam area drop file untuk mengupload file PDF atau drag & drop file PDF.
- Klik tombol Konversi Sekarang, konverter PDF ke teks online gratis akan mengubah PDF menjadi file teks.
- Tautan unduhan file teks keluaran akan tersedia secara instan setelah mengonversi file PDF menjadi teks.
Apa cara terbaik untuk mengonversi PDF ke file teks di Java?
Cara terbaik untuk mengonversi PDF menjadi file teks di Java adalah dengan menggunakan library or API yang dirancang khusus untuk tujuan ini, seperti GroupDocs.Conversion Cloud REST API.
Bagaimana cara mengubah PDF menjadi teks di Windows?
Silakan kunjungi tautan ini untuk mengunduh konverter file PDF ke teks offline untuk Windows. Konverter dokumen PDF ke file teks ini dapat digunakan untuk mengonversi PDF menjadi teks di Windows dengan cepat, dengan satu klik.
Lihat juga
Jika Anda ingin belajar tentang topik terkait kami sarankan Anda mengunjungi artikel berikut:
- Konversikan EXCEL ke JSON dan JSON ke EXCEL dengan Python
- Cara Mengonversi CSV ke JSON dan JSON ke CSV dengan Python
- Konversi file MSG dan EML ke PDF menggunakan API Konversi Python
- Konversi Dokumen Word ke PDF menggunakan REST API dengan Python
- Cara Mengonversi PDF ke Excel dengan Python menggunakan REST API
- Konversi PDF ke Dokumen Word yang Dapat Diedit dengan Python SDK
- Cara Mengonversi PDF ke PPTX menggunakan REST API dengan Python
- Konversi Word ke Markdown dan Markdown ke Word dengan Python
- Konversi File PDF ke PNG dan PNG ke Format PDF menggunakan Java
- Bagaimana Mengkonversi PowerPoint PPT PPTX ke HTML menggunakan Java