Як PDF-файл у кілька PDF-файлів у Python

Розбиття документів Python - розділіть PDF-файл на кілька PDF-файлів за допомогою Python.

PDF(Portable Document Format) – це широко використовуваний формат файлів для документів, якими потрібно надати спільний доступ, надрукувати чи заархівувати. Ви втомилися працювати з великими PDF-файлами, які містять кілька документів або розділів? Вам важко витягти окремі сторінки чи розділи з одного PDF-файлу як окремі документи? Розбиття PDF-файлу на декілька менших файлів може значно спростити завдання керування документами. У цій статті ми розглянемо, як розділити PDF-файл на кілька PDF-файлів у Python за допомогою GroupDocs.Merger Cloud SDK для Python.

У цій статті будуть розглянуті такі теми:

Python REST API для розділення PDF на сторінки та інсталяції SDK

GroupDocs.Merger Cloud SDK для Python — це потужний і багатофункціональний набір для розробки програмного забезпечення, який дозволяє програмно керувати файлами PDF. Він надає різноманітні функції, зокрема розділення, об’єднання, обертання та перевпорядкування колекції сторінок у підтримуваних форматах документів. SDK можна інтегрувати в програму на основі Python, щоб спростити процес розробки та підвищити продуктивність.

Ви можете встановити Merger API у своїй програмі Python за допомогою PIP із PyPI, виконавши таку команду в терміналі:

pip install groupdocs-merger-cloud

Далі вам потрібно зареєструватися для безкоштовного пробного облікового запису або придбати план підписки на веб-сайті GroupDocs і отримати ключ API. Отримавши ідентифікатор клієнта та секрет клієнта, додайте наведений нижче фрагмент коду до програми на основі Python:

# Імпорт SDK для злиття groupdocs
import groupdocs_merger_cloud

# Отримайте app_sid і app_key з https://dashboard.groupdocs.cloud після безкоштовної реєстрації.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Отримайте конфігурації File API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Як розділити PDF-сторінки на окремі PDF-файли в Python

Щоб розділити PDF-файл на кілька PDF-файлів за допомогою GroupDocs.Merger Cloud SDK для Python, виконайте такі дії:

Завантажте файли

По-перше, завантажте PDF-файл у хмару, використовуючи наведений нижче приклад коду:

# Створіть екземпляр файлу API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Виклик запиту на завантаження файлу
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Завантажте файл у хмару
response = file_api.upload_file(request)
print(response.uploaded)

У результаті завантажені файли будуть доступні в розділі файлів вашої інформаційної панелі в хмарі.

Розділіть PDF на окремі сторінки в Python

У цьому розділі ми напишемо кроки та приклад фрагмента коду, щоб програмно розділити PDF-сторінки на окремі PDF-файли, як зазначено нижче:

  • По-перше, створіть екземпляр класу DocumentApi.
  • По-друге, створіть екземпляр класу SplitOptions.
  • По-третє, створіть екземпляр класу FileInfo.
  • Укажіть шлях до вхідного файлу як параметр FileInfo.
  • Далі вкажіть вихідний шлях до каталогу.
  • Встановіть певні номери сторінок у масиві, розділеному комами.
  • Тепер установіть режим розділення PDF на Сторінки, щоб розділити номери сторінок.
  • Потім створіть екземпляр класу SplitRequest і передайте параметр SplitOptions.
  • Нарешті, викличте метод DocumentAPI.split() і передайте параметр SplitRequest, щоб отримати результати.

У наступному фрагменті коду показано, як розділити PDF-файли в Python за допомогою REST API:

# Як розділити PDF-файл на кілька окремих PDF-файлів у Python
try:
	# Створіть екземпляр Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Завантажте файл

Наведений вище зразок коду збереже відокремлений файл у хмарі. Ви можете завантажити його за допомогою наступного зразка коду:

# Ініціалізація API для завантаження файлу
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Створити запит на завантаження файлу
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# Завантажити файл
response = file_api.download_file(request)

# Перемістіть завантажений файл у свій каталог
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Це воно!

Розділіть PDF-документ на окремі файли, застосувавши фільтр діапазону

Ви можете відокремити PDF-файли, забезпечивши режим діапазону сторінок і програмно відфільтрувати, виконавши наведені нижче кроки.

  • По-перше, створіть екземпляр класу DocumentApi.
  • По-друге, створіть екземпляр класу SplitOptions.
  • По-третє, створіть екземпляр класу FileInfo.
  • Укажіть шлях до вхідного файлу як параметр FileInfo.
  • Далі введіть вихідний шлях до каталогу як «тестування python».
  • Установіть значення startpagenumber і endpagenumber.
  • Далі встановіть режим діапазону сторінок на OddPages.
  • Тепер установіть режим розділення PDF на Сторінки, щоб розділити номери сторінок.
  • Потім створіть екземпляр класу SplitRequest і передайте параметр SplitOptions.
  • Нарешті, викличте метод DocumentAPI.split() і передайте параметр SplitRequest, щоб отримати результати.

У наведеному нижче фрагменті коду показано, як розділити PDF-файл, застосувавши фільтр у Python за допомогою REST API:

# Як розділити PDF-файл на кілька окремих PDF-файлів за допомогою фільтра
try:
	# Створіть екземпляр Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Розділіть PDF-сторінки на кілька файлів у Python, застосувавши фільтр масиву

У цьому розділі ми напишемо кроки та приклад фрагмента коду для програмного розділення PDF-файлів на багатосторінкові PDF-файли:

  • По-перше, створіть екземпляр класу DocumentApi.
  • По-друге, створіть екземпляр класу SplitOptions.
  • По-третє, створіть екземпляр класу FileInfo.
  • Укажіть шлях до вхідного файлу як параметр FileInfo.
  • Далі введіть вихідний шлях до каталогу як «тестування python».
  • Потім установіть колекцію сторінок у форматі масиву.
  • Щоб розділити PDF-файли, установіть режим розділення PDF на Інтервали.
  • Потім створіть екземпляр класу SplitRequest і передайте параметр SplitOptions.
  • Нарешті, викличте метод DocumentAPI.split() і передайте параметр SplitRequest, щоб отримати результати.

У наступному фрагменті коду показано, як розділити PDF-файли на кілька PDF-файлів у Python за допомогою REST API:

# Як розділити PDF-файл на кілька багатосторінкових файлів у Python
try:
	# Створіть екземпляр Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Безкоштовний онлайн-спліттер PDF

Як розділити PDF-файли онлайн безкоштовно? Будь ласка, спробуйте наведений нижче онлайновий роздільник PDF, щоб безкоштовно розділити документи PDF. Цей онлайн-інструмент для розділення документів розроблено з використанням вищезгаданого REST API.

Висновок

Підсумовуючи, розбиття PDF-файлу на кілька PDF-файлів за допомогою GroupDocs.Merger Cloud SDK для Python забезпечує зручний спосіб керування PDF-документами та керування ними. Ось що ви дізналися з цієї статті:

  • як розділити один файл PDF на кілька файлів за допомогою Python у хмарі;
  • програмно завантажувати та завантажувати файли на Python у хмару;
  • розділити PDF-файли на кілька файлів у Python за допомогою фільтра діапазону сторінок;
  • і безкоштовно розділяйте PDF-файли за допомогою онлайн-розділювача PDF.

Крім того, ми також надаємо розділ довідки API, який дозволяє візуалізувати наші API та спілкуватися з ними безпосередньо через браузер. Повний вихідний код Python SDK є у вільному доступі на GitHub. Будь ласка, перевірте GroupDocs.Merger Cloud SDK для Python Приклади тут.

Крім того, ми пропонуємо вам ознайомитися з нашим посібником із початку роботи, щоб отримати докладні кроки та використання API.

Нарешті, ми продовжуємо писати нові повідомлення в блозі про різні операції з документами за допомогою REST API. Тому зв’яжіться з нами, щоб отримувати регулярні оновлення.

Задайте питання

Якщо у вас є будь-які запитання щодо API розділювача PDF-документів, будь ласка, не соромтеся поставити їх на безкоштовному форумі підтримки.

поширені запитання

Чи можу я розділити PDF-файл на кілька файлів на основі певних сторінок?

Так, використовуючи GroupDocs.Merger Cloud SDK для Python, ви можете визначити діапазон сторінок для вилучення та розділення PDF-файлу на окремі PDF-файли.

Чи підтримує GroupDocs.Merger Cloud SDK для Python інші формати документів, крім PDF?

Так, GroupDocs.Merger Cloud SDK для Python підтримує різні формати документів, зокрема DOCX, XLSX, PPTX тощо. Ви також можете виконувати подібні операції з цими типами файлів.

Чи можна за потреби об’єднати розділені PDF-файли в один?

Так, GroupDocs.Merger Cloud SDK для Python також підтримує об’єднання файлів PDF. За потреби ви можете легко об’єднати розділені PDF-файли в один документ.

Чи зберігає GroupDocs.Merger Cloud SDK для Python оригінальне форматування PDF-файлів під час процесу розділення?

Так, SDK зберігає оригінальне форматування та компонування PDF-файлів, розділяючи їх на кілька файлів.

Дивись також

Щоб отримати додаткову інформацію на пов’язані теми, радимо переглянути такі статті: