Как преобразовать PDF-файл в несколько PDF-файлов в Python

Разделение документа Python. Разделите PDF-файл на несколько PDF-файлов с помощью Python.

PDF(Portable Document Format) — это широко используемый формат файлов для документов, которыми необходимо делиться, распечатывать или архивировать. Вы устали иметь дело с большими PDF-файлами, содержащими несколько документов или разделов? Вам трудно извлекать определенные страницы или разделы из одного файла PDF в виде отдельных документов? Разделение файла PDF на несколько файлов меньшего размера может значительно упростить задачи управления документами. В этой статье мы рассмотрим, как разделить PDF-файл на несколько PDF-файлов в Python с помощью GroupDocs.Merger Cloud SDK для Python.

В этой статье должны быть раскрыты следующие темы:

Python REST API для разделения PDF на страницы и установки SDK

GroupDocs.Merger Cloud SDK для Python — это мощный и многофункциональный комплект для разработки программного обеспечения, позволяющий программно управлять PDF-файлами. Он предоставляет различные функции, включая разделение, слияние, вращение и изменение порядка набора страниц в поддерживаемых форматах документов. SDK можно интегрировать в приложение на основе Python, чтобы упростить процесс разработки и повысить производительность.

Вы можете установить Merger API в свое приложение Python с помощью PIP из PyPI, выполнив в терминале следующую команду:

pip install groupdocs-merger-cloud

Затем вам нужно зарегистрироваться для получения бесплатной пробной учетной записи или приобрести план подписки на веб-сайте GroupDocs и получить ключ API. Получив идентификатор клиента и секрет клиента, добавьте приведенный ниже фрагмент кода в приложение на основе Python:

# Импорт пакета SDK для слияния групповых документов
import groupdocs_merger_cloud

# Получите app_sid и app_key с https://dashboard.groupdocs.cloud после бесплатной регистрации.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Получить конфигурации файлового API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Как разделить PDF-страницы на отдельные PDF-файлы в Python

Чтобы разделить PDF-файл на несколько PDF-файлов с помощью GroupDocs.Merger Cloud SDK для Python, выполните следующие действия.

Загрузите файлы

Во-первых, загрузите файл PDF в облако, используя приведенный ниже пример кода:

# Создайте экземпляр файлового API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Вызов запроса на загрузку файла
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Загрузить файл в облако
response = file_api.upload_file(request)
print(response.uploaded)

В результате загруженные файлы будут доступны в разделе файлов вашей панели управления в облаке.

Разделить PDF на отдельные страницы в Python

В этом разделе мы напишем шаги и пример фрагмента кода для программного разделения страниц PDF на отдельные файлы PDF, как показано ниже:

  • Во-первых, создайте экземпляр класса DocumentApi.
  • Во-вторых, создайте экземпляр класса SplitOptions.
  • В-третьих, создайте экземпляр класса FileInfo.
  • Укажите путь к входному файлу в качестве параметра FileInfo.
  • Затем укажите путь к выходному каталогу.
  • Задайте конкретные номера страниц в массиве, разделенном запятыми.
  • Теперь установите режим разделения PDF на Страницы, чтобы разделить номера страниц.
  • Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
  • Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.

В следующем фрагменте кода показано, как разделить PDF-файлы в Python с помощью REST API:

# Как разделить PDF-файл на несколько отдельных PDF-файлов в Python
try:
	# Создайте экземпляр API документа
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Загрузите файл

Приведенный выше пример кода сохранит разделенный файл в облаке. Вы можете загрузить его, используя следующий пример кода:

# Инициализация API для загрузки файла
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Создать запрос на скачивание файла
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# Загрузить файл
response = file_api.download_file(request)

# Переместите загруженный файл в свой каталог
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Вот и все!

Разделить PDF-документ на отдельные файлы, применив фильтр диапазона

Вы можете разделить PDF-файлы, предоставив режим диапазона страниц и программно отфильтровав их, выполнив следующие шаги:

  • Во-первых, создайте экземпляр класса DocumentApi.
  • Во-вторых, создайте экземпляр класса SplitOptions.
  • В-третьих, создайте экземпляр класса FileInfo.
  • Укажите путь к входному файлу в качестве параметра FileInfo.
  • Затем укажите путь к выходному каталогу как «python-testing».
  • Установите значения startpagenumber и endpagenumber.
  • Затем установите режим диапазона страниц в OddPages.
  • Теперь установите режим разделения PDF на Страницы, чтобы разделить номера страниц.
  • Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
  • Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.

В следующем фрагменте кода показано, как разделить PDF-файл, применив фильтр в Python с помощью REST API:

# Как разделить PDF-файл на несколько отдельных PDF-файлов с помощью фильтра
try:
	# Создайте экземпляр API документа
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Разделите страницы PDF на несколько файлов в Python, применив фильтр массива

В этом разделе мы напишем шаги и пример фрагмента кода для программного разделения PDF-файлов на многостраничные PDF-файлы:

  • Во-первых, создайте экземпляр класса DocumentApi.
  • Во-вторых, создайте экземпляр класса SplitOptions.
  • В-третьих, создайте экземпляр класса FileInfo.
  • Укажите путь к входному файлу в качестве параметра FileInfo.
  • Затем укажите путь к выходному каталогу как «python-testing».
  • Затем установите коллекцию страниц в формате массива.
  • Установите для режима разделения PDF значение «Интервалы», чтобы разделить файлы PDF.
  • Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
  • Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.

В следующем фрагменте кода показано, как разделить PDF-файлы на несколько PDF-файлов в Python с помощью REST API:

# Как разделить файл PDF на несколько многостраничных файлов в Python
try:
	# Создайте экземпляр API документа
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Бесплатный онлайн-разделитель PDF

Как разделить файлы PDF онлайн бесплатно? Пожалуйста, попробуйте следующий онлайн-разделитель PDF для бесплатного разделения PDF-документов. Этот онлайн-инструмент для разделения документов разработан с использованием вышеупомянутого REST API.

Заключение

В заключение, разделение PDF-файла на несколько PDF-файлов с помощью GroupDocs.Merger Cloud SDK для Python предоставляет удобный способ управления вашими PDF-документами и манипулирования ими. Вот что вы узнали из этой статьи:

  • как разделить один файл PDF на несколько файлов с помощью Python в облаке;
  • программно загружать и скачивать файлы на Python в облаке;
  • разделить PDF-файлы на несколько файлов в Python с помощью фильтра диапазона страниц;
  • и разделяйте PDF-файлы бесплатно с помощью онлайн-разделителя PDF.

Кроме того, мы также предоставляем раздел справки по API, который позволяет вам визуализировать наши API и взаимодействовать с ними напрямую через браузер. Полный исходный код Python SDK находится в свободном доступе на GitHub. Пожалуйста, ознакомьтесь с SDK GroupDocs.Merge Cloud для Python Примеры здесь.

Кроме того, мы рекомендуем вам следовать нашему Руководству по началу работы для получения подробных инструкций и использования API.

Наконец, мы продолжаем писать новые сообщения в блогах о различных операциях с документами с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.

Задайте вопрос

Если у вас есть какие-либо вопросы об API разделителя PDF-документов, задайте их нам на Форуме бесплатной поддержки.

Часто задаваемые вопросы

Могу ли я разделить файл PDF на несколько файлов на основе определенных страниц?

Да, используя GroupDocs.Merger Cloud SDK для Python, вы можете определить диапазон страниц для извлечения и разделения PDF-файла на отдельные PDF-файлы.

Поддерживает ли GroupDocs.Merger Cloud SDK для Python другие форматы документов помимо PDF?

Да, GroupDocs.Merger Cloud SDK для Python поддерживает различные форматы документов, включая DOCX, XLSX, PPTX и другие. Аналогичные операции можно выполнять и с этими типами файлов.

Можно ли при необходимости объединить разделенные файлы PDF обратно в один файл?

Да, GroupDocs.Merger Cloud SDK для Python также поддерживает слияние PDF-файлов. При необходимости вы можете легко объединить разделенные PDF-файлы в один документ.

Сохраняет ли GroupDocs.Merger Cloud SDK для Python исходное форматирование файлов PDF в процессе разделения?

Да, SDK сохраняет исходное форматирование и макет PDF-файлов, разбивая их на несколько файлов.

Смотрите также

Для получения дополнительной информации по связанным темам мы предлагаем ознакомиться со следующими статьями: