PDF(Portable Document Format) — это широко используемый формат файлов для документов, которыми необходимо делиться, распечатывать или архивировать. Вы устали иметь дело с большими PDF-файлами, содержащими несколько документов или разделов? Вам трудно извлекать определенные страницы или разделы из одного файла PDF в виде отдельных документов? Разделение файла PDF на несколько файлов меньшего размера может значительно упростить задачи управления документами. В этой статье мы рассмотрим, как разделить PDF-файл на несколько PDF-файлов в Python с помощью GroupDocs.Merger Cloud SDK для Python.
В этой статье должны быть раскрыты следующие темы:
- Python REST API для разделения PDF на страницы и установки SDK
- Как разделить страницы PDF на отдельные файлы PDF в Python
- Разделить PDF-документ на отдельные файлы, применив фильтр диапазона
- Разделить страницы PDF на несколько файлов в Python, применив фильтр массива
Python REST API для разделения PDF на страницы и установки SDK
GroupDocs.Merger Cloud SDK для Python — это мощный и многофункциональный комплект для разработки программного обеспечения, позволяющий программно управлять PDF-файлами. Он предоставляет различные функции, включая разделение, слияние, вращение и изменение порядка набора страниц в поддерживаемых форматах документов. SDK можно интегрировать в приложение на основе Python, чтобы упростить процесс разработки и повысить производительность.
Вы можете установить Merger API в свое приложение Python с помощью PIP из PyPI, выполнив в терминале следующую команду:
pip install groupdocs-merger-cloud
Затем вам нужно зарегистрироваться для получения бесплатной пробной учетной записи или приобрести план подписки на веб-сайте GroupDocs и получить ключ API. Получив идентификатор клиента и секрет клиента, добавьте приведенный ниже фрагмент кода в приложение на основе Python:
# Импорт пакета SDK для слияния групповых документов
import groupdocs_merger_cloud
# Получите app_sid и app_key с https://dashboard.groupdocs.cloud после бесплатной регистрации.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Получить конфигурации файлового API
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
Как разделить PDF-страницы на отдельные PDF-файлы в Python
Чтобы разделить PDF-файл на несколько PDF-файлов с помощью GroupDocs.Merger Cloud SDK для Python, выполните следующие действия.
Загрузите файлы
Во-первых, загрузите файл PDF в облако, используя приведенный ниже пример кода:
# Создайте экземпляр файлового API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Вызов запроса на загрузку файла
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# Загрузить файл в облако
response = file_api.upload_file(request)
print(response.uploaded)
В результате загруженные файлы будут доступны в разделе файлов вашей панели управления в облаке.
Разделить PDF на отдельные страницы в Python
В этом разделе мы напишем шаги и пример фрагмента кода для программного разделения страниц PDF на отдельные файлы PDF, как показано ниже:
- Во-первых, создайте экземпляр класса DocumentApi.
- Во-вторых, создайте экземпляр класса SplitOptions.
- В-третьих, создайте экземпляр класса FileInfo.
- Укажите путь к входному файлу в качестве параметра FileInfo.
- Затем укажите путь к выходному каталогу.
- Задайте конкретные номера страниц в массиве, разделенном запятыми.
- Теперь установите режим разделения PDF на Страницы, чтобы разделить номера страниц.
- Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
- Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.
В следующем фрагменте кода показано, как разделить PDF-файлы в Python с помощью REST API:
# Как разделить PDF-файл на несколько отдельных PDF-файлов в Python
try:
# Создайте экземпляр API документа
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.pages = [1, 3]
options.mode = "Pages"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Загрузите файл
Приведенный выше пример кода сохранит разделенный файл в облаке. Вы можете загрузить его, используя следующий пример кода:
# Инициализация API для загрузки файла
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Создать запрос на скачивание файла
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)
# Загрузить файл
response = file_api.download_file(request)
# Переместите загруженный файл в свой каталог
shutil.move(response, "H:\\groupdocs-cloud-data\\")
Вот и все!
Разделить PDF-документ на отдельные файлы, применив фильтр диапазона
Вы можете разделить PDF-файлы, предоставив режим диапазона страниц и программно отфильтровав их, выполнив следующие шаги:
- Во-первых, создайте экземпляр класса DocumentApi.
- Во-вторых, создайте экземпляр класса SplitOptions.
- В-третьих, создайте экземпляр класса FileInfo.
- Укажите путь к входному файлу в качестве параметра FileInfo.
- Затем укажите путь к выходному каталогу как «python-testing».
- Установите значения startpagenumber и endpagenumber.
- Затем установите режим диапазона страниц в OddPages.
- Теперь установите режим разделения PDF на Страницы, чтобы разделить номера страниц.
- Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
- Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.
В следующем фрагменте кода показано, как разделить PDF-файл, применив фильтр в Python с помощью REST API:
# Как разделить PDF-файл на несколько отдельных PDF-файлов с помощью фильтра
try:
# Создайте экземпляр API документа
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 3
options.end_page_number = 9
options.range_mode = "OddPages"
options.mode = "Pages" # mode Intervals
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Разделите страницы PDF на несколько файлов в Python, применив фильтр массива
В этом разделе мы напишем шаги и пример фрагмента кода для программного разделения PDF-файлов на многостраничные PDF-файлы:
- Во-первых, создайте экземпляр класса DocumentApi.
- Во-вторых, создайте экземпляр класса SplitOptions.
- В-третьих, создайте экземпляр класса FileInfo.
- Укажите путь к входному файлу в качестве параметра FileInfo.
- Затем укажите путь к выходному каталогу как «python-testing».
- Затем установите коллекцию страниц в формате массива.
- Установите для режима разделения PDF значение «Интервалы», чтобы разделить файлы PDF.
- Затем создайте экземпляр класса SplitRequest и передайте параметр SplitOptions.
- Наконец, вызовите метод DocumentAPI.split() и передайте параметр SplitRequest, чтобы получить результаты.
В следующем фрагменте кода показано, как разделить PDF-файлы на несколько PDF-файлов в Python с помощью REST API:
# Как разделить файл PDF на несколько многостраничных файлов в Python
try:
# Создайте экземпляр API документа
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.pages = [3, 6, 8]
options.mode = "Intervals"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Бесплатный онлайн-разделитель PDF
Как разделить файлы PDF онлайн бесплатно? Пожалуйста, попробуйте следующий онлайн-разделитель PDF для бесплатного разделения PDF-документов. Этот онлайн-инструмент для разделения документов разработан с использованием вышеупомянутого REST API.
Заключение
В заключение, разделение PDF-файла на несколько PDF-файлов с помощью GroupDocs.Merger Cloud SDK для Python предоставляет удобный способ управления вашими PDF-документами и манипулирования ими. Вот что вы узнали из этой статьи:
- как разделить один файл PDF на несколько файлов с помощью Python в облаке;
- программно загружать и скачивать файлы на Python в облаке;
- разделить PDF-файлы на несколько файлов в Python с помощью фильтра диапазона страниц;
- и разделяйте PDF-файлы бесплатно с помощью онлайн-разделителя PDF.
Кроме того, мы также предоставляем раздел справки по API, который позволяет вам визуализировать наши API и взаимодействовать с ними напрямую через браузер. Полный исходный код Python SDK находится в свободном доступе на GitHub. Пожалуйста, ознакомьтесь с SDK GroupDocs.Merge Cloud для Python Примеры здесь.
Кроме того, мы рекомендуем вам следовать нашему Руководству по началу работы для получения подробных инструкций и использования API.
Наконец, мы продолжаем писать новые сообщения в блогах о различных операциях с документами с использованием REST API. Поэтому, пожалуйста, свяжитесь с нами для получения регулярных обновлений.
Задайте вопрос
Если у вас есть какие-либо вопросы об API разделителя PDF-документов, задайте их нам на Форуме бесплатной поддержки.
Часто задаваемые вопросы
Могу ли я разделить файл PDF на несколько файлов на основе определенных страниц?
Да, используя GroupDocs.Merger Cloud SDK для Python, вы можете определить диапазон страниц для извлечения и разделения PDF-файла на отдельные PDF-файлы.
Поддерживает ли GroupDocs.Merger Cloud SDK для Python другие форматы документов помимо PDF?
Да, GroupDocs.Merger Cloud SDK для Python поддерживает различные форматы документов, включая DOCX, XLSX, PPTX и другие. Аналогичные операции можно выполнять и с этими типами файлов.
Можно ли при необходимости объединить разделенные файлы PDF обратно в один файл?
Да, GroupDocs.Merger Cloud SDK для Python также поддерживает слияние PDF-файлов. При необходимости вы можете легко объединить разделенные PDF-файлы в один документ.
Сохраняет ли GroupDocs.Merger Cloud SDK для Python исходное форматирование файлов PDF в процессе разделения?
Да, SDK сохраняет исходное форматирование и макет PDF-файлов, разбивая их на несколько файлов.
Смотрите также
Для получения дополнительной информации по связанным темам мы предлагаем ознакомиться со следующими статьями:
- Как объединить PDF-файлы в C# с помощью REST API
- Java DOM Parser — извлечение текста из XML-документов с использованием Java
- Объединяйте документы разных типов в Java с помощью REST API
- Объединить несколько файлов JPG в один в Java - Объединить JPG в JPG
- Извлечение изображений из PDF-файлов на Java с использованием REST API