Como arquivo PDF em vários PDFs em Python

Divisão de documento Python - divida o arquivo PDF em vários arquivos PDF usando Python.

PDF(Portable Document Format) é um formato de arquivo amplamente usado para documentos que precisam ser compartilhados, impressos ou arquivados. Você está cansado de lidar com arquivos PDF grandes que contêm vários documentos ou seções? Você acha difícil extrair páginas ou seções específicas de um único arquivo PDF como documentos separados? Dividir um arquivo PDF em vários arquivos menores pode simplificar muito suas tarefas de gerenciamento de documentos. Neste artigo, exploraremos como dividir um arquivo PDF em vários arquivos PDF em Python usando GroupDocs.Merger Cloud SDK para Python.

Os seguintes tópicos serão abordados neste artigo:

Python REST API para dividir PDF em páginas e instalação do SDK

GroupDocs.Merger Cloud SDK for Python é um kit de desenvolvimento de software poderoso e rico em recursos que permite manipular arquivos PDF programaticamente. Ele fornece várias funcionalidades, incluindo divisão, fusão, rotação e reorganização de uma coleção de páginas em formatos de documento suportados. O SDK pode ser integrado a um aplicativo baseado em Python para simplificar seu processo de desenvolvimento e aumentar a produtividade.

Você pode instalar a API Merger em seu aplicativo Python com PIP de PyPI executando o seguinte comando no terminal:

pip install groupdocs-merger-cloud

Em seguida, você precisa inscrever-se para uma conta de avaliação gratuita ou comprar um plano de assinatura no site do GroupDocs e obter sua chave de API. Depois de obter o ID do cliente e o segredo do cliente, adicione o trecho de código abaixo a um aplicativo baseado em Python:

# Importar SDK de fusão do groupdocs
import groupdocs_merger_cloud

# Obtenha app_sid e app_key em https://dashboard.groupdocs.cloud após o registro gratuito.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obter configurações de API de arquivo 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Como dividir páginas PDF em arquivos PDF separados em Python

Para dividir um arquivo PDF em vários arquivos PDF usando o GroupDocs.Merger Cloud SDK para Python, siga estas etapas:

Envie os arquivos

Em primeiro lugar, carregue o arquivo PDF para a nuvem usando o exemplo de código abaixo:

# Crie uma instância da API de arquivo
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Solicitação de arquivo de upload de chamada
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Carregar arquivo para a nuvem
response = file_api.upload_file(request)
print(response.uploaded)

Como resultado, os arquivos enviados estarão disponíveis na seção de arquivos do seu painel na nuvem.

Dividir PDF em páginas individuais em Python

Nesta seção, escreveremos etapas e um trecho de código de exemplo para dividir páginas PDF em arquivos PDF separados de forma programática, conforme indicado abaixo:

  • Primeiramente, crie uma instância da classe DocumentApi.
  • Em segundo lugar, crie uma instância da classe SplitOptions.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Forneça o caminho do arquivo de entrada como um parâmetro para FileInfo.
  • Em seguida, forneça o caminho do diretório de saída.
  • Defina números de página específicos em uma matriz separada por vírgulas.
  • Agora, defina o modo de divisão de PDF como Páginas para dividir os números das páginas.
  • Em seguida, crie uma instância da classe SplitRequest e passe o parâmetro SplitOptions.
  • Por fim, chame o método DocumentAPI.split() e passe o parâmetro SplitRequest para obter os resultados.

O trecho de código a seguir mostra como dividir arquivos PDF em Python usando a API REST:

# Como dividir arquivo PDF em vários arquivos PDF únicos em Python
try:
	# Crie uma instância da API de documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Baixe o arquivo

O exemplo de código acima salvará o arquivo separado na nuvem. Você pode baixá-lo usando o seguinte exemplo de código:

# Inicialização da API para baixar o arquivo
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Criar solicitação de arquivo de download
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# ⇬ Fazer download do arquivo
response = file_api.download_file(request)

# Mova o arquivo baixado para o seu diretório
shutil.move(response, "H:\\groupdocs-cloud-data\\")

É isso!

Dividir documento PDF em arquivos separados aplicando filtro de intervalo

Você pode separar arquivos PDF fornecendo um modo de intervalo de páginas e filtrar programaticamente seguindo as etapas abaixo:

  • Primeiramente, crie uma instância da classe DocumentApi.
  • Em segundo lugar, crie uma instância da classe SplitOptions.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Forneça o caminho do arquivo de entrada como um parâmetro para FileInfo.
  • Em seguida, forneça o caminho do diretório de saída como “python-testing”.
  • Defina os valores startpagenumber e endpagenumber.
  • Em seguida, defina page rangemode como OddPages.
  • Agora, defina o modo de divisão de PDF como Páginas para dividir os números das páginas.
  • Em seguida, crie uma instância da classe SplitRequest e passe o parâmetro SplitOptions.
  • Por fim, chame o método DocumentAPI.split() e passe o parâmetro SplitRequest para obter os resultados.

O trecho de código a seguir mostra como dividir um arquivo PDF aplicando um filtro em Python usando a API REST:

# Como dividir o arquivo PDF em vários PDFs individuais aplicando filtro
try:
	# Crie uma instância da API de documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Dividir páginas PDF em vários arquivos em Python aplicando filtro de matriz

Nesta seção, escreveremos etapas e um trecho de código de exemplo para dividir arquivos PDF em arquivos PDF de várias páginas programaticamente:

  • Primeiramente, crie uma instância da classe DocumentApi.
  • Em segundo lugar, crie uma instância da classe SplitOptions.
  • Em terceiro lugar, crie uma instância da classe FileInfo.
  • Forneça o caminho do arquivo de entrada como um parâmetro para FileInfo.
  • Em seguida, forneça o caminho do diretório de saída como “python-testing”.
  • Em seguida, defina a coleção de páginas no formato de matriz.
  • Defina o modo de divisão de PDF como Intervalos para dividir arquivos PDF.
  • Em seguida, crie uma instância da classe SplitRequest e passe o parâmetro SplitOptions.
  • Por fim, chame o método DocumentAPI.split() e passe o parâmetro SplitRequest para obter os resultados.

O trecho de código a seguir mostra como dividir arquivos PDF em vários arquivos PDF em Python usando a API REST:

# Como dividir arquivo PDF em vários arquivos de várias páginas em Python
try:
	# Crie uma instância da API de documento
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Divisor de PDF Online Gratuito

Como dividir arquivos PDF online gratuitamente? Experimente a seguinte ferramenta divisor de PDF online para dividir documentos PDF gratuitamente. Esta ferramenta online de divisão de documentos é desenvolvida usando a API REST mencionada acima.

Conclusão

Em conclusão, dividir um arquivo PDF em vários arquivos PDF usando o GroupDocs.Merger Cloud SDK para Python fornece uma maneira conveniente de gerenciar e manipular seus documentos PDF. O seguinte é o que você aprendeu neste artigo:

  • como dividir um arquivo PDF em vários arquivos usando Python na nuvem;
  • carregar e baixar programaticamente os arquivos em Python na nuvem;
  • dividir arquivos PDF em vários arquivos em Python usando um filtro de intervalo de páginas;
  • e divida arquivos PDF gratuitamente usando um divisor de PDF online.

Além disso, também fornecemos uma seção de referência de API que permite que você visualize e se comunique com nossas APIs diretamente pelo navegador. O código-fonte completo do Python SDK está disponível gratuitamente no GitHub. Verifique o GroupDocs.Merger Cloud SDK para Python Exemplos aqui.

Além disso, sugerimos que você siga nosso Guia de primeiros passos para obter etapas detalhadas e uso da API.

Por fim, continuamos escrevendo novas postagens de blog sobre diferentes operações de documentos usando a API REST. Então, por favor, entre em contato para as atualizações regulares.

Faça uma pergunta

Se você tiver alguma dúvida sobre a API do divisor de documento PDF, sinta-se à vontade para nos perguntar no Fórum de suporte gratuito.

perguntas frequentes

Posso dividir um arquivo PDF em vários arquivos com base em páginas específicas?

Sim, usando o GroupDocs.Merger Cloud SDK para Python, você pode definir o intervalo de páginas para extrair e dividir um PDF em arquivos PDF separados.

O GroupDocs.Merger Cloud SDK para Python oferece suporte a outros formatos de documento além do PDF?

Sim, GroupDocs.Merger Cloud SDK for Python oferece suporte a vários formatos de documento, incluindo DOCX, XLSX, PPTX e muito mais. Você também pode executar operações semelhantes nesses tipos de arquivo.

É possível mesclar os arquivos PDF divididos em um único arquivo, se necessário?

Sim, GroupDocs.Merger Cloud SDK for Python também oferece suporte à mesclagem de arquivos PDF. Você pode combinar facilmente os arquivos PDF divididos em um único documento quando necessário.

O GroupDocs.Merger Cloud SDK para Python preserva a formatação original dos arquivos PDF durante o processo de divisão?

Sim, o SDK mantém a formatação e o layout originais dos arquivos PDF enquanto os divide em vários arquivos.

Veja também

Para mais informações sobre temas relacionados, sugerimos a leitura dos seguintes artigos: