Cómo convertir un archivo PDF en varios archivos PDF en Python

División de documentos de Python: divida un archivo PDF en varios archivos PDF usando Python.

PDF(Formato de documento portátil) es un formato de archivo ampliamente utilizado para documentos que deben compartirse, imprimirse o archivarse. ¿Está cansado de lidiar con archivos PDF grandes que contienen varios documentos o secciones? ¿Le resulta difícil extraer páginas o secciones específicas de un solo archivo PDF como documentos separados? Dividir un archivo PDF en varios archivos más pequeños puede simplificar enormemente las tareas de gestión de documentos. En este artículo, exploraremos cómo dividir un archivo PDF en varios archivos PDF en Python usando GroupDocs.Merger Cloud SDK para Python.

En este artículo se tratarán los siguientes temas:

API REST de Python para dividir PDF en páginas e instalación de SDK

GroupDocs.Merger Cloud SDK for Python es un kit de desarrollo de software potente y rico en funciones que le permite manipular archivos PDF mediante programación. Proporciona varias funciones, como dividir, fusionar, rotar y reorganizar una colección de páginas en formatos de documentos admitidos. El SDK se puede integrar en una aplicación basada en Python para simplificar su proceso de desarrollo y mejorar la productividad.

Puede instalar Merger API en su aplicación Python con PIP desde PyPI ejecutando el siguiente comando en la terminal:

pip install groupdocs-merger-cloud

A continuación, debe registrarse para obtener una cuenta de prueba gratuita o comprar un plan de suscripción en el sitio web de GroupDocs y obtener su clave API. Una vez que tenga la identificación del cliente y el secreto del cliente, agregue el siguiente fragmento de código a una aplicación basada en Python:

# Importar SDK de fusión de groupdocs
import groupdocs_merger_cloud

# Obtenga app_sid y app_key de https://dashboard.groupdocs.cloud después del registro gratuito.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtener configuraciones de la API de archivos 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Cómo dividir páginas PDF en archivos PDF separados en Python

Para dividir un archivo PDF en varios archivos PDF con GroupDocs.Merger Cloud SDK para Python, siga estos pasos:

Sube los archivos

En primer lugar, cargue el archivo PDF en la nube usando el ejemplo de código que se muestra a continuación:

# Crear una instancia de la API de archivo
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Solicitud de archivo de carga de llamadas
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Subir archivo a la nube
response = file_api.upload_file(request)
print(response.uploaded)

Como resultado, los archivos cargados estarán disponibles en la sección de archivos de su tablero en la nube.

Dividir PDF en páginas individuales en Python

En esta sección, escribiremos pasos y un fragmento de código de ejemplo para dividir páginas PDF en archivos PDF separados mediante programación, como se indica a continuación:

  • En primer lugar, cree una instancia de la clase DocumentApi.
  • En segundo lugar, cree una instancia de la clase SplitOptions.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
  • A continuación, proporcione la ruta del directorio de salida.
  • Establezca números de página específicos en una matriz separada por comas.
  • Ahora, configure el modo de división de PDF en Páginas para dividir los números de página.
  • Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
  • Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.

El siguiente fragmento de código muestra cómo dividir archivos PDF en Python usando la API REST:

# Cómo dividir un archivo PDF en varios archivos PDF individuales en Python
try:
	# Crear una instancia de Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Descargar el archivo

El ejemplo de código anterior guardará el archivo separado en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:

# Inicialización de la API para descargar el archivo
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Crear solicitud de archivo de descarga
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# Descargar archivo
response = file_api.download_file(request)

# Mueva el archivo descargado a su directorio
shutil.move(response, "H:\\groupdocs-cloud-data\\")

¡Eso es todo!

Divida un documento PDF en archivos separados aplicando un filtro de rango

Puede separar archivos PDF proporcionando un modo de rango de páginas y filtrar mediante programación siguiendo los pasos que se indican a continuación:

  • En primer lugar, cree una instancia de la clase DocumentApi.
  • En segundo lugar, cree una instancia de la clase SplitOptions.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
  • A continuación, proporcione la ruta del directorio de salida como “prueba de Python”.
  • Establezca los valores de número de página inicial y número de página final.
  • A continuación, establezca el modo de rango de página en OddPages.
  • Ahora, configure el modo de división de PDF en Páginas para dividir los números de página.
  • Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
  • Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.

El siguiente fragmento de código muestra cómo dividir un archivo PDF aplicando un filtro en Python usando la API REST:

# Cómo dividir un archivo PDF en varios archivos PDF individuales aplicando un filtro
try:
	# Crear una instancia de Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Dividir páginas PDF en varios archivos en Python mediante la aplicación de filtro de matriz

En esta sección, escribiremos los pasos y un fragmento de código de ejemplo para dividir archivos PDF en archivos PDF de varias páginas mediante programación:

  • En primer lugar, cree una instancia de la clase DocumentApi.
  • En segundo lugar, cree una instancia de la clase SplitOptions.
  • En tercer lugar, cree una instancia de la clase FileInfo.
  • Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
  • A continuación, proporcione la ruta del directorio de salida como “prueba de Python”.
  • Luego, configure la colección de páginas en formato de matriz.
  • Establezca el modo de división de PDF en Intervalos para dividir archivos PDF.
  • Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
  • Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.

El siguiente fragmento de código muestra cómo dividir archivos PDF en varios archivos PDF en Python usando la API REST:

# Cómo dividir un archivo PDF en varios archivos de varias páginas en Python
try:
	# Crear una instancia de Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Divisor de PDF en línea gratuito

¿Cómo dividir archivos PDF en línea de forma gratuita? Pruebe la siguiente herramienta divisor de PDF en línea para dividir documentos PDF de forma gratuita. Esta herramienta en línea para dividir documentos se desarrolla utilizando la API REST mencionada anteriormente.

Conclusión

En conclusión, dividir un archivo PDF en varios archivos PDF con GroupDocs.Merger Cloud SDK para Python proporciona una manera conveniente de administrar y manipular sus documentos PDF. Lo siguiente es lo que has aprendido en este artículo:

  • cómo dividir un archivo PDF en varios archivos usando Python en la nube;
  • cargue y descargue mediante programación los archivos en Python en la nube;
  • dividir archivos PDF en múltiples archivos en Python usando un filtro de rango de páginas;
  • y divida archivos PDF de forma gratuita utilizando un divisor de PDF en línea.

Además, también proporcionamos una sección de referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Python SDK está disponible gratuitamente en GitHub. Consulte GroupDocs.Merger Cloud SDK para Python Ejemplos aquí.

Además, le sugerimos que siga nuestra Guía de introducción para conocer los pasos detallados y el uso de la API.

Finalmente, seguimos escribiendo nuevas publicaciones de blog sobre diferentes operaciones de documentos utilizando la API REST. Por lo tanto, póngase en contacto para recibir actualizaciones periódicas.

Hacer una pregunta

Si tiene alguna pregunta sobre la API del divisor de documentos PDF, no dude en consultarnos en el Foro de soporte gratuito.

preguntas frecuentes

¿Puedo dividir un archivo PDF en varios archivos en función de páginas específicas?

Sí, con GroupDocs.Merger Cloud SDK for Python, puede definir el rango de páginas para extraer y dividir un PDF en archivos PDF separados.

¿Admite GroupDocs.Merger Cloud SDK para Python otros formatos de documentos además de PDF?

Sí, GroupDocs.Merger Cloud SDK for Python admite varios formatos de documentos, incluidos DOCX, XLSX, PPTX y más. También puede realizar operaciones similares en estos tipos de archivos.

¿Es posible fusionar los archivos PDF divididos en un solo archivo si es necesario?

Sí, GroupDocs.Merger Cloud SDK for Python también admite la combinación de archivos PDF. Puede combinar fácilmente los archivos PDF divididos en un solo documento cuando sea necesario.

¿El SDK de GroupDocs.Merger Cloud para Python conserva el formato original de los archivos PDF durante el proceso de división?

Sí, el SDK mantiene el formato y el diseño originales de los archivos PDF mientras los divide en varios archivos.

Ver también

Para más información sobre temas relacionados, sugerimos echar un vistazo a los siguientes artículos: