PDF(Formato de documento portátil) es un formato de archivo ampliamente utilizado para documentos que deben compartirse, imprimirse o archivarse. ¿Está cansado de lidiar con archivos PDF grandes que contienen varios documentos o secciones? ¿Le resulta difícil extraer páginas o secciones específicas de un solo archivo PDF como documentos separados? Dividir un archivo PDF en varios archivos más pequeños puede simplificar enormemente las tareas de gestión de documentos. En este artículo, exploraremos cómo dividir un archivo PDF en varios archivos PDF en Python usando GroupDocs.Merger Cloud SDK para Python.
En este artículo se tratarán los siguientes temas:
- API REST de Python para dividir PDF en páginas e instalación de SDK
- Cómo dividir páginas PDF en archivos PDF separados en Python
- Dividir documento PDF en archivos separados mediante la aplicación de filtro de rango
- Dividir páginas PDF en varios archivos en Python aplicando un filtro de matriz
API REST de Python para dividir PDF en páginas e instalación de SDK
GroupDocs.Merger Cloud SDK for Python es un kit de desarrollo de software potente y rico en funciones que le permite manipular archivos PDF mediante programación. Proporciona varias funciones, como dividir, fusionar, rotar y reorganizar una colección de páginas en formatos de documentos admitidos. El SDK se puede integrar en una aplicación basada en Python para simplificar su proceso de desarrollo y mejorar la productividad.
Puede instalar Merger API en su aplicación Python con PIP desde PyPI ejecutando el siguiente comando en la terminal:
pip install groupdocs-merger-cloud
A continuación, debe registrarse para obtener una cuenta de prueba gratuita o comprar un plan de suscripción en el sitio web de GroupDocs y obtener su clave API. Una vez que tenga la identificación del cliente y el secreto del cliente, agregue el siguiente fragmento de código a una aplicación basada en Python:
# Importar SDK de fusión de groupdocs
import groupdocs_merger_cloud
# Obtenga app_sid y app_key de https://dashboard.groupdocs.cloud después del registro gratuito.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Obtener configuraciones de la API de archivos
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
Cómo dividir páginas PDF en archivos PDF separados en Python
Para dividir un archivo PDF en varios archivos PDF con GroupDocs.Merger Cloud SDK para Python, siga estos pasos:
Sube los archivos
En primer lugar, cargue el archivo PDF en la nube usando el ejemplo de código que se muestra a continuación:
# Crear una instancia de la API de archivo
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Solicitud de archivo de carga de llamadas
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# Subir archivo a la nube
response = file_api.upload_file(request)
print(response.uploaded)
Como resultado, los archivos cargados estarán disponibles en la sección de archivos de su tablero en la nube.
Dividir PDF en páginas individuales en Python
En esta sección, escribiremos pasos y un fragmento de código de ejemplo para dividir páginas PDF en archivos PDF separados mediante programación, como se indica a continuación:
- En primer lugar, cree una instancia de la clase DocumentApi.
- En segundo lugar, cree una instancia de la clase SplitOptions.
- En tercer lugar, cree una instancia de la clase FileInfo.
- Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
- A continuación, proporcione la ruta del directorio de salida.
- Establezca números de página específicos en una matriz separada por comas.
- Ahora, configure el modo de división de PDF en Páginas para dividir los números de página.
- Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
- Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.
El siguiente fragmento de código muestra cómo dividir archivos PDF en Python usando la API REST:
# Cómo dividir un archivo PDF en varios archivos PDF individuales en Python
try:
# Crear una instancia de Document API
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.pages = [1, 3]
options.mode = "Pages"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Descargar el archivo
El ejemplo de código anterior guardará el archivo separado en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:
# Inicialización de la API para descargar el archivo
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Crear solicitud de archivo de descarga
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)
# Descargar archivo
response = file_api.download_file(request)
# Mueva el archivo descargado a su directorio
shutil.move(response, "H:\\groupdocs-cloud-data\\")
¡Eso es todo!
Divida un documento PDF en archivos separados aplicando un filtro de rango
Puede separar archivos PDF proporcionando un modo de rango de páginas y filtrar mediante programación siguiendo los pasos que se indican a continuación:
- En primer lugar, cree una instancia de la clase DocumentApi.
- En segundo lugar, cree una instancia de la clase SplitOptions.
- En tercer lugar, cree una instancia de la clase FileInfo.
- Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
- A continuación, proporcione la ruta del directorio de salida como “prueba de Python”.
- Establezca los valores de número de página inicial y número de página final.
- A continuación, establezca el modo de rango de página en OddPages.
- Ahora, configure el modo de división de PDF en Páginas para dividir los números de página.
- Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
- Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.
El siguiente fragmento de código muestra cómo dividir un archivo PDF aplicando un filtro en Python usando la API REST:
# Cómo dividir un archivo PDF en varios archivos PDF individuales aplicando un filtro
try:
# Crear una instancia de Document API
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 3
options.end_page_number = 9
options.range_mode = "OddPages"
options.mode = "Pages" # mode Intervals
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Dividir páginas PDF en varios archivos en Python mediante la aplicación de filtro de matriz
En esta sección, escribiremos los pasos y un fragmento de código de ejemplo para dividir archivos PDF en archivos PDF de varias páginas mediante programación:
- En primer lugar, cree una instancia de la clase DocumentApi.
- En segundo lugar, cree una instancia de la clase SplitOptions.
- En tercer lugar, cree una instancia de la clase FileInfo.
- Proporcione la ruta del archivo de entrada como un parámetro para FileInfo.
- A continuación, proporcione la ruta del directorio de salida como “prueba de Python”.
- Luego, configure la colección de páginas en formato de matriz.
- Establezca el modo de división de PDF en Intervalos para dividir archivos PDF.
- Luego, cree una instancia de la clase SplitRequest y pase el parámetro SplitOptions.
- Finalmente, llame al método DocumentAPI.split() y pase el parámetro SplitRequest para obtener los resultados.
El siguiente fragmento de código muestra cómo dividir archivos PDF en varios archivos PDF en Python usando la API REST:
# Cómo dividir un archivo PDF en varios archivos de varias páginas en Python
try:
# Crear una instancia de Document API
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
options.output_path = "python-testing"
options.pages = [3, 6, 8]
options.mode = "Intervals"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Divisor de PDF en línea gratuito
¿Cómo dividir archivos PDF en línea de forma gratuita? Pruebe la siguiente herramienta divisor de PDF en línea para dividir documentos PDF de forma gratuita. Esta herramienta en línea para dividir documentos se desarrolla utilizando la API REST mencionada anteriormente.
Conclusión
En conclusión, dividir un archivo PDF en varios archivos PDF con GroupDocs.Merger Cloud SDK para Python proporciona una manera conveniente de administrar y manipular sus documentos PDF. Lo siguiente es lo que has aprendido en este artículo:
- cómo dividir un archivo PDF en varios archivos usando Python en la nube;
- cargue y descargue mediante programación los archivos en Python en la nube;
- dividir archivos PDF en múltiples archivos en Python usando un filtro de rango de páginas;
- y divida archivos PDF de forma gratuita utilizando un divisor de PDF en línea.
Además, también proporcionamos una sección de referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. El código fuente completo de Python SDK está disponible gratuitamente en GitHub. Consulte GroupDocs.Merger Cloud SDK para Python Ejemplos aquí.
Además, le sugerimos que siga nuestra Guía de introducción para conocer los pasos detallados y el uso de la API.
Finalmente, seguimos escribiendo nuevas publicaciones de blog sobre diferentes operaciones de documentos utilizando la API REST. Por lo tanto, póngase en contacto para recibir actualizaciones periódicas.
Hacer una pregunta
Si tiene alguna pregunta sobre la API del divisor de documentos PDF, no dude en consultarnos en el Foro de soporte gratuito.
preguntas frecuentes
¿Puedo dividir un archivo PDF en varios archivos en función de páginas específicas?
Sí, con GroupDocs.Merger Cloud SDK for Python, puede definir el rango de páginas para extraer y dividir un PDF en archivos PDF separados.
¿Admite GroupDocs.Merger Cloud SDK para Python otros formatos de documentos además de PDF?
Sí, GroupDocs.Merger Cloud SDK for Python admite varios formatos de documentos, incluidos DOCX, XLSX, PPTX y más. También puede realizar operaciones similares en estos tipos de archivos.
¿Es posible fusionar los archivos PDF divididos en un solo archivo si es necesario?
Sí, GroupDocs.Merger Cloud SDK for Python también admite la combinación de archivos PDF. Puede combinar fácilmente los archivos PDF divididos en un solo documento cuando sea necesario.
¿El SDK de GroupDocs.Merger Cloud para Python conserva el formato original de los archivos PDF durante el proceso de división?
Sí, el SDK mantiene el formato y el diseño originales de los archivos PDF mientras los divide en varios archivos.
Ver también
Para más información sobre temas relacionados, sugerimos echar un vistazo a los siguientes artículos:
- Cómo combinar archivos PDF en C# usando la API REST
- Java DOM Parser: extraiga texto de documentos XML utilizando Java
- Combinar documentos de diferentes tipos en Java usando REST API
- Combinar varios archivos JPG en uno en Java - Combinar JPG a JPG
- Extraiga imágenes de archivos PDF en Java usando REST API