Cómo extraer páginas de documentos de Word en Python

Cómo extraer páginas de documentos de Word en Python

Es posible que deba dividir el documento de Word en varios documentos por página mediante programación. Al dividir documentos de Word, puede extraer fácilmente una página de un documento de Word y compartir información o datos específicos con las partes interesadas. Como desarrollador de Python, puede dividir documentos de Word en archivos separados en línea en la nube. En este artículo, aprenderá cómo extraer páginas de documentos de Word en Python.

Los siguientes temas se tratarán en este artículo de división de página de palabras:

API REST del divisor de documentos de Word - Python SDK

Para dividir un archivo de Word en varios archivos, usaré el SDK de Python de GroupDocs.Merger Cloud API. Le permite rotar, dividir, unir, eliminar y reorganizar una sola página o una colección de páginas de formatos de documentos compatibles de Word, Excel, dibujos de Visio, PDF y HTML. Python repositorio de código fuente está disponible gratuitamente en GitHub.

La descarga gratuita del divisor de archivos de Word está disponible. Puede instalar word doc splitter en su aplicación Python con PIP desde PyPI usando el siguiente comando en la terminal:

pip install groupdocs-merger-cloud

Por favor, obtenga su ID de cliente y secreto desde el tablero antes de seguir los pasos mencionados a continuación. Una vez que tenga su ID y secreto, agregue el siguiente código en su aplicación para dividir el documento de Word en archivos separados como se muestra a continuación:

# Importar SDK de fusión de groupdocs
import groupdocs_merger_cloud

# Obtenga app_sid y app_key de https://dashboard.groupdocs.cloud después del registro gratuito.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtener configuraciones de la API de archivos 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Cómo dividir un documento de Word en un solo documento en Python

Puede dividir docx mediante programación en la nube siguiendo los pasos que se mencionan a continuación.

  • Subir el archivo de word a la nube
  • Split documento de Word en la nube
  • Descargar el documento extraído

Subir documento de Word

En primer lugar, cargaremos los archivos de Word en la nube para extraer páginas de Word en línea usando el ejemplo de código que se muestra a continuación:

# Subir archivo de Word al almacenamiento en la nube
# Crear una instancia de la API de archivo
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Solicitud de archivo de carga de llamadas
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Subir archivo de word a la nube
response = file_api.upload_file(request)
print(response.uploaded)

Como resultado, los archivos cargados estarán disponibles en la sección de archivos de su tablero en la nube.

Dividir páginas de documentos de Word en Python

Puede dividir páginas de palabras en archivos separados mediante programación siguiendo los pasos que se detallan a continuación:

  • En primer lugar, cree una instancia de DocumentApi.
  • Luego, crea una instancia de SplitOptions
  • Ahora, cree una instancia de FileInfo
  • Pase la ruta del archivo de entrada como argumento a FileInfo
  • A continuación, proporcione la ruta del archivo de salida
  • Establecer números de página específicos en una matriz separada por comas
  • Ahora, configure el modo de división docx en Páginas. Permite dividir números de página en una matriz separada por comas
  • Crear SplitRequest con SplitOptions
  • Finalmente, llame al método DocumentAPI.split() con SplitRequest como argumento y obtenga resultados

El siguiente fragmento de código muestra cómo dividir un archivo de Word en páginas separadas usando la API REST en Python:

# Cómo dividir un documento de Word en un solo documento en Python
try:
    # Crear una instancia de Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Cómo dividir un archivo de Word en páginas separadas en Python

Cómo dividir un archivo de Word en páginas separadas en Python

Descargar el archivo único

Finalmente, el ejemplo de código anterior guardará el archivo separado en la nube usando python. Se puede descargar usando el siguiente ejemplo de código:

# Inicialización de API para descargar archivos separados
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Crear solicitud de archivo de descarga
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Descargar archivo separado
response = file_api.download_file(request)

# Mueva el archivo descargado a su directorio
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Divida el documento de Word en uno solo por rango de página en Python

Puede dividir un documento de Word en varios documentos por página en línea siguiendo los siguientes pasos que se detallan a continuación:

  • Cree una instancia de DocumentApi
  • Luego, crea una instancia de SplitOptions
  • Ahora, cree una instancia de FileInfo
  • Pase la ruta del archivo de entrada como argumento a FileInfo
  • A continuación, proporcione la ruta del archivo de salida as “python-testing”
  • Establecer valores de inicio\página\número y final\página\número
  • Establezca el modo de división de docx en Páginas para dividir la palabra
  • Crear SplitRequest con SplitOptions
  • Finalmente, llame al método DocumentAPI.split() con SplitRequest como argumento

El siguiente fragmento de código muestra cómo extraer páginas de un documento de Word en Python usando la API REST:

# Cómo dividir un documento de Word en uno solo por rango de página en Python
try:
    # Crear una instancia de Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Dividir documentos de Word en archivos separados aplicando un filtro

Puede dividir un documento de Word en varios documentos por página en línea usando el modo de rango y filtrar mediante programación como se muestra a continuación:

  • Crear una instancia de DocumentApi
  • Luego, crea una instancia de SplitOptions
  • Ahora, cree una instancia de FileInfo
  • Pase la ruta del archivo de entrada como argumento a FileInfo
  • A continuación, proporcione la ruta del archivo de salida as “python-testing”
  • Establecer valores de inicio\página\número y final\página\número
  • A continuación, establezca range\mode en “OddPages”
  • Establezca el modo de división de docx en Páginas para dividir la palabra
  • Crear SplitRequest con SplitOptions
  • Finalmente, llame al método DocumentAPI.split() con SplitRequest como argumento

El siguiente fragmento de código muestra cómo extraer páginas de documentos de Word aplicando un filtro mediante la API REST en Python:

# Cómo dividir documentos de Word en archivos separados aplicando un filtro
try:
    # Crear una instancia de Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Cómo dividir Word Doc en varios archivos usando Python

Puede dividir el archivo de Word en varios documentos mediante programación siguiendo los pasos que se detallan a continuación:

  • Crear una instancia de DocumentApi
  • Luego, crea una instancia de SplitOptions
  • Ahora, cree una instancia de FileInfo
  • Pase la ruta del archivo de entrada como argumento a FileInfo
  • A continuación, proporcione la ruta del archivo de salida as “python-testing”
  • Luego, configure la colección de páginas en formato de matriz
  • Establezca el modo de división docx en Intervalos para dividir la palabra
  • Crear SplitRequest con SplitOptions
  • Finalmente, llame al método DocumentAPI.split() con SplitRequest como argumento

El siguiente fragmento de código muestra cómo dividir docx en varios archivos usando la API REST en Python:

# Cómo dividir archivos Docx en varios archivos usando Python
try:
    # Crear una instancia de Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Archivo de Word dividido en línea

¿Cómo dividir un documento de Word en varios archivos en línea gratis? Puede probar nuestro divisor de documentos de Word en línea para dividir documentos de Word en varios archivos en línea de forma gratuita por un número fijo de páginas o en varios rangos de páginas. Los documentos de texto de varias páginas se dividen en varios archivos de texto manteniendo el formato del documento original.

Conclusión

En este tutorial, hemos aprendido:

  • cómo dividir un archivo de Word en dos en Python en la nube;
  • cómo dividir un archivo docx en archivos separados en Python;
  • Programáticamente cómo dividir un documento de Word por página en Python;
  • programáticamente cómo dividir un documento de Word en múltiples documentos en línea en Python;
  • cómo dividir archivos de Word en línea gratis usando el divisor de páginas de palabras en línea;

Además, puede obtener más información sobre GroupDocs.Merger Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar y comunicarse con nuestras API directamente a través del navegador. Además, consulte GroupDocs.Merger Cloud SDK for Python Ejemplos aquí.

Hacer una pregunta

Si tiene alguna pregunta sobre cómo extraer páginas de un documento de Word en línea, no dude en consultarnos en el Foro

preguntas frecuentes

¿Cómo extraer páginas de un documento de Word en línea usando la API del divisor docx?

Instale la descarga gratuita del divisor de documentos biblioteca de Python para extraer páginas de palabras en línea. Puede visitar la documentación para obtener detalles completos de la API.

¿Cuál es la forma más rápida de dividir un documento de Word gratis en línea?

Extractor de páginas de Word en línea funciona muy rápido y puede dividir docx en línea en unos segundos.

¿Cómo extraer una página de Word en línea de forma gratuita?

  • Abra extractor de página de palabras en línea.
  • Haga clic dentro del área de colocación de archivos para cargar un archivo Word docx o arrastrar y soltar un archivo Word.
  • Haga clic en el botón Convertir. Su documento se cargará y convertirá a formato DOC.
  • El enlace de descarga de los archivos de salida estará disponible instantáneamente después de la división.

¿Es seguro usar el divisor de documentos en línea gratuito?

Sí, la palabra divisora de documentos es segura y nadie tiene acceso a sus archivos cargados. Eliminamos los archivos cargados después de 24 horas.

Ver también