Como extrair páginas de documentos do Word em Python

Como extrair páginas de documentos do Word em Python

Você pode precisar dividir o documento do Word em vários documentos por página programaticamente. Ao dividir documentos do Word, você pode extrair facilmente a página do documento do Word e compartilhar informações ou dados específicos com as partes interessadas. Como desenvolvedor Python, você pode dividir o documento do Word em arquivos separados online na nuvem. Neste artigo, você aprenderá como extrair páginas de documentos do Word em Python.

Os seguintes tópicos devem ser abordados neste artigo divisor de páginas de palavras:

API REST do divisor de documentos do Word - Python SDK

Para dividir o arquivo de palavras em vários arquivos, usarei o Python SDK do GroupDocs.Merger Cloud API. Ele permite que você gire, divida, junte, remova e reorganize uma única página ou uma coleção de páginas de formatos de documento suportados de Word, Excel, desenhos do Visio, PDF e HTML. Python repositório de código-fonte está disponível gratuitamente no GitHub.

O download gratuito do divisor de arquivos do Word está disponível. Você pode instalar o word doc splitter em seu aplicativo Python com PIP de PyPI usando o seguinte comando no terminal:

pip install groupdocs-merger-cloud

Por favor, obtenha seu ID e Segredo do Cliente no painel antes de seguir as etapas abaixo mencionadas. Depois de obter seu ID e segredo, adicione o código abaixo ao seu aplicativo para dividir o documento do Word em arquivos separados, conforme mostrado abaixo:

# Importar SDK de fusão do groupdocs
import groupdocs_merger_cloud

# Obtenha app_sid e app_key em https://dashboard.groupdocs.cloud após o registro gratuito.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obter configurações de API de arquivo 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Como dividir um documento do Word em um único documento em Python

Você pode dividir o docx programaticamente na nuvem seguindo as etapas mencionadas abaixo.

  • Upload o arquivo word para a nuvem
  • Dividir documento do Word na nuvem
  • Baixar o documento extraído

Carregar documento do Word

Em primeiro lugar, faremos o upload dos arquivos do Word para a nuvem para extrair as páginas do Word online usando o exemplo de código abaixo:

# Carregar arquivo do Word para armazenamento em nuvem
# Crie uma instância da API de arquivo
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Solicitação de arquivo de upload de chamada
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Carregar arquivo de palavras para a nuvem
response = file_api.upload_file(request)
print(response.uploaded)

Como resultado, os arquivos enviados estarão disponíveis na seção de arquivos do seu painel na nuvem.

Dividir páginas de documento do Word em Python

Você pode dividir páginas de palavras em arquivos separados programaticamente seguindo as etapas abaixo:

  • Em primeiro lugar, crie uma instância do DocumentApi.
  • Em seguida, crie uma instância do SplitOptions
  • Agora, crie uma instância do FileInfo
  • Passe o caminho do arquivo de entrada como argumento para FileInfo
  • Em seguida, forneça o caminho do arquivo de saída
  • Definir números de página específicos em uma matriz separada por vírgula
  • Agora, defina o modo de divisão docx para páginas. Permite dividir números de página em uma matriz separada por vírgula
  • Criar SplitRequest com SplitOptions
  • Por fim, chame o método DocumentAPI.split() com SplitRequest como argumento e obtenha os resultados

O trecho de código a seguir mostra como dividir o arquivo de palavras em páginas separadas usando a API REST em Python:

# Como dividir um documento do Word em um único documento em Python
try:
    # Crie uma instância da API de documento
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Como dividir o arquivo do Word em páginas separadas em Python

Como dividir o arquivo do Word em páginas separadas em Python

Baixe o arquivo único

Por fim, o exemplo de código acima salvará o arquivo separado na nuvem usando python. Ele pode ser baixado usando o seguinte exemplo de código:

# Inicialização da API para baixar o arquivo separado
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Criar solicitação de arquivo de download
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Baixar arquivo separado
response = file_api.download_file(request)

# Mova o arquivo baixado para o seu diretório
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Dividir documento do Word em únicos por intervalo de páginas em Python

Você pode dividir o documento do Word em vários documentos por página online usando as seguintes etapas abaixo:

  • Crie uma instância do DocumentApi
  • Em seguida, crie uma instância do SplitOptions
  • Agora, crie uma instância do FileInfo
  • Passe o caminho do arquivo de entrada como argumento para FileInfo
  • Em seguida, forneça o caminho do arquivo de saída as “python-testing”
  • Defina os valores início\página\número e fim\página\número
  • Defina o modo de divisão docx como Páginas para dividir a palavra
  • Criar SplitRequest com SplitOptions
  • Por fim, chame o método DocumentAPI.split() com SplitRequest como argumento

O trecho de código a seguir mostra como extrair páginas de um documento do Word em Python usando a API REST:

# Como dividir o documento do Word em únicos por intervalo de páginas em Python
try:
    # Crie uma instância da API de documento
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Dividir documentos do Word em arquivos separados aplicando filtro

Você pode dividir o documento do Word em vários documentos por página online usando o modo de intervalo e filtrar programaticamente conforme mostrado abaixo:

  • Crie uma instância do DocumentApi
  • Em seguida, crie uma instância do SplitOptions
  • Agora, crie uma instância do FileInfo
  • Passe o caminho do arquivo de entrada como argumento para FileInfo
  • Em seguida, forneça o caminho do arquivo de saída as “python-testing”
  • Defina os valores início\página\número e fim\página\número
  • Em seguida, defina range\mode como “OddPages“
  • Defina o modo de divisão docx como Páginas para dividir a palavra
  • Criar SplitRequest com SplitOptions
  • Por fim, chame o método DocumentAPI.split() com SplitRequest como argumento

O trecho de código a seguir mostra como extrair páginas de documentos do Word aplicando filtro usando a API REST em Python:

# Como dividir documentos do Word em arquivos separados aplicando filtro
try:
    # Crie uma instância da API de documento
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Como dividir documento do Word em vários arquivos usando Python

Você pode dividir o arquivo do Word em vários documentos programaticamente seguindo as etapas abaixo:

  • Crie uma instância do DocumentApi
  • Em seguida, crie uma instância do SplitOptions
  • Agora, crie uma instância do FileInfo
  • Passe o caminho do arquivo de entrada como argumento para FileInfo
  • Em seguida, forneça o caminho do arquivo de saída as “python-testing”
  • Em seguida, defina a coleção de páginas no formato de matriz
  • Defina o modo de divisão docx como Intervalos para dividir a palavra
  • Criar SplitRequest com SplitOptions
  • Por fim, chame o método DocumentAPI.split() com SplitRequest como argumento

O trecho de código a seguir mostra como dividir docx em vários arquivos usando a API REST em Python:

# Como dividir arquivos Docx em vários arquivos usando Python
try:
    # Crie uma instância da API de documento
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Ficheiro Word Dividido Online

Como dividir um documento do Word em vários arquivos online grátis? Você pode tentar nosso divisor de documento do Word online para dividir o documento do Word em vários arquivos online gratuitamente por um número fixo de páginas ou em vários intervalos de páginas. Documentos do Word com várias páginas são divididos em vários arquivos do Word, mantendo o formato do documento original.

Conclusão

Neste tutorial, aprendemos:

  • como dividir arquivo de palavras em dois em Python na nuvem;
  • como dividir arquivo docx em arquivos separados em Python;
  • Programaticamente como dividir documento do Word por página em Python;
  • como dividir programaticamente um documento do Word em vários documentos online em Python;
  • como dividir arquivo de palavras on-line gratuitamente usando o divisor de página de palavras on-line;

Além disso, você pode aprender mais sobre GroupDocs.Merger Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e se comunicar com nossas APIs diretamente pelo navegador. Além disso, consulte GroupDocs.Merger Cloud SDK para Python Examples here.

Faça uma pergunta

Se você tiver alguma dúvida sobre como extrair páginas de um documento do Word online, sinta-se à vontade para nos perguntar no Fórum

perguntas frequentes

Como extrair páginas do documento do Word online usando a API do divisor docx?

Instale o download gratuito do divisor de documentos Biblioteca Python para extrair páginas do Word online. Você pode visitar a documentação para obter detalhes completos da API.

Qual é a maneira mais rápida de dividir um documento do Word gratuitamente online?

Word page extractor online funciona muito rápido e você pode dividir o docx online em alguns segundos.

Como extrair pagina do word online gratis?

  • Abra extrator de página de palavras on-line.
  • Clique dentro da área para soltar o arquivo para carregar o arquivo docx do word ou arraste e solte o arquivo do word.
  • Clique no botão Converter. Seu documento será carregado e convertido para o formato DOC.
  • O link de download dos arquivos de saída estará disponível instantaneamente após a divisão.

É seguro usar o divisor de documentos on-line gratuito?

Sim, o divisor de documentos Word é seguro e ninguém tem acesso aos seus arquivos enviados. Excluímos os arquivos enviados após 24 horas.

Veja também