Cómo convertir Word a HTML en línea en Python

Convierta Word a HTML en línea en Python

Como desarrollador de Python, puede convertir fácilmente su documento Word en un archivo HTML mediante programación en la nube. Los archivos de Word se utilizan principalmente para compartir datos oficiales y personales. Sin embargo, si desea ver o mostrar el documento en un navegador web, una solución inteligente es convertir Word a HTML en línea en Python. La conversión de Word a Html es útil para que los archivos html se puedan cargar fácilmente en Internet. En este artículo, aprenderá cómo convertir Word a HTML en línea en Python.

En este artículo se tratarán los siguientes temas:

API REST de conversión de Word a HTML y SDK de Python

Para convertir archivos de Word a HTML, usaré la API Python SDK de GroupDocs.Conversion Cloud. Esta API le permite convertir sus documentos e imágenes de cualquier formato de archivo compatible a cualquier formato que necesite. Puede convertir fácilmente entre más de 50 tipos de documentos e imágenes como Word, PowerPoint, Excel, PDF, HTML, CAD, imágenes rasterizadas, etc.

Puede instalar GroupDocs.Conversion Cloud en su proyecto de Python usando el siguiente comando en la consola:

pip install groupdocs_conversion_cloud

Obtenga su ID de cliente y Secreto de cliente del panel de control antes de comenzar a seguir los pasos y los ejemplos de código disponibles. Una vez que tenga su identificación y secreto, agregue el código como se muestra a continuación:

# Importe el SDK de Python en su aplicación de Python desde http://api.groupdocs.cloud
import groupdocs_conversion_cloud

# Obtenga client_id y client_secret de https://dashboard.groupdocs.cloud después del registro gratuito.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtener configuraciones de la API de archivos 
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Convierta Word a HTML usando la API REST en Python

Puede convertir archivos de Word a HTML siguiendo los sencillos pasos que se mencionan a continuación:

Sube el documento

En primer lugar, cargue el archivo de Word en la nube usando el ejemplo de código que se muestra a continuación:

# Subir archivo de Word al almacenamiento en la nube
# Crear una instancia de la API de archivo
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# Solicitud de archivo de carga de llamadas
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Subir archivo docx a la nube
response = file_api.upload_file(request)
print(response.uploaded)

Como resultado, el archivo de Word cargado estará disponible en la sección de archivos de su tablero en la nube.

Convertir Word a HTML en Python

Puede convertir fácilmente Word a HTML mediante programación siguiendo los pasos que se detallan a continuación:

  • Crear una instancia de ConvertApi
  • Cree una instancia de ConvertSettings
  • Establecer la ruta del archivo de Word
  • Asigne “html” al formato
  • Proporcione la ruta del archivo de salida
  • Defina HtmlConvertOptions si es necesario
  • Establezca varias propiedades, como from\page y pages\count, etc.
  • Crear ConvertDocumentRequest con ConvertSettings
  • Obtenga resultados llamando al método convert\document() con ConvertDocumentRequest

El siguiente ejemplo de código muestra cómo convertir Word a HTML sin perder el formato usando la API REST:

# Cómo convertir Word a HTML en Python
# Crear las instancias de API necesarias
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparar la configuración de conversión
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"

# Opciones de conversión HTML
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions

# Crear solicitud de documento de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir páginas de Word a archivo HTML
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)

Descargar el archivo convertido

El ejemplo de código anterior guardará el archivo html convertido en la nube. Puede descargarlo utilizando el siguiente ejemplo de código:

# Inicialización de la API para descargar el archivo convertido
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# Crear solicitud de archivo de descarga
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)

# Descargar archivo convertido
response = file_api.download_file(request)

# Mueva el archivo descargado a su directorio
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Conversión de Word a HTML sin usar Cloud Storage

Puede convertir documentos de Word a HTML sin usar el almacenamiento en la nube siguiendo los pasos que se detallan a continuación:

  • Crear una instancia de ConvertApi
  • Cree ConvertDocumentDirectRequest y pase el formato del documento solicitado y la ruta del archivo de entrada
  • Obtenga resultados llamando al método convert\document\direct() con ConvertDocumentDirectRequest
  • Opcionalmente, guarde el archivo de salida en la ruta local usando el método shutil.move()

El siguiente ejemplo de código muestra cómo convertir Word a HTML sin usar el almacenamiento en la nube:

# Conversión de Word a HTML sin usar almacenamiento en la nube
# Crear las instancias de API necesarias
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparar solicitud de conversión
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")

# Convierta Word a HTML sin almacenamiento en la nube
response = convert_api.convert_document_direct(request)

# Mueva el archivo descargado a su directorio de trabajo
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Pasará el archivo de entrada en el cuerpo de la solicitud y recibirá el archivo de salida en la respuesta de la API.

Cómo convertir Word a HTML y descargarlo directamente

Puede convertir fácilmente un archivo de Word a HTML mediante programación siguiendo los pasos que se detallan a continuación:

  • Crear una instancia de ConvertApi
  • Cree una instancia de ConvertSettings
  • Establecer la ruta del archivo de Word
  • Asigne “html” al formato
  • Establezca “Ninguno” en la ruta de salida
  • Crear ConvertDocumentRequest con ConvertSettings
  • Obtenga resultados llamando al método convert\document\download()
  • Opcionalmente, guarde el archivo de salida en la ruta local usando el método shutil.move()

El siguiente ejemplo de código muestra cómo convertir Word a HTML y descargarlo directamente usando una API REST en Python:

# Cómo convertir Word a HTML y descargarlo directamente
# Crear las instancias de API necesarias
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Preparar la configuración de conversión
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"

# salida como documento IOStream
settings.output_path = None    

# Preparar solicitud de conversión
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir Word a archivo HTML directamente
response = convert_api.convert_document_download(request)

# Mueva el archivo descargado a su directorio de trabajo
shutil.move(response, "H:\\groupdocs-cloud-data\\")

La API devolverá el archivo html convertido en respuesta. Siga los pasos mencionados anteriormente para cargar un archivo.

Convertidor en línea de Word a HTML

Pruebe la siguiente herramienta de conversión gratuita de Word a HTML en línea, que se desarrolla utilizando la API anterior.

Conclusión

En este artículo, has aprendido:

  • cómo convertir un documento de Word a un archivo HTML usando Python en la nube;
  • cargue el archivo HTML en la nube y luego descargue el archivo html convertido de la nube;
  • cómo convertir Word a archivo HTML sin usar el almacenamiento en la nube mediante programación;
  • cómo convertir Word a archivo HTML y descargarlo directamente;

Puede obtener más información sobre GroupDocs.Conversion Cloud API utilizando la documentación. También proporcionamos una sección Referencia de API que le permite visualizar e interactuar con nuestras API directamente a través del navegador.

Hacer una pregunta

Si tiene alguna pregunta sobre el convertidor de Word a HTML, no dude en consultarnos en el Foro de soporte gratuito.

Ver también

Te recomendamos visitar los siguientes artículos para conocer: