InicioFunción avanzadaCreación de un archivo OOXML en el que se puedan realizar búsquedas mediante OCR

Creación de un archivo OOXML en el que se puedan realizar búsquedas mediante OCR

Cuando envíe un archivo OOXML (PPTX, DOCX o XLSX), cree un archivo OOXML en el que se puedan realizar búsquedas utilizando tecnología de reconocimiento óptico de caracteres (OCR).

Para activar la búsqueda de un archivo OOXML, seleccione [PPTX], [DOCX] o [XLSX] como tipo de archivo y seleccione [Reconocimiento de caracteres]. A continuación, configure las siguientes opciones.

Configuración

Descripción

[ACT.]/[DES.]

Seleccione [ACT.] para activar la búsqueda en el archivo OOXML.

[Seleccionar idioma]

Seleccione un idioma para el procesamiento OCR.

Seleccione el idioma utilizado en el original para reconocer correctamente los datos de texto.

[Ajustar rotación]

Asigne a esta opción el valor ON para llevar a cabo automáticamente el ajuste de la rotación de cada página basándose en la dirección de los datos de texto detectados por el procesamiento OCR.

Al deshabilitar el ajuste de la rotación, si la orientación especificada del original no corresponde con la dirección del texto, los datos de texto no se reconocen correctamente.

[Output Method]

Esta opción está disponible cuando se selecciona [DOCX] o [XLSX] como tipo de archivo.

Seleccione cómo crear un archivo OOXML utilizando texto detectado por el procesamiento OCR.

Cuando se selecciona [DOCX] como tipo de archivo:

El sistema analiza el original escaneado y crea "datos de imagen" incluyendo ilustraciones del original, "datos de texto" detectados por el procesamiento OCR o "datos de imagen de texto" en los que el texto del original se trata como imágenes.

  • [Prioridad de texto]: crea un archivo DOCX con función de búsqueda combinando "datos de texto" y "datos de imagen". Esta función muestra "datos de texto" detectados por el procesamiento OCR sin ningún ajuste; por tanto, su calidad visual puede no corresponderse con el original escaneado dependiendo del resultado del procesamiento OCR.

  • [Prioridad de imagen]: crea un archivo DOCX combinando únicamente "datos de imagen" y "datos de imagen de texto".

  • [Imagen y texto]: crea un archivo DOCX en el que se pueden realizar búsquedas combinando "datos de imagen", "datos de texto" y "datos de imagen de texto". Los "datos de texto" se guardan por separado con respecto a los "datos de imagen de texto"; por tanto, es posible realizar búsquedas de texto al mismo tiempo que se conserva la calidad visual del original.

Cuando se selecciona [XLSX] como tipo de archivo:

El sistema crea una "imagen escaneada" del original y "datos de texto" detectados por el procesamiento OCR a partir del original escaneado.

  • [Imagen y texto]: crea un archivo XLSX en el que se pueden realizar búsquedas combinando "imagen escaneada" y "datos de texto". Es posible realizar una búsqueda de texto manteniendo la calidad visual del original.

  • [Solo texto]: crea un archivo XLSX en el que se pueden realizar búsquedas utilizando únicamente "datos de texto". Esta función muestra "datos de texto" detectados por el procesamiento OCR sin ningún ajuste; por tanto, su calidad visual puede no corresponderse con el original escaneado dependiendo del resultado del procesamiento OCR.

  • Para utilizar esta función, se requiere una opción adicional. Para obtener más información sobre la opción necesaria, consulte Aquí.

  • [Ajustar rotación] no está disponible cuando se activa junto con el cifrado con certificado digital (ID digital).

  • Si se seleccionan los siguientes idiomas en [Seleccionar idioma], la dirección del texto se reconoce de forma automática.
    [Japonés], [Chino (simplificado)], [Coreano], [Chino (tradicional)]

  • Al seleccionar [Seleccionar idioma], si están mezcladas en la misma página de un original direcciones vertical y horizontal, se reconocen como una dirección.
    [Chino (simplificado)], [Coreano], [Chino (tradicional)]