Inicio >
Función avanzada > Creación de un archivo PDF de alta funcionalidad > Creación de un archivo OOXML en el que se puedan realizar búsquedas mediante OCR
Cuando envíe un archivo OOXML (PPTX, DOCX o XLSX), cree un archivo OOXML en el que se puedan realizar búsquedas utilizando tecnología de reconocimiento óptico de caracteres (OCR).
Para activar la búsqueda en un archivo OOXML, seleccione [PPTX], [DOCX], o [XLSX] como tipo de archivo, y seleccione [Reconocim. Caracteres]. A continuación, configure las siguientes opciones.
| |
---|
| Seleccione [ACT.] para activar la búsqueda en el archivo OOXML. |
| Seleccione un idioma para el procesamiento OCR. Seleccione el idioma utilizado en el original para reconocer correctamente los datos de texto. |
| Asigne a esta opción el valor ON para llevar a cabo automáticamente el ajuste de la rotación de cada página basándose en la dirección de los datos de texto detectados por el procesamiento OCR. Al deshabilitar el ajuste de la rotación, si la orientación especificada del original no corresponde con la dirección del texto, los datos de texto no se reconocen correctamente. |
| Esta opción está disponible cuando está seleccionada la opción [DOCX] o [XLSX] como tipo de archivo. Seleccione cómo crear un archivo OOXML utilizando texto detectado por el procesamiento OCR. |
| Si está seleccionado [DOCX] como tipo de archivo: | El sistema analiza el original escaneado y crea "datos de imagen" incluyendo ilustraciones del original, "datos de texto" detectados por el procesamiento OCR o "datos de imagen de texto" en los que el texto del original se trata como imágenes. [Prioridad de texto]: crea un archivo DOCX con función de búsqueda combinando "datos de texto" y "datos de imagen". Esta función muestra "datos de texto" detectados por el procesamiento OCR sin ningún ajuste; por tanto, su calidad visual puede no corresponderse con el original escaneado dependiendo del resultado del procesamiento OCR. [Prioridad de imagen]: crea un archivo DOCX con función de búsqueda combinando solo "datos de imagen" y "datos de imagen de texto". [Imagen y texto ]: crea un archivo DOCX con función de búsqueda combinando "datos de imagen", "datos de texto" y "datos de imagen de texto". "Los datos de texto" se guardan por separado con respecto a los "datos de imagen de texto"; por tanto, es posible realizar búsquedas de texto al mismo tiempo que se conserva la calidad visual del original.
|
Si está seleccionado [XLSX] como tipo de archivo: | El sistema crea una "imagen escaneada" del original y "datos de texto" detectados por el procesamiento OCR a partir del original escaneado. [Imagen y texto ]: crea un archivo XLSX con función de búsqueda combinando una "imagen escaneada" y "datos de texto". Es posible realizar una búsqueda de texto manteniendo la calidad visual del original. [Solo texto ]: crea un archivo XLSX con función de búsqueda utilizando únicamente "datos de texto". Esta función muestra "datos de texto" detectados por el procesamiento OCR sin ningún ajuste; por tanto, su calidad visual puede no corresponderse con el original escaneado dependiendo del resultado del procesamiento OCR.
|
- Para utilizar esta función, se requiere una opción adicional. Para más detalles sobre la opción requerida, consulte "Lista de funciones con opciones requeridas" en [Manual del operador [Acerca de esta máquina]].
- [Ajustar rotación] no está disponible cuando se activa junto con el cifrado con certificado digital (ID digital).
- Si se seleccionan los siguientes idiomas en [Seleccionar idioma], la dirección del texto se reconoce de forma automática.
[Japonés], [Chino], [Coreano], [Taiwanés] - Al seleccionar [Seleccionar idioma], si están mezcladas las direcciones vertical y horizontal en la misma página de un original, se reconoce solo una de las dos direcciones.
[Chino], [Coreano], [Taiwanés]