HomeErweiterte FunktionenDurchsuchbare OOXML-Datei mittels OCR erstellen

Durchsuchbare OOXML-Datei mittels OCR erstellen

Erstellen Sie beim Versand einer OOXML-Datei (PPTX, DOCX oder XLSX) mit Hilfe von OCR-Zeichenerkennungstechnologie eine durchsuchbare OOXML-Datei.

Wählen Sie für die Suche in einer OOXML-Datei die Option [PPTX], [DOCX] oder [XLSX] als Dateityp und wählen Sie dann [Zeichenerkennung]. Richten Sie anschließend die folgenden Einstellungen ein.

Einstellung

Beschreibung

[EIN]/[AUS]

Wählen Sie [EIN], um das Durchsuchen einer OOXML-Datei zu ermöglichen.

[Sprache auswählen]

Wählen Sie eine Sprache für die OCR-Verarbeitung.

Wählen Sie die im Original verwendete Sprache, um die ordnungsgemäße Erkennung der Textdaten sicherzustellen.

[Drehung anpassen]

Setzen Sie diese Option auf EIN, um die Drehung automatisch für jede Seite basierend auf der Ausrichtung der bei der OCR-Verarbeitung erkannten Textdaten vorzunehmen.

Wenn die Anpassung der Drehung deaktiviert ist und die angegebene Ausrichtung des Originals nicht mit der Textausrichtung übereinstimmt, werden die Textdaten nicht ordnungsgemäß erkannt.

[Ausgabemethode]

Diese Option steht zur Verfügung, wenn als Dateityp [DOCX] oder [XLSX] ausgewählt ist.

Geben Sie an, wie eine OOXML-Datei anhand des bei der OCR-Verarbeitung erkannten Texts erstellt werden soll.

Wenn als Dateityp [DOCX] ausgewählt ist:

Das System analysiert das gescannte Original und erstellt die "Bilddaten" (einschließlich der Abbildungen im Original), die bei der OCR-Verarbeitung erkannten "Textdaten" oder die "Textbilddaten", bei denen Textinhalte im Original als Bilder behandelt werden.

  • [Textpriorität]: Damit wird eine durchsuchbare DOCX-Datei durch die Kombination von "Textdaten" und "Bilddaten" erstellt. Diese Funktion zeigt die bei der OCR-Verarbeitung erkannten "Textdaten" ohne jegliche Anpassungen an. Daher kann unter Umständen die visuelle Qualität in Abhängigkeit von den Ergebnissen der OCR-Verarbeitung vom gescannten Original abweichen.

  • [Bildpriorität]: Damit wird eine DOCX-Datei lediglich durch die Kombination von "Bilddaten" und "Textbilddaten" erstellt.

  • [Bild und Text]: Damit wird eine durchsuchbare DOCX-Datei durch die Kombination von "Bilddaten", "Textdaten" und "Textbilddaten" erstellt. "Textdaten" werden getrennt von "Textbilddaten" gespeichert. Dadurch ist die Textsuche bei gleichzeitiger Wahrung der visuellen Qualität des Originals möglich.

Wenn als Dateityp [XLSX] ausgewählt ist:

Das System erstellt ein "Gescanntes Bild" des Originals und der bei der OCR-Verarbeitung des Scanner-Originals erkannten "Textdaten".

  • [Bild und Text]: Damit wird eine durchsuchbare XLSX-Datei durch die Kombination des "gescannten Bilds" und der "Textdaten" erstellt. Eine Textsuche kann bei Wahrung der visuellen Qualität des Originals durchgeführt werden.

  • [Nur Text]: Damit wird eine durchsuchbare XLSX-Datei lediglich basierend auf den "Textdaten" erstellt. Diese Funktion zeigt die bei der OCR-Verarbeitung erkannten "Textdaten" ohne jegliche Anpassungen an. Daher kann unter Umständen die visuelle Qualität in Abhängigkeit von den Ergebnissen der OCR-Verarbeitung vom gescannten Original abweichen.

  • Für die Verwendung dieser Funktion wird eine Zubehörkomponente benötigt. Ausführliche Informationen zu den erforderlichen Zubehörkomponenten finden Sie Hier.

  • [Drehung anpassen] ist nicht verfügbar, wenn gleichzeitig die Verschlüsselung mit einem digitalen Zertifikat (digitale ID) aktiviert ist.

  • Wenn unter [Sprache auswählen] die folgende Sprache ausgewählt ist, wird die Textausrichtung automatisch erkannt.
    [Japanisch], [Vereinfachtes Chinesisch], [Koreanisch], [Traditionelles Chinesisch]

  • Wenn [Sprache auswählen] ausgewählt ist und auf derselben Seite des Originals sowohl eine vertikale als auch eine horizontale Ausrichtung vorhanden ist, wird nur eine dieser beiden Ausrichtungen erkannt.
    [Vereinfachtes Chinesisch], [Koreanisch], [Traditionelles Chinesisch]