...
Table of Contents | ||||
---|---|---|---|---|
|
Ablauf der Verarbeitung
Ab 8.50 (geändert: OCR-Verarbeitung):
- Ein Dokument wird erstellt
- Der Server erstellt in der CPQueue Jobs für Documentviewer (RENDITION)
- Documentviewer holt sich den Rendition-Job ab
- Documentviewer erstellt Rendition-Dateien im DV-Cache (alle Vorschau-Varianten – Client-Vorschau, Quicklook, Thumbnail …). Genau genommen:
- Holt er sich die Objectinformationen (Hashwert, Dokument-Eigenschaften …)
- Erstellt zuerst einen Pre-Vorschau für den Client und dann die eigentliche Daten im DV-Cache
- Prüft ob Volltext nötig ist. Falls ja, wird die Volltexterkennung ausgeführt.
- Ist OCR nötig, wird ein OCR-Job in der Documentviewer-OCR-Queue erstellt. Es ist nicht mehr nötig, den Abbyy-Finereader auf dem Documentviewer-Server zu installieren.
Zudem wird eine ocr-error-Datei im Documentviewer-Cache erstellt. Nach erfolgreicher OCR-Erkennung wird im Documentviewer-Cache die OCR-Error-Datei mit den Rückgabedaten ersetzt. Zudem wird ein Volltext-Job in die CPQueue gelegt. - Die Daten werden im Cache-Verzeichnis nach Hashwert abgelegt. Die Volltext-Daten liegen unter hashwert\Text abgelegt und zusätzlich im Verzeichnis DV-BACKUP.
- es wird geprüft, ob Quicklook erstellt werden soll. Falls ja, wird ein SLIDE-Job in die CPQueue erstellt
- außerdem wird ein Pagecount-Job erstellt, wenn Rendition fertig ist
- Der Servicemanager-OCRService prüft die Documentviewer-OCR-Queue, ob ein OCR-Job vorhanden ist. Falls ja, wird dieser abgeholt und mit Hilfe des Finereaders verarbeitet. D.h. der Abbyy Finereader muss immer auf dem Server installiert sein, auf dem der OCR-Service läuft.
Das Ergebnis der OCR-Erkennung wird an den Documentviewer gesendet, von dem der Job geholt wurde. - Der periodische Server-Job Pagecount prüft die CPQueue und wenn ein PAGECOUNT-Job vorhanden ist, wird der Pagecount-Wert vom Documentviewer geholt und in die Object-Tabelle geschrieben
- Der periodische Server-Job Slide prüft die CPQueue und wenn ein SLIDE-Job vorhanden ist, werden die Qicklooks vom Documentviewer abgeholt und in das SLIDE-Verzeichnis des Servers übertragen.
- Der Servicemanager-Indexservice prüft die CPQueue, ob ein Index-Job vorhanden ist. Falls ja, werden die Daten vom Documentviewer abgerufen.
...
- Ein Dokument wird erstellt
- Der Server erstellt in der CPQueue Jobs für Documentviewer (RENDITION)
- Der Documentviewer ruft die Rendition-Jobs ab und stellt die erstellten Vorschaudaten ins Documentviewer-Cache-Verzeichnis.
Sofern OCR nötig ist,
vor 8.10: stellt der Documentviewer OCR-Jobs in das OCR-Job-Verzeichnis. Die OCR-Jobs werden vom Finereader (durch axfrocr*.exe, überwacht von Server oder Watchdog oder Skript) verarbeitet. Die Überwachung erfolgt über Steuerdateien (*.Meta)
ab 8.10: ruft der Documentviewer die OCR-Instanz direkt auf. Daher muss der Abbyy Finereader auf dem Documentviewer-Server installiert sein! - Wenn der Documentviewer fertig ist, erstellt er in der CPQueue die nötigen Jobs SLIDE (= Quicklooks) und Volltext
- Der Volltext holt die Volltext-Jobs aus der CPQueue ab und holt sich die Daten vom Documentviewer.
- Pagecount gibt es nicht.
...