Zusammenhang der Dienste/Services bei Dokumenterstellung
Zusammenhang der Dienste/Services bei Dokumenterstellung
Um zu verstehen, wann welcher Service aktiv wird oder wo man beginnen soll, zu suchen, sollte man wissen, wir die Services zusammenarbeiten.
Nachfolgend:
Ablauf der Verarbeitung
Ab 8.50 (geändert: OCR-Verarbeitung):
- Ein Dokument wird erstellt
- Der Server erstellt in der CPQueue Jobs für Documentviewer (RENDITION)
- Documentviewer holt sich den Rendition-Job ab
- Documentviewer erstellt Rendition-Dateien im DV-Cache (alle Vorschau-Varianten – Client-Vorschau, Quicklook, Thumbnail …). Genau genommen:
- Holt er sich die Objectinformationen (Hashwert, Dokument-Eigenschaften …)
- Erstellt zuerst einen Pre-Vorschau für den Client und dann die eigentliche Daten im DV-Cache
- Prüft ob Volltext nötig ist. Falls ja, wird die Volltexterkennung ausgeführt.
- Ist OCR nötig, wird ein OCR-Job in der Documentviewer-OCR-Queue erstellt. Es ist nicht mehr nötig, den Abbyy-Finereader auf dem Documentviewer-Server zu installieren.
Zudem wird eine ocr-error-Datei im Documentviewer-Cache erstellt. Nach erfolgreicher OCR-Erkennung wird im Documentviewer-Cache die OCR-Error-Datei mit den Rückgabedaten ersetzt. Zudem wird ein Volltext-Job in die CPQueue gelegt. - Die Daten werden im Cache-Verzeichnis nach Hashwert abgelegt. Die Volltext-Daten liegen unter hashwert\Text abgelegt und zusätzlich im Verzeichnis DV-BACKUP.
- es wird geprüft, ob Quicklook erstellt werden soll. Falls ja, wird ein SLIDE-Job in die CPQueue erstellt
- außerdem wird ein Pagecount-Job erstellt, wenn Rendition fertig ist
- Der Servicemanager-OCRService prüft die Documentviewer-OCR-Queue, ob ein OCR-Job vorhanden ist. Falls ja, wird dieser abgeholt und mit Hilfe des Finereaders verarbeitet. D.h. der Abbyy Finereader muss immer auf dem Server installiert sein, auf dem der OCR-Service läuft.
Das Ergebnis der OCR-Erkennung wird an den Documentviewer gesendet, von dem der Job geholt wurde. - Der periodische Server-Job Pagecount prüft die CPQueue und wenn ein PAGECOUNT-Job vorhanden ist, wird der Pagecount-Wert vom Documentviewer geholt und in die Object-Tabelle geschrieben
- Der periodische Server-Job Slide prüft die CPQueue und wenn ein SLIDE-Job vorhanden ist, werden die Qicklooks vom Documentviewer abgeholt und in das SLIDE-Verzeichnis des Servers übertragen.
- Der Servicemanager-Indexservice prüft die CPQueue, ob ein Index-Job vorhanden ist. Falls ja, werden die Daten vom Documentviewer abgerufen.
Ab 7.10 bis 8.10 (neu +CPQueue):
- Ein Dokument wird erstellt
- Der Server erstellt in der CPQueue Jobs für Documentviewer (RENDITION)
- Der Documentviewer ruft die Rendition-Jobs ab und stellt die erstellten Vorschaudaten ins Documentviewer-Cache-Verzeichnis.
Sofern OCR nötig ist,
vor 8.10: stellt der Documentviewer OCR-Jobs in das OCR-Job-Verzeichnis. Die OCR-Jobs werden vom Finereader (durch axfrocr*.exe, überwacht von Server oder Watchdog oder Skript) verarbeitet. Die Überwachung erfolgt über Steuerdateien (*.Meta)
ab 8.10: ruft der Documentviewer die OCR-Instanz direkt auf. Daher muss der Abbyy Finereader auf dem Documentviewer-Server installiert sein! - Wenn der Documentviewer fertig ist, erstellt er in der CPQueue die nötigen Jobs SLIDE (= Quicklooks) und Volltext
- Der Volltext holt die Volltext-Jobs aus der CPQueue ab und holt sich die Daten vom Documentviewer.
- Pagecount gibt es nicht.
vor enaio 7.10 (keine CPQueue):
- Ein Dokument wird erstellt
- Der Server erstellt:
- bei Bilddokumenten und wenn Volltext für den Objecttyp aktiviert ist, OCR-Jobs im OCR-Job-Verzeichnis
- Im Falle des Volltextes wird das Dokument und eine Steuerdatei (= DAT-Datei) im Volltext-Export-Verzeichnis erstellt
- Vor 5.50: Per Events wird ein Job für die Vorschau angetriggert im InfoView-Fenster
- Ab 5.50: Einführung Contentviewer, Ansteuerung weiterhin per Events
- Ab 7.00: Einführung Documentviewer. Die Vorschau wird beim Anklicken des Dokumentes und aktivem Vorschaufenster angetriggert. Dazu wird eine entsprechende Job-Datei im Job-Verzeichnis des Documentviewers erstellt
- Ab 7.x: Der Documentviewer holt die Job-Dateien ab und ruft die Konvertierung auf. Die erstellten Daten werden in das Contentviewer-Cache-Verzeichnis kopiert.
- Der Volltext holt sich die DAT-Dateien ab. Wenn hier steht, dass OCR nötig ist, erstellt es einen OCR-Job im OCR-Job-Verzeichnis.
- Es gibt eine Abbyy-Finereader-Instanz, die entweder auf dem Applikationsserver läuft oder auf einem anderen Server. Liegt sie auf einem anderen Server, muss die Instanz axfr*ocr.exe per WatchDog oder Skript überwacht bzw. im Falle eines Falles gestartet werden. Diese prüft das OCR-Job-Verzeichnis. Sind hier Jobs vorhanden, wird eine OCR-Erkennung ausgeführt. Die erstellten Daten werden in die Verzeichnisse kopiert, die in der Job-Datei stehen.
- Sobald im Volltext-Export alle Daten vollständig sind (Dat + Dokument), werden die Daten vom Volltext abgeholt und verarbeitet.
- SLIDEs werden erstellt, wenn im Client jemand die Quicklooks-Anzeige aktiviert. Der Applikationsserver (axsvckrn.exe) ruft dann entsprechende Jobs auf, um die Slides zu erstellen.
- Pagecount gibt es nicht.
Ab enaio 8.50 sollte die CPQueue nicht mehr abgestellt werden. Es gibt zwar noch die Möglichkeit, aber die Services beachten die Datenpfade teilweise nicht mehr.
Verwandte Artikel
, multiple selections available, Use left or right arrow keys to navigate selected items