...
- Pagecount Jobs und Slide Jobs
- jeder Server holt sich die Infos vom Documentviewer (periodischer Server Job, Standardwer = alle 60 Sek.). Verwendet wird der Documentviewer, der im enaio Enterprisemanager bei diesem Server hinterlegt ist.
- Rendition Jobs
- Der Documentviewer holt die Rendition-Jobs (RENDITION und RENRESET) ab.
- Dann holt er sich vom enaio Server die Dokumenteigenschaften (dms.GetObjectDetails).
- Anhand dessen weiß er, ob Volltext und Slides erstellt werden müssen. Er führt dementsprechend die Konvertierung aus bzw. das Rendern in PDF. Bei Bedarf (und Konfiguration) werden OCR Job erstellt.
- Wenn die Konvertierung bzw. das Rendern fertig ist, werden - je nach ermittelter Konfiguration - Volltextjobs in CPQueue gelegt sowie SLIDE Jobs und Pagecount Jobs
- Fulltext Jobs
- Indexservice (Bestandteil des Servicemanager) holt alle Fulltext Jobs ab (FULLTEXTIDX, FULLTEXTDOC ...).
- Er ruft pro Dokument die Texte beim Documentviewer ab und sendet sie an den ElasticSearch. Der ElasticSearch fügt die Daten in seine Datenbank ein.
- Es wird standardmäßig der Documentviewer verwendet, der bei dem Server hinterlegt ist bei Renditioncache, mit dem sich der Servicemanager verbindet, sofern . Ist in der Index-prod.yml kein ein alternativer Link stehthinterlegt, wird dieser Documentviewer verwendet und nicht der Standard.
Jeder Job, der gerade in Bearbeitung ist, wird vom jeweiligen Service gesperrt. Im enaio Enterprisemanager sieht man es in der Spalte Dienstname. Treten Fehler auf, dann bleiben die Jobs gesperrt. Im Erfolgsfall wird der Job aus der CPQueue entfernt.
...
Jeder Documentviewer hat seine eigene OCR-Queue. Sofern beim Documentviewer Finereader aktiviert ist, erstellt er auch Jobs. Diese Jobs holt sich der OCRService (Bestandteil des Servicemanager) proaktiv vom Documentviewer ab. D.h. sind mehrere Documentviewer vorhanden, müssen alle Documentviewer dem OCRService bekanntgegeben werden. Die DV-Das erfolgt mittel Auflistung in der OCR-PROD.YML. Die OCR-Jobs werden dann mittels Abbyy Finereader konvertiert in lesbaren Text. Das Ergebnis wird vom OCRService zurück an den Documentviewer gesendet. Dieser fügt sie dann in sein Cache-Verzeichnis ein (und pro Dokument eine Sicherung in Cache\BACKUP sowie BackupIndex Datenbank). Daraufhin gibt es einen Index-Job in der CPQueue.
Einsehen der OCR-Jobs: http://<documentviewerserver>:8070/osrenditioncache/app/management/info/db/ocr
Da jeder Documentviewer seine eigene Queue hat, muss die Abfrage pro Documentviewer ausgeführt werden.
...