Glossar
Wir legen großen Wert darauf, unsere Kunden nicht mit zuviel “Fachchinesisch” zu überfrachten und uns nicht hinter tollen Schlagwörtern zu verstecken. Unser Glossar soll Ihnen kurz die wichtigsten Fachbegriffe zu den Themen Dokumentenmanagement und IT allgemein verständlich erläutern.
ADF
Automatic Document Feeder. Automatischer Dokumenteneinzug bei Scannern.
AFP
Advanced Function Presentation (auch: Printing). IBM-Architektur für das Management von Druckoutput. Siehe auch MO:DCA.
AIIM
Association for Information and Image Management. Verband von Herstellern und Anwendern von Archivierungs- und Dokumentenmanagementsystemen.
ASCII
American Standard Code for Information Interchange. Standard der Unix- und PC-Welt für Textdokumente.
Barcode
Darstellung von Zahlen oder Buchstaben durch eine Kombination senkrecht angeordneter Balken von meist 2 unterschiedlichen Breiten. Weltweit sind heute zahlreiche Barcode-verfahren im Einsatz, z.B. EAN 8, EAN 13, EAN 128, Code 39, Interleaved 2/5, Codabar, UPC-A. Diese Verfahren haben oft noch Untergruppen.
Blu-Ray Disk
DVD-Nachfolger mit gleichen Abmessungen; durch Verwendung kurzwelligeren Laserlichts (Blue ray) wird ein wesentlich engeres Beschreiben des Mediums möglich. Die Speicherkapazität liegt zwischen 25 GB (single layer) und 50 GB (double layer), durch multiple layer können theoretisch bis zu 400 GB erreicht werden. Im professionellen Bereich für digitale Archivierung hat sich parallel die ebenfalls auf Blue ray basierende UDO-WORM durchgesetzt.
Cache
engl./franz. für “Versteck” – Redundante Datenhaltung. Caching dient allgemein der Beschleunigung von Vorgängen: Daten, die von langsameren Datenträgern (Band, WORM, MO, CD) gelesen werden müssten, werden auf schnelleren Datenträgern (Festplatte, RAM) redundant vorrätig gehalten und damit die Performance signifikant gesteigert.
Capturing
(engl. für “Erfassung, Gewinnung”). Erfassung von Dokumenten, üblicherweise der erste Schritt der DMS/ECM-Prozesskette. Klassisches Beispiel ist das Einscannen von Papierdokumenten. Meist wird der Begriff nur für den Bereich Scannen und nicht für die Übernahme elektronischer Dokumente verwendet.
CAS
Content Adressed Storage. “WORM”-Speicherverfahren auf Festplatten, dass die Unveränderbarkeit der Informationen sicherstellt. Dabei wird die Information nicht wie üblich anhand ihres Ortes, sondern anhand ihres Inhalts lokalisiert. Hierzu wird ein Hash-Wert über die Datei gebildet und vom System verwaltet.
CCITT
Commité Consultatif International de Télégraphique et Téléephonique. Bis 1994 Ständiges Organ (Komitee) der ITU, das für internationale Empfehlungen und Standardisierungen im Fernmeldewesen zuständig war; ging im Bureau ITU-T auf.
CD-R
Compact Disc Recordable. Verfahren nach ISO 9630 zum einmaligen und unveränderlichen Beschreiben von CDs.
CI
Coded Information. Kodierte und damit in der Regel maschinell einfach weiterzuverarbeitende Information.
COLD
Computer Output to Laser Disc: Verfahren zur automatischen Archivierung und Verstichwortung großer Dokumentenmengen. Der Ausdruck “Laser Disc” wurde vor allem zur Unterscheidung zum COM-(Computer Output to Microfilm)Verfahren gewählt.
DMS
Document Management System. DV-gestütztes System zu Aufbewahrung und Bearbeitung von “Dokumenten” in Dateiform. Erweiterung der digitalen Archivsysteme um Bearbeitungs-Funktionen wie Versionierung, Sperren (Check-in, Check-out). etc.
dpi
dots per inch, Bildpunkte pro Zoll. Maßstab für die Auflösung digitalisierter (z.B: eingescannter) Bilder und für dir Ausgabequalität von Druckern. Bei Scannern spricht man gelegentlich auch von ppi (pixel per inch).
DVD
Digtal Versatile Disk. Speichermedium mit 12 cm Durchmesser, Nachfolger der CD im Consumer-Bereich. Bietet je nach Format auf einer Seite zwischen 4,7 GB (single layer, DVD-5) und 8,5 GB (double layer, DVD-9) Speicherplatz. Beidseitig bespielbare DVD (“Flipper”) mit bis zu 17 GB sind eher selten. Im Bereich der digitalen Archivierung konnte sich die DVD aufgrund der Vielzahl an Formaten nicht durchsetzen. Ihr Nachfolger im Consumer-Bereich ist die Blu-Ray Disc.
EBCDIC
Extended Binary Coded Decimal Interchange Code. IBMs Dateiformat im HOST/Mainframe-Umfeld. Erweiterte das 4-Bit Encoding der Ziffern 0-9 um Buchstaben, Sonderzeichen und Steuerzeichen.
ECM
Enterprise Content Management. Umfassender Ansatz, nachdem sämtliche Informationsobjekte eines Unternehmens bereichsübergreifend in einem einheitlichen System abgelegt und verwaltet werden. Unterschied zum Dokumentenmanagement ist die von Anfang an unternehmensweite Zielstellung.
HCR
Handprint Character Recognition. Elektronische Erkennung von Handschriften
ICR
Intelligent Character Recognition: Indviduell auf das betreffende Beleggut kalibrierter Einsatz spezieller OCR-Verfahren.
ITU
International Telecommunication Union. Weltweite Organisation zur Koordination des Aufbaus von Telekommunikationsnetzen und Diensten.
JDBC
Java Database Connectivity. Schnittstelle der Java-Plattform für gängige relationale Datenbanken. Gegenstück zu ODBC.
JPEG
Joint Photographic Expert Group. Standardkompression für Graustufen- und Farbbilder und hat durch das Internet eine weite Verbreitung erfahren.
JPEG 2000
Verfahren zur Kompression von Bildern unter Benutzung der Wavelet-Technologie, die bei gleicher Kompression bessere Qualität verspricht. Nicht abwärtskompatibel zu JPEG, sondern ein neues Format der gleichen Gruppe.
MO
Magneto-Optical (Disc). Magneto-optischer Datenträger. Allgemein Bezeichnung für ein Medium, dessen Oberfläche zunächst durch einen Laser punktuell auf über 200° Celsius erhitzt werden muss, bevor die darunter liegenden Teilchen magnetisierbar und damit beschreibbar werden.
MO:DCA
(auch MOD:CA geschrieben) Mixed Object Document Content Architecture. Bestandteil der IBM-AFP Architektur. Es handelt sich dabei um EBCDIC-Dateien mit vielen gleichartigen Dokumenten (z.B. Ausgangsrechnungen), die jeweils nur einmal die für alle Dokumente gleichen Ressourcen (Schriftart, Logos, Unterschriften, Formularhintergrund, Kleingedrucktes) enthalten und somit extrem Platz sparend sind.
NCI
Non Coded Information. Nichtkodierte Information sind Bilder, Sprache, Ton, Video, etc. Sie sind vom Rechner (im Gegensatz zu CI) nicht unmittelbar und eindeutig interpretierbar. NCI-Dokumente nehmen bei der Archivierung i.d.R. deutlich mehr (leicht bis zu 10-fach und mehr) Speicherplatz pro Seite in Anspruch als vom Informationsgehalt her identische CI-Dokumente.
OCR
Optical Character Recognition, (Optische Zeichenerkennung). Verfahren, um aus Rasterbildern (z.B. gescannten Textdokumenten) Text im ASCII-Format zu extrahieren. Entscheidendes Merkmal ist dabei die (von vielen Faktoren abhängige) Erkennungsrate.
ODBC
Open Database Connectivity. Von Microsoft entwickelte Software-Schnittstelle zur Kommunikation von beliebigen Applikationen mit relationalen Datenbanken.
ODF
Open Document Format (for Office Applications). Offener ISO-Standard (ISO 26300) für Dateiformate für Office-Anwendungen wie Textverarbeitungen, Tabellenkalkulationen, Präsentationen, etc. Das XML-basierte ODF gründet auf den Produkten StarOffice/OpenOffice und wurde 2004 veröffentlicht, um einen offenen Gegenstandard zu den Microsoft-Office-Formaten zu etablieren. In zahlreichen Ländern favorisiert vor allem die öffentliche Hand inzwischen den Einsatz von ODF, so auch in Deutschland.
OMR
Optical Mark Recognition. Automatische Erkennung von Markierungen, z.B. angekreuzten Felder auf Fragebögen.
OpenXML
Von einem Microsoft-geführten Konsortium entwickelte Alternative zum “Open Document Format”. Offener ISO-Standard (ISO 29500:2008) für die Ablage von Office-Dokumenten. Basis sind die von Microsoft entwickelten Formate für Word, Excel, Powerpoint, etc
PDF
Portable Document Format. Von der Firma Adobe entwickeltes Format zur originalgetreuen Wiedergabe von Dokumenten unabhängig von der verwendeten Hard- und Software. Text wird als CI, Bilder als NCI gespeichert, Metainformationen als XML. Die Version PDF 1.7 ist seit dem 1.7.2008 ISO-Standard (ISO 32000-1:2008).
PDF/A
“Unterform” des PDF-Standards, speziell für die Langzeitarchivierung von Dokumenten entwickelt. Durch die Einbettung der verwendeten Schriftarten und den Verzicht auf Links sollen Dokumente auch nach langer Zeit in der usrprünglichen Form wiederherstellbar bleiben. Durch ISO-Standardisierung 19005-1 wurde die Gefahr späterer patentrechtlicher Forderungen (wie etwa bei GIF) ausgeschlossen.
RAID
Redundant Array of Independent (früher auch: Inexpensive) Disks. Zusammenschalten von mehreren Festplatten zu einem gemeinsamen Bereich (Array), der nach außen als ein einzelnes (“logisches”) Laufwerk erscheint. Seit Einführung des Begriffes 1987 ist eine Vielzahl von RAID-Möglichkeiten entstanden, die Entwicklung dauert bis heute fort. Lag der Zweck zunächst vor allem darin, mehr Speicherplatz zu bieten, stehen heute die Optimierung von Hochverfügbarkeit, Datensicherheit und Performance mit im Vordergrund.
RDBMS
Relationales Datenbank Management System. Datenbank, die aus beliebig vielen Tabellen besteht und darüber hinaus verschiedene Funktionalitäten bietet, Abfragen und Manipulationen auf diesen Tabellen auszuführen und die Konsistenz dieser Tabellen untereinander aufrecht zu erhalten. SQL (Structured Query Language) dient dabei als Abfragesprache.
Recherche
Suche nach einem Dokument im Archiv; endet mit dem Finden des Dokumentes in einer Trefferliste. Der Vorgang des Retrievals schließt sich an, gehört aber – streng genommen – nicht mehr zur Recherche.
Retrieval
Anfordern eines Dokumentes beim Server und Lieferung an den Clientrechner.
SCSI
Small Computer System Interface. Bildete sich in den 80er/90er Jahren als Standard zum Anschluss von internen Geräten im professionellen Bereich heraus, z.B. Festplatten und CD-Laufwerke oder externen Geräten wie Scanner und Jukebox an einen PC oder Server. Durch USB 2.0 und FireWire bei Scannern und S-ATA bei Festplatten hat SCSI inzwischen an Bedeutung verloren.
SnapLock
“WORM”-Speicherverfahren auf Festplatten-Systemen, dass die Unveränderbarkeit der Informationen durch Softwarefunktionen sicherstellt. Der Begriff SnapLock wird vom Hersteller NetApp exklusiv verwendet, andere Hersteller bieten ähnliche Verfahren an.
SQL
Structured Query Language. Strukturierte Abfragesprache für Datenbanken; sie gilt heute als Standard für Operationen in relationalen Datenbanken.
TIFF
Tagged Image File Format. Dateiformat für Bilddaten, denen innerhalb der Datei ein “Etikett” (engl. Tag) vorangestellt ist. Dabei werden oft Kompressionsverfahren verwendet. Am häufigsten ist die Fax-Kompression nach CCITT Gruppe 4 für Schwarzweiß-Dokumente.
TIFF G6
Tiff Gruppe 6 ist eine neuere Bezeichnung der ITU-T (früher CCITT) für Tiff-Dateien mit der Fax-Kompression nach CCITT Gruppe 4.
UDF
Universal Data Format. Vom Betriebssystem unabhängiges Format zum Beschreiben von Datenträgern. Fortentwicklung des ISO 9660-Standards.
UDO
Ultra Density Optical – Verfahren, mit dem sich optische Medien mittels blauem Laserlicht (blue ray) wesentlich dichter beschreiben lassen als bisher. Dei Kapazität der üblichen 5,25 Zoll-Medien wurde damit von bisher 9,1 GB auf zunächst 30 GB, seit Frühjahr 2007 auf 60 GB gesteigert.
Video
Von der Firma Kofax entwickelte Hardware-Schnittstelle zum Anschluss von Scannern an einen PC. Alternative zum SCSI-Anschluss. Lange Zeit im High-End-Bereich führend, wird diese Schnittstelle inzwischen kaum noch unterstützt und ist durch USB 2.0 und FireWire abgelöst worden.
VOI
Verband für Organisation- und Informationssysteme (früher: Verband Optische Informationssysteme e.V.). 1991 gegründeter Verband der Hersteller, Anbieter und Berater von DMS-, elektronischen Archiv-, optischen Speicher-, Workflow-, Groupware-, Intranet-, Multimedia- und Mikrofilm-Hybrid-Systemen.
WebDAV
Web-based Distributed Authoring and Versioning. Offener Standard zur Bereitstellung von Dateien und ganzen Verzeichnissen im Internet. Bietet u.a. Möglichkeiten zur Versionierung, zum Sperren und Vergabe von Attributen und erweitert das HTTP-Protokoll um entsrechende Methoden. WebDAV war letztlich ein Ansatz zum Content Management im Web, der sich aber gegen die proprietären Ansätze der einzelnen Hersteller nicht wirklich durchsetzen konnte. Die 1995/96 gegründeten Arbeitsgruppen wurden bis 2007 aufgelöst.
WORM
Write Once, Read Many (Times). Verfahren, bei dem ein Datenträger nur einmal beschrieben werden kann und die Informationen danach nicht mehr veränderbar sind. In der elektronischen Archivierung wurde hierfür lange Zeit fast ausschließlich auf magneto-optische Datenträger gesetzt, zumeist vom Format 5¼”. Die Speicherkapazität wurde von ursprünglich 1,2 GB (um 1992)auf bis zu 60 GB (2007) gesteigert. Seit Ende der 90er Jahre sind zunehmend WORM-Produkte auf Basis von Magnetbändern (Tapes) und Festplatten im Markt erhältlich.
Ihr Kontakt zu uns
+49 (0) 52 08 / 9 57 58-240
Rückruf
Senden Sie uns Ihre Telefonnummer. Wir rufen Sie gerne zurück:

