Archivieren: Unterschied zwischen den Versionen

Aus IV1
Bodenwinkler (Diskussion | Beiträge)
Bodenwinkler (Diskussion | Beiträge)
Zeile 174: Zeile 174:
*'''Einsatz offener Standards''' wie z.B. freier Dokumentenformate, die als relativ langlebig betrachten werden und deren Aufbau öffentlich bekannt ist
*'''Einsatz offener Standards''' wie z.B. freier Dokumentenformate, die als relativ langlebig betrachten werden und deren Aufbau öffentlich bekannt ist
*'''Regelmäßiges Umkopieren''' von einem alten Speichermedium auf neue Datenträger, um den Verlust von Daten durch die Alterung von Datenträgern zu verhindern
*'''Regelmäßiges Umkopieren''' von einem alten Speichermedium auf neue Datenträger, um den Verlust von Daten durch die Alterung von Datenträgern zu verhindern


== ECM - Die rechtlichen Rahmenbedingungen ==
== ECM - Die rechtlichen Rahmenbedingungen ==
Zeile 210: Zeile 213:
'''ITIL (Infrastructure Library):'''
'''ITIL (Infrastructure Library):'''
ITIL ist eine Sammlung von Good Practices, die die für den Betrieb einer IT-Infrastruktur notwendigen Prozesse beschreiben und ist inzwischen international ein De-fakto-Standard geworden.
ITIL ist eine Sammlung von Good Practices, die die für den Betrieb einer IT-Infrastruktur notwendigen Prozesse beschreiben und ist inzwischen international ein De-fakto-Standard geworden.


== Literatur ==
== Literatur ==

Version vom 13. August 2009, 12:52 Uhr

Wenn man einen Brief oder eine Email schreibt, einen Finanzbericht mit einem Tabellenkalkulationsprogramm erstellt oder ein Fax, eine elektronische Rechnung erhält, immer stellt sich die Frage, wo speichert man diese Informationen ab und wie findet man sie bei Bedarf wieder. In modernen Unternehmen und Verwaltungen entstehen heute die meisten Dokumente bereits in digitaler Form und was noch in Papierform vorliegt, wird eingescannt und digital weiterverarbeitet. Wir sprechen von Tausenden und bei größeren Organisationen von vielen Millionen von Dokumenten, die jährlich anfallen und in digitaler Form aufbewahrt werden müssen. Der nachfolgende Beitrag geht nun der Frage nach, wie und unter welchen Rahmenbedingungen die elektronische Archivierung dieser Informationsflut erfolgen soll.




Zum Einstieg: Ablage und Archiv aus Anwendersicht

Für den betrieblichen Anwender, der ein physisches oder elektronisches Dokument erzeugt oder erhält (Angebot, Rechnung, Bestellmail, Mahnschreiben, Vertrag, Liquiditätsplan etc. etc.), stellt sich relativ rasch die Frage, was mit diesem Dokument weiter geschieht, sobald seine Erstellungs- und/oder Bearbeitungsaktivitäten beendet sind. Unter vorläufiger Außerachtlassung aller organisatorischen oder auch rechtlichen Regelungen stellen sich beispielsweise folgende Fragen:


Wo und wie werden die Dokumente abgelegt, damit man sie später wieder leicht findet?

Das ist sehr oft keine einfache Fragestellung, da die Antwort von vielen Detailfakten abhängen kann. Handelt es sich beispielsweise bei einem Dokument um ein Papierdokument (z.B. um eine Bestellung), so kann das Dokument einerseits nach einem entsprechend geordneten System abgelegt werden (Papierarchiv) oder andererseits auch eingescannt und in eine elektronisches Archiv übergeführt werden. Wesentlich ist in beiden Fällen, dass eine einheitliche logische Struktur der Archivierung besteht und vor allem im elektronisches Archiv auch eindeutige Kriterien für eine Beschlagwortung (= Suchkriterien) vorhanden sind. Es ist also von großer Bedeutung, dass es für die Organisationseinheit klare und eindeutige Regelungen hinsichtlich der Ablage von Dokumenten und Unterlagen aller Art gibt. Würden diese nicht existieren, so wäre mittelfristig ein organisatorisches Chaos die Folge. Daneben ist noch anzumerken, dass man damit auch gegen gesetzliche und regulatorische Vorgaben verstoßen würde.


Welche Dokumente sind wie lange aufzubewahren?

Mit dieser Fragestellung ist der „normale“ Anwender in der Regel überfordert, da die Beantwortung auch von der Art des Dokuments abhängt. Ganz generell kann man dazu sagen, dass aufgrund der regulatorischen Verschärfungen der letzten Jahre sämtliche Dokumente, die in irgendeiner Weise mit der betrieblichen Leistungserstellung im Zusammenhang stehen, auch aufzubewahren und zu archivieren sind. Dies trifft beispielsweise auch auf Emails zu. Die Aufbewahrungsfristen können branchen- und dokumentenbezogen unterschiedlich sein; in der Regel kann man allerdings von vielen Jahren ausgehen.


Wie kann erreicht werden, dass man auf Dokumente aus unterschiedlichen Quellen, die zu einem Geschäftsvorfall gehören, zugreifen kann?

In vielen Unternehmen ist es üblich und auch notwendig, dass man für die Dokumente eines Geschäftsfalles einen „Akt“ erstellt (Verkaufsakte, Transportakte, Patientenakte, Akt für ein Bauansuchen etc.). In diesem „Akt“ sollten letztendlich sämtliche Dokumente, die in irgendeinem Zusammenhang mit dem Geschäftsfall stehen, landen. Diese Logik muss natürlich auch beibehalten werden, wenn Dokumente elektronisch archiviert werden.


Können, sollen oder müssen auch andere Mitarbeiter auf diese Dokumente zugreifen?

In der Regel wird es so sein, dass einerseits eine ganze Reihe von Personen einen Zugriff auf die Dokumente zur Erfüllung ihrer Aufgaben benötigen und andererseits es natürlich auch sein kann, dass andere Mitarbeiter aus unterschiedlichsten Gründen diese Dokumente nicht sehen dürfen. Es bedarf also entsprechender Regelungen, wer zu was berechtigt ist oder eben nicht. Wenn Dokumente elektronisch archiviert werden, so ist diese Berechtigungsstruktur natürlich auch elektronisch abzubilden. Weiters müssen in bestimmten Fällen Unterlagen auch externen Personen zugänglich gemacht werden (z.B. dem Finanzamt im Rahmen der Betriebsprüfung, dem Wirtschaftsprüfer im Rahmen der Jahresabschlussprüfung).



Vom "Papierarchiv" zum "Elektronischen Archiv"

Die Begriffe „Archiv“ bzw. „archivieren“ sind keine neuen Wortschöpfungen. Ganz im Gegenteil – die sprachlichen Wurzeln liegen in der lateinischen Sprache (archivum), die wiederum auf griechische Ursprünge (archeίo) zurückzuführen ist. Dort verstand man darunter (meist öffentliche) Einrichtungen, in denen wichtige Dokumente und Gegenstände aufbewahrt worden sind. Das Aufbewahren und natürlich auch das Wiederfinden von in Archiven abgelegten Dokumenten sind also seit Jahrtausenden von großer Bedeutung.

In der jüngeren Vergangenheit vollzog sich rund um das Thema Archivierung eine ganz wesentliche Erweiterung und Veränderung. Durch das Faktum, dass Informationen nun seit einigen Jahrzehnten neben dem Papieroriginal auch in elektronischer Form vorliegen können, ergab sich die Möglichkeit, diese Dokumente auch in elektronischer Form zu archivieren (elektronisches Archiv). Diese Möglichkeit zur elektronischen Archivierung wurde auch immer häufiger genutzt, da sie zahlreiche Vorteile für das Unternehmen bringt. Inzwischen ist die Entwicklung so weit fortgeschritten, dass es möglich ist, dass überhaupt kein Papieroriginal mehr existiert, sondern das Original ausschließlich in elektronischer Form vorliegt (z.B. digital signierte elektronische Rechnung). In diesem Fall besteht keine Wahlmöglichkeit mehr, ob man elektronisch archivieren will oder nicht, hier MUSS elektronisch archiviert werden.

Der Begriff der elektronischen Archivierung wird allerdings einerseits sehr unterschiedlich genutzt und andererseits auch durch Funktionalitäten erweitert, die weit über das Ablegen und Wiederfinden von Informationen hinausgehen.

Im deutschsprachigen Raum hat sich die Bezeichnung Dokumenten-Management-System (DMS) für jene Softwarelösungen durchgesetzt, die die Verwaltung ursprünglich meist papiergebundener Dokumente in elektronischen Systemen umfasst. In solchen Systemen ist das elektronische Archiv allerdings nur ein Teilbereich jener Funktionalitäten, die ein DMS auszeichnen. Typische DMS-Softwaremodule sind beispielsweise:

  • COLD (Computer Output on Laserdisk) ist ein Verfahren zur automatisierten Übernahme von Computer-Ausgabedatenströmen (meist Druckdaten) in ein Archivsystem. Oft spricht man in diesem Zusammenhang auch von Spoolfilearchivierung. Die Bezeichnung „on Laserdisk“ hat historische Gründe; heute wird in der Regel auf Magnetplatten abgespeichert.
  • SCAN-Module digitalisieren Papierbelege mittels Scanner (verbunden mit einer automatischen und/oder benutzergeführten Indexierung).
  • Das ARCHIV-Modul zur Ablage, Aufbereitung und Verwaltung der Dokumente in einer Datenbank (elektronisches Archiv im engeren Sinne)


Vom Dokumenten-Management-System zum Enterprise-Content-Management (ECM)

Die Entwicklungen der letzten Jahre haben gezeigt, dass das klassische elektronische Dokumentenarchiv für sich alleine gesehen nur eine Teilfunktion dessen ist, was moderne Organisationseinheiten zur Erfüllung Ihrer Aufgaben benötigen. Ein DMS ist heute nur mehr eine integrierte Komponente von weitaus mächtigeren Systemen mit Workflow, Collaboration, Email-Management, Webintegration, Business Process Management, Auditing, etc.


Unter Enterprise Content Management (ECM) versteht man alle Technologien zur Erfassung, Verwaltung, Bewahrung und Bereitstellung von Content und Dokumenten zur Unterstützung von organisatorischen Prozessen.[1] [2]


Von Bedeutung ist in dieser Definition der Begriff „Content“. Content (engl.) mit dem deutschen Wort „Inhalt“ zu übersetzen, greift nicht weit genug. Unter Content wird in diesem Zusammenhang alles verstanden, was an inhaltlicher elektronischer Information in Systemen bereitgehalten wird, unabhängig davon, ob es sich um strukturierte, schwach strukturierte oder unstrukturierte Daten handelt. Beispielsweise kann es sich hier um Rechnungen, gescannte Frachtpapiere, Emails, Briefe, Faxnachrichten, Finanzanalysen, Dokumente aus ERP-Systemen aber auch Fotos, Videos oder Audios handeln.


Die wichtigen ECM-Komponenten und –Technologien lassen sich in fünf Hauptkategorien einordnen[3]:

  • CAPTURE (Erfassung): Bildbearbeitung, Formularverarbeitung, COLD, Indexierung, Kategorisierung
  • MANAGE (Verwaltung, Bearbeitung, Nutzung): Dokumentenmanagement, Collaboration, Web-Content-Management, Ablage- und Archiverwaltung, Workflow, Business-Process-Management
  • STORE (Speicherung): Repositories (Speicherorte, Datenspeichersysteme), Library-Services (Search/Retrieval), Speichertechnologien/Medien
  • PRESERVE (Erhalten, Bewahren, Archivieren): Langzeitarchivierung, Migration
  • DELIVER (Liefern, Bereitstellen, Ausgeben): Transformations-Techniken, Sicherheits-Techniken, Verteilung




ECM - Die technischen Rahmenbedingungen

Information Lifecycle Management

Die Ausgangssituation, mit der heute ein Unternehmen konfrontiert ist, sieht häufig so aus:

  • Jährliches Datenwachstum im hohen zweistelligen Prozentbereich und damit oft unkontrollierter Storagewachstum
  • Historisch bedingt werden zumeist alle Daten, unabhängig von Art und Wert der Daten, gleich behandelt (die Fachabteilungen möchten meist alle Daten so lange wie möglich speichern)
  • Neue und immer schärfere rechtliche Vorschriften führen dazu, dass niemand mehr für das Löschen von Daten verantwortlich sein will


Ziel von Information Lifecycle Management (ILM) ist das

  • Speichern von Informationen entsprechend ihrem Wert (Wichtigkeit, Wertigkeit, Kosten)
  • auf dem jeweils günstigsten Speichermedium
  • basierend auf Regeln und Prozessen (Klassifizierung der Daten, Quellen und Speichersysteme) zur entsprechenden Behandlung der Information (Automatismen).


ILM ist also weder Hardware noch Software sondern ein organisatorischer Prozess, an dem allerdings mittelfristig kein Unternehmen vorbeikommt.


Datenformate / Archivformate

……… ADB, ADF, ANI, ARC, AVI, BAK, BAT, BIN, BMP, CAT, CBI, CGI, CLL, CSS, CSV, DBF, DGN, DOC, DRM, DRW, DTF, EMD, EXE, FBK, FFX, FRT, GDB, GFX, GKS, HEX, HTM, ICL, IGF, JFIF, JMP, JPEG, LDL, MAD, MBX, MP3, OCX, OLE, OTL, PBR, PRJ, QDT, RAR, RAW, REG, RMD, RTF, SCF, SCV, ………

Für die Speicherung digitaler Informationen gibt es historisch gesehen unzählige Datenformate, die mehr oder weniger Bedeutung haben. Es handelt sich dabei teils um proprietäre Datenformate, die meist von großen Hard- oder Softwareanbietern entwickelt wurden und teils um freie, teilweise genormte Datenformate, die sich am Markt etabliert haben. Was fehlt, sind einheitliche Standards, die weltweit und langfristig anerkannt und eingesetzt werden. Diese, für den IT-Markt nicht unübliche Situation, erschwert natürlich das Thema Archivierung und vor allem Langzeitarchivierung enorm.

Datenformate, die für die Langzeitarchivierung geeignet erscheinen, können auch als Archivformate bezeichnet werden, und sollten folgenden Anforderungen genügen:

  • Hersteller-, System- und Geräteunabhängigkeit (nicht proprietär)
  • Aufbau der Datenformate ist öffentlich bekannt und dokumentiert
  • International genormter und öffentlicher Standard
  • Verzicht auf Komprimierung der Daten


Aus derzeitiger Sicht kommen beispielsweise folgende Archivformate, die obige Anforderungen zumindest teilweise erfüllen, in Frage:

  • TIFF (Tagged Image File Format): sehr gebräuchliches Grafik-Rasterformat
  • PDF (Portable Document Format): proprietäres ADOBE-Dokumentenformat mit diversen Subformaten
  • PDF/A (Portable Document Format/Archiv) : gezielt für die Langzeitarchivierung entwickeltes, international normiertes Dokumentenformat basierend auf PDF (ISO 19005-1 :2005)
  • XML (Extensible Markup Language): Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten


Problematischer ist die Situation im Bereich der Archivierung von Audio- und Videodaten, da es hier der Normierungs- und Standardisierungsgrad noch geringer ist.


Speichermedien (Hierarchisches Speichermanagement)

Grundsätzlich kommen für die Archivierung alle heute üblichen Extern-Speichermedien in Frage:

  • Solid State Disk (SSD): sehr schnell und sehr teuer
  • Konventionelle Festplatten (HDD): schnell und relativ teuer
  • Magnetbänder (Tape): langsam und billig
  • (Optische Speichersysteme (Optical): relativ schnell und relativ billig, bei neueren Lösungen allerdings nicht mehr gebräuchlich)


Welche Medien bzw. welche Kombination von Speichermedien für die Archivierung im Einzelfall tatsächlich verwendet werden, sollte letztlich einer Analyse auf Basis TCO (Total Cost of Ownership) vorbehalten sein.


Von einem hierarchischen Speichermanagement (HSM) spricht man dann, wenn Datenbestände, auf welche über längere Zeit nicht zugegriffen wurde, automatisiert auf ein Speichermedium niedrigerer Hierarchiestufe (billiger, dafür aber langsamer Zugriff) ausgelagert werden (beispielsweise von der Festplatte auf ein Magnetband). Greift ein Benutzer auf eine solche ausgelagerte Datei zu, so wird die Datei wieder auf das schnellere Speichermedium zurückkopiert. Für den Benutzer ist diese Aus- bzw. Rücklagerung nicht transparent – er bemerkt höchstens die längere Zugriffszeit.


Probleme der Langzeitarchivierung

Die Langzeitarchivierung digitaler Informationen bedeutet, dass sich Unternehmen mit der Problemstellung auseinandersetzen müssen, wie trotz des gerade vom Informationsmarkt verursachten ständigen technischen Wandels sichergestellt werden kann, dass Informationen möglicherweise auch noch nach vielen Jahrzehnten einwandfrei und eindeutig gelesen werden können.

Während alte Papierdokumente oft viele Jahrhunderte haltbar sind, trifft dies gerade auf neue Speichermedien nicht zu. Disketten, CDs, Bandkassetten etc. sind oft schon nach wenigen Jahren nicht mehr lesbar. Aber selbst wenn sie lesbar wären, gibt es dann oft die notwendigen Hardwarekomponenten nicht mehr, die solche Medien noch lesen können (z.B. Diskettenlaufwerke, Laufwerke für Wechselplatten). Und sollten selbst die Hardwarekomponenten verfügbar sein, so sind es dann oft die alten Datenformate, die von den heute verwendeten Applikationen nicht mehr unterstützt werden und daher nicht gelesen werden können.


Oft wird übersehen, dass diese Probleme der Langzeitarchivierung letztendlich sehr bald für einen Großteil der Unternehmen und Verwaltungskörper relevant wird. Man braucht nur die heute bereits bestehenden rechtlichen und regulatorischen Rahmenbedingungen für die Aufbewahrung von Dokumenten unterschiedlichster Art betrachten:

  • Belege aus dem Rechnungswesen sind in Österreich sieben Jahre und in Deutschland zehn Jahre aufzubewahren (zum Teil auch länger)
  • Krankenakte sind zehn bzw. dreißig Jahre und zukünftig lebenslang aufzubewahren
  • Unterlagen über Lebensversicherungen sind sogar über den Tod des Versicherten hinaus aufzubewahren


Durch den schnellen Medien- und Systemwandel im IT-Bereich sind folgende Maßnahmen sinnvoll, um die langfristige Verfügbarkeit digitaler Informationen zu gewährleisten:

  • Einsatz offener Standards wie z.B. freier Dokumentenformate, die als relativ langlebig betrachten werden und deren Aufbau öffentlich bekannt ist
  • Regelmäßiges Umkopieren von einem alten Speichermedium auf neue Datenträger, um den Verlust von Daten durch die Alterung von Datenträgern zu verhindern



ECM - Die rechtlichen Rahmenbedingungen

Die nachfolgenden Themen sind nur als kurzer Exkurs über die inzwischen sehr komplexen und schwer überschaubaren rechtlichen und organisatorischen Rahmenbedingungen, die die elektronische Archivierung begleiten, gedacht. Vor allem sollten einige wichtige Begriffe erläutert werden.


IT-Compliance / IT-Governance

Was versteht man unter Revisionssicherheit?

Rechtliche Vorgaben und Regelwerke

Aus der Vielzahl von Rechtsvorschriften und sonstigen Regularien, die Einfluss auf die elektronische Archivierung haben, werden nachfolgend nur einige beispielhaft angeführt:

  • UGB / BAO – Unternehmensgesetzbuch / Bundesabgabenordnung
  • SigG / SigV – Signaturgesetz / Signaturverordnung
  • InfoSig / InfoSiV – Informationssicherheitsgesetz / -verordnung
  • Basel II
  • SOX (oder SOA) - Sarbanes-Oxley-Act (USA)
  • 8. EU-Richtlinie (Euro-SOX)
  • GDPdU – Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (Deutschland)

CobiT und ITIL

Für die IT-Governance kommen immer mehr Verfahrensmodelle und Werkzeuge, wie CobiT, ITIL und andere in Gebrauch, die Transparenz und Überprüfbarkeit der IT-Landschaft im Unternehmen ermöglichen sollen und somit auch Einfluss auf das Thema ECM haben:

CobiT (Control Objectives for Information and Related Technology): CobiT ist das international anerkannte Framework zur IT-Governance und gliedert die Aufgaben der IT in Prozesse und Control Objectives. CobiT war ursprünglich als Werkzeug für IT-Prüfer entwickelt worden und hat sich zu einem Werkzeug für die Steuerung der IT aus Unternehmenssicht und für die Sicherstellung der Einhaltung gesetzlicher Anforderungen weiterentwickelt.

ITIL (Infrastructure Library): ITIL ist eine Sammlung von Good Practices, die die für den Betrieb einer IT-Infrastruktur notwendigen Prozesse beschreiben und ist inzwischen international ein De-fakto-Standard geworden.

Literatur

Quellen

  1. http://de.wikipedia.org/wiki/Enterprise_Content_Management
  2. Siehe dazu auch den Branchenverband AIIM (Association for Information and Image Management) für ECM (http://www.aiim.org)
  3. http://de.wikipedia.org/wiki/Enterprise_Content_Management_System


Weiterführende Links