Anmerkungen zu ERA (NARA)
Kürzlich hat Hubert Wajs am DLM Forum in Helsinki einen Beitrag über den Stand des ERA Projekts (NARA) geliefert. Zur Zeit das grösste digital preservation Projekt weltweit. (2005 sprach der US Kongress nochmals über 300 Mio US$ bis 2012; für die Planungsphase sind seit 2002 schon jährlich > 30 Mio ausgegeben worden).
Dabei gibt es doch ein paar interessante Aspekte, die vermuten lassen, das das Mega-Projekt Gefahr läuft, aus dem Ruder zu laufen:
- Gestrichen wurde die Anforderung an die 'authentically preserved electronic record'. 'Authenticity' wird nun durch einige technische Vorkehrungen und 'Identity Metadata' (16 Elemente) gewährleistet.
- Gestrichen wurde auch die Anforderung an 'free from dependency on any specific hardware or software' (= open source). [Vermutlich ein Tribut an die kommerziellen Interessen von Lockheed Martin Corp.]
- Die technische Realisierung ist nur mit einem Data Grid von dezentralen Servern möglich, welches durch einen 'Storage Resource Broker (SRB)' Server verwaltet werden. [Abkehr vom zentralen Super-mega-cluster und der totalen Archiv-Datenbank
- Zur Analyse und Beschreibung werden semantische Technologien eingesetzt.
- Die Ordnung folgt ISAD (G) und wird im 'Logical File Name' als dem 'persistent identifier' festgeschrieben.
- Die Archivformate sind PDF (für Dokumente) und XML (für Daten und Metadaten).
- Das Projekt wird viermal länger dauern und fünfzehnmal teurer sein als 2002 angenommen (dies soll auch in andern Projekten und Firmen vorkommen ...)
- Elektronische Datenvolumina wachsen ins Unendliche. [Ab 2018 ist das exponentielle Wachstum nicht mehr zu beherrschen, d.h., die Lösung hält für ca. 10 Jahre vor; etwas kurz für ein Archiv 'for the Life of the Republic'
Auffällig auch, dass der ERA link inzwischen von der NARA Startseite verschwunden ist.
danke auch an meinen Kollegen Francis für die Hinweise
JH
ERA Website: http://www.archives.gov/era/
Dabei gibt es doch ein paar interessante Aspekte, die vermuten lassen, das das Mega-Projekt Gefahr läuft, aus dem Ruder zu laufen:
- Gestrichen wurde die Anforderung an die 'authentically preserved electronic record'. 'Authenticity' wird nun durch einige technische Vorkehrungen und 'Identity Metadata' (16 Elemente) gewährleistet.
- Gestrichen wurde auch die Anforderung an 'free from dependency on any specific hardware or software' (= open source). [Vermutlich ein Tribut an die kommerziellen Interessen von Lockheed Martin Corp.]
- Die technische Realisierung ist nur mit einem Data Grid von dezentralen Servern möglich, welches durch einen 'Storage Resource Broker (SRB)' Server verwaltet werden. [Abkehr vom zentralen Super-mega-cluster und der totalen Archiv-Datenbank
- Zur Analyse und Beschreibung werden semantische Technologien eingesetzt.
- Die Ordnung folgt ISAD (G) und wird im 'Logical File Name' als dem 'persistent identifier' festgeschrieben.
- Die Archivformate sind PDF (für Dokumente) und XML (für Daten und Metadaten).
- Das Projekt wird viermal länger dauern und fünfzehnmal teurer sein als 2002 angenommen (dies soll auch in andern Projekten und Firmen vorkommen ...)
- Elektronische Datenvolumina wachsen ins Unendliche. [Ab 2018 ist das exponentielle Wachstum nicht mehr zu beherrschen, d.h., die Lösung hält für ca. 10 Jahre vor; etwas kurz für ein Archiv 'for the Life of the Republic'
Auffällig auch, dass der ERA link inzwischen von der NARA Startseite verschwunden ist.
danke auch an meinen Kollegen Francis für die Hinweise
JH
ERA Website: http://www.archives.gov/era/
jhagmann - 10. Dez, 22:14
the singluarity is near
Nach meiner Erfahrung ist die beste Moeglichkeit,
1. resourcen fuer adaptierbarkeit zu planen
2. bei ganz wenigen zentralen entitaeten extrem konservatid zu sein.