Beitrag von Tobias Wildi (docuteam)
Am 30. Oktober 2009 hat das Schweizerische Bundesarchiv (BAR) offiziell ein Dateiformat (resp. Datenstruktur) und Softwaresuite präsentiert als "zukunftsfähige Lösung zur Archivierung relationaler Datenbanken". Die Software erzeugt aus MS SQL, Oracle oder Access einen Dump, so dass die Datenbankinhalte als Textfile gespeichert werden können. Gegen Hinterlegung der Kontaktadresse kann die SIARD-Suite gratis heruntergeladen werden. Die Lizenzbestimmungen (siehe
http://tinyurl.com/yghqf8y) stützen sich aber nicht auf eines der verbreiteten Modelle wie GPL oder Apache, sondern wurden in ein eigenes Regelwerk gegossen. Die zentralen Punkte:
- Die Benutzung der Software ist kostenlos.
- Der Quellcode wird nicht offengelegt.
- Wenn ein Archiv Erweiterungen an der Software wünscht, so darf es diese nicht selber programmieren oder einen ihm genehmen Dienstleister damit beauftragen. Es muss zuerst einen Wartungsvertrag mit einer namentlich benannten Firma eingehen, welche sodann mit der Programmierung von Erweiterungen beauftragt werden darf. Das BAR bekommt die vom Drittarchiv bezahlten Erweiterungen / Änderungen unentgeltlich, umgekehrt besteht kein Anspruch auf Entschädigung (und wohl nicht einmal auf den Quellcode).
Grundsätzlich ist es dem BAR hoch anzurechnen, dass es eigenentwickelte Software veröffentlicht. Aber unter den gegenwärtigen Lizenzbestimmungen sind folgende Punkte problematisch:
Die Struktur der Dump-Dateien ist zwar bereits seit 2008 offen dokumentiert, die Weiterentwicklung des Formats wird aber vom Bundesarchiv kontrolliert. Es handelt sich somit um ein proprietäres Format (es gehört jemandem), das vom Besitzer nach Belieben verändert werden kann. Niemand kann sagen, ob die heutigen Files in ein paar Jahrzehnten von der dannzumaligen SIARD-Software noch gelesen werden können oder in welchen Abständen die Datenbestände zu migrieren sind. Solange das BAR das Format alleine kontrolliert und nicht einem geeigneten Standardisierungsgremium übergibt, macht eine auf SIARD basierende Archivstrategie für Dritte keinen Sinn.
SIARD umfasst Module zur Erstellung und zum Zurücklesen von Datenbankdumps. Als Archivar habe ich aufgrund des fehlenden Quellcodes keine Möglichkeit, die Vorgänge innerhalb der Software zu rekonstruieren und zu prüfen. Das bedeutet: Ein Archiv fertigt heute fleissig SIARD-Dumps von Datenbanken an. In einigen Jahrzehnten, wenn das BAR das SIARD-Format möglicherweise längst aufgegeben hat, möchte es die Files zurückspielen und baut aufgrund der Formatspezifikation die SiardToDb-Applikation nach. Erst dann wird sich zeigen, ob sich die ursprüngliche datenproduzierende Applikation an die Spezifikation gehalten hat oder nicht. Niemand kann dies heute überprüfen, ausser es finden sich Personen, die eine eigene, quelloffene Implementierung der SIARD-Suite vornehemen, so dass sich die Resultate querprüfen lassen (wie dies im Fall von PDF/A bei pdfa.org sehr intensiv geschieht). Momentan entscheidet sich ein Archiv für ein Format, welches heute nur durch eine einzige, nicht quelloffene Applikation geschrieben und gelesen werden kann. Die geringe Verbreitung von SIARD und vor allem der nicht verfügbare Quellcode der erzeugenden Applikation sind Argumente, die SIARD für Dritte zur Zeit uninteressant machen.
Die Lizenz enthält weitere Fragezeichen. Die SIARD-Software wurde mit Steuergeldern finanziert. Dies ist keine Ausnahme, bei ähnlichen Projekten wie Xena in Australien (http://xena.sourceforge.net/) oder koLibRi in Deutschland (http://kopal.langzeitarchivierung.de/index_koLibRI.php.en) verhält es sich genau gleich. Nur: Diese zwei Werkzeugen stehen unter Softwarelizenzen (GPL2, resp. eine eigene Open Source-Lizenz), die dem Bürger (= Investor) die freie Nutzung und Erweiterung der Software freistellt. Aus der Sicht des Steuerzahlers bedeutet dies: "You get what you pay for". Nicht so in der Schweiz, hier behält der Staat die Rechte sehr restriktiv bei sich.
Ein besonders fragwürdiges Modell wurde für den zukünftigen Entwicklungspfad der Software gewählt. Archive, die die Applikationen weiterentwickeln wollen, müssen dafür ein namentlich genanntes Unternehmen beauftragen und erhalten weder Rechte an ihren Softwareteilen, noch Einblick in den von ihnen bezahlten Code. Unter dem eigenartigen Titel "Freeware" hält ein Archiv weder einen Vertrag mit einem kommerziellen Anbieter noch den Zugriff auf den Quellcode in seinen Händen. Damit entsteht eine hohe Rechts- und Zugriffsunsicherheit. Ich halte dies für ein höchst fragwürdiges Modell, Innovation zu betreiben.
Ein Gegenbeispiel zum verunglückten Lizenzmodell von SIARD: In der Stadt Baden bauten wir mit einem beschränkten Budget das erste digitale Kommunalarchiv der Schweiz auf. Dies war möglich, weil wir auf eine Fülle von Open Source-Software und nicht-proprietäre Formate zurückgreifen konnten und diese für unsere Zwecke nutzbar machten. Zum Teil nutzten wir ganze Softwareumgebungen, zum Teil passten wir sie an und Teile schrieben wir auch selber. Nur weil die grossen amerikanischen Wissenschaftsstiftungen (Andrew W. Mellon etc.) und das britische JISC bei ihren Projekten die Veröffentlichung des Quellcodes zur Bedingung machen, war der Aufbau eines kleinen digitalen Langzeitarchivs überhaupt möglich. SIARD andererseits ist mit der gegenwärtigen Lizenz für Staats- oder Kommunalarchive absolut uninteressant.
SIARD ist der erste Versuch des BAR, Software zu veröffentlichen. Diese an sich begrüssenswerte Initiative bremst sich gegenwärtig mit der gewählten Lizenzpolitik gleich selber wieder aus. Erst wenn SIARD unter ein genormtes Dach wie GPL2, BSD oder die Apache-Lizenz gestellt wird, werden Drittarchive das Dateiformat und die Software überhaupt erst in Erwägung ziehen.
Tobias Wildi, t.wildi@docuteam.ch.
jhagmann - 7. Nov, 07:35