IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library 
Associations and InstitutionsAnnual 
ConferenceSearchContacts

64th IFLA Conference Logo

   64th IFLA General Conference
   August 16 - August 21, 1998

 


Code Number: 022-141-G
Division Number: IV.
Professional Group: Bibliography
Joint Meeting with: -
Meeting Number: 141.
Simultaneous Interpretation:   Yes

Statistische Auswertung Nationalbibliographischer Daten

UTE SCHWENS
Dienstleistungen und Archivierung
Die Deutsche Bibliothek
Frankfurt am Main
Germany


Paper

EU-Projekt CoBRA-METRIC

„Statistik - oh, Gott", das ist die häufigste Reaktion der Beteiligten auf die Notwendigkeit, Zahlenmaterial zur Gewinnung von Informationen unterschiedlichster Art für unterschiedlichste Zwecke zusammenzustellen.

Auch Bibliotheken erheben Statistiken, die sich hauptsächlich auf Bestandszuwachs bei den verschiedenen Medienarten und/oder Sammelschwerpunkten, auf ausgegebene Mittel unter unterschiedlichsten Gesichtspunkten und auf die interne Arbeitsleistung beziehen. Diese Statistiken dienen

Nationalbibliotheken sehen sich darüber hinaus in der letzten Zeit verstärkt weiteren Anforderungen gegenübergestellt. Aufgrund ihres gesetzlichen Auftrags, nationales Schrifttum möglichst umfassend zu sammeln und zu erschließen, werden sie von Berufsverbänden, Buchhandelsorganisationen, Marktforschungsinstituten u. a. nach marktrelevanten Informationen gefragt, die für Rückblicke, Analysen und Prognosen benötigt werden. (1) Die anfragenden Institutionen gehen dabei davon aus, daß die Nationalbibliotheken solche Informationen liefern können, da sie ja die gesamte nationale Verlags- und „graue" Produktion ihres Landes erhalten und in ihren Datenbanken verzeichnen, ...
... was diese ja auch tun, jedoch mehr unter bibliothekarischen als unter marktpolitischen, statistischen Gesichtspunkten. Die Retrievalsoftware bibliographischer Datenbanken liefert andere Suchergebnisse, als sie für marktanalytische Fragestellungen nötig sind.

Als im Herbst 1993 von der Europäischen Kommission und den europäischen Nationalbibliotheken die Initiative CoBRA (Computerized bibliographic record actions)(2) gegründet und im Rahmen dieser Initiative über Projektmöglichkeiten diskutiert wurde, kam von den Teilnehmern der Vorschlag, die Frage der statistischen Auswertung nationalbibliographischer Daten als Projektvorschlag bei der EU einzureichen.

Der Vorschlag wurde akzeptiert. Das Projekt begann am 15.12.1994 und sollte ursprünglich am 28.02.1996 beendet sein, wurde dann aber bis Ende September 1996 verlängert.

Projektpartner waren Die Deutsche Bibliothek (Frankfurt/Leipzig), die Koninklijke Bibliotheek Albert I (Brüssel), die Koninklijke Bibliotheek (Den Haag) und die Kungliga Biblioteket (Stockholm). Die Federführung lag bei Der Deutschen Bibliothek.

Das Projekt gliederte sich in vier Teile:

Der erste Teil beinhaltete eine Analyse und Gegenüberstellung der Erschließungspraxis der vier Partner: Welche Informationen werden erhoben, in welcher Form, wie strukturiert, welche fehlen. Das Ergebnis dieser Analyse wurde mit der Praxis anderer Nationalbibliotheken verglichen Die Durchführung dieses Projektteils erfolgte durch einen unabhängigen Berater (A. A. Herpers, Amsterdam) in Zusammenarbeit mit den Partnerbibliotheken, wobei der belgische Partner die Hauptverantwortung innehatte.

Am Ende lag eine Liste von Feldern vor, die für statistische Erhebungen interessant sein könnten und bei allen Partnern entweder bereits in den Titelaufnahmen enthalten sind oder - da sie für wichtig erachtet werden - demnächst aufgenommen werden. Diese Liste setzt sich u. a. zusammen aus:

Auf der Basis dieser Liste wurde im zweiten Teil des Projekts, für den Die Deutsche Bibliothek zuständig war, zunächst ein „bibliometric format", d. h. ein Statistikformat definiert: Die einzelnen Felder wurden benannt, die Art der Darstellung (Code, alpha-numerischen oder rein numerisch) und die Feldlänge wurden festgelegt, die Wiederholbarkeit von Feldern wurde definiert (z. B. muß das Feld „Sachgruppe" mehrfach belegbar sein).

Über reine Formatfragen hinausgehend wurden mögliche Fragestellungen gesammelt. Dabei schöpften die Partner aus den Erfahrungen, die sie jeweils mit den eingangs erwähnten Institutionen in ihrem Land gemacht hatten.

Hier einige Beispiele:

usw.

Bei der nächsten Frage, welche kommerzielle Software für den Aufbau einer statistischen Datenbank geeignet scheint, kamen die Projektpartner und die diesen Part begleitende Softwarefirma Cap Volmac, Utrecht, zu der Entscheidung, MS-Access zu nutzen.

Diese Software ist weit verbreitet, kostengünstig, leicht zugänglich, leicht nutzbar und durch einfache Programmierschritte in SQL (Structured Query Language) erweiterbar. Außerdem bietet sie gute graphische Exportmöglichkeiten.

Basierend auf dem definierten Statistikformat und den genannten Fragestellungen erstellte Cap Vomac eine Access-Datenbank sowie ein Programm zum Laden von Daten in diese Datenbank. Außerdem wurden Vorgaben gemacht, wie die statistischen Daten, die im dritten Projektteil von allen Partnerbibliotheken aus deren bibliographischen Daten extrahiert werden sollten, auszusehen haben.

Sowohl die Software (Access-Datenbank, Loading Programme) als auch die Dokumentation über das Layout des „Extraction files" liegen auf dem FTP-Server Der Deutschen Bibliothek, so daß jederzeit Zugriff darauf besteht.

Der dritte Teil von CoBRA-METRIC lag in der Verantwortung der Niederländer. Er umfaßte - wie bereits gesagt - die Extraktion statistischer Daten aus der nationalbibliographischen Datenbank d. h. die Konversion bibliographischer Daten in da festgelegte Statistikformat, wobei die oben erwähnten Vorgaben erfüllt werden mußten.

Die Projektpartner einigten sich dabei aus Kapazitätsgründen auf zwei Bibliographiejahrgänge; alle nationalen Statistikdaten wurden ebenfalls auf den FTP-Server gelegt. Für einen Vergleich zwischen den eigenen Daten und denen eines oder mehrerer Länder mußten die Daten der Partner nur in das eigene System geladen werden.

Im vierten und letzten Teil des Projekts erstellte die schwedischen Nationalbibliothek eine Dokumentation der statistischen Datenbank. Sie umfaßt die Beschreibung der einzelnen Fenster, gibt Beispiele für Fragestellungen und für die Darstellung der Ergebnisse (verbal oder graphisch). Grundkenntnisse in Windows und Access werden allerdings vorausgesetzt. Auch diese Dokumentation ist über den Server erhältlich.

Damit ist das Projekt abgeschlossen und die Nutzung für einen erweiterten Interessentenkreis möglich.

Nach diesem Eingangsdialog findet man die Verzeichnisse /unzip (enthält die Entpackungssoftware pkunzip.exe), /doc (enthält extract.zip = Layout für den „Extraction file", die Dokumentation der Datenbank usw.), /database/loader (enthält loader.zip und nach dem Entpacken die Datien cobra.ldb und cobra.mdb = leer Access-Datenbank sowie CoBRA-loader = loading programme).

Die im Lauf des Projekts entstandene Statistikdatenbank erhebt beileibe noch keinen Anspruch auf Perfektion. Zu groß waren die Probleme bereits am Anfang, als es um die Analyse der Erschließungspraxis der Partnerbibliotheken ging, da man teilweise sogar Bedeutungsinhalte definieren mußte. Zu viele Felder müssen von einzelnen Bibliotheken in der nächsten Zeit überhaupt erst besetzt werden. Zu groß sind teilweise die Unterschiede in der Behandlung mehrbändiger Werke, Serien, Zeitschriften usw. Doch die größten Probleme konnten bereinigt werden und die Partnerbibliotheken sind im großen und ganzen zufrieden mit dem Ergebnis.

Jedenfalls würden sich alle freuen, wenn das Projekt auf Interesse stieße, weiter verbessert würde und viele Nachnutzer fände.

Footnotes

  1. Sabine Gafke, Felix Neiger: Buchmarkt-Analysen durch elektronische Katalogisierung. In: Dialog mit Bibliotheken, 6 (1994) 1, S. 33-36

  2. Über CoBRA wurde in dieser Zeitschrift bereits mehrfach berichtet.