Pl4net.info

Bibliothekarische Stimmen. Independent, täglich.

Mehr aus den Daten in Katalogen herausholen

Unter dem Titel Zwischen Wunsch und Wirklich­keit: Bibliotheksdaten und Bibliothekskataloge – Fünf Thesen hat Prof. Heidrun Wiesenmüller von der Hochschule der Medien Stuttgart in den vdB-Mitteilungen einen sehr inspirierenden Artikel über die Verbesserung von Bibliothekskatalogen – insbesondere ausgehend von deren bibliographischen Daten – veröffentlicht.

Dieser Artikel zeigt anhand vieler praktischer Beispiele, wie sehr es sich für eine erfolgreiche Recherche-Erfahrung lohnt, einen Blick darauf zu werfen, was man an Daten zur Verfügung hat, welche Unzulänglichkeiten im Kontext eines Bibliothekskatalog zu umgehen sind und wie mit einer intelligenteren Verarbeitung der Daten weitere Hilfen für den Nutzer angeboten werden können.

Oft steckt die Tücke der Benutzung der Kataloge in der korrekten Erfassung nach RAK. Ein gutes Beispiel ist das Schiller-Räuber-Problem, bei dem der Nutzer erfolglos nach “Schiller Räuber” recherchiert, weil “Schiller” in der Hauptaufnahme “Werke” und “Räuber” in der Unterordnung zu finden sind – ohne Personenangabe “Schiller”.  Durch eine Anreicherung mit den Verfassern der Überordnung lässt sich diese Problem – wie in OpenBib – schnell erledigen. Ähnlich gelagert ist die Problematik, die sich aus der Umstellung von der ISBN10 auf die ISBN13 ergab.

Prof. Wiesenmüller gibt weitere Beispiele für unnötig fehlgeschlagende “known-item searches”.

  • Recherchen nach einem bestimmten Jahrgang einer Zeitschrift laufen ins Leere, weil dort die Kategorie Erscheinungsjahr korrekterweise nicht besetzt ist. Stattdessen ist der Erscheinungsverlauf besetzt, der dem Nutzer aber immer noch nicht wirklich weiterhilft, da ihn eigentlich nur der Bestandsverlauf interessiert – also jene Titel, die in der Bibliothek (oder elektronisch) tatsächlich verfügbar sind. Nach einer Analyse der Bestandsverläufe werden in der nächsten OpenBib daher nun alle Jahreszahlen für die Recherche angereichert, aus “2008 -” wird nun also “2008 2009 2010 2011 2012″.
  • Copy-and-paste Recherchen scheitern u.a. aufgrund von verwendeten Abkürzungen (z.B. Verl. anstelle Verlag). Hier wird eine “ungenauere” Recherche vorgeschlagen. Aus meiner Sicht bringt das jedoch weitere Probleme mit sich, da dann eventuell generell mehr gefunden wird – besser gesagt die Trefferlisten länger und unübersichtlicher werden – und der Nutzer nicht durchschaut, warum bestimmte Titel denn eigentlich dort auftauchen. Aus meiner Sicht ließe sich das Problem gezielter durch die Verwendung von Synonym-Wörterbüchern innerhalb der jeweils verwendeten Suchmaschine lösen. Generelle Abkürzungen oder Akronyme sollten in so einer Datei gesammelt und der Suchmaschine bereitgestellt werden, also z.B. Verl. und Verlag bzw. c# und c sharp.

Ein weiterer Schwachpunkt in Katalogen ist das Fehlen wichtiger Informationen – insbesondere die schlechte Sacherschließung (im SWB ist die Sacherschließungsrate gerade einmal 31,8 Prozent – in anderen Verbünden erwarte ich ähnliche Raten), die sich in begrenztem Maße durch Übernahme aus anderen Katalogen oder Manifestationen verbessern lässt. Gerade hier zeigen sich die Vorteile der Open Bibliographic Data-Bewegung, da nun für jedermann eine Anreicherung der eigenen Daten mit externen Sacherschließungsinformationen erst möglich wird. Nach wie vor lassen sich aber auch unter Zuhilfenahme etablierter Schnittstellen (Z39.50/SRW/…) Daten lokal anreichern. An der USB Köln wurde zur Anreicherung unseres Bestandes mit Sacherschließungsinformationen eine Webanwendung erstellt, mit der Titel mit bisher fehlender Basisklassifikation (und derzeit experimentell auch bei fehlender Verschlagwortung) von unseren Fachreferenten gezielt bearbeitet und zugehörige Vorschläge aus anderen Verbünden automatisch übernommen werden können.

Demgegenüber werden tatsächlich vorhandene Informationen oft nicht sinnvoll genutzt. Als Beispiel werden durch Lebensjahre individualisierte Personen-Normdateneinträge sowie Thesaurusrelationen und speziell Ländercodes genannt. Letztere können zur Bildung von geographischen Facetten verwendet werden, wie im Artikel “Mehr aus der Schlagwortnormdatei herausholen” von Wiesenmüller, Maylein und Pfeffer in B.I.T.online 14 (2011) Nr. 3.

Leider steckt auch in der Individualisierung der Einträge in Personen-Facetten durch die zugehörigen Lebensjahre die eine oder andere Tücke. So sind uns nach der Integration dieser Funktionalität in die kommende OpenBib-Version verschiedene konkrete Probleme aufgefallen:

  • Die Anzahl von Personen-Normdaten mit Lebensjahr-Angabe ist erschreckend gering. Beispiel “Schmitz, Wolfang” im hbz Verbundkatalog: Zu ihm gibt es in der Personen-Normdatei 15 Einträge. Davon haben lediglich 5 Einträge die Jahresangaben und von diesen wiederum sind jeweils 2 dublett.
  • Die Personen-Normdaten sind mit den entsprechenden Titeln nicht immer richtig oder konsequent verknüpft. So sind die Werke “unseres” Wolfgang Schmitz auf die Personen-Normdatensätze mit und ohne Jahresangaben verteilt. Damit aber läuft die Suggestion einer durch Jahresangaben vollqualifizierten Personen-Facette in Leere. Der Nutzer denkt mit der Facette “Schmitz, Wolfgang (1949 -)” alle seine Werke auszuwählen, obwohl einige nur mit der unqualifizierten Facette “Schmitz, Wolfgang” erreicht werden können. Diese Problematik begleitet uns beim KUG schon etliche Jahre. Ursprünglich wurden Personen-Normdaten mit den Titeln vollqualifiziert durch deren ID in den Trefferangaben verlinkt in der – wie wir inzwischen wissen – irrigen Annahme, das die Verknüpfungen korrekt sind und wirklich alle zugehörigen Titel dadurch erreicht werden. Schmerzhaft mussten wir aber lernen, dass dem nicht so ist. Typischerweise gibt es mindestens 3 Normdaten-Einträge mit der gleichen Ansetzungsform, mit denen mal 4, mal 5, mal kein Titel verknüpft ist. Aus diesem Grund wurde die Verknüpfung durch die Personen-Normdaten-ID im KUG aufgegeben und zukünftig wird nur noch direkt über die Ansetzungsform recherchiert.
  • Ist die Verwendung der “vollqualifizierten Personen-Facetten” in nur einem Katalog (s.o.) schon ein Problem, so vergrößert es sich noch mehr bei der Recherche in mehreren Datenquellen. Das ist z.B. in der USB bei der gleichzeitigen Suche in den vielen Institutskatalogen der Fall.  Denn in den Institutskatalogen werden quasi nie Jahresangaben in die Personen-Normdaten eingepflegt. In all diesen Katalogen wäre es grundsätzlich sinnvoll durch Abgleich mit frei verfügbaren bibliographischen Daten eine Anreicherung der Personen-Normdaten mindestens mit PND/GND-Nummern und zusätzlich den Jahresangaben vorzunehmen.
  • Jenseits der Personen-Facetten stellt sich schließlich die Frage, wie denn in Trefferlisten und Einzeltreffern die Personen verlinkt werden sollen – mit Jahresangaben qualifiziert oder unqualifiziert.

Wesentlich für einen Katalog wird jenseits der Recherche das “Browsing” und “unentdeckte Suchen” gefordert. Beides zeigen verschiedene Kataloge (E-LIB, Heidi, beluga) und gehört zu der Grundphilosophie von KUG und OpenBib. Seit jeher versuchen wir die Vernetzung mit thematisch passenden weiteren Titeln oder Informationen (intern wie auch extern) zu maximieren. Dazu bedienen wir uns verschiedener Techniken wie Data-Mining, Kataloganreicherung oder Mashups. Gerade in einem Verbund vieler getrennten Kataloge wie dem KUG ist dies eine besondere Herausforderung.

Der Artikel schließt mit der Forderung nach mehr Kooperation in der Katalogentwicklung – kommerziell wie open source. Dem möchte ich mich uneingeschränkt anschließen. Gerade durch offenen Erfahrungsaustausch, der offenen Dokumentation von Best-Practices, der Verwendung offener (lizenzfreier) Schnittstellen, offen einseh- und nachnutzbaren Beispiel-Implementationen, offenen Kolaborationswerkzeugen usw. kann die Katalogentwicklung noch transparenter und erfolgreicher werden. “Offen” ist hier wesentlich und keine unnötigen Schutzzäune durch notwendige Zeitschriften-Abos, Interlectual property (z.B. von Schnittstellen), Monopolisierung sowie Abschottung guter Ideen oder dergleichen.

Fazit: Die Auseinandersetzung mit seinen bibliographischen Daten lohnt sich.

 

Kommentare sind geschlossen.