Afbrokkelende muren: Bibliotheken op het Internet

Yellow line

A good library is a place, a palace where the lofty spirits
of all nations and generations meet.

Samuel Niger (1883 - 1956)

Yellow line

Inleiding

Libraries without walls, elektronische bibliotheek, digitale bibliotheek, bibliotheken van de toekomst. Als er een sector is waar de ontwikkelingen op het gebied van informatie- en communicatietechnologie zich doen voelen dan is het wel in bibliotheekland. In amper vijftien jaar tijd hebben bibliotheken zich ontwikkeld van organisaties waar grijze muizen werkten die boeken het liefst niet uitleenden tot dynamische instellingen die zich zelf presenteren als belangrijke relais aan de elektronische snelweg. Van passief naar pro-actief, geen ontoegankelijke schrijnen van informatie, maar plekken waar de lezer / lener van voorheen is omgedoopt tot eindgebruiker die op maat en just-in-time bediend dient te worden, ongeacht de plek waar hij of zij zich bevindt.

In deze aflevering van de rondgang aandacht voor bibliotheken op het Internet. Zoals gebruikelijk worden allereerst startpunten gegeven, vervolgens passeren enkele grote Amerikaanse en Europese bibliotheken de revue. Speciaal aandacht is er voor het hart van elke bibliotheek, de catalogus, waarvoor steeds vaker WWW-interfaces opduiken, overigens niet zonder problemen. Afgesloten wordt met enkele initiatieven om de informatie op het Internet toegankelijker te maken, gebruikmakend van beproefde bibliotheektechnieken in een nieuw jasje.

Startpunten

Een van de oudere en een van de beste indexen van bibliotheken op het Internet in het algemeen is HYTELNET van Peter Scott. Van oorsprong is HYTELNET een programma (met versies voor diverse operating systems) dat informatie gaf over bibliotheekcatalogi die via telnet (remote login) bereikbaar waren. Door middel van een geografische ingang kan de gebruiker op zoek naar een bibliotheek en krijgt vervolgens informatie over de aard van de catalogus, het telnetadres, de wijze van in- en uitloggen en soms korte praktische tips. Dezelfde gegevens zijn nu ook via WWW ter beschikking. Een nieuw onderdeel van deze service is Webcats on HYTELNET. Deze index biedt evenals het oude HYTELNET informatie over bibliotheekcatalogi, zij het dat deze hier beperkt is tot catalogi met een WWW interface.

Een meer algemene service is LibWeb - Library WWW servers, gesitueerd op de Berkeley Digital Library Site en onderdeel van de WWW Virtual Library. Begin juli 1996 kent deze index meer dan 1000 bibliotheken in 45 landen en 6 continenten. In tegenstelling tot Peter Scott's lijst gaat het hier niet enkel om via WWW toegankelijke catalogi, maar meer om algemene WWW servers van bibliotheken. Catalogi kunnen daar een onderdeel van uitmaken, maar vaker gaat het om meer algemene informatiebronnen. De servers zijn per werelddeel / land gerangschikt terwijl daarnaast ook twee andere ingangen naar catalogi op het Web worden gegeven. LibWeb bouwt voort op werk van anderen, waaronder Peter Scott's Webcats.

Een van de sites waarnaar LibWeb verwijst is Eric Lease Morgan's Online catalogs with 'webbed' interfaces. Morgan waarschuwt ervoor dat hij geen uitputtende lijst geeft, maar meer een research tool biedt voor bibliothecarissen die de mogelijkheden willen verkennen van verwebde catalogi. Morgan's site is alfabetisch georganiseerd en biedt zowel directe toegangen tot web-catalogi als ook naar meta-sites met indexen van web-catalogi. Ook hier worden verwijzingen naar aanverwante sites gevonden. Een meer traditioneel startpunt is Yahoo! -Reference/Libraries. Yahoo deelt in naar soort bibliotheek, terwijl ook verwijzingen naar aanverwante sites, bijvoorbeeld over boeken, zijn opgenomen.

Ook Nederlandse bibliotheken onderhouden lijsten van via het WWW raadpleegbare bibliotheken. Een voorbeeld is de pagina Bibliotheken op het Web van de bibliotheek van de Rijksuniversiteit Utrecht. De lijst is geordend naar continent en geeft tevens links naar ondernemingen op het gebied van bibliotheeksoftware.

Een andere Nederlandse lijst is de Wegwijzer naar bibliotheken wereldwijd van de Koninklijke Bibliotheek in Den Haag. Deze pagina bevat allereerst verwijzingen naar andere meta-sites, vervolgens links naar bibliotheken in Nederland en elders in de wereld en voorts ook links naar documentaire informatie op het Internet in het algemeen en links naar bibliotheekopleidingen. Daarnaast heeft de Koninklijke Bibliotheek nog een aparte pagina met links naar National Union Catalogues, nationale overkoepelende catalogi, in Europa. Deze zijn overigens niet allemaal via WWW te bereiken en ook niet allemaal vrij toegankelijk.

Meer specifiek op de Nederlandse situatie gericht is de pagina Bibliotheken in Nederland, onderhouden door Surfnet. Deze deelt de bibliotheken in naar type: van openbare bibliotheek tot universiteitsbibliotheken. Ook hier geldt dat niet alle bibliotheken via WWW toegankelijk zijn, van sommige is bijvoorbeeld alleen de catalogus toegankelijk via telnet.

Grote Amerikaanse bibliotheken op het Internet

Een van de belangrijkste bibliotheken in de wereld is uiteraard de Library of Congress (LC) in Washington. De LC homepage toont een fraaie clickable imagemap waarop diverse keuzes gemaakt kunnen worden. Een zo'n keuze is American Memory. Dit is de bijdrage van LC aan het National Digital Library initiatief, en betreft de speciale collecties van LC op het gebied van de historie en cultuur van de Verenigde Staten. De collecties betreffen foto's, films, geluidsopnamen en gedrukte documenten waarin naar believen gezocht kan worden of gegrasduind. Van de films kunnen fragmenten worden gedownload om op eigen werkstation of pc af te spelen. Bij de foto's is een collectie van 600 daguerrotypes uit de periode 1842 - 1862 te bewonderen, waaronder een portret van Abraham Lincoln. Helaas is de catalogus van de Library of Congress niet via WWW te raadplegen, wel kan vanuit de browser eenvoudig een telnet verbinding met de catalogus worden gelegd.

Een andere belangrijke - en interessante! -bibliotheek in Washington is die van Smithsonian Institute. Ook hier is de catalogus enkel via een telnet verbinding raadpleegbaar. De WWW server van het Smithsonian heeft echter meer te bieden, waaronder toegang tot online tentoonstellingen en elektronische publicaties, zij het dat deze laatste loot nog duidelijk in ontwikkeling is. De online tentoonstelling Science and the Artist's book is echter zeer de moeite waard.

Een derde en grote bibliotheek in de Verenigde Staten die in deze rondgang niet mag ontbreken is de New York Public Library (NYPL). De homepage opent met een fraaie opname van de markante ingang van deze bibliotheek en biedt toegang tot de catalogi, tentoonstellingen, resource guides en zoekmogelijkheden op het Internet. Er zijn twee catalogi toegankelijk, via WWW is dat CATNYP, de catalogus van de onderzoeksbibliotheken, via telnet is dat LEO - verwijzend naar de gebeeldhouwde leeuwen bij de ingang - de publieke collectie van meer dan 1 miljoen titels, toegankelijk (log in als leo - kleine letters!). De resource guides geven specifieke informatie over de speciale collecties, zoals bijvoorbeeld de Danscollectie van de NYPL. In die laatste collectie zijn bijvoorbeeld de Isadora Duncan collectie en een verzameling foto's van Nijinsky opgenomen. Het onderdeel tentoonstellingen geeft beschrijvingen van de lopende tentoonstellingen in de NYPL of een van haar branche-bibliotheken, terwijl er ook twee online tentoonstellingen zijn te bezichtigen. De Global Library Exhibit probeert de gevolgen van het Internet voor de opslag en communicatie van kennis in kaart te brengen. Belangrijk onderdeel van deze exhibit is een Tour of the World Wide Web.

Grote Europese bibliotheken op het Internet

In Engeland lijkt The British Library een bezoek waard. Helaas is op de WWW server enkel informatie over de collecties en tentoonstellingen in de bibliotheek te vinden. De catalogi zijn niet vrij toegankelijk. Interessant zijn de pagina's over de nieuwbouw van de British Library bij het St Pancras station, zij het dat de informatie verouderd is.

Wellicht de grootste bibliotheek in Europa is de Bibliothèque Nationale de France. Op de homepage uiteraard een - ietwat klein uitgevallen - foto van de imposante vier torens van de nieuwbouw en, gelukkig, een taal-switch waarmee naar een Engelse versie kan worden omgeschakeld. De catalogus, BN - OPALE, die nog steeds retrospectief wordt uitgebreid, is via telnet toegankelijk en bevat meer dan 2 miljoen records (log in als opale, kleine letters, gebruik ctrl-c om de sessie af te sluiten). Opvallend is de uitgebreide aandacht voor de historie van deze bibliotheek die in de vijftiende eeuw gesticht werd door Lodewijk XI. Dat de bibliotheek kon uitgroeien tot zijn huidige omvang heeft mede te maken met het wettelijk depot dat reeds in de zestiende eeuw werd geregeld en slechts tijdens de Franse revolutie kort onderbroken werd. Het historisch overzicht wordt afgesloten met een overzicht van het nieuwbouw project, ook bekend onder het motto Très Grande Bibliothèque.

Ook de Nederlandse Koninklijke Bibliotheek is op het WWW vertegenwoordigd met haar informatiedienst Alexicon. Via telnet is toegang tot de catalogus mogelijk (log in als opc). Via deze catalogus is er ook toegang tot het Online Contents bestand van de KB, dit bestand bevat beschrijvingen van artikelen uit een beperkt aantal tijdschriften waarop de KB is geabonneerd. Het gaat daarbij om de vakgebieden geschiedenis, beeldende kunst, theologie, bibliotheekwetenschap, psychologie en moderne talen. Vermeldenswaard is de online tentoonstelling Honderd hoogtepunten uit de Koninklijke Bibliotheek, een historisch overzicht van items uit de papierhistorische collectie van de KB. Zonder meer dapper is de poging van de KB Internet-bronnen te ontsluiten met het zogenaamde Nederlandse Basisclassificatie Web (NBW). Dit NBW rangschikt Internet resources naar onderwerp, waarbij de rangschikking is gebaseerd op de Nederlandse Basisclassificatie. Naast browsen door de onderwerpscategoriëen is het ook mogelijk zoektermen in te tikken.

Catalogi met WWW interfaces

Feitelijk is het HTTP protocol dat gebruikt wordt op het Web niet geschikt voor het onderhouden van sessies tussen een information retrieval (IR) client en een database server. Dit heeft te maken met het gegeven dat in een IR sessie vaak doorgebouwd wordt op resultaten van eerdere acties. Na het intikken van een zoekterm geeft de server bijvoorbeeld het aantal hits terug, waarna de gebruiker kan besluiten hits te presenteren, danwel een vervolgzoekactie uit te voeren op basis van het eerdere resultaat met het doel dit resultaat te vergroten of juist te verkleinen. HTTP is voor dit werk minder geschikt aangezien het een zogenaamd stateless protocol is, het onthoudt niet wat er eerder is gebeurd en kent feitelijk het begrip sessie niet, dat meer thuishoort bij een connection oriented IR protocol als Z39.50 of het vergelijkbare ISO Search and Retrieve (ISO 10162 / 10163). Een HTTP server werkt een verzoek per keer af, doorgaans het versturen van data, en gaat weer luisteren of er een volgend verzoek komt. Waarom zijn dan WWW interfaces voor catalogi zo populair ? Een belangrijke reden is dat WWW zo populair is, een tweede belangrijke reden is dat via WWW een eenvoudige integratie met full text te bereiken is. Een derde reden is de complexiteit van Z39.50. Overigens is een huwelijk tussen beide protocollen niet uitgesloten. De Amerikaanse bibliotheekorganisatie OCLC heeft bijvoorbeeld de WebZ software ontwikkeld waarbij de voordelen van beide protocollen worden gecombineerd. State wordt hier gehandhaafd door bij de eerste transactie een session id toe te kennen, terwijl de geschiedenis van de transacties bijgehouden wordt aan de kant van de server. Feitelijk wordt er een gateway gebouwd tussen een HTTP en een Z39.50 server. De gebruiker behoudt zijn eenvoudige en vertrouwde WWW omgeving terwijl tegelijkertijd de geavanceerde mogelijkheden van Z39.50, zoals het gelijktijdig afzoeken van meerdere lokale en remote databases, behouden blijven. Een demonstratie van de WebZ software is vrij toegankelijk.

Een voorbeeld van een traditionele catalogus met een WWW interface is die van het Antwerps bibliotheeknetwerk. Deze toont ook meteen de voordelen van een dergelijke benadering door de hypertext mogelijkheden te benutten. Zo kan een gebruiker vanuit een gevonden catalogus record met een muisklik een nieuwe zoekactie starten naar een term uit het catalogusrecord en zo bijvoorbeeld alle aanwezige werken van een bepaalde auteur oproepen. Ook is het veel makkelijker om online contextgebonden hulp te bieden. Een ander voordeel, zeker vergeleken bij de telnet-sessies van vroeger, is het eenvoudige downloaden en printen van gevonden informatie. Bijzonder fraai in de Antwerpse catalogi is het onderwerpsnavigatie hulpmiddel. De gebruiker kan door een lijst van onderwerpscodes klikken totdat de juiste code gevonden is en vervolgens een zoekactie starten met deze code. Nadeel is dat het systeem veel tussenstappen maakt voordat het uiteindelijke resultaat getoond wordt.

Een voorbeeld van een WWW-catalogus met iets meer mogelijkheden is die van Yale University Library. Naast hypertext links naar gerelateerde catalogusrecords, kent deze catalogus ook links naar full text en image databases en naar Internet resources. Overigens zijn full text bestanden alleen toegankelijk voor interne gebruikers die zich met een password dienen te identificeren.

In Nederland was de bibliotheek van de Rijksuniversiteit Utrecht een van de eerste met een WWW catalogus. De service werkt niet helemaal vlekkeloos, maar is een goede illustratie van de mogelijkheden. Inmiddels zijn meerdere Nederlandse bibliotheken met hun catalogus op het Web vertegenwoordigd, waaronder de UB Delft, de bibliotheek van de KNAW en de openbare bibliotheek Den Haag.

Internet projecten

Terwijl WWW-catalogi de mogelijkheid bieden om full text geïntegreerd aan te bieden, wordt van deze mogelijkheid in de praktijk nog vrij weinig gebruik gemaakt. Dat is temeer jammer, aangezien het Internet al heel wat mogelijkheden op het gebied van full text kent, zoals electronic journals en electronic preprints. Toch huiveren de meeste bibliotheken om deze informatie in hun catalogi op te nemen. Redenen daarvoor zijn onbekendheid en onzekerheid. Bibliotheekcatalogi zijn ingericht voor de beschrijving van stabiele bibliografische entiteiten. Een catalogusrecord beschrijft op een eenduidige wijze de laatste roman van W.F. Hermans, noemt druk en aantal pagina's en geeft zelfs de afmetingen van het werk in centimeters. Wie het boek ernaast neemt komt eenduidig tot de conclusie dat dit precies het werk is dat in het betreffende catalogusrecord wordt beschreven. Internet documenten zijn daarentegen veel instabieler. Er bestaan weliswaar elektronische tegenhangers van gedrukte documenten zoals de reeds genoemde artikelen en research memoranda. Andere typen documenten hebben daarentegen de neiging te veranderen in de loop van de tijd, soms van plaats, maar soms ook van inhoud. Volgens de regels zou dan een nieuwe beschrijving gemaakt moeten worden. Soms bestaan er meerdere versies van documenten, eveneens een nachtmerrie voor catalogiseerders. In enkele gevallen kan zelfs de vraag worden gesteld waar de grenzen van een document liggen, met name is dat het geval bij documenten die gebruik maken van hypertext en multimedia-mogelijkheden.

Waarschijnlijk om deze redenen kiezen bibliotheken ervoor Internet-bronnen op een aparte wijze te beschrijven en aan te bieden. Daarbij zijn grofweg twee benaderingen te onderscheiden. De eerste oplossing is om een hypertext structuur aan te leggen rondom een bestaand classificatiemiddel, de tweede manier sluit aan bij het meer traditionele werk, er wordt een aparte catalogus aangelegd. In Nederland is een voorbeeld van de eerste benadering het al eerder genoemde Nederlandse Basisclassificatie Web, terwijl de tweede benadering geïllustreerd wordt in een project dat bij PICA op stapel staat, de Centrale Catalogus Internet Resources. Van enige afstemming tussen beide projecten lijkt nauwelijks sprake te zijn. De tweede benadering, via een catalogus, lijkt overigens de voorkeur te verdienen, aangezien deze de mogelijkheid open laat searches over traditionele catalogi en catalogi van internet resources te combineren door gebruik te maken van de mogelijkheden van Z39.50. Langs een omweg wordt dan toch een integratie bereikt, waardoor de gebruiker niet veroordeeld is tot het uitvoeren van eenzelfde search in meerdere databases.

In het buitenland zijn vergelijkbare ondernemingen te vinden die pogen orde te scheppen in de chaos op het Internet. In Engeland is dat bijvoorbeeld de BUBL Subject Tree. Deze boom is geordend op onderwerp, gebruik makend van de Universele Decimale Classificatie. Voor wie daar niet in thuis is, bestaat er ook een alfabetische ingang op de diverse onderwerpen. Eem voorbeeld in de Verenigde Staten van het bouwen van een catalogus is het Internet Cataloging Project van het al eerder genoemde OCLC.

imagemap IPL

Een veel speelsere benadering van het probleem het Internet toegankelijker te maken is IPL The Internet Public Library. Begonnen als een project van de bibliotheekacademie van de University of Michigan, heeft deze organisatie inmiddels een jaarlijks budget van $ 450.000 verkregen uit subsidies en giften van een "Friends of the Library" vereniging. Deze openbare bibliotheek van het Internet trekt de metafoor van een echte bibliotheek sterk door zoals blijkt uit de imagemap.

Vanaf de imagemap zijn de diverse collecties toegankelijk, kan met andere gebruikers gecommuniceerd worden in een interactieve MOO ( Multi-User Object Oriented environment), en zijn er diverse "leeszalen" waar gebrowsed kan worden door virtuele boeken- en tijdschriftenrekken. Ook zijn er, evenals bij de grote broers in Washington en New York een aantal online tentoonstellingen te bewonderen.

Tot slot

Bibliotheken hebben informatie- en communicatietechnologie ontdekt en omarmd, zoveel is duidelijk. De technologie maakt het bereiken van het ideaal van bibliotheken, een zo breed mogelijk informatie-aanbod voor een zo breed mogelijk publiek en zo toegankelijk mogelijk, in principe eenvoudiger te bereiken. Tegelijkertijd worstelen bibliotheken met enkele belangrijke problemen die deze nieuwe wereld met zich meebrengt. Een probleem is de integriteit van informatie, een ander vraagstuk betrfeft het conserveren van informatie in elektronische vorm. Een heel acuut probleem wordt gevormd door het ontbreken van een duidelijk economisch model voor het beschikbaar stellen van elektronische informatie, met name full text, welke geleverd wordt door uitgevers. Niettemin is de trend duidelijk en onomkeerbaar in de richting van eenvoudiger en directer toegang tot primaire informatiebronnen en spelen bibliotheken een belangrijke rol bij het scheppen van orde in de anarchie die de wereld van het Internet nu eenmaal is.

Hans Roes
Bibliotheek Katholieke Universiteit Brabant


HTML versie van een artikel verschenen in EMNET / Nieuwsbrief Elektronische Media 27 juli 1996.