Den semantiske katalogen

Fra Biblab

Gå til: navigasjon, søk

Ville det la seg gjøre å bytte ut den MARC-baserte kjernen i dagens biblioteksystemer med en kjerne som er basert på teknologier fra den semantiske webben? Herunder RDF som dataformat, en Triplestore for lagring av dataene og SPARQL for spørringer? Hvilke fordeler og ulemper ville det medføre? Denne siden kan brukes til drodling rundt ideen.

Innhold

Fordeler og ulemper

Fordeler

  • Bibliotekene ville kunne benytte programvare og teknologier som brukes på mange andre områder og som ikke er bibliotekspesifikke.
  • Andre ville kunne hente ut data fra katalogene våre uten å måtte lære seg bibliotekspesifikke formater (MARC) og protokoller (Z39.50).
  • Mindre duplisering av data
  • Mindre duplisering av arbeid
  • Dataene er åpne
  • Data som fødselsår for personer kan ha én autoritativ kilde, slik at det enkelte biblioteket slipper å bruke tid og krefter på å registrere dem.

Ulemper

  • Mye gamle (MARC-)data ville måtte konverteres til nye formater.

Datatyper

Hva slags data trenger vi om dokumentene som er representert i en bibliotekkatalog?

  • Administrative data (strekkode, tapt-status, erstatningskostnad)
  • Rene fakta (sidetall, størrelse, spilletid)
  • Relasjonsdata (forfattet av, del av serie, manifestasjon av verk)
  • Emnedata (personer og korporasjoner som emner, abstrakte emner, klassifikasjonsnummer)

Identifikatorer, ontologier, datakilder

Dokumenttype/"ting" Identifikatorer Ontologier Semantiske datakilder Andre datakilder
Generelt Bibliofil-ID, BIBSYS objektid BIBO, FRBR vocabulary DBpedia, Freebase
Adm. data - DAIA Ontology - -
Elektroniske dok. DOI
Bøker ISBN, Open Library ID Open Library Bokkilden
Periodika ISSN
Musikk MusicBrainz ID MusicBrainz
Personer Open Library ID FOAF VIAF

Lesestoff

Lenker

Personlige verktøy