Datakilder undersøkt på workshop
Fra Biblab
PÅ Biblabs workshop 109. og 20. juni undersøkte én gruppe ulike datakilder som kan være aktuelle i en mash-up. Under har gruppen oppsummert undersøkelsen.
Vi var innom et antall ressurser som kunne være aktuelle for berikelse av søkeresultater i OPAC. Vi prøvde å finne frem til og evt. analysere web-service disse eksponerte.
Inspirert av Amazons operasjoner, er det muilg å diskutere to mulige mashup-tilnærminger:
Oppslag: henting av metadata / innhold tilhørende en kjent ressurs, basert på en entydig identifikator, for eksempel ISBN. Her "vet" man hva man får som resultat, og kan berike resultatet allerede på trefflistenivået.
Søk: søk basert på metadata som ikke peker ut en manifestasjon entydig. Her er resultatberikelsen mer komplisert å få til.
Rettighetsproblematikken er ofte relevant, og må avklares.
Noen ressurser vi har vært gjennom:
Wikipedia:
Kan ikke brukes med en entydig identifikator. Sammensatt søk.
Var vanskelig å finne en REST eller SOAP basert API. dbpedia
med søkespråket SPARQL
skulle taes opp av en annen gruppe.
En gammel indekseringsmaskin (ONTOK) har åpenbart forsøkt å tilby
en "3.parts" API, men ser ikke ut til å være i drift eller
utvikling.
Google Books:
Kan brukes med entydig identifikator? Hvordan søke? JSON basert. Gir muligheter for å tilrettelegge lenker av to typer: statiske lenker - vanlige lenker til innhold / metadata dynamiske lenker - f. eks. plasserer lenker dersom bare ressursen finnes (unngår døde lenker)
Emusic:
Skal i prinsippet kunne brukes til å plassere lenker til surrogat eller lydfil
Vi fant ingen Web-service / API
XISBN og ThingISBN:
Er en ressurs for Verk-basert FRBRisering av vanlige, ikke FRBR-baserte kataloger:-gruppering av manifestasjoner tilhørende sammen verk
Fant vi noen API? Ja (REST basert)
YouTube
Kan brukes på samme måte sim Emusic ovenfor, med videosnutter. Rikholdige APIer som føler standarder (opensearch). Resultat kan hentes som Atom feed, RSS-feed eller Json. Mange operasjoner og søkeattributter.
FLICKR
Kan brukes til å berike et OPAC-resultat med bilder. Det er naturligvis umulig med en
entydig identifikasjon av et bilde, men et rikholdig API gir muligheter til ganske fokuserte søk.
Kan aksesseres med både REST, SOAP og XML-RPC
returnerer både REST, XML-RPC, SOAP, JSON og PHP-snutter.
Citeulike
Ingen API