Standardy metadanych w serwisie e-ISBN

Przede wszystkim serwis wprowadza standard ONIX for ISBN rozbudowany o wybrane elementy specyfikacji ONIX for Books 3.0.

Ponadto do serwisu e-ISBN została wprowadzona kartoteka haseł wzorcowych VIAF powiązana z identyfikatorem ISNI. Kartoteka haseł wzorcowych VIAF jest największą światową bazą tego typu.

Wprowadzenie standardu ONIX oraz identyfikatora ISNI wynika z normy ISO 2108.

Serwis e-ISBN, poprzez jednoczesne wdrożenie specyfikacji ONIX oraz VIAF, daje polskim wydawcom szansę na sporządzanie pełnych, prawidłowych i zestandaryzowanych opisów publikacji, zgodnych z najnowszymi międzynarodowymi zaleceniami dotyczącymi wymiany metadanych.

Dlaczego wymiana metadanych nabrała dla serwisu e-ISBN tak dużego znaczenia?

Według ostrożnych szacunków ponad 80 proc. metadanych (opisów) dotyczących książek oraz innych produktów wydawniczych wytworzono w ciągu ostatnich dwóch lat.

Jesteśmy świadkami ogromnej fali informacji o różnych publikacjach. Niestety, nie wszystkie metadane (opisy) są prawdziwe, znaczna część opisów jest niepełna, część spośród nich jest zdezaktualizowana.

Trzy zjawiska – coraz większa i różnorodna produkcja wydawnicza, coraz bogatsza sieć współzależności pomiędzy różnymi formami produktowymi oraz coraz bardziej różnicujące się kanały dystrybucji – powodują, że nabywca (czytelnik) z jednej strony ma teoretyczną możliwość zakupu (dotarcia do) alternatywnych lub komplementarnych produktów (publikacji), z drugiej natomiast – brak informacji lub wadliwa informacja uniemożliwia faktyczne dotarcie do poszukiwanego produktu.

Brak metadanych o publikacji lub wadliwe opisy ograniczają możliwość działania sieci dystrybucji, sieci bibliotecznych czy wyszukiwarek internetowych.

Ponadto, wobec coraz większej liczby produktów cyfrowych, które nie posiadają formy fizycznej i często nie mogą być obiektywnie opisywane „z natury”, opis produktu (publikacji) sporządzony przez producenta (wydawcę) jest w sposób naturalny najbardziej rzetelny, pełny i aktualny.

Co to jest ONIX?

ONIX to skrót terminu ONline Information eXchange, co po polsku można określić jako: wymiana informacji on-line. Jest to specyfikacja opracowana przez konsorcjum EDItEUR, stanowiąca podstawę automatycznej komunikacji server-to-server.

Specyfikacja ONIX for Books to międzynarodowy standard opisu publikacji i produktów wydawniczych wszystkich typów, służący do automatycznej wymiany informacji o publikacjach.

Ze specyfikacji ONIX for Books korzysta ponad 7000 firm wydawniczych na świecie.

Kluczowe aspekty kodowania informacji w ONIX:

1. Przepływ: automatyczny, bez ingerencji człowieka, server to server – oparty na języku XML.

2. Porządek (szyk, układ danych, formatka podawanych informacji): pod względem formatki ONIX for Books jest prawdopodobnie najbardziej zaawansowanym zestandaryzowanym opisem książki, dostępnym publicznie za darmo.

Jakie informacje można przekazać korzystając z ONIX for Books?

Opis produktu został w ONIX for Books pogrupowany w sześciu blokach (Block1–Block6). Bloki zawierają punkty opisu, stosowana jest numeracja w zapisie ciągłym od P.3 do P.25 (punkty P.1 oraz P.2 są zarezerwowane dla opisu nadawcy i odbiorcy komunikatu). Opis produktu wygląda następująco:

Block 1: Product description (DANE O PRODUKCIE)
P.3 Product form
P.4 Product parts
P.5 Collection
P.6 Product title detail
P.7 Authorship
P.8 Conference
P.9 Edition
P.10 Language
P.12 Subject
P.13 Audience

Block 2: Marketing collateral detail (DANE MARKETINGOWE)
P.14 Descriptions and other supporting text
P.15 Cited content
P.16 Links to supporting resources
P.17 Prizes

Block 3: Content detail (ZAWARTOŚĆ PRODUKTU)
P.18 Content items

Block 4: Publishing detail (DANE O WYDAWCY)
P.19 Publisher
P.20 Global publishing status and dates / copyright
P.21 Territorial rights and other sales restrictions

Block 5: Related material (POWIĄZANIA Z INNYMI MATERIAŁAMI)
P.22 Related works
P.23 Related products

Block 6: Product supply (DOSTAWA PRODUKTU)
P.24 Market
P.25 Market publishing

Punkty P.3–P.25 są podzielone na podpunkty – nie widać tego na skrótowym schemacie przedstawionym powyżej.

Najniższym poziomem specyfikacji jest wartość danej cechy. Cechą produktu może być np. autor produktu, wymiary produktu, kraj pochodzenia produktu, rok wydania, rodzaj zawartości, publiczność docelowa czy forma produktu.

Przykładowo, ONIX przewiduje kilkaset wartości cechy, którą jest forma produktu. Innymi słowy ONIX for Books rozpoznaje i definiuje kilkaset różnych rodzajów formy produktu (od oprawy twardej w skórze z węża, po książeczki dla dzieci ze szmatek; od dokumentu doc. po dokument elektroniczny zabezpieczony DRM dostępny na 10 czytnikach jednocześnie, ale jedynie w sieci bibliotecznej w Wielkiej Brytanii bez możliwości kopiowania i drukowania).

Wartości opisujące cechy są pogrupowane na listach kodowych dostępnych na stronach EDItEUR: http://www.editeur.org/14/Code-Lists/

ONIX for ISBN

ONIX for ISBN jest specyfikacją opracowaną przez EDItEUR specjalnie pod kątem działalności systemu ISBN. Jest to skrócony opis książki lub produktu powiązanego.

Z formalnego punktu widzenia ONIX for ISBN jest podzbiorem ONIX for Books.

Pełna specyfikacja opisu produktu w ONIX for ISBN jest dostępna pod adresem http://www.editeur.org/118/ONIX-ISBN-Registration-format/

Spośród 23 punktów opisu stosowanych w ONIX for Books do specyfikacji ONIX for ISBN wybrano 11 punktów, przy czym w większości przypadków – w niepełnym zakresie.

Co oznacza skrót EDItEUR?

Éditeur to oczywiście wydawca w języku francuskim, ale w przypadku określenia EDItEUR chodzi o grę słów. EDItEUR to nazwa własna konsorcjum działającego w branży standaryzacyjnej sektora wydawniczego od 1991 roku, prowadzącego biuro Międzynarodowej Agencji ISBN w Londynie. Nazwa powstała w wyniku połączenia skrótów EDI (Electronic Data Interchange - elektroniczna wymiana danych) i EUR (Europe; w związku z faktem, że wsparcia dla działań konsorcjum udzieliła UE).

EDI polega na wymianie dokumentów (zamówienia, faktury, dokumenty przewozowe etc) w zestandaryzowanej formie elektronicznej bez konieczności ingerencji człowieka.

EDItEUR zrzesza obecnie podmioty i instytucje z ponad 20 krajów z całego świata. Biblioteka Narodowa jest członkiem EDItEUR od 2012 roku.

Co to jest VIAF?

Virtual International Authority File (VIAF) to największa światowa kartoteka haseł wzorcowych nadzorowana przez konsorcjum Ohio College Library Center (OCLC) i uruchomiona dzięki staraniom kilku bibliotek narodowych z niemiecką Deutsche Nationalbibliothek oraz amerykańską Library of Congres na czele.

Biblioteka Narodowa przystąpiła do konsorcjum VIAF w 2013 roku.

VIAF obejmuje hasła wzorcowe osób oraz instytucji. Dzięki zintegrowaniu bazy VIAF z bazą ISBN wydawca otrzymuje automatyczną podpowiedź co do prawidłowej pisowni nazwiska oraz imienia autora, a także dodatkowe podpowiedzi w przypadku osób o tym samym imieniu i nazwisku. Ponadto, dzięki powiązaniu bazy VIAF z bazą ISNI, każdy wydawca rejestrujący swoje książki i produkty powiązane w serwisie e-ISBN może korzystać z identyfikatorów ISNI.

Co to jest ISNI?

International Standard Name Identifier (ISNI) to międzynarodowy standard ISO wdrożony w Polsce w 2014 roku normą PN-ISO 27729:2014-04P Informacja i dokumentacja – Międzynarodowy znormalizowany identyfikator nazwy (ISNI).

Numer ISNI służy jednoznacznej identyfikacji tożsamości podmiotów (osób oraz instytucji) zaangażowanych w tworzenie, produkcję, zarządzanie i dystrybucję zawartości.

W kwietniu 2014 roku baza ISNI obejmowała blisko 7,5 miliona identyfikatorów, w tym 7 mln osób i 490 tys. organizacji. ISNI jest jednym z najszybciej rozwijających się standardów opisów, w założeniach ma to być tzw. identyfikator pomostowy, służący wymianie informacji (metadanych) w modelu Linked Data oraz Semantic Web (sieć semantyczna).

Norma ISO 2108 zaleca włączenie do opisu rekordu ISBN identyfikatora ISNI.