The KIM Technology Watch Report: http://metadaten-twr.org

RDA: Deutsche Nationalbibliothek im Steuerungsgremium JSC

November 25th, 2011 by tobiassteinke

Als erste Institution aus dem nicht anglo-amerikanischen Raum ist die Deutsche Nationalbibliothek als neues Mitglied ins Joint Steering Committee for Development of RDA (JSC) eingeladen worden. Die Interessen der deutschsprachigen bibliothekarischen Fachcommunity fließen damit direkt in die Entwicklung des Standards Resource Description and Access (RDA) ein.

Weitere Informationen:
http://www.dnb.de/standardisierung/afs/afs_aacr_rda.htm
http://www.rda-jsc.org/rda.html

Read 2 comments or post your comment  |  Show this entry only


New thesaurus standard ISO 25964 Part 1 published

October 24th, 2011 by traugottkoch

After three and a half years of intensive work and a long formal process, ISO TC46/SC9 WG8 has finalized work on Part 1 of the new thesaurus standard. It has been published by ISO on August 18, 2011.

ISO 25964-1 “Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval”, is a standard for development of thesauri and exchange of thesaurus data, covering both mono- and multilingual thesauri.

It has been developed (cf. [1]) as an extensive revision and extension of ISO 2788 and ISO 5964 (1985/6), based on BS 8723 (2005-2008), to include the following main sections:
1 Scope
2 Terms and definitions
3 Symbols, abbreviated terms and other conventions
4 Thesaurus overview and objectives
5 Concepts and their scope in a thesaurus
6 Thesaurus terms
7 Complex concepts
8 The equivalence relationship, in a monolingual context
9 Equivalence across languages
10 Relationships between concepts
11 Facet analysis
12 Presentation and layout
13 Managing thesaurus construction and maintenance
14 Guidelines for thesaurus management software
15 Data model
16 Integration of thesauri with applications
17 Exchange formats
18 Protocols
Annex A (informative) Examples of displays found in published thesauri
Annex B (informative) XML Schema for data exchange
Bibliography
Index

Part 1 can be bought and downloaded from ISO [2] or ordered from national standards bodies such as BSI, DIN, ANSI, AFNOR. It is available in PDF or print, in English language only. Standards distributors may sell it as well and certain reference libraries include it in their holdings.

Freely available is, however, the XML schema, that has been developed for exchange of thesaurus data (an Annex to the standard), cf. [3]. It is underpinned by a UML data model that provides for all the features a thesaurus may include, e.g. terms, relations among terms, concepts, relations among concepts, arrays, concept groups etc. Some constraints have been incorporated in the schema to ensure the quality of the represented thesauri.
The schema can be accessed without charge or password control at the NISO site [4] containing the schema and an introduction to it, an XML test example, HTML documentation files and an errata page for the standard.

A presentation at the recent NKOS 2011 workshop at TPDL in Berlin [5] did focus on the XML schema and made a comparison with the SKOS schema, pointing to necessary SKOS extensions.

Part 2 of the new standard, “Interoperability with other vocabularies”, covers mapping between thesauri and other types of vocabulary, such as classification schemes, file plans for records management, taxonomies, subject heading schemes, ontologies, terminologies, name authority lists, and synonym rings.

As ISO DIS 25964-2 (Draft International Standard) it has been submitted mid October for circulation among the member bodies of TC46/SC9 (Information and documentation/ Identification and description) and for comments.
Publication of Part 2 can be expected in 2012.
National standards bodies make the text available, applying different policies, however. BSI will, most probably, make it available to everybody during a commenting period, free of charge and passwords (cf. [6]).

[1] http://metadaten-twr.org/2009/05/27/new-iso-thesaurus-standard-under-development/
[2] http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=53657
[3] http://metadaten-twr.org/2010/02/12/thesaurus-data-model-and-schema-in-isodis-25964-1-available-for-public-comment/
[4] http://www.niso.org/schemas/iso25964/
[5] http://www.comp.glam.ac.uk/pages/research/hypermedia/nkos/nkos2011/presentations/DextreClarke_DeSmedt_ISO25964.pdf
[6] http://metadaten-twr.org/2009/11/06/commenting-and-balloting-on-the-new-draft-international-thesaurus-standard-opened/

Post a comment  |  Show this entry only


Nutzung von Autorenwerkzeugen zur Erfassung interoperabler Metadaten. KIM Bericht

July 27th, 2011 by traugottkoch

Autor: Alexander Haffner, Deutsche Nationalbibliothek, A.Haffner@dnb.de

Die Möglichkeiten der Generierung von Metadaten in Werkzeugen zur digitalen Dokumentenerstellung und -verarbeitung werden in einem Bericht (http://www.kim-forum.org/material/zertifizierung/dokumentenverarbeitungprozesse.htm) des DFG geförderten Projekts KIM Kompetenzzentrum Interoperable Metadaten (http://www.kim-forum.org/) untersucht. Eine Anreicherung von Dokumenteigenschaften während der Dokumentenerstellung mit einem Autorenwerkzeug kann die Auffindbarkeit digitaler Dokumente im Web und die Nachnutzung von Metadaten verbessern.

Hierzu werden Metadaten verwandt, mit deren Hilfe maschinell auf den Dokumenteninhalt, den Autor sowie Themengebiete rückgeschlossen werden kann. Der Einsatz weit verbreiteter und interoperabler Metadatenstandards für diesen Zweck ermöglicht die Interpretation der Dokumenteigenschaften durch eine Vielzahl von heterogenen Systembetreibern. Es liegt nahe, diese Metadaten bereits durch den Autor in den Dokumentenver- und -erarbeitungsprozess einfließen zu lassen, da er der entscheidende Wissensträger für die entstehende Publikation ist. Aus diesem Grund wurden drei weitverbreitete Dokumentenformate und die zugehörigen, marktführenden Autorenwerkzeuge (Microsoft Office, OpenOffice.org, Adobe Acrobat) hinsichtlich ihrer Funktionalität und ihrer Gebrauchstauglichkeit zur Integration interoperabler Metadaten in Dokumenten untersucht.

Für die Auffindbarkeit und Nutzbarkeit einer Publikation im Web ist die Qualität der Metadaten von großer Bedeutung. Der Bericht definiert Qualitätskriterien für die Integration interoperabler Metadaten in Dokumenten und ermittelt Funktionen von Autorenwerkzeugen, die für die Generierung dieser Metadaten durch einen Produzenten relevant und somit für die Auswahl des zu verwendenden Autorenwerkzeuges ausschlaggebend sind.

Die Qualitätskriterien werden ausführlich beschrieben und eine Checkliste zur Evaluation von Dokumentenformaten und Autorenwerkzeugen in Hinsicht auf ihre Eignung für die Erfassung und den Transfer von Metadaten während des Dokumentenerstellungssprozesses bereitgestellt. Diese Checkliste, in Verbindung mit dem vorliegenden Bericht, kann Auswahl und Bewertung von Autorenwerkzeugen unterstützen.

Post a comment  |  Show this entry only


PDF/A-2 als ISO-Norm 19005-2 veröffentlicht

July 6th, 2011 by tobiassteinke

PDF/A-2 wurde als ISO-Norm 19005-2 “Document management – Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2)” veröffentlicht. Bei PDF/A-konformen Dateien handelt es sich um PDF-Dateien, die Kriterien zur besseren Eignung für Langzeitarchivierung erfüllen. PDF/A-2 basiert dabei anders als PDF/A-1 auf PDF 1.7, was selbst als ISO 32000-1 eine Norm ist. Ein weiterer Unterschied ist die Möglichkeit in PDF/A-2, andere PDF/A-Dateien einzubetten. Wie bei ISO-Normen üblich, ersetzt 19005-2 nicht die Norm 19005-1. PDF/A-1 und PDF/A-2 werden zukünftig parallel existieren und bereits von verschiedenen Tools gleichermaßen unterstützt.

Kurz vor der Veröffentlichung steht auch PDF/A-3, das sich von PDF/A-2 nur in einem einzigen Punkt unterscheiden wird: Es können beliebige andere Dateien eingebettet werden. Da dies für verschiedene Anwendungen benötigt wird, aber eine Langzeitarchivierung für die eingebetteten Dateien nicht sicher gestellt werden kann, hat man sich zu dieser seperaten Veröffentlichung entschieden. Planungen für ein PDF/A-4 gibt es derzeit nicht.

Read 2 comments or post your comment  |  Show this entry only


Einführung von RDA in den USA endgültig beschlossen

June 21st, 2011 by tobiassteinke

Autorin: Christine Frodl, Deutsche Nationalbibliothek, c.frodl@dnb.de

Am 13. Juni 2011 haben die Direktoren der Library of Congress und der beiden US-amerikanischen nationalen Fachbibliotheken, National Library of Medicine und National Agricultural Library, ihre Entscheidung hinsichtlich einer Einführung der RDA bekannt gegeben. Grundlage für die Entscheidung ist der Bericht des U. S. RDA Test Coordinating Committee. Der ausführliche Testbericht wir im Laufe des Juni 2011 veröffentlicht werden, folgende Dokumente sind der Fachöffentlichkeit bereits jetzt zugänglich:

Die Verlautbarung der Direktoren („Cover Statement“): http://www.nlm.nih.gov/tsd/cataloging/RDA_Executives_statement.pdf

Eine Zusammenfassung der Testergebnisse („Executive Summary“): http://www.nlm.nih.gov/tsd/cataloging/RDA_report_executive_summary.pdf

Demnach beabsichtigen die Library of Congress, die National Library of Medicine und die National Agricultural Library, die RDA einzuführen, jedoch nicht vor dem 1. Januar 2013. Zuvor sollen noch bestimmte Anpassungen vorgenommen werden.

Dazu gehören u. a.:

  • Formulierung des Regelwerkstextes in verständlichem und einfachem Englisch
  • Verbesserung der Funktionalität des RDA-Toolkits
  • Fortschritte im Hinblick auf eine Ablösung des Datenformates MARC
  • Untersuchung prototypischer Verfahren und Systeme unter Nutzung des RDA Element Sets, inklusive der RDA Relationships

 Zur Erreichung dieser Ziele hat das U. S. RDA Test Coordinating Committee einen Plan vorgelegt, der die einzelnen Arbeitschritte in einer nicht sequentiellen Reihenfolge aufführt[1]. Für den deutschsprachigen Raum wird der Standardisierungsausschuss am 5. Oktober 2011 über das weitere Vorgehen beraten.

RDA – Resource Description and Access ist ein neuer Erschließungsstandard. Mit ihm sollen analoge und digitale Ressourcen aus Institutionen des Kulturerbes[2] beschrieben und zugänglich gemacht werden. RDA ist die Weiterentwicklung der AACR2, der 2. Ausgabe der Anglo-American Cataloguing Rules. Während sich die AACR als Standard auf den anglo-amerikanischen Sprachraum beziehen, soll RDA als internationaler Standard Anwendung finden. Das Potenzial der RDA sieht man auch in der Chance, Metadaten aus Bibliotheken, Museen und Archiven dem Semantic Web zugänglich zu machen.

Grundlagen der RDA sind die IFLA-Standards Functional Requirements for Bibliographic Records (FRBR)[3], Functional Requirements for Authority Data (FRAD)[4], Functional Requirements for Subject Authority Data (FRSAD) sowie das Statement of International Cataloguing Principles (ICP)[5] der IFLA.[6]

RDA wird vom Joint Steering Committee for Development of RDA (JSC), erarbeitet und laufend gepflegt. Das JSC besteht derzeit aus Vertretern folgender Institutionen: American Library Association (ALA), Australian Committee on Cataloguing (ACOC), British Library (BL), Canadian Committee on Cataloguing (CCC), Chartered Institute of Library and Information Professionals (CILIP), und der Library of Congress (LC). Strategische Entscheidungen trifft das Committee of Principals (CoP), das sich aus den Direktoren der oben genannten bibliothekarischen Verbände und Nationalbibliotheken zusammensetzt.

Die Deutsche Nationalbibliothek mit ihrer Arbeitsstelle für Standardisierung, die zugleich Geschäftsstelle des Standardisierungsausschusses[7] ist, leistet die hauptamtliche Facharbeit im Bereich der bibliothekarischen Standardisierung im deutschsprachigen Raum. Der  Standardisierungsausschuss hat Ende 2004 die Internationalisierung der deutschen Standards beschlossen. Dazu gehört neben dem Umstieg auf MARC 21 als einheitliches Austauschformat unter anderem auch die Entscheidung für eine aktive Beteiligung am Geneseprozess des neuen Regelwerks „Resource Description and Access (RDA)“ als international anwendbares Regelwerk mit dem Ziel einer Einführung als Katalogisierungsstandard im deutschsprachigen Raum. Im Rahmen dieser Aktivitäten arbeitet die Arbeitsstelle für Standardisierung auch an der offiziellen deutschen Übersetzung des Standards RDA inklusive seiner Elemente-Sets (Vokabulare). Der Standard RDA ist über eine web-basierte Anwendung, das „RDA Toolkit“[8] zugänglich.

Weitere Informationen zu den RDA und zur laufenden Diskussion sind auf der Website des JSC[9], der Website der Arbeitsstelle für Standardisierung[10] und über ein Abonnement der RDA-Mailingliste[11] erhältlich.

 


[1] vgl. S. 3 und 4 der „Executive Summary“

[2] Bibliotheken, Archive, Museen

[3] http://www.ifla.org/publications/translations-of-frbr#de und
http://www.d-nb.de/standardisierung/pdf/frbr_deutsch_09.pdf

[4] http://www.ifla.org/publications/ifla-series-on-bibliographic-control-41

[5] http://www.ifla.org/files/cataloguing/icp/icp_2009-de.pdf und
http://www.d-nb.de/standardisierung/pdf/icp-2009_german.pdf

[6] http://www.ifla.org

[7] Der Standardisierungsausschuss ist ein kooperativer Zusammenschluss großer wissenschaftlicher Bibliotheken der Bundesrepublik Deutschland, der regionalen Verbundsysteme für das Bibliothekswesen der Bundesrepublik Deutschland, je eines Vertreters des Österreichischen und des Schweizerischen Bibliothekswesens, der Öffentlichen Bibliotheken der Bundesrepublik Deutschland, der ekz Bibliotheksservice GmbH sowie der Deutschen Forschungsgemeinschaft und zwei Vertretern der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland.

[8] http://www.rdatoolkit.org/

[9] http://www.rda-jsc.org/

[10] http://www.d-nb.de/standardisierung/index.htm

[11] http://www.rda-jsc.org/rdadiscuss.html

Post a comment  |  Show this entry only