The KIM Technology Watch Report: http://metadaten-twr.org

New ISO thesaurus standard under development

May 27th, 2009 by traugottkoch

The heavily used ISO thesaurus standards are now about 35 years old and their last revisions took place more than twenty years ago. Since roughly a year ago, an international working group (WG 8 Structured Vocabularies) under the ISO TC46/SC9 committee “Identification and Description”, is developing a common new standard under the title “ISO 25964 Thesauri and interoperability with other vocabularies”.

Aim
The basic principles of how to build, maintain and use a thesaurus and, especially, the function of such a controlled vocabulary, might not have changed significantly. The technology, scale of application and especially the new context of the digital world and the Internet are radically different, however.
Modern tools are needed to access networked information resources by topic and to prepare for Semantic Web. Rather traditional Knowledge Organization tools have shown to carry considerable benefits in this new environment.

Predecessors
Prior updates to the original ISO standards (ISO 2788 monolingual thesauri and ISO 5964 multilingual thesauri) have been taking place in US and UK national standards. NISO has updated the US national standard for monolingual thesauri ANSI/NISO Z39.19 more frequently, especially with the latest version 2005 (available at [1]). Seven years of work in the UK resulted in BS 8723, published in five parts between 2005 and 2008 (print for a fee, copyright). The latter effort is the main basis for the work with the new ISO standard, again under the leadership of Stella Dextre Clarke as convenor.

New content, structure and scope
All of the existing scope of the two earlier ISO standards will be retained and revised, and the following additional subjects will be added, what to a large degree already has happened in the new British Standard:

  • Function (and display) of thesauri in electronic environments
  • Functional specification for software to manage thesauri
  • Data model for a thesaurus
  • Formats and protocols for exchange of thesaurus data
  • Guidelines for certain additional types of vocabulary (e.g. classification schemes, taxonomies)
  • Interoperability and mapping between vocabularies

Since thesauri still are dealt with in greatest detail and completeness, the ISO standard will be published in two separate parts:

1) Thesauri for information retrieval, covering mono- and multilingual thesauri; data model and exchange formats; everything which relates solely to thesauri

2) Interoperability with other vocabularies, covering guidelines and issues of interoperability between thesauri and single other types of structured vocabularies; advice on mapping

Timetable, Contributions
A Committee Draft (CD), in the language of ISO, of Part 1 has been delivered to SC9 on 30 November 2008. During February/March 2009, the standard bodies of the SC9 member countries voted on the Committee Draft which received 100% approval to advance to the Draft International Standard (DIS) stage. The extensive comments received will be used to consider and improve the text for the submission of a DIS version, expected in July 2009, which again will be voted on. Part 1, ISO 25964-1, is expected to be finally published and ready for use in Fall 2009. The work on Part 2 has been started during May 2009.

As widely known, drafts and texts worked on during an ISO standardisation process are not publicly available, they are confidential and under copyright constraints.

To exercise your influence, please contact experts in the responsible national committees (Canada, Denmark, France, Germany, Finland, New Zealand, South Africa, Spain, Sweden, United Kingdom, Ukraine and United States are represented in the ISO working group at this time) via the national standards bodies.
At least the DIS will be open to everybody for general comments and feedback.
Your comments and questions on this and following blog entries at this TechWatch Report site are very welcome and will be read and considered by the responsible ISO working group.

Reference
For a few further details and references, i.e. the five parts of the British standard, consult:
Dextre Clarke, Stella G. (2008). ISO 2788 + ISO 5964 + Much Energy = ISO 25964. In: ASIS&T Bulletin October/November 2008 [2]

[1] http://www.niso.org/standards/
[2] http://www.asis.org/Bulletin/Oct-08/OctNov08_DextreClarke.html

Read 1 comment or post a comment  |  Show this entry only


Die Standardisierung von Open XML

November 25th, 2008 by tobiassteinke

Autor: Tobias Steinke, Deutsche Nationalbibliothek, t.steinke@d-nb.de

Am 2. April 2008 wurde Open XML als ISO-Norm 29500 verabschiedet. Sie wurde am 19. November 2008 in vier Teilen veröffentlicht und gehört zu den wenigen kostenlos verfügbaren ISO-Normen, welche hier heruntergeladen werden können. Zuvor hatte es im Zuge des Standardisierungsverfahren erhebliche Kontroversen gegeben.

Die Office-Formate der Programme von Microsoft sind zwar schon lange ein Defakto-Standard, aber bisher legte die Firma die zugehörigen Spezifikationen nie völlig offen. Ihr für die aktuelle Programmversion neu entwickeltes Office-Format auf Basis von XML wurde nun aber zuerst ein ECMA-Standard und als solcher auch beim ISO zur Normierung eingereicht. Kritiker waren gegen die Normierung, da es bereits ein anderes von der ISO normiertes Office-Format auf XML-Basis gibt, OpenDocument (ISO 26300). OpenDocument wird besonders von Open-Source-Befürwortern gefördert und von vielen Programmen unterstützt, insbesondere vom freien Programmpaket OpenOffice.org. Microsoft argumentierte für ihr eigenes Format damit, dass sich mit OpenDocument nicht alles abbilden ließe, was mit den bisherigen MS-Office-Produkten möglich war. Die Kritiker unterstellten Microsoft hingegen, mit einem eigenen Norm-Format nur die eigene Vormachtstellung im Office-Markt zementieren zu wollen. Denn die 6000 Seiten umfassende Spezifikation von Open XML sei so ausgelegt, dass Mitbewerber sie kaum implementieren könnten. Aus Sicht der Langzeitarchivierung von Office-Dokumenten kann die Normierung jedoch begrüßt werden. Denn eine ISO-Norm garantiert, dass die Spezifikationen “für alle Zeiten” verfügbar bleiben, was für die Langzeitarchivierung essentiell ist. Ein nicht-offener Defakto-Standard, wie sie die Microsoft-Office-Formate bisher waren, schafft dagegen erhebliche Probleme bei der Durchführung der notwendigen Langzeitverfügbarkeitsstrategien Migration und Emulation.

Post a comment  |  Show this entry only


Aktueller Stand der PDF/A-Standardisierung

November 25th, 2008 by tobiassteinke

Autor: Tobias Steinke, Deutsche Nationalbibliothek, t.steinke@d-nb.de

PDF/A ist eine Untermenge des Dateiformats PDF von Adobe, welche durch bestimmte Einschränkungen archivierungsgeeigneter sein will. ISO 19005-1 (PDF/A-1) wurde 2005 verabschiedet und beschreibt ein solches Regularium für PDF 1.4. Inzwischen ist jedoch schon PDF 1.7 aktuell und wurde zudem als ISO-Standard 32000-1 verabschiedet.Das in Arbeit befindliche PDF/A-2 wird auf dieser Norm beruhen, aber ansonsten den Anspruch von PDF/A-1 beibehalten.

Weitere mögliche Änderungen betreffen das Zulassen von Transparenz und dem eingebetteten Bildformat JPEG2000, die Unterstützung von 3D-Objekten, sowie dem Integrieren von anderen PDF/A-konformen Dateien (PDF Packages). Zudem soll es in PDF/A-2 neben den beiden Konformitätsstufen A (vollständige Unterstützung aller PDF/A-Anforderungen) und B (enthält keine Strukturinformationen in Tagged PDF und hat keine vollständige Unicode-Unterstützung) nun auch eine neue mit der Bezeichnung U geben (kein Tagged PDF, aber Unicode-Unterstützung). Mit der Veröffentlichung von PDF/A-2 ist nicht vor Ende 2009 zu rechnen. Für PDF/A-1 gibt es inzwischen schon eine Vielzahl von Tools, welche diese für Archive und Bibliotheken in Hinblick auf die Langzeitarchivierung sehr sinnvolle Variante von PDF unterstützen. Der aktuelle Adobe Reader 9 kennzeichnet PDF/A-konforme Dateien bei der Darstellung deutlich und das kostenlose Office-Paket OpenOffice.org 3.0 hat eine eigene Option zur Erstellung von PDF/A-Dateien. Eine Auflistung weiterer Tools findet sich beim PDF/A Competence Center1.

References

  1. http://www.pdfa.org/doku.php?id=pdfa:produkte

Post a comment  |  Show this entry only


JHOVE

October 21st, 2008 by Bernhard Haslhofer

Autoren: Bernhard Haslhofer, Universität Wien, bernhard.haslhofer@univie.ac.at; Prof. Dr. Franz Wirl, Research Studios Austria, franz.wirl@researchstudio.at

Abstract
Im Kontext digitaler Langzeitarchivierung tritt immer wieder die Frage nach dem Dateiformat eines Medienobjekts auf. Abhängig vom Format müssen Strategien entwickelt werden, die es ermöglichen auch noch in ferner Zukunft auf archivierte Inhalte zuzugreifen. Dieser Bericht stellt JHove vor, ein JAVA-Tool zur Bestimmung, Validierung, und Charakterisierung von Dateiformaten.
Read the rest of this entry »

Post a comment  |  Show this entry only


MOF

September 22nd, 2008 by Bernhard Haslhofer

Autor: Bernhard Haslhofer, Universität Wien, bernhard.haslhofer@univie.ac.at

Abstract
Die Verwendung unterschiedlicher Datenmodelle und Schema-Definitionssprachen führt bei institutionellen Metadaten-Systemen zu Inkompatibilität mit anderen Systemen. Die Meta Object Facility (MOF), ein Standard der ursprünglich der Domäne des Model Driven Engineerings entstammt und deshalb hauptsächlich mit der Unified Modeling Language (UML) in Verbindung gebracht wird, bietet einen Weg, diese Inkompatibilitäten zu überbrücken. Dieser Beitrag bietet eine kurze Einführung in die MOF-Grundkonzepte und analysiert, wie und in welchem Ausmaß MOF Interoperabilität zwischen Systemen herstellen kann.

The Meta Object Facility (MOF)1 is a standardized metadata management framework to enable the interoperability of model and metadata driven systems. It originates from the domain of Model Driven Engineering and is widely known as the modeling language in which the Unified Modeling Language (UML)2 has been specified. However, in the course of time it has become an Object Management Group (OMG) standard that can be used to establish a certain degree of interoperability among any metadata systems such as metadata repositories or digital library applications. Read the rest of this entry »

Post a comment  |  Show this entry only