IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library 
Associations and InstitutionsAnnual 
ConferenceSearchContacts

64th IFLA Conference Logo

   64th IFLA General Conference
   August 16 - August 21, 1998

 


Code Number: 007-126-S
Division Number: IV.
Professional Group: Cataloguing
Joint Meeting with: -
Meeting Number: 126.
Simultaneous Interpretation:   No

Catalogación Versus Metadata: Vino Viejo en Odres Nuevos?

Stefan Gradmann
Pica, Leiden, Netherlands


Abstract

El método de los metadatos refleja la necesidad de reformular la relación entre los datos descriptivos y los elementos referenciados, sobre todo en el campo de los Document Like Objects (DLO, "documentos como objetos") electrónicos. En este área parece que hay algunos parámetros básicos que están experimentando transiciones importantes. El artículo identifica algunas de las diferencias fundamentales entre la actividad catalográfica tradicional y los metadatos en las áreas de producción de metadatos, su contexto de uso y la relación entre los metadatos y los objetos que estos metadatos y los registros catalográficos referencian respectivamente.

El trabajo defiende que el reconocimiento de estas diferencias es un requisito fundamental para la redefinición del papel del bibliotecario en el paradigma emergente y rápidamente cambiante de la información.


Paper

Introducción

Un trabajo de R. Heery publicado en 1996 ( y de esto hace mucho tiempo si se consideran los estándares Internet y su desarrollo) dice: "El conocido registro de catálogo de biblioteca se podría describir como metadatos, ya que este registro son 'datos sobre datos'."(HEERY 1996a). Si esta afirmación todavía es válida (y al menos semánticamente parece serlo), una reacción correcta, aunque algo ingenua, desde la perspectiva del bibliotecario podría ser considerar la catalogación simplemente como una actividad de creación de un tipo concreto de metadatos y dejaría de lado toda los aspectos no bibliotecarios de esta palabra de moda: básicamente, se trataría de continuar catalogando como si nada hubiera sucedido.

Uno de los objetivos concretos de este trabajo es dar indicaciones de lo inadecuado de esta reacción: el propósito básico es identificar algunos de los puntos de interés que el tema de los metadatos suscitará en las bibliotecas en el futuro próximo.

Así pues, este trabajo no es de ninguna manera una introducción a los metadatos que presuponga un conocimiento básico sobre el tema. Este conocimiento es fácil de obtener, y puntos de partida podrían ser la página WWW "Metadata Resources" de la IFLA (http://www.ifla.inist.fr/II/metadata.htm) o el sitio web de metadatos de la UKOLN (http://www.ukoln.ac.uk/metadata/); ambos web proporcionan una extensa información sobre todos los aspectos de los metadatos. Cualquiera que esté familiarizado con estos recursos de información o con el tema de los metadatos, comprenderá por qué trato el tema de manera tan específica: este trabajo no pretende contemplar todos los estándares y actividades de metadatos, sino que se concentra en un ejemplo, quizás el más destacado hasta el momento, el llamado "Dublin core" (DC)
(para información general, véase primero http://purl.org/metadata/dublin_core).

Este trabajo tampoco pretende contribuir a los procesos de normalización en el campo del DC o de las reglas y los formatos bibliotecarios de catalogación ya existentes o en desarrollo (como la ISBD(ER)); tampoco pretende abogar a favor de ninguno de estos modelos de trabajo: hay contextos más adecuados para ello (como las listas de discusión respectivas) y, además, seguro que hay especialistas en ambos campos con muchos más méritos que el autor de esta presentación para hacer una contribución de este tipo.

Lo que pretendo es examinar la posible relación mutua entre la catalogación y los metadatos en un intento tímido y aproximativo de dar algunas respuestas. Se ha dicho que, hasta cierto punto, los metadatos y los registros catalográficos convencionales son complementarios, pero lo que yo pretendo mostrar en esta contribución es que son fundamentalmente distintos, e incluso modelos de trabajo contrapuestos, y que los conceptos de trabajo que están en la base de los dos modelos difieren de forma substancial.

Después de todo, hay algunas buenas razones -algunas explícitas, otras implícitas- por las que la comunidad de los metadatos no empezó proponiendo enmiendas al formato MARC, sino que creó un marco de atributos completamente nuevo. Algunas de las razones tienen sus raíces en la perspectiva externa de qué es lo que hacen los bibliotecarios: un punto vital sobre el que los bibliotecarios deberían reflexionar.

Por otro lado, el método de los metadatos se ve favorecido por el beneficio de todo lo que empieza desde cero -una vez ya no sean tan nuevas, las actividades basadas en metadatos redescubrirán probablemente algunos de los problemas y dificultades que los bibliotecarios han experimentado en los últimos 30 años: si reinventar la rueda puede incluso estar justificado algunas veces (y de todas maneras ésta ha sido una práctica habitual hasta el momento en el campo de la automatización de bibliotecas), hay buenas razones para evitar, como mínimo, los errores que otros ya han cometido.

Esta contribución quiere provocar y estimular la discusión. Así pues, pido disculpas por todas las simplificaciones y analogías necesarias que voy a hacer en este contexto: son tan erróneas como todas las simplificaciones y analogías...

Quién lo hace y cómo se hace?

Cuando se contemplan los resultados típicos de un producto de metadatos conforme con el DC, un pensamiento tentador --al menos desde la perspectiva de un bibliotecario- es considerar los metadatos DC como una especie de formato catalográfico simplificado. Algunas definiciones de metadatos, como la siguiente, fomentan este punto de vista: "Metadatos son datos sobre datos, y por lo tanto proporcionan información básica como el autor de una obra, la fecha de creación, conexiones a obras relacionadas, etc. Una forma conocida de metadatos es el catálogo de fichas de una biblioteca; la información de la ficha constituye una serie de metadatos sobre el libro. Quizás sin saberlo, usted mismo usa metadatos en su trabajo diario. ..." (MILLER 1996)

Esta idea está conforme con la expresada por P. Caplan muy al inicio del desarrollo del DC. En un intento de responder a la pregunta "What is Metadata, Anyway?" ("Y qué son los metadatos?"), Caplan afirmó que: "Realmente, metadatos sólo son datos sobre datos; un registro de catálogo son metadatos; la cabecera TEI, también, o cualquier otra forma de descripción. Los podríamos llamar catalogación, pero para algunas personas este término tiene demasiadas connotaciones, como las Anglo-American Cataloguing Rules y el USMARC. Así, hasta cierto punto se trata de una situación del tipo 'you call it corn, we call it maize' ('vosotros los llamáis alubias; nosotros, judías'), pero "metadatos" es un buen término neutro que cubre todas las bases." (CAPLAN 1995) (1)

En otro intento de proporcionar una panorámica de los formatos de metadatos, R. Heery también sitúa la catalogación y el DC en un mismo paradigma, pero indica diferencias de complejidad:


Banda uno		   Banda    Banda 	   	      Banda 
			    dos	    tres	   	      cuatro
				
Registros de    simple     Dublin   MARC	  	      ICPSR
propietarios:		   Core

NetFirst		   IAFA	    Cabeceras  independiente  FGDC
				    TEI
			
[...]			   [...]   [...]		      [...]

formularios    	CIP	   CIP     Mensajes 
de editores		   MARC	   EDI	

(HEERY 1996a)

Todo esto parece indicar que la preocupación básica de este trabajo no debe plantearse como un problema, sino como una simple cuestión de ligeros cambios terminológicos y de ciertas variantes de complejidad.

Sin embargo, en la siguiente definición de T. Berners-Lee se puede percibir algo más que una pequeña diferencia: "Metadatos son una información que entiende el ordenador sobre recursos web u otras cosas." Y el autor continua diciendo: "La frase 'que entiende el ordenador' es clave. Estamos hablando de información que los productores de software pueden usar para hacernos la vida más fácil, asegurar que obedecemos a nuestros principios, la ley, comprobar que podemos confiar en lo que hacemos y hacer que todo funcione mejor y rápidamente." (BERNERS-LEE 1998)

El punto de vista anterior difiere notablemente del que afirma "Podemos llamarlo catalogación". Si bien los objetivos generales se aproximan a los de la catalogación (la fiabilidad y la autenticación de la meta-información), el contexto del uso de la información es diferente (productores de software y no usuarios de biblioteca) y la preocupación explícita por la eficacia significa realmente que las cosas están pensadas para que "funcionen mejor y rápidamente" -¡comparadas con la catalogación!

Las diferencias se aclaran más incluso cuando consideramos uno de los aspectos iniciales del DC que, recientemente, ha sido retomado por Stuart Weibel: "Una de las motivaciones originales de la serie de seminarios sobre el DC era la idea de que los autores podrían proporcionar sus propias descripciones." (WEIBEL 1998). (2) Así pues, no sólo difiere el flujo de producción, sino que además los creadores de la meta-información no son catalogadores de biblioteca.

Un aspecto adicional que hay que tener presente es que uno de los puntos centrales de la iniciativa del DC era "facilitar el descubrimiento de recursos en un entorno de red" (LAGOZE 1997); por esto no se trataba, ante todo, de hacer una descripción del recurso. Así pues, el método de los metadatos sólo cabe de manera accidental en el paradigma de la descripción de la catalogación bibliotecaria.

Todo lo dicho nos conduce a una noción más clara de las suposiciones explícitas e implícitas ligadas al término metadatos: están pensados para un contexto de uso diferente de los catálogos bibliotecarios, en general no están creados por catalogadores profesionales, están pensados para ser producidos de manera más eficiente que los registros catalográficos, cubren un tipo concreto de material (los recursos electrónicos) y -este aspecto se explicará más adelante- la relación entre los metadatos y los recursos referenciados difiere substancialmente de la relación entre un registro catalográfico y el libro que tiene la biblioteca.

Aunque los resultados de la producción de metadatos, los registros DC, pueden ser semánticamente similares a un registro catalográfico simplificado (y pueden ser fácilmente proyectados al formato MARC (3)), el contexto general de producción y uso de esta información es substancialmente diferente y está impulsada por la intención de ir más allá del paradigma tradicional de la catalogación. Considerar que el proceso de creación de metadatos es un tipo de catalogación simplificada, sería probablemente un error importante.

Para quién se hace? Cómo se usa?

Los registros catalográficos tal como los han producido tradicionalmente los bibliotecarios son bastante genéricos en el sentido de que hacen pocas suposiciones sobre los usuarios potenciales de estos registros. El contexto futuro de uso (integración en un OPAC o colocación de las fichas impresas en un catálogo organizado de manera secuencial) ha tenido hasta ahora muy poco impacto en la manera en que esta información se crea en el proceso de catalogación y no ha influenciado demasiado la semántica (tal como está formalizada en los códigos de catalogación tipo AACR2). Este hecho puede ser una ventaja -sin embargo, la comunidad bibliotecaria es actualmente mucho más consciente de las desventajas de esta falta de orientación hacia el usuario final de la actividad catalográfica y está obligada a reconsiderar algunos de sus principios aunque sólo sea porque, en el contexto político, es consciente de los costes crecientes.

Éste no es el caso del DC ni de otras iniciativas de metadatos, ya que me parece que una de sus características principales es que están muy orientadas por los requerimientos de los usuarios finales. Este hecho se podría considerar una desventaja, ya que los cambios en el comportamiento del usuario final y el contexto de uso podrían afectar de manera fundamental este enfoque con el riesgo de una falta de continuidad; sin embargo, esta característica posiblemente se considera en la actualidad un aspecto positivo. Siempre que se hace una introducción al DC, se dan argumentos pensando en tipos concretos de recursos (objetos electrónicos en el entorno WWW), se acompañan de suposiciones concretas sobre el contexto de uso (por ejemplo, uno de los argumentos recurrentes en este contexto son las mejoras de precisión de los buscadores internet) y a menudo se desarrollan pensando en un grupo de usuarios concretos. La metáfora del 'turista digital' fomentada por la comunidad del DC es significativa en este sentido.

Todo ello ya es hasta cierto punto verdad para la semántica del DC. Sirva como un ejemplo que una de las suposiciones básicas parece ser la unicidad de los recursos, y no se tiene en cuenta el hecho de que una "obra" (en la terminología del estudio Functional Requirements for Bibliographic Records) pueda tener distintas "representaciones / manifestaciones", ni tampoco que puedan existir diversos ejemplares -el resultado es una relación 1:1 entre los metadatos y los recursos físicos hechos a la medida del paradigma plano de la información de la WWW (4). Esto es todavía más tangible en el contexto de las propuestas correspondientes de sintaxis, las cuales están claramente orientadas a un entorno de uso WWW. (5)

Esta diferencia fundamental quizás se puede ilustrar mejor comparando las respectivas relaciones entre los registros catalográficos y los libros y entre los metadatos y los recursos que éstos referencian.

En la mayoría de sistemas locales bibliotecarios los registros bibliográficos se complementan normalmente con registros de ejemplar que contienen punteros (esto es, topográficos) que indican la colocación del libro. Así pues, este topográfico utiliza la funcionalidad del préstamo del sistema bibliotecario como fórmula de mediación, y a menudo incluso requiere la actividad humana adicional del personal bibliotecario para proporcionar al usuario el objeto de su deseo, el libro o documento real. La cuestión básica es que este contexto de uso tiene pocas o ninguna consecuencia para el registro bibliográfico o la actividad catalográfica. Como ya señaló R. Heery, la situación de los metadatos es fundamentalmente distinta:

Los metadatos son parte de una infraestructura de información técnica concreta, y esto es así, incluso hasta cierto punto en el nivel semántico, ya que en principio estaban pensados para ser independientes del contexto: el valor real del registro de metadatos viene determinado en gran medida por el hecho de que los punteros de acceso del registro funcionen realmente (lo cual explica la gran preocupación mostrada en las discusiones del DC sobre el problema de las "conexiones rotas" y su relación con los procesos de estandarización relacionados con el URN -u otro identificador) y también por el hecho de que los punteros de acceso cumplan los requisitos técnicos del software de aplicación utilizado para acceder a la información. Si este aspecto se simplifica mucho, se podría decir que un registro de metadatos que contenga un puntero inválido del recurso vale casi tan poco como la ausencia de registro.

Así pues, la conclusión de esta sección es que los metadatos no sólo pertenecen a un paradigma de producción diferente, sino que también pretenden ser parte de un contexto de uso distinto del de los registros catalográficos y que están técnicamente conectados a este contexto en alto grado. Si bien esta afirmación parece simplificar enormemente las cosas (permitiendo el acceso directo al documento a partir de métodos normalizados de punteros), paradójicamente las cosas se complican al mismo tiempo: el papel de los registros de metadatos en esta infraestructura de información depende de la rápida evolución de los estándares internet que cambian y evolucionan constantemente (pero hay que dejar claro que sólo se trata de una aclaración y que no hay que leerlo como una crítica al método de los metadatos).

...y una oportunidad para los bibliotecarios?!!

En este punto ya deberían estar claras algunas de las diferencias fundamentales entre los registros bibliográficos y los metadatos y también deberían estarlo algunos de los paradigmas de producción respectivos. Deberían estar lo suficientemente claros como para entender que ambos enfoques son parte de infraestructuras distintas de información y poder reaccionar ante este hecho, aunque pueda haber áreas de contacto y similitudes.

Podría ser posible combinar provisionalmente los dos paradigmas de información, como en la propuesta de Xu (1998) de utilizar el OPAC de la biblioteca como pasarela de acceso a un archivo de metadatos. No quiero entrar en los detalles de esta posibilidad, pero tengo mis dudas en relación a su aplicación práctica inmediata. Sin embargo, ésta podría ser una línea de investigación interesante para los bibliotecarios, y algunos de los trabajos actuales que se llevan a cabo en mi institución -Pica- van en la misma dirección de combinar la automatización bibliotecaria y las técnicas de información de internet. Ejemplos del trabajo realizado son los proyectos WebDOC y DELTA.

También hay otras áreas en las que la comunidad de los metadatos puede beneficiarse de la competencia y la experiencia bibliotecarias (o, en las que ya se da el caso, debido a la muchas personas que representan el mundo bibliotecario en esta comunidad) y seguramente esto es mucho más cierto en el llamado 'DC cualificado' que en el 'DC simple'. Estoy pensando en ejemplos como el uso de ítems repetibles y en las lecciones que posiblemente hay que aprender de la experiencia MARC, de su arquitectura de subcampos o del uso de vocabulario controlado, lo cual puede conducir a debates muy similares a los que tenían lugar en el pasado en el entorno bibliotecario sobre las formas autoritativas. Hay más áreas de este tipo, en las que la reinvención necesaria de la rueda de los metadatos podría (y de hecho lo hace) evitar problemas que ya se habían identificado en contextos anteriores.

Me gustaría terminar este trabajo indicando dos áreas en las que las profundas y continuas contribuciones del mundo bibliotecario pueden ser especialmente útiles para el método de los metadatos. Uno de los participantes en la lista de discusión meta2 ha dicho recientemente:

Asegurar la consistencia y el control de autoridades han sido temas de gran preocupación para los bibliotecarios y seguramente habrá un papel sistemático para ellos en el contexto de los metadatos para contribuir concretamente a la consistencia general de los resultados de producción; pero ha de quedar claro que no se trata de reconvertir el método de metadatos en un tipo de actividad catalográfica tradicional.

La segunda área en la que pienso, está muy relacionada con lo anterior y tiene que ver con el problema de la autenticación de los metadatos. El reciente informe del EC Metadata Workshop de Luxemburgo afirma que "el avance actual del Dublin core es lento, y hay una falta de masa crítica". Entre otras razones, uno de los problemas que está en la base de este hecho es el relativo poco uso que los buscadores como Alta Vista hacen de los metadatos excepto en la mera indización de palabras clave; al mismo tiempo, se ha sugerido que la razón de esto es la falta de autenticación de los metadatos. Un mensaje de S. Weibel a meta2 se puede entender como una reacción a este problema cuando dice:

En este mismo contexto se hizo la siguiente sugerencia:

No estoy seguro de que éste sea un camino prometedor o deseable: puede que haya una manera de involucrar a instituciones públicas, como bibliotecas, en este proceso necesario de intermediar en la información. Si bien estoy de acuerdo en que en este proceso serán necesarias terceras partes asociadas, no estoy seguro de que todos nosotros estemos satisfechos de depender enteramente de los servicios intermediarios de instituciones comerciales en este contexto vital de validación de la información. Incluso si esta idea es anticíclica en el sentido de que se mueve en contra de la corriente de desregulación, creo que este es un punto importante que hay que considerar.

Retomando el título de este trabajo, en este punto debería estar suficientemente claro que les metadatos no son, desde luego, una simple palabra de moda y de que no se trata en absoluto de vino viejo en odres nuevos. Los metadatos son como tallos del paradigma de la información que difieren de otros que representan la actividad de la catalogación bibliotecaria y creo que las bibliotecas deberían sentirse invitadas a seguir intensamente su evolución y a no percibirlos como una amenaza, sino como una oportunidad de redefinir su papel en el contexto de los paradigmas de información emergentes.

Traducción al español: A. Estivill

Referencias

Arnett, Nick: Re: authentication of metadata. meta2@mrrl.lut.ac.uk (23 Jan. 1998) (= ARNETT 1998)

Berners-Lee, Tim: Metadata Architecture. Documents, Metadata, and Links. Last edit Date: 1998/02/06 17:06:46. http://www.w3.org/DesignIssues/Metadata.html (= BERNERS-LEE 1998)

Caplan, Priscilla: "You Call It Corn, We Call It Syntax-Independent Metadata for Documents-Like Objects". En: The Public-Access Computer Systems Review, 6, no. 4 (1995).
http://info.lib.uh.edu/ pr/v6/n4/cap16n4.html (= CAPLAN 1995)

Heery, Rachel: Metadata format. December 1996. Deliverable D1.1 - Work Package 1 of Telematics for Libraries, Project BIBLINK (LB 4034)
http://www.ukoln.ac.uk/BIBLINK/wp1/d1.1/ (= HEERY 1996a)

Heery, Rachel: "Review of Metadata Formats". En: Program, vol. 30, no. 4 (October 1996), p. 345-373 (= HEERY 1996b)

Lagoze, Karl: "From Static to Dynamic Surrogates: Resource Dicovery in the Digital Age". En: D-Lib Magazine (June 1997).
http://www.dlib.org/dlib/june97/06lagoze.html (= LAGOZE 1997)

Metadata Workshop, Luxembourg 1-2 December 1997: Workshop Report.
http://hosted.ukoln.ac.uk /ec/metadata-1997/report/

Miller, Paul: "Metadata for the Masses". En: Ariadne, 5 (Sept. 1996).
http://www.ariadne.ac.uk/ issue5/metadata-masses/ (= MILLER 1996)

Miller, Paul: "An Introduction to the Resource Description Framework". En: D-Lib Magazine (May 1998) (= MILLER 1998)

Olson, Nancy: Cataloging Internet Resources: a manual and practical guide. 2nd ed.
http://www. oclc.org/oclc/man/9256cat/toc.htm (= OLSON)

A User Guide for Simple Dublin Core. Draft version 4.0. (15/05/1998).
http://www.128.253.70.110/DC5/UserGuide4.html (USER GUIDE)

Weibel, Stuart: Re: Authentication of Metadata. meta2@mrrl.lut.ac.uk (23 Jan. 1998) (= WEIBEL 1998)

Weibel, Stuart; Hakela, Juha. DC-5: "The Helsinki Metadata Worshop: A Report of the Workshop and Subsequent Developments: Official Report of the Helsinki DC Meeting". En: D-Lib Magazine (Feb. 1998).
http://www.dlib.org/dlib/february98/02weibel.html (= WEIBEL/HAKELA 1998)

Weinheimer, James: Re: Authentication of Metadata. meta2@mrrl.lutac.uk (23 Jan. 1998) (= WEINHEIMER 1998)

Xu, Amanda. "Metadata Conversion and the Library OPAC". En: The Serials Librarian, 33 (Spring 1998).
http://web.mit.edu/waynej/www/xu.htm (= XU 1998)

Footnotes

  1. En el contexto de esta definición, los borradores incipientes del DC se sitúan en el mismo nivel que otros "estándares que definen conjuntos de elementos de metadatos, desde las AACR2 a GILS" (CAPLAN 1995)
  2. En consecuencia, publicaciones profesionales del contexto bibliotecario, como la de OLSON, no mencionan el DC como algo relevante.
  3. Así se demuestra en Mapping the Dublin core metadata elements to USMARC. (OCLC discussion paper; no. 86. May, 1995) (http://ifla.inist.fr/documents/libraries/cataloguing/dublin1.txt). También se demuestra en otros trabajos.
  4. Este principio todavía se mantiene incluso con la clara conciencia de que la "complejidad de relaciones entre obras relacionadas se resiste a una explicación coherente" (WEIBEL/HAKELA 1998)
  5. Las propuestas actuales de usar sintaxis RDF basada en XML son un buen ejemplo de ello. (cf. MILLER 1998)