IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library Associations and InstitutionsAnnual ConferenceSearchContacts
*    
To Bangkok Conference programme

65th IFLA Council and General
Conference

Bangkok, Thailand,
August 20 - August 28, 1999


Code Number:011-117_S
Division Number: IV
Professional Group: Classification and Indexing
Joint Meeting with: -
Meeting Number: 117
Simultaneous Interpretation:   No

Pasarelas temáticas del Sudeste Asiático: análisis de sus métodos de clasificación

Edward Lim
Bibliotecario de Universidad
Universidad de Monash, Melbourne, Australia


Paper

El problema

Desde siempre, la biblioteca tradicional ha formado colecciones o facilitado acceso a recursos de información diseñados para satisfacer las necesidades de sus usuarios más inmediatos. Es decir, el espacio de información en la que han de navegar sus usuarios tiende a ser concentrado, cerrado y finito. Internet, por otra parte, con un espacio de información casi ilimitado y la ausencia de una organización coherente, plantea serios problemas de navegación a los investigadores y otras personas interesadas en la búsqueda de información. Para facilitar el acceso a la gran cantidad de información disponible han surgido una serie de servicios de indización que se encargan de indizar gran parte de la World Wide Web. Desgraciadamente, sin embargo, los grandes motores de búsqueda o directorios como Alta Vista, Nothern Light, HotBot, Excite y Lycos no son totalmente satisfactorios para una recuperación efectiva de información debido a varias razones:

  • Estos sólo indizan una parte del total de documentos disponibles en la Web, y su cobertura varía ampliamente. Debido a que ningún servicio de búsqueda es exhaustivo, si se requiere un alto índice de precisión en la recuperación, es necesario usar más de un motor de búsqueda. En este sentido, Lawrence y Giles han demostrado que combinando seis motores se puede recuperar casi 3.5 veces más información que la que se recupera utilizando un solo motor (Reuters, 1998).
  • Numerosos estudios demuestran que la calidad de los resultados de búsqueda usando diferentes motores varía enormemente.
  • La mayoría de los motores de búsqueda efectúan una indización a texto completo, pero no necesariamente indizan el contexto de aquellos documentos que encuentran. Frecuentemente sólo son indizadas las primeras líneas del texto. Además, puesto que no existe un control del vocabulario, la búsqueda por palabras clave puede dar como respuesta cientos, cuando no miles de items, muchos de los cuales pueden ser no relevantes.
  • La mayoría de los motores de búsqueda son casi inservibles para buscar y recuperar documentos no textuales y objetos, como audio, video y programas ejecutables.
  • La mayoría de los motores no pueden buscar y recuperar sitios Web controlados por contraseña.
  • Puesto que muchos documentos Web no llevan a cabo el proceso de acreditación, propio de las revistas profesionales impresas o de las monografías publicadas por editores de prestigio, es difícil, con frecuencia, separar el trigo de la paja. Como vemos, el problema no es sólo el de recuperar información relevante sino también el de recuperar información de calidad.

Unido al problema de la localización de recursos de información usando alguno de los grandes motores de búsqueda existentes, está el de la dificultad que tienen los usuarios para formular buenas estrategias de búsqueda. Los bibliotecarios referencistas saben que los usuarios expresan habitualmente sus peticiones de un modo bastante impreciso y que es necesaria una gran habilidad para descubrir qué información necesitan exactamente. El problema con el acceso directo, que es el camino que las bibliotecas están tomando por motivos de carácter económico y financiero, es que por sí mismos y sin la suficiente formación y asesoramiento, los usuarios lo van a tener muy difícil para encontrar en Internet la información que buscan.

Las soluciones

Se han sugerido diferentes soluciones para mejorar la búsqueda y recuperación en Internet. Estas se pueden dividir en tres grandes categorías. La primera de ellas orienta sus esfuerzos a ayudar a los usuarios finales a usar los motores de búsqueda de manera más efectiva. Esto puede hacerse a través de programas de información, guías impresas o el asesoramiento directo de los bibliotecarios. La segunda categoría se basa en mejorar la capacidad y funcionalidad de los motores, p.e. mejorando la recogida o reunión de datos y el proceso de indización, permitiendo búsquedas por lenguaje natural, añadiendo la posibilidad de combinar operadores booleanos, aumentando los límites en el número de claves de búsqueda, mejorando el algoritmo de ponderación, incorporando la búsqueda por truncamiento y por caracteres comodín, indizando más campos, etc. La tercera categoría conlleva una mayor intervención humana. Esta categoría se puede dividir en dos subcategorías:

  • La primera subcategoría incluye el uso de metadatos para mejorar el proceso de recogida y recuperación.
  • La segunda subcategoría intenta construir pasarelas temáticas (subject gateways) o de información que ayuden a los usuarios a descubrir información de calidad rápida y efectivamente. En el contexto del acceso a recursos de información en red, una pasarela temática se define como "una utilidad que posibilita un acceso más fácil a los recursos de información que existen en la red acerca de una materia determinada". El tipo más sencillo de pasarela temática sería un conjunto de páginas Web que contienen enlaces a recursos de información." (Kirriemuir, 1998)

El Proyecto de Desarrollo de un Servicio Europeo para la Información sobre Investigación y Educación, DESIRE (1998) ha descrito las principales características de una pasarela temática del siguiente modo:

En el entorno de información tradicional, los intermediarios humanos, como son los editores y los bibliotecarios, filtran y procesan información, de forma que los usuarios pueden utilizar catálogos e índices en los que se organiza el conocimiento, en contraposición a los datos ofrecidos en bruto y a la información no pertinente. Las pasarelas temáticas se basan en el mismo principio -emplean expertos en materias y profesionales de la información para seleccionar, clasificar y catalogar recursos de Internet con objeto de ayudar a los usuarios en el proceso de búsqueda y recuperación. A los usuarios se les ofrece el acceso a una base de datos que contiene descripciones de recursos Internet y en la que pueden buscar por palabra clave o por áreas temáticas. Esto pueden hacerlo con la seguridad de que están consultando una colección de recursos controlada y de calidad. A los usuarios se les ofrece una descripción de cada recurso para ayudarlos a examinar rápidamente el origen, contenido y naturaleza de éste, y capacitándolos para decidir si vale la pena seguir investigando o no.

Es interesante destacar el hecho de que los problemas que encontramos en el entorno Internet son los mismos que han estado presentes siempre en el campo de las Ciencias de la Información -problemas relacionados con la organización del conocimiento, problemas causados por la ingente cantidad de información publicada (explosión de la información), problemas de identificación, categorización y recuperación de la información, y problemas intrínsecos al tratamiento de las materias complejas, las cuales son difíciles de representar incluso usando los sistemas de clasificación tradicionales. No deja de ser ciertamente irónico que los informáticos y otros profesionales, al enfrentarse hoy a los complicados problemas que plantea el almacenamiento y la recuperación de la información, estén redescubriendo las tradicionales o clásicas herramientas que desde hace tanto tiempo han venido empleando los bibliotecarios para organizar y recuperar la información.

Las razones para clasificar

Los avances para mejorar la recuperación de información combinan hoy el uso de motores de búsqueda basados en robots con la creación de pasarelas temáticas que contienen páginas Web útiles en áreas temáticas específicas. Para mejorar la capacidad de estas pasarelas temáticas, es necesaria alguna forma de ordenación jerárquica, lo que ha conducido a la adopción de los sistemas de clasificación bibliotecaria para su representación.

Vizine-Goetz (1998, p. 93) señala que "la estructura de los sistemas de clasificación tradicionales presenta un gran potencial tanto para mejorar la descripción y localización de recursos en Internet como para la organización de colecciones de documentos electrónicos."

El Proyecto DESIRE (1999) ha realizado un informe subrayando algunas de las ventajas que ofrece el uso de los sistemas de clasificación en la recuperación de información en un entorno de red. Estas son:

  • Un sistema de clasificación puede facilitar la búsqueda a los usuarios poco experimentados
  • La naturaleza jerárquica de las clasificaciones permite ampliar o delimitar la búsqueda según se precise
  • Un sistema de clasificación confiere un contexto a los términos de búsqueda
  • Un sistema de clasificación permite un acceso multilingüe a una colección, ya que la notación que se utiliza es independiente de cualquier idioma
  • La estructura lógica de un sistema de clasificación proporciona un mecanismo para fragnmentar o manipular los resultados
  • El uso de un sistema de clasificación consolidado puede facilitar la búsqueda en múltiples bases de datos
  • Un sistema de clasificación es susceptible de ser actualizado
  • Los sistemas de clasificación bibliotecarios son, en teoría, bien conocidos por los usuarios.
  • Muchos sistemas de clasificación ya están disponibles en formato legible por máquina
  • Un análisis de los métodos utilizados en varios sitios Web evidencia que la gran mayoría de ellos ordena las materias alfabéticamente usando descriptores, en ocasiones basados en el vocabulario controlado de un tesauro de una disciplina específica. Otros utilizan un sistema de clasificación jerárquico. El Proyecto DESIRE (1999) ha identificado los diferentes sistemas de clasificación utilizados como:
  • Sistemas consolidados, como la Clasificación Decimal de Dewey (DDC), la Clasificación Decimal Universal (CDU) o la Clasificación de la Biblioteca del Congreso (LCC).
  • Sistemas nacionales de carácter general, p.e. Nederlandse Basisclassificatie (BC); Sveriges Allmäma Biblioteksförening (SAB)
  • Sistemas especializados en alguna materia, p.e. Clasificación de recursos de información sobre arte; Sistema de la Biblioteca Nacional de Medicina (NLM)
  • Sistemas propios

Internet en el Sudeste de Asia

Hay que decir que aunque el uso de Internet se ha extendido considerablemente en el Sudeste de Asia, su uso per cápita no es aún tan alto como en los países desarrollados. A título comparativo el número de usuarios de Internet en Australia en diciembre de 1998 era de 4.36 millones, lo que supone un 24.2% del total de la población (NUA Ltd, 1998). Aunque el número de Proveedores de Servicios a Internet en el Sudeste de Asia es bastante pequeño, la mayoría de ellos están regulados. El número de bibliotecas que disponen de acceso a Internet es también muy limitado. La mayoría son bibliotecas universitarias, bibliotecas de colegios universitarios, o bibliotecas nacionales.

Estudios de casos

Los datos demuestran que no puede esperarse un desarrollo importante de pasarelas temáticas en el Sudeste de Asia. Básicamente, las pasarelas temáticas referidas a esta región pueden dividirse en tres grandes grupos, según el criterio de su creación:

  • Pasarelas creadas fuera de la región
  • Pasarelas creadas por organizaciones comerciales
  • Pasarelas creadas por bibliotecas del Sudeste Asiático

En este trabajo, examinaremos algunos ejemplos representativos de cada una de estas categorías.

Internacional

No es sorprendente que la pasarela temática más grande del Sudeste Asiático (Southeast Asian Studies WWW Virtual Library, 199?) se localice fuera de la región, en la Universidad de Leiden, en Holanda, a través de la pasarela IIAS (Instituto Internacional de Estudios Asiáticos) (Gateway to Asian Studies, 199?). Esta pasarela fue desarrollada para:

  • dar a conocer en Internet la investigación que sobre Asia se lleva a cabo en Holanda, ofreciendo información en red sobre los estudios especializados en dicho tema;
  • ofrecer una "ventana a la información existente en la red Internet, especialmente en la World Wide Web".

La Southeast Asian Studies WWW Virtual Library es realmente una división del Asian Studies WWW Virtual Library, mantenido por el Dr. T. Matthew Ciolek, de la Universidad Nacional de Australia (Asian Studies WWW Virtual Library, 1994-1999).

El sistema de clasificación que utiliza es un sistema propio. Los enlaces a los países muestran gran inconsistencia en la categorización de las páginas. Por ejemplo, el sitio correspondiente a las Filipinas es mantenido por el IIAS, y tiene, sin embargo, el mismo diseño y filosofía que la página Web principal del Southeast Asian WWW Virtual Library.

Por otra parte, las páginas de Singapur y Malasia, debido a que están mantenidas por diferentes organizaciones, tienen su propia idiosincracia organizativa. La página de Malasia está mantenida por el Malasyan Timber Council (Asian Studies - Malasya, 1997) y es, desde un punto de vista bibliotecario, la menos profesional de todas. La página de Singapur está mantenida por el Servicio Bibliotecario del Sur/Sudeste Asiático (SSEALS) de la Universidad de California, Berkeley (Singapore WWW Virtual Library, 1998) y tiene una apariencia más profesional. En ella, y con el software plug-in requerido por el navegador Web, es posible ver el texto con caracteres chinos.

Comercial

La mayoría de los sitios Web referidos a temas del Sudeste Asiático está mantenidos por organizaciones comerciales. Por ejemplo, el proveedor de servicios Internet Jaring mantiene una pasarela a recursos de información de Malasia (Malasya, 1999). Suministra enlaces a un gran número de sitios Web malayos (Hotlinks, 1999). Hotlinks es un sitio diseñado de manera muy profesional, y proporciona un índice A-Z de los enlaces electrónicos así como la clasificación de los distintos recursos.

Bibliotecas

La mayor parte de las bibliotecas que ofrecen pasarelas temáticas son universitarias, nacionales y de escuelas técnicas, principalmente porque estas bibliotecas suelen estar mejor dotadas que las públicas o escolares. A pesar de esto, las páginas no están mejor clasificadas que las mantenidas por las organizaciones comerciales. Las tres páginas Web que se han examinado en el presente trabajo son las de la Universiti Sains Malasya (USM), la Universidad Nacional de Singapur (NUS) y el Instituto Asiático de Tecnología (AIT) en Tailandia.

La página Web del USM (Virtual Subject Libraries, 1996-1999), clasifica las entradas de acuerdo a las escuelas universitarias existentes en esta Universidad, a saber, Biología, Ciencias Químicas, Educación, Humanidades, Tecnología Industrial, Gestión Empresarial, Ciencias Sociales, Farmacia, Urbanismo, Edificación y Planificación de Viviendas.

La página del NUS (Subject Guides to Web Resources, 1999) también organiza los recursos Web por facultades, a saber Estudios de Area, Arte y Humanidades, Negocios, Ingeniería, Leyes, Biblioteconomía y Documentación, Ciencias Sociales, Medicina y Ciencia. Además, ofrece un listado alfabético de los recursos por su forma o tipo de presentación, ej: Revistas electrónicas, Guías de citas, Indices, Directorios de recursos en Internet, Servidores de Listas de distribución, Periódicos, Patentes, Obras de referencia, Viajes, Universidades y Escuelas Técnicas.

El AIT tiene una página Web que contiene tanto información sobre Asia como sobre Tailandia (Guide to Thai Information on the Internet, 1998). De la breve descripción de las distintas pasarelas temáticas que hemos estudiado, puede deducirse claramente que, desde el punto de vista del profesional de la clasificación, su organización de la información es muy pobre:

  • Los grupos temáticos que se establecen no son muy lógicos o consistentes. Por ejemplo, la página Web del Southeast Asian WWW Virtual Library subdivide las materias por grupos temáticos como Arte y Humanidades, Ciencia, Estudios Sociales, pero por alguna razón que desconocemos excluye Gobierno, Política y Negocios (de las categorías de Arte y Humanidades Ciencias Sociales) y los muestra separadamente.
  • Aunque se utilizan los descriptores de materia, éstos no siempre aparecen ordenados alfabéticamente por tema.
  • En muchos casos la ordenación parece aleatoria, sin que aparentemente exista una razón que explique este hecho.
  • En muchos casos, los grupos temáticos que aparecen después de los dos primeros niveles carecen de toda lógica.
  • El contenido tiene el aspecto de una amalgama de páginas web y de títulos de libros y revistas.
  • Las páginas se caracterizan más por lo que no hacen que por lo que hacen.

Conclusión

El análisis anterior demuestra que las pasarelas del Sudeste de Asia no han adoptado todavía muchos de los mecanismos o tecnologías que facilitan un acceso eficiente y efectivo a los recursos de información en la Web. Aunque algunas de estas técnicas están todavía en fase de experimentación, muchas se basan en metodologías que han sido, y continúan siendo utilizadas por los bibliotecarios para organizar el conocimiento.

Además del empleo de sistemas de clasificación tradicionales, los métodos o técnicas para mejorar el acceso incluyen el uso de índices alfabéticos, la creación de mecanismos de búsqueda y browsing cruzados, y la posibilidad de efectuar una clasificación automática. Cyberstacksä, por ejemplo, que clasifica sus recursos utilizando la LCC, ofrece dos índices alfabéticos para una posible clasificación - el Indice de Clasificación Cruzada y el Indice de Títulos. El Indice de Clasificación Cruzada no difiere realmente del índice tradicional que se usa en los catálogos sistemáticos de siempre. Sin embargo, CyberStacksä, propone la mejora de la capacidad de búsqueda introduciendo un tesauro estructurado de encabezamientos de materia en lugar del uso de descriptores libres (McKiernan, 1997).

Aunque los sistemas de clasificación ofrecen medios adecuados para la búsqueda de recursos en áreas específicas concretas, la proliferación de las pasarelas temáticas ha llevado a identificar la necesidad de mejorar la localización de recursos, evitando que el usuario invierta tiempo y esfuerzo buscando en varias pasarelas específicas correspondientes a distintas áreas. Se ha señalado que lo que realmente sería necesario es un mecanismo que permita a los usuarios ejecutar "una simple búsqueda cruzada en varias pasarelas temáticas", ofreciendo los resultados de la búsqueda en una única lista acumulativa (Kirriemuir et al., 1998). A pesar de los problemas que plantea la búsqueda cruzada, se ha desarrollado un sistema de prueba usando el Protocolo de Indización Común, que permite adelantar información desde diferentes bases de datos remotas (es decir, conocer los datos que cada una de estas bases de datos contienen antes de que se procese la petición de búsqueda del usuario) y proporcionar rutas de búsqueda desde "un único servidor de bases de datos a otros que posiblemente contengan información relevante"

Aunque la búsqueda cruzada aplicada a las pasarelas temáticas debería solucionar el problema de la agrupación de la información relevante, lo cierto es que muchas pasarelas están diseñadas para realizar la búsqueda mediante un sistema de clasificación jerárquico en lugar de la búsqueda directa. Para solucionar el problema de la "búsqueda cruzada" o búsqueda en diferentes pasarelas temáticas que utilizan diferentes sistemas de clasificación, se han sugerido las siguientes soluciones:

  • Analizar los diferentes sistemas de clasificación utilizados en las pasarelas temáticas;
  • Utilizar un tesauro consensuado como índice de una serie de sistemas de clasificación;
  • Usar la Normativa de Descripción de Recursos del Consorcio WWW (RDF) como un formato común para el intercambio de información electrónica en la Web.

La clasificación es obviamente una operación muy laboriosa. En consecuencia se están desarrollando diferentes experimentos para mejorar los mecanismos de clasificación automática (DESIRE, 1999; Dolin et al., 1998). El proyecto más importante en este ámbito es probablemente el proyecto Scorpion de la OCLC, cuyo objetivo es "dar respuesta al reto que plantea la aplicación efectiva de los sistemas de clasificación y de encabezamientos de materia a la información electrónica" (Thompson et al., 1997).

Así, aunque hay muchas técnicas y métodos que pueden usarse para mejorar el acceso a los recursos de información en Internet, desgraciadamente muchas bibliotecas y organizaciones del Sudeste de Asia todavía no poseen la experiencia, la formación o los recursos necesarios para hacer uso de ellos. La situación no es sorprendente, ya que muchas bibliotecas de esta región trabajan con presupuestos muy pequeños y apenas si tienen personal debidamente formado, por lo que la posibilidad de utilizar técnicas avanzadas es realmente muy limitada.

Si hay un área en la que IFLA desee contribuir, quizá ésta pueda ser una. Existe una clara necesidad de organizar seminarios o jornadas de trabajo para enseñar a los bibliotecarios del Sudeste de Asia a utilizar muchas de las técnicas de clasificación que perfeccionarían el acceso a sus pasarelas temáticas Web.

Traducido por: Jesús Jiménez Pelayo

Referencias

Asian Studies - Malaysia (1997). Malaysian Timber Council. Disponible en:{HYPERLINK http://www.mtc.com.my/Virtual-Library/Malaysia.html} . (Consulta 03.05.1999).

Asian Studies WWW Virtual Library (1994-1999). Australian National University. Disponible en: {HYPERLINK http://coombs.anu.edu.au/WWWVL-AsianStudies.html/} (Consulta 03.05.1999).

DESIRE (1998) Homepage. Disponible en: http://www.desire/org/ (Consulta 27.04.1999).

DESIRE (1999). "The role of classification schemes in Internet resource description and discovery." Disponible en: http://www.ukoln.ac.uk/metadata/desire/classification/. (Consulta 27.04.99).

Dolin, R. et al. (1998). "Using automated classification for summarizing and selecting heterogeneous information sources." D-Lib Magazine, January. Disponible en: http://www.dlib.org/dlib/january98/dolin/01dolin.html. (Consulta 15.04.1999).

Gateway to Asian Studies (199?). International Institute for Asian Studies. Disponible en: http://iias.leidenuniv.nl/wwwvl/index.html. (Consulta 15.04.1999).

Guide to Thai Information in the Internet (1998). Asian Institute of Technology. Disponible en: http://emailhost.ait.ac.th/Asia/infoth.html/. (Consulta 27.04.1999).

Hotlinks (1999). Jaring. Disponible en: http://www.mymalaysia.net.my/hotlink/. (Consulta 03.05.1999).

Internet Service Providers in SEA (199?). SunSite. Disponible en: {HYPERLINK http://sunsite.nus.sg/SEAlinks/isp.html} . (Consulta 27.04.1999)

Kirriemuir, John et al. (1998) "Cross-searching subject gates; the query routing and forward knowledge approach." D-Lib Magazine, January. Disponible en: http://www.dlib.org/dlib/january98/01kirriemuir.html. (Consulta 15.04.1999).

McKiernan, Gerry (1997). "Hand-made in Iowa: organizing the Web along the Lincoln Highway." D-Lib Magazine, February. Disponible en: http://www.dlib.org.dlib/february97/02mckiernan.html/. (Consulta 15.04.1999).

Malaysia {HYPERLINK mailto:Homep@ge} (1999). Jaring. Disponible en: {HYPERLINK http://www.jaring.my/}welcome.html. (Consulta 03.05.1999).

NUA Ltd. (1998). "How many online?" Disponible en: {HYPERLINK http://www.nua.ie/surveys/how_many_online/asia.html}. (Consulta 03.05.1999).

Reuters (1998). "Search engines fall short." Disponible en: {HYPERLINK http://news.cnet.com/news/0-1005-200-328039.html}. (Consulta 03.05.1999).

Singapore WWW Virtual Library (1998). South/Southeast Asia Library Service, University of California, Berkeley. Disponible en: http://library.berkeley.edu/SSEAL/SouthAsia/WWWVL/singapore.html/. (Consulta 03.05.1999).

South-East Asia Information (199?). SunSite. Disponible en: {HYPERLINK: http://sunsite.nus.sg/asiavc.html/ }. (Consulta 27.04.1999).

Southeast Asian Studies WWW Virtual Library (199?). International Institute for Asian Studies. Available at: http://iias.leidenuniv.nl/wwwvl/southeas.html. (Consulta 15.04.1999).

Subject Guides to Web Resources (1999). National University of Singapore. Disponible en: http://www.lib.nus.edu.sg/webcont.html. (Consulta 27.04.1999).

Thompson, Roger et al. (1997). "Evaluating Dewey concepts as a knowledge base for automatic subject assignment." Disponible en: http://orc.rsch.oclc.org:6109/eval_dc.html. (Consulta 19.04.1999).

Virtual Subject Libraries (1996-1999). Universiti Sains Malaysia. Disponible en: http://www.lib.usm.my/bysubject/vsl2.html. (Consulta 15.04.1999).

Vizine-Goetz, Diane (1998). "OCLC investigates using classification tools to organize Internet data." In: Clinic on Library Applications of Data Processing: 1997. Visualizing subject access for 21st century information sources; ed. by Pauline Atherton Cochrane and Eric H. Johnson, with the editorial assistance of Sandra Roe. Urbana-Champaign: Graduate School of Library & Information Science, University of Illinois at Urbana-Champaign, pp. 93-105.

*    

Latest Revision: June 1, 1999 Copyright © 1995-2000
International Federation of Library Associations and Institutions
www.ifla.org