IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library Associations and InstitutionsAnnual ConferenceSearchContacts
*    
To Bangkok Conference programme

65th IFLA Council and General
Conference

Bangkok, Thailand,
August 20 - August 28, 1999


Code Number: 013-117_S
Division Number: IV
Professional Group: Classification and Indexing
Joint Meeting with: -
Meeting Number: 117
Simultaneous Interpretation:   No

La preparación de un índice para la edición china de la Clasificación Decimal de Dewey (21 ed.): problemas y soluciones

Hou Hanqing
&
Wang Dongbo

Equipo editorial de la Clasificación Documental
Beijing, China


Paper

1. Selección del tipo de índice

En general, los índices de los sistemas de clasificación bibliotecaria pueden dividirse en los siguientes tres tipos:

  1. Indice relativo: los índices de la Clasificación Decimal de Dewey, 21 ed. (DDC 21) y de la Clasificación Documental China (CBC) son de este tipo.
  2. Indice fraccionado o en cadena: los índices de la Clasificación Colonada (India) y de la Clasificación Bibliográfica de Bliss (Gran Bretaña) pertenecen a esta clase.
  3. Indice en forma de tesauro: son de este tipo los índices de algunas tablas especiales de la Clasificación Decimal Universal (CDU). Estos índices incluyen no sólo la denominación y notación de las clases, sino también las abreviaturas que normalmente encontramos en los tesauros: UP (usado por), TE (término específico), TG (término genérico) y TR (término relacionado). En realidad, este índice puede considerarse como un tipo de tesauro.

Todos los métodos de indización, especialmente los que producen mediante el ordenador, como son los índices KWIC (palabra clave en contexto), KWOC (palabra clave fuera de contexto) y PRECIS (Sistema de indización con mantenimiento del contexto), pueden usarse en la preparación del índice de una clasificación. Cúal es el tipo de índice que prepararemos para la edición china de la Clasificación Decimal de Dewey? Una opción bien sencilla sería confeccionar un índice relativo como el de la DDC y CBC. Sin embargo, los índices relativos presentan algunos inconvenientes. El primero, es la dificultad de generar un índice automáticamente. El proceso requiere una gran inversión de trabajo humano; por lo tanto, consume igualmente tiempo y recursos. El segundo inconveniente es que la especificidad de las entradas en un índice relativo es limitada. Un gran número de términos compuestos que expresan conceptos complejos no aparecerían permutados en el índice, por lo que no podrían ser encontrarlos en éste si son buscados por algunos puntos de acceso concretos.

Para la preparación de un índice a la edición china de la DDC 21, nos hemos marcado los siguientes objetivos:

  1. las entradas del índice deben ser altamente específicas, equiparándose lo más posible a las clases que aparecen en la tabla.
  2. el índice debe proporcionar múltiples puntos de búsqueda/acceso a cada clase.
  3. el índice debe ser fácil de compilar y de usar, así como posibilitar el empleo del ordenador en su proceso de compilación.
  4. el índice debe tener en cuenta al cien por cien las características de la lengua china.

Para lograr estos objetivos, se decidió confeccionar un índice permutado chino tipo KWIC, combinando algunas de las ventajas de otros tipos de índices.

Este tipo de índice permutado permite a los clasificadores buscar por una palabra (una palabra de uno o varios caracteres en lengua china) o un elemento de una palabra (un carácter en una palabra china) en las entradas de las clases. Múltiples puntos de búsqueda llevan al usuario a encontrar fácilmente las entradas en el índice. Una de las características de la lengua china es que muchos conceptos de una "familia" comparten la/s misma/s palabra/s o elementos de palabra. En un índice, la misma palabra o elemento de palabra usado en áreas temáticas distintas pueden ser agrupados de forma natural. Llega a ser conveniente para el usuario comprobar o buscar por algunos conceptos temáticos que tengan varias relaciones jerárquicas o asociativas en ocasiones diferentes.

2. Método de generación del índice

Hay dos métodos para preparar un índice de la edición china DDC. Uno de ellos es traducir al chino el índice de la DDC 21 inglesa una vez que se ha completado la traducción de toda la clasificación. Otro método es generar automáticamente un índice permutado basándose en el sistema de clasificación traducido. El primer método consiste, en realidad en una traducción directa, ya que se traduce directamente el índice de la DDC inglesa a la lengua china. Aunque este método conlleva un gran consumo de tiempo y trabajo humano, los términos traducidos apenas si guardan consistencia con las entradas de la clasificación DDC china. Además, la ordenación de las entradas del índice chino requiere también mucho trabajo. El segundo método se conoce como reordenación. Se genera un nuevo índice basado en las tablas de la edición china de la DDC 21. Esta metodología ahorra mucho tiempo y trabajo, ya que utiliza el sistema de clasificación traducido. El problema que presenta dicho índice es su inconsistencia con el índice de la edición inglesa de la DDC 21. Sopesando los pros y los contras de ambos métodos, se decidió optar por el método de reordenación. El tipo de indización elegido es KWIC. Cada entrada incluye el encabezamiento (palabra clave) y el contexto en el que aparece, referencias cruzadas y clases alternativas, y los localizadores (es decir, notaciones relacionadas). El índice proporciona numerosos puntos de búsqueda (la profundidad de la indización es superior a 2). La especificidad de las entradas del índice es alta, y el índice es fácil de usar.

3. Colaboración hombre-máquina durante el proceso de preparación del índice

El Dr. Ranganathan desarrolló el procedimiento denominado en cadena usando las correspondientes relaciones entre clases y encabezamientos de materia. Este ha tenido una amplia influencia en los campos de la Biblioteconomía y de la Información y ha sido utilizado para confeccionar índices alfabéticos de sistemas de clasificación así como catálogos alfabéticos. El procedimiento encadenado es un método semiautomático de preparación de un índice. Hoy día, mediante el uso del ordenador, podemos convertir con gran efectividad una cadena de una clase en las entradas de un índice.

Teníamos la experiencia de haber generado en 1999 un índice (aproximadamente unas 1000 páginas) para la CLC mediante el procedimiento encadenado y un sistema de indización por palabras clave, utilizando para ello un software que nosotros mismos desarrollamos. Esta experiencia es muy útil para confeccionar el índice de la edición china de la DDC 21. Al traducir la DDC 21 al chino, generamos datos legibles por máquina en el proceso de automatización. Estos datos constituyen la base del índice. El sistema que, de un modo satisfactorio, hemos desarrollado para generar el índice consta de seis módulos:

  1. Módulo de producción del diccionario: este módulo recogerá los términos utilizados para el índice de la edición china de la DDC 21, y generará un "diccionario de términos" a partir de la reordenación de los términos recogidos;
  2. Módulo de automatización: la principal función de este módulo es hacer que el ordenador procese el sistema de clasificación de la edición china de la DDC después de que se hayan añadido los indicadores manualmente. El resultado final es un conjunto de entradas automatizadas que poseen significados semánticos independientes, completos y precisos.
  3. Módulo de división automática de palabras: su objetivo es dividir frases automáticamente utilizando el "diccionario de términos", a fin de garantizar y perfeccionar la rapidez y consistencia de la división de los términos. Además, es necesario efectuar una modificación manual de las palabras que se han dividido automáticamente.
  4. Módulo de verificación mediante ordenador y de prueba: este módulo verificará y evaluará los datos que se han procesado automáticamente por el ordenador. Mediante el uso de palabras vacías pueden reducirse los posibles errores humanos que se hayan producido en el proceso de permutación y de eliminación de aquellas divisiones de términos mal efectuadas.
  5. Módulo de producción y ordenación del índice: este módulo completa la rotación de las entradas, relaciona y ordena las entradas, y genera las entradas del índice. También se encargará de borrar todos los indicadores y las señales que se usen para la división.
  6. Módulo de estadísticas y gestión: sus principales funciones incluyen generar los datos estadísticos, mostrar en pantalla la producción de las entradas del índice y controlar el resultado final del índice, que incluye comprobar el número de entradas y el tamaño del índice impreso.

El proceso de preparación del índice permutado de la edición china de la DDC 21 representa la combinación de la tecnología informática con el trabajo humano. Hemos procurado siempre aprovechar las ventajas que ofrece el ordenador para manipular datos, dividir palabras, generar las entradas de los índices, hacer permutaciones, ordenaciones, verificaciones, evaluaciones y presentar los resultados. El esfuerzo humano se ha centrado en el trabajo intelectual. La confección de la edición china de la DDC 21 puede resumirse del siguiente modo:

  1. el programa informático borra automáticamente todas las marcas de escritura incluyendo las notas históricas y metodológicas de la presentación automatizada de la DDC china; después mueve los datos procesados a una base de datos relacional.
  2. El procesamiento manual de los datos incluye:
    1. añadir algunos indicadores especiales de acuerdo a las relaciones entre clases;
    2. usar símbolos especiales para indicar la localización definida o modificada de las palabras o elementos de palabra específicos;
    3. borrar aquellas clases que no van a ser utilizadas en la búsqueda, d) corregir o reescribir una mínima parte de las entradas cuando el añadir símbolos especiales resulta demasiado complicado.
  3. Después de haber añadido manualmente los símbolos especiales, el programa de ordenador genera frases que tienen significados semánticos independientes, completos y precisos, e incluye una o más entradas de clase, notas de alcance y de uso.
  4. El programa de ordenador divide automáticamente las frases de entrada usando un "diccionario de términos".
  5. Los editores del índice añaden algunas palabras que no se pueden dividir automáticamente debido a la limitación del "diccionario de términos". Estas palabras se mezclarán con los demás puntos de acceso en el índice.
  6. Después de la comprobación y prueba automática, es necesario realizar un control de calidad humano de las entradas del índice, basado en la comparación de las entradas con el sistema de clasificación. (
  7. El programa de ordenador produce entradas de índice, entradas ordenadas y permutadas, e imprime el borrador del índice. El borrador es corregido posteriormente por un equipo humano. (
  8. El ordenador envía el producto final a una impresora láser. Este producto final es comprobado una vez más por los editores.

Traducido por: Jesús Jiménez Pelayo

Referencias:

Hou Hanqing, et al. Computer-aided compilation of permuted index of Chinese Thesaurus. Journal of Information Science (in Chinese), v.17, no.4 1998.

Wilson, T.D. An introduction to subject indexing. London: Clive, Bingley, 1971.

*    

Latest Revision: June 17, 1999 Copyright © 1995-2000
International Federation of Library Associations and Institutions
www.ifla.org