1. CONCEPTO DE TESAURO

Los tesauros han sido instrumentos profusamente analizados y estudiados desde su aparición, en los años 50 del siglo XX, por los investigadores de las Ciencias Documentales. Todos los autores coinciden en que los tesauros son lenguajes documentales postcoordinados, artificiales, elaborados a priori, y cuyo fin es facilitar, mediante distintos recursos, la eficaz recuperación de documentos que dan respuesta a las demandas de información realizadas por los usuarios. Hay coincidencia en cuanto a su estructura, tipología, forma de elaboración y de utilización.

1.1. DEFINICIONES DE TESAURO

Existen multitud de definiciones de tesauro, porque la mayor parte de los especialistas en lenguajes documentales han reflejado en sus obras su propia definición. Para analizar el concepto, se revisan algunas definiciones desde una perspectiva diacrónica.
En 1974, la ISO define el tesauro desde dos ángulos: “Desde el punto de vista de su función, un tesauro es un instrumento de control terminológico utilizado al trasladar a un lenguaje más estricto, el lenguaje documental, la lengua natural empleada en los documentos y por los indizadores o los usuarios; desde un punto de vista estructural, es un vocabulario, controlado y dinámico de términos que mantienen entre ellos relaciones semánticas y genéricas, aplicado a un campo particular del conocimiento”.
En la obra de 1987 de Van Slype: “Un thesaurus es una lista estructurada de conceptos, destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado, y a ayudar al usuario en la indización de los documentos y de las consultas”.
La AFNOR dice que un tesauro es “un lenguaje documental fundado sobre la estructuración jerarquizada de uno o varios dominios del conocimiento y en el cual las nociones son representadas por términos de la lengua natural y las relaciones entre nociones por signos convencionales”.
En la Norma UNE 50-106-90: “vocabulario de un lenguaje de indización controlado, organizado formalmente con el objeto de hacer explícitas las relaciones, a priori, entre conceptos”.
Hudon en 1997: “el tesauro es un lenguaje documental fundamentado sobre la estructuración jerarquizada de uno o de varios dominios del conocimiento, en el que los conceptos son representados por términos del lenguaje natural y las relaciones entre términos por signos convencionales.” Posteriormente añade: “el tesauro puede ser desarrollado en relación directa con una base de datos particular, o como útil de referencia independiente que sirva de reserva terminológica o de base de conocimientos”.

2. CARACTERÍSTICAS Y RASGOS FUNDAMENTALES DEL TESAURO

Los rasgos fundamentales que podemos extraer de las definiciones, son los siguientes:
-El tesauro es un instrumento de control terminológico: pretende representar de forma unívoca el contenido de los documentos y de las consultas; ya hemos establecido la importancia que en los lenguajes documentales tiene la existencia de univocidad semántica, y en el tesauro se busca conseguirla totalmente, de forma que no exista duda sobre qué descriptor utilizar para indizar un determinado concepto, y a qué concepto nos referimos cuando se utiliza un descriptor en concreto. La ambigüedad de los términos del lenguaje natural se neutraliza después de analizarlo con el tesauro.
-Es un lenguaje de indización: sus términos se han extraído del lenguaje natural y se utilizan para representar los temas de los documentos.
-Generalmente es un lenguaje especializado: se elabora para un determinado campo del conocimiento.
El hecho de que sea un lenguaje específico en una materia -y no un lenguaje universal- tiene como consecuencia que puede profundizarse más en esa materia, abarcándola desde sus aspectos más generales a los más específicos y concretos, algo que los lenguajes más amplios no pueden conseguir, dado que su extensión llegaría a ser inmensa y su proceso de elaboración muy costoso. En otras definiciones se dice que “es un lenguaje propio de un sistema documental determinado”, con lo que la especialización se centraría en los temas que se traten en un determinado sistema documental. Frecuentemente se elaboran tesauros especialmente para una institución u organismo concreto, centrándose en sus necesidades específicas, para aprovechar al máximo sus posibilidades. Estos son los más eficaces para el almacenamiento y recuperación de la información, puesto que antes de su elaboración se realizan estudios de necesidades del personal de esa determinada institución.
-Es un lenguaje dotado de estructura: existe una estructura combinatoria, una estructura jerárquica y una estructura alfabética permutada o no permutada. Esta estructura del tesauro se forma a partir de las unidades léxicas de que se compone, y de las relaciones que se establecen entre ellas.
-Es un lenguaje elaborado con anterioridad a su uso: se construye a priori, antes de su uso en la indización, al contrario que los descriptores libres, que se elaboran a la vez que se utilizan.
-Van Slype aporta una peculiaridad: “…destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indización de los documentos y de las consultas”. Para ofrecer esta ayuda es por lo que el tesauro contiene unos términos concretos, que están estructurados de una determinada forma, y tiene una forma de uso igualmente determinada. Es lo que lo diferencia de los otros lenguajes postcoordinados controlados, y de los lenguajes postcoordinados libres. Los términos que forman el tesauro y las relaciones semánticas que existen entre ellos se destinan a facilitar al usuario la labor de indizar los documentos y las consultas, como afirma Van Slype: enviar de un término con prohibición de uso al término (s) permitidos, permitir al usuario realizar búsquedas mediante un descriptor determinado, y si con éste no obtiene los resultados deseados indicarle qué otros descriptores, más genéricos o más específicos, son los adecuados; sugerirle nuevos términos en los que el usuario no había pensado; ayudar a buscar información en varios idiomas
Estas son formas de ayudas al usuario que no están disponibles en otros lenguajes documentales. La única dificultad es que, si el usuario final quiere realizar él mismo la búsqueda de información debe conocer algo el tesauro, su manejo y su estructura, para aprovecharlas eficazmente.
-Su objetivo es ayudar a recuperar rápida y eficazmente los documentos deseados, para que la necesidad de información del usuario sea solventada.
En los tesauros multilingües se aporta algo más: el conocimiento de qué términos debemos usar para designar un concepto en cualquiera de los idiomas que cubre el tesauro,
lo que facilita la indización y la búsqueda de información en esos idiomas, con la seguridad de que utilizamos los términos correctos, cuyo significado es equivalente al que conocemos en nuestro idioma. Permite al usuario conocer la estructura del campo científico y las relaciones entre los términos, en cualquiera de esos idiomas.
La indización mediante la postcoordinación de los términos dota a este lenguaje de una flexibilidad:
podemos asignar un número más o menos extenso de descriptores para representar el contenido conceptual de un documento de la mejor forma posible; la indización se facilita porque todos los descriptores tienen el mismo valor: solamente se yuxtaponen en el campo que corresponda dentro del registro documental. En la búsqueda de información, los descriptores se pueden combinar entre sí en cualquier orden, número y mediante cualquier combinación entre ellos, para definir de la mejor forma posible el tema planteado por el usuario, y para ello podemos recurrir de nuevo a las ayudas de que dispone. En general, los lenguajes postcoordinados tienen mayor potencia semántica que los precoordinados, lo que se une al resto de las posibilidades de los tesauros.
La posibilidad de profundizar en un determinado sector de la ciencia, la flexibilidad en la indización y en la búsqueda, la existencia de ayudas para la localización de los términos correctos de indización y el intento de sistematización de un determinado campo científico o técnico, son ventajas del tesauro frente al resto de los lenguajes documentales.

3. TIPOLOGÍA DE TESAUROS

Hay gran parte de la estructura, funciones y posibilidades que son comunes a todos ellos. Estos criterios son los siguientes:

3.1. SEGÚN LA COBERTURA O EL ÁMBITO TERRITORIAL al que está destinado el tesauro:

· TESAUROS INSTITUCIONALES: elaborados para ser utilizados en una institución concreta. Están adaptados al área temática y necesidades de dicha institución.
·TESAUROS NACIONALES: se conciben para utilizarse en el ámbito de una nación, en diversos centros, repartidos por todo el país, de un sistema o red documental.
·TESAUROS INTERNACIONALES: se elaboran con la perspectiva de su utilización de centros de distintas nacionalidades. Suelen ser la UNESCO, la FAO, etc.
En el mundo globalizado en que nos encontramos actualmente, esta tipología de tesauros ha perdido algo de su sentido. Ahora podemos acceder, a través de Internet, a cientos de tesauros sobre temáticas diversas, elaborados en cualquier país del mundo, y quizás concebidos para un determinado ámbito y usuarios, y adquirirlo o/y utilizarlo en España si lo creemos adecuado a las características de nuestro centro y de nuestros usuarios.

3.2. SEGÚN EL NÚMERO DE IDIOMAS en que los descriptores pueden ser consultados:

· TESAUROS MONOLINGÜES: el tesauro está solamente en un idioma.
· TESAUROS BILINGÜES: cada descriptor de un idioma tiene un descriptor equivalente en el otro, y la estructura semántica también es la misma en cada versión lingüística. En cada una de estas versiones aparecen, los descriptores o términos preferentes en ambos idiomas, de forma que es posible la indización de conceptos en cualquiera de ellos. Los no-descriptores no suelen aparecer más que en el idioma de la versión que estemos utilizando.
· TESAUROS TRILINGÜES: ídem, en tres idiomas.
· TESAUROS POLILINGÜES O MULTILINGÜES: se utiliza este nombre para denominar a tesauros con versiones en varios idiomas.

3.3. SEGÚN LAS MATERIAS QUE TRATA y/o su forma de tratarlas:

· MEGATESAUROS: tesauros que abarcan todas las áreas de la Ciencia. Pueden compararse con las clasificaciones universales. Su nivel de profundidad en el tratamiento de cada una de ellas, es mucho menor que en tesauros especializados.
· MACROTESAUROS: abarcan varias áreas temáticas, la mayor parte de las veces tienen alguna relación entre sí. García Gutiérrez afirma que “corresponden a las distintas grandes ramas del saber: Ciencias Sociales, Ciencias Aplicadas, etc., o bien a combinaciones de diversas disciplinas: Economía y Derecho, etc”.
· TESAUROS: están especializados en un sector concreto de la Ciencia. También contienen términos de otras áreas pero de forma tangencial, en tanto que pueden ser necesitados para la indización de documentos en el área en el que el tesauro está especializado.
· MICROTESAUROS: Tesauros muy especializados. En algunos casos, se utiliza este nombre para designar las partes en que se divide un megatesauro o un macrotesauro: cada microtesauro es un tesauro completo, pero existen relaciones entre los términos de distintos microtesauros cuando éstos forman parte de un macrotesauro.

3.4. SEGÚN SU SOPORTE FÍSICO:

· TESAUROS IMPRESOS: los más tradicionales, impresos en papel. Son los que se han venido elaborando y utilizando desde los años 50 hasta hoy día. En los últimos años van dejando paso a los automatizados.
· TESAUROS ELECTRÓNICOS: Pueden ser implementados en forma de archivo plano, integrados en la estructura de una base de datos, o en hipertexto. En ocasiones un mismo tesauro puede encontrarse tanto en papel como en soporte electrónico, siendo ambas versiones casi idénticas, con la única diferencia del soporte y la forma de acceso que éste conlleva. En otros casos -los más novedosos- se elaboran únicamente con vistas a su utilización automatizada, con lo que se pueden incluir nuevos recursos y nuevos tipos de presentación de los términos.

3.5. POR EL TIPO DE ORGANIZACIÓN de los descriptores:

· TESAUROS TEMÁTICOS: los descriptores se agrupan por temas.
· TESAUROS FACETADOS: los descriptores se organizan en grupos por facetas.
· TESAUROS MIXTOS O HÍBRIDOS: en ellos se encuentran grupos temáticos, y dentro de cada uno existen subdivisiones por facetas.