Posibilidades y límites de los tesauros frente a otros sistemas de organización del conocimiento: folksonomías, taxonomías y ontologías

Soler Monreal, Concha; Gil Leiva, Isidoro

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Revista Interamericana de Bibliotecología

Print version ISSN 0120-0976On-line version ISSN 2538-9866

Rev. Interam. Bibliot vol.33 no.2 Medellín July/Dec. 2010

INVESTIGACIONES

Posibilidades y límites de los tesauros frente a otros sistemas de organización del conocimiento: folksonomías, taxonomías y ontologías

Possibilities and limitations of thesauri in comparison with other systems of knowledge organization: folksonomies, taxonomies and ontologies

**Concha Soler Monreal; ***Isidoro Gil Leiva

** Doctora en Documentación por la Universidad Politécnica de Valencia. Valencia, España. Profesora asociada, Departamento de Historia de la Ciencia y Documentación, Universidad de Valencia. Valencia, España. m.concepcion.soler@uv.es

*** Doctor por la Universidad de Murcia, Programa Técnicas y Métodos Actuales en Información y Documentación. Profesor Titular, Facultad de Comunicación y Documentación, Universidad de Murcia. Murcia, España. isgil@um.es

Resumen

A partir de variables tales como objetivo, origen, entorno, estructura, productores y costos de elaboración, se realizó un análisis comparativo entre tesauros, folksonomías, taxonomías y ontologías como sistemas de organización y representación del conocimiento. Aunque estas herramientas comparten el mismo objetivo, sus características están en relación directa tanto con sus aplicaciones como con su complejidad. Los resultados han sido sistematizados en tablas duales. Se concluye que los ambientes digitales han propiciado la reutilización y adaptación de herramientas tradicionales de representación del conocimiento, como ocurre con las taxonomías y folksonomías; han permitido el paso natural de algunas herramientas del mundo analógico al electrónico, como son los tesauros; y han propiciado el desarrollo de otras nuevas, como es el caso de las ontologías. También se pone de presente que estos sistemas de organización y representación del conocimiento no son incompatibles entre sí, y que de hecho, pueden incorporarse simultáneamente en el diseño de una misma herramienta web.

Palabras clave: tesauros, folksonomías, taxonomías, ontologías, lenguajes de representación del conocimiento, análisis comparativo.

Cómo citar este artículo: SOLER MONREAL, Concha y GIL LEIVA, Isidoro. Posibilidades y límites de los tesauros frente a otros sistemas de organización del conocimiento: folksonomías, taxonomías y ontologías. Revista Interamericana de Bibliotecología, Jul.–Dic. 2010, vol. 33, no. 2, p. 361–377.

Abstract

On the basis of such variables as objective, source, environment, structure, producers and elaboration costs, a comparative analysis was made among thesauri, folksonomies, taxonomies and ontologies as systems of knowledge organization and representation. Although these tools share the same objective, their characteristics are in direct relationship with their application and their complexity. The results were systematized in dual tables. The conclusion was arrived at that digital environments have stimulated the reuse and adaptation of traditional tools of knowledge representation, as it happens with taxonomies and folksonomies; they have allowed for a natural transference of some tools from the analogical to the electronic world such as thesauri, and they have promoted the development of other new tools such as ontologies. It is also remarked that these systems of knowledge organization and representation are not compatible among them and that, in fact, can be simultaneously incorporated in the design of one and the same web tool.

Key words: thesauri, folksonomies, taxonomies, ontologies, knowledge representation languages, comparative analysis

How to cite this article: SOLER MONREAL, Concha, y GIL LEIVA, Isidoro. Possibilities and limitations of thesauri in comparison with other systems of knowledge organization: folksonomies, taxonomies and ontologies. Revista Interamericana de Bibliotecología, Jul.–Dic. 2010, vol. 33, no. 2, p. 361–377

1. Introducción

El ser humano comenzó hace miles de años a generar, representar y transferir conocimiento. Cámara de la Fuente (2004) señala los recursos usados en la representación del conocimiento, a saber: recursos auditivos (sonidos, discurso hablado y música), recursos visuales (imágenes, iconos o símbolos), y recursos lingüísticos (lenguaje hablado y escrito). Así, para una adecuada organización y acceso a dichos recursos se han ido construyendo distintas herramientas, basadas en mayor o menor medida en representaciones conceptuales reducidas directamente de la representación del conocimiento plasmada en los documentos. Ejemplos de instrumentos para la organización y accesibilidad del conocimiento son los tesauros, de los que hacen uso desde la década de 1950 los profesionales de la información y la documentación; las taxonomías, utilizadas de nuevo desde mitad de la década de 1990 en Internet para la organización de contenidos; las folksonomías, etiquetado de información a través de palabras en lenguaje natural en entornos sociales digitales; y las ontologías, surgidas en la década de 2000, que permiten tanto la organización de conocimiento como su reutilización y la inferencia de otro nuevo.

El uso cada vez mayor de determinados sistemas de organización del conocimiento en el entorno digital (taxonomías, anillos de sinónimos u ontologías) ha llevado a su inclusión en las normas, como la norteamericana Z39.19:2005, la norma británica BS 8723–3:2007 y la próxima ISO 25964–2. Así, estas normas ya no están dedicadas exclusivamente a los tesauros sino que se extienden a otros vocabularios controlados, ampliando su radio de acción a otras formas de organización del conocimiento y al intercambio de datos estandarizados.

Como puede verse en la figura 1, estas formas de representación del conocimiento emplean diferentes estrategias, que van desde la utilización de técnicas muy sencillas (el uso de palabras claves en las foklsonomías) hasta otras más complejas (el uso de axiomas para realizar inferencias en las ontologías).

Daconta, Obrst y Smith (2003, p. 157), Davis (2006, p. 25), Zeng (2008, p. 161) y Pastor Sánchez (2009, p.73), para establecer los niveles de complejidad de los distintos sistemas para la organización del conocimiento han diseñado figuras similares, fundamentadas en una línea progresiva ascendente que representa desde lo más simple hasta lo más complejo. La figura 2 es una cuasirreproducción de la figura elaborada por M.L. Zeng, si bien se han incorporado ideas de las otras ilustraciones mencionadas, como por ejemplo la simplificación de la variable Estructura incluyendo + ó – semántica (en Davis y Pastor Sánchez), así como otras formas de organización del conocimiento no fijadas por Zeng, como las folksonomías.

El objetivo principal de este trabajo fue analizar las posibilidades y límites de las cuatro formas de organización y representación del conocimiento ya mencionadas, concretamente enfrentando los tesauros con las folksonomías, taxonomías y ontologías. La metodología ha consistido en un análisis comparativo de estas formas de organización y representación a partir de variables como objetivo, origen, entorno, estructura, productores, costes de elaboración, cobertura, lenguaje, autoría, tipos de relaciones, usuarios, entre otras. Los resultados obtenidos se han sistematizado de manera sintética en tablas duales para alcanzar una mayor comprensión.

2. Tesauros versus folksonomías

Folksonomía es el resultado del marcado libre de la información personal y los objetos (cualquier cosa con dirección url) para su propia recuperación. El etiquetado se da en entornos digitales sociales (generalmente abiertos a otros). La folksonomía se crea a partir del acto del etiquetado por parte de la persona que consume información (Vander Wal, 2007); y Serrano Cobos (2007) ha señalado que son los internautas los que clasifican los contenidos de una manera espontánea por medio de etiquetas para definir los objetos. Como ejemplos, ver figuras 3 y 4.

Las folksonomías, según Moreiro González (2006, p. 101), deben cumplir una serie de condiciones:

1. Cualquier persona las puede hacer

2. Se requieren muy pocas reglas para crearlas

3. Se producen sin interés propio

4. Las ventajas de los usuarios crecen con la agregación

5. No se rompen cuando hay datos incompletos

6. Se presentan en forma de conjuntos y no de jerarquías

7. No están diseñadas a priori, lo que las hace más flexibles

8. No pertenecen a nadie, pues nadie las centraliza ni controla

9. Son relevantes para los propósitos e intereses de un sitio web.

Asimismo, cuentan con las siguientes características y ventajas:

• Bajo coste

• Se trata de sistemas de clasificación muy simples

• Requieren poco esfuerzo

• No están estructuradas

• Los términos no tienen relaciones entre sí

• Permiten la navegación por las etiquetas relacionadas

• Se ofrece la posibilidad de ver los elementos etiquetados que están relacionados, por lo que se da la posibilidad de hallar cosas que no se buscaban

• Su uso es sencillo

• La presentación en forma de tags o etiquetas es visualmente atractiva

• El trabajo de descripción lo hacen los usuarios

• Reflejan la frescura y dinamicidad de la lengua

• Proporcionan la libertad de utilizar las palabras clave sin necesidad de estar de acuerdo con otra persona

• Permiten la coexistencia de diversos puntos de vista

• Permiten la unión de artículos mediante links

• Implican activamente a los usuarios en el sistema de organización.

Por otro lado, las folksonomías pueden presentar algunos inconvenientes, la mayoría derivados de su naturaleza, ya que se recurre al lenguaje natural para la conformación de las etiquetas:

• Alta ambigüedad. Por ejemplo, la palabra ''coral'' puede referirse a un grupo de personas que canta o a un elemento de la naturaleza

• Ausencia total del control de la sinonimia. Los mismos recursos pueden describirse con términos diferentes. Por ejemplo, para referirse al mismo objeto material pueden utilizarse las etiquetas ''coche'', ''automóvil'', ''utilitario'', etc.

• No diferencia entre singular y plural. Podemos encontrarnos ''carro'' y ''carros''

• Empleo de abreviaturas y acrónimos como etiquetas

• Las etiquetas, en general, se construyen con unitérminos, así que no es posible construir expresiones complejas

• Solamente existen relaciones asociativas entre los términos, por co–aparición

• Aumenta la exhaustividad en la recuperación pero disminuye la precisión

• El tamaño visual puede inducir a utilizar una etiqueta para describir los contenidos, en detrimento de otra más adecuada

• Son más apropiadas para sistemas de navegación que para sistemas de búsqueda.

Posiblemente, la única similitud importante entre los tesauros y las folksonomías es su capacidad para la organización y representación del conocimiento, mientras que una diferencia de peso es que, mientras los tesauros persiguen alejarse de la ambigüedad terminológica por medio de la normalización y el control del vocabulario para conseguir un mejor almacenamiento y recuperación de la información, en las folksonomías, en cambio, los internautas emplean su propio lenguaje natural. En la Tabla 1 se esquematiza un conjunto considerable de divergencias entre ambas formas. La comparación entre las folksonomías y los tesauros puede hacerse extensible a cualquier tipo de vocabulario controlado.

3. Tesauros versus taxonomías

El término taxonomía procede del griego taxis, ordenación y nomos, norma. El primero en utilizar el término fue Aristóteles, al categorizar objetos científicos, aunque Grove (2003, p. 2771) señala que ya en el Génesis se establece una taxonomía en la genealogía de los descendientes de Ham. Lineo introdujo la práctica de dividir los seres vivos, a partir de la cual la taxonomía adquirió relevancia como el apartado de la biología que trabaja en la clasificación de organismos en función de sus características. Esta manera sistemática de estructurar el conocimiento ha sido adoptada en los ambientes digitales y así, desde la década de 1990 se utiliza para organizar y presentar contenidos.

La norma ANSI/NISO Z39.19:2005 define taxonomía como ''(...) una colección de términos de un vocabulario controlado organizados en una estructura jerárquica. Ese término en una taxonomía tiene una o más relaciones padres/hijos (broader/narrower) hacia otros términos en la taxonomía''. Una taxonomía es el resultado de clasificar de acuerdo con unas características comunes. Las primeras taxonomías sirvieron para clasificar seres vivos desde la botánica o la biología, principalmente a partir del XVIII. En los últimos años, las taxonomías se han venido usando en sitios Web y en entornos corporativos para la organización de su información. Según Fernández Hernández (2007), los elementos que las caracterizan son la jerarquía para la estructuración de los contenidos y la navegabilidad por ellos. Gilchrist (2001, p. 34) habla de que a la hora de organizar, presentar o facilitar la búsqueda de información en entornos web se pueden distinguir tres ''enfoques taxonómicos'' que equivalen a tres clases de taxonomías funcionales:

1. Taxonomía como método de presentación. Cita como ejemplo la clasificación de Yahoo que se presenta en la figura 5, la cual permite a los usuarios llegar a un asunto concreto de su interés tras pasar por distintos estratos:

2. Taxonomía para la organización de grandes volúmenes de datos, especialmente en servicios de noticias, para la indización automática y la recuperación guiada. ''Lo que el usuario puede ver se parece mucho a una clasificación convencional pero lo que se asigna a cada término es un complejo conjunto de reglas semánticas''. Ver ejemplo en la figura 6.

3. Taxonomías empleadas en webs de empresas con objeto de mejorar el acceso a través de portales de información empresarial. Como ejemplo, la figura 7 presenta un extracto de la estructura del portal de la empresa Iberdrola:

La semejanza más importante entre los tesauros y las taxonomías es que ambos usan la jerarquía, si bien las taxonomías carecen de relaciones asociativas y de equivalencia. Además, el diseño de las taxonomías está basado en un lenguaje claro, conciso y conocido por los internautas, dirigido a facilitar su navegación, mientras que la construcción de tesauros se fundamenta más en terminología consensuada, normalizada y controlada. La tabla 2, presenta una comparación detallada sobre estos dos lenguajes.

4. Tesauros versus ontologías

Posiblemente la definición más conocida y citada es la de Gruber (1993, p. 139), según la cual una ontología es la ''(...) especificación explícita de una conceptualización''. Las ontologías han ido naciendo en entornos digitales con el fin de organizar, explotar, compartir y reutilizar información.

En Gil Leiva (2008, p. 226) aparece una clasificación de las ontologías de acuerdo con dos dimensiones a partir de van Heijst, Schreiber y Wielinga (1997, p. 193–194), según se aprecia en la tabla 3.

Gómez–Pérez, Fernández–López y Corcho (2004, p. 32) hablan de ontologías ligeras cuando contienen la definición, la taxonomía, las propiedades y relaciones de los conceptos, y de ontologías pesadas cuando, además de los componentes anteriores, incluyen axiomas y restricciones.

Las diferencias entre tesauros y ontologías se sistematizan en la tabla 4, elaborada a partir de elementos aportados por Schwarz (2005, p. 17) y Gil Leiva (2008, p. 232):

5. Conclusiones

Según lo analizado hasta ahora se puede señalar que las folksonomías parecen una adaptación informal a los entornos digitales de la indización con unitérminos (palabras clave, es decir, lenguaje natural), concebida por Mortimer Taube en la década de 1950; en cambio, las taxonomías son también una reutilización de las formas de hacer de la biología, que se dedica a nombrar y clasificar los seres vivos, pero en este caso se usan para la categorizar contenidos en la web. Del mismo modo, los tesauros están pasando al entorno digital de una manera natural mediante modelos o lenguajes de marcado específicos para tesauros, como por ejemplo, Skos–core o Zthes. Estos lenguajes garantizan su organización, representación y el intercambio de datos estandarizados. O por el contrario, en estos entornos digitales han nacido otras formas de representación y explotación del conocimiento, como las ontologías. Por otro lado, aunque estas cuatro herramientas tienen como objetivo la organización del conocimiento presentan características que están en relación directa tanto con sus aplicaciones como con su complejidad. Así, mientras que una taxonomía es una clasificación jerárquica de sus elementos, en los tesauros, además de la jerarquía, hay otras relaciones para la conexión de dichos elementos. Del mismo modo, una ontología posee taxonomías para la organización de conocimiento y puede disponer igualmente de un tesauro, si bien la diferencia mayor entre las ontologías y el resto de formas de organización es su capacidad de representar e interconectar mundos a través de descripciones, relaciones, atributos y valores para inferir.

Los ambientes digitales han propiciado la reutilización de herramientas tradicionales de representación del conocimiento, el paso natural de unas herramientas del mundo analógico al electrónico y el desarrollo de otras nuevas. Además, las herramientas analizadas no son incompatibles entre sí, porque en el diseño de una determinada herramienta web pueden estar presentes a la vez varias de estas formas de organización y representación del conocimiento, como una taxonomía para estructurar y presentar contenidos, un tesauro, o incluso una ontología para facilitar la búsqueda de información, y las folksonomías por las cuales los internautas etiquetan dicho entorno digital.

Referencias Bibliográficas

1. ANSI/NISO Z39.19:2005. Guidelines for the construction, format and management of monolingual controlled vocabularies. 4. ed. Bethesda, Md .: National Information Standards Organization, 2005. 184 p. [ Links ]

2. CÁMARA DE LA FUENTE, L. 2004. La representación lingüística del conocimiento y su relevancia en la ingeniería lingüística [on line]. Hipertext.net, 2004, no 2. [citado marzo 9, 2010].Disponible en la Web: http://www.hipertext.net [ Links ]

3. DACONTA, M.C., OBRST, L.J. y SMITH, K.T. 2003. The semantic web: a guide to the future of XML, web services, and knowledge management. Indianapolis: Wiley Publishing, 2003. [ Links ]

4. DAVIS, M. 2006. Semantic wave 2006: executive guide to the business value of semantic technologies. [en línea] USA : Semantic Interoperability Community of Practice, 2006. 56 p. (SICoP white paper series, module 2). [citado mayo 4, 2010] Disponible en Internet: http://web–services.gov/SICOPsemwave2006v1.0.doc [ Links ]

5. FERNÁNDEZ HERNÁNDEZ, A. 2007. Organización de los contenidos en los sitios web: las taxonomías. Acimed [en línea], 2007, vol.15, no. 5 [citado septiembre 27, 2010]. Disponible en: http://bvs.sld.cu/revistas/aci/vol15_05_07/aci12507.htm [ Links ]

6. GIL LEIVA, I. 2008. Manual de indización: teoría y práctica. Gijón: Trea, 2008. 429 p. Disponible parcialmente en Internet: http://webs.um.es/isgil/ [ Links ]

7. GILCHRIST, A. 2001. Getting the measure of taxonomies. Information World Review, 2001, no. 172, p. 34. [ Links ]

8. GÓMEZ–PÉREZ, A., FERNÁNDEZ–LÓPEZ, M. y CORCHO, M. 2004. Ontological engineering: with examples from the areas of knowledge management, e–commerce and semantic web. Londres: Springer Verlag, 2004. 403 p. [ Links ]

9. GROVE, A. 2003. Taxonomy. Encyclopedia of library and information science. 2. ed. New York: Marcel Dekker, 2003, p. 2770–2777. [ Links ]

10. GRUBER, T. 1993. A translating approach to portable ontology specifications. Knowledge Acquisition, 1993, vol. 5, no. 2, p. 199–220. [ Links ]

11. MARSHALL, Thomas Humprey; y BOTTOMORE, Thomas Burton. 1998. Ciudadanía y clase social. España: Alianza, 1998. 149 p. [ Links ]

12. MOREIRO GONZÁLEZ, J.A. 2006. La representación y recuperación de los contenidos digitales: de los tesauros conceptuales a las folksonomías. En: TRAMULLAS, J. (coord.). Tendencias en documentación digital. Gijón: Trea, 2006, p. 81–108. [ Links ]

13. PASTOR SÁNCHEZ, J.A. 2009. Diseño de un sistema colaborativo para la creación y gestión de tesauros en Internet basado en SKOS. [en línea]. Murcia : Universidad de Murcia, 2009. 296 p. (Tesis doctoral). [citado mayo 4, 2010]. Disponible en la Web: http://www.tdr.cesca.es/TDR–0403109–113737/index_cs.html [ Links ]

14. SCHWARZ, K. 2005. Domain model enhanced search: a comparison of taxonomy, thesaurus and ontology. [en línea], Netherlands: University of Utrecht, 2005. 81 p. (Thesis Master) [citado mayo 19, 2010]. Disponible en Internet: http://homepages.cwi.nl/~media/publications/masterthesis_kat_domainmodel_2005.pdf [ Links ]

15. SERRANO COBOS, J. 2007. Tags, folksonomies y bibliotecas. Anuario ThinkEPI, [en línea] 2007, vol. 1, p. 71–73. [citado enero 6, 2010]. Disponible en la Web: http://www.thinkepi.net/repositorio/tags–folksonomies–y–bibliotecas/ [ Links ]

16. VAN HEIST, G.; SCHREIBER, A.T.; WIELINGA, B.J. 1997. Using explicit ontologies in KBS development. International Journal of Human–Computer Studies, 1997, vol. 47, p. 183 – 292. [ Links ]

17. VANDER WAL, T. 2007. Folksonomy [en línea] Thomas Vander Wal's, vanderwal.net: blog. February 2, 2007. [citado junio 5, 2010]. Disponible en: http://vanderwal.net/folksonomy.html [ Links ]

18. ZENG, M.L. 2008. Knowledge organization systems (KOS). Knowledge Organization, 2008, vol. 35, no. 2–3, p. 160–182. [ Links ]

Artículo recibido: 8 de junio de 2010. Aprobado: 19 de octubre de 2010.

Pie de páginas

Artículo derivado de la tesis doctoral ''Evaluación de vocabularios controlados en la indización de documentos mediante índices de consistencia entre indizadores'', dirigida por el Dr. Isidoro Gil Leiva. Universidad Politécnica de Valencia. Valencia, España.

Anexos