<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1794-1237</journal-id>
<journal-title><![CDATA[Revista EIA]]></journal-title>
<abbrev-journal-title><![CDATA[Rev.EIA.Esc.Ing.Antioq]]></abbrev-journal-title>
<issn>1794-1237</issn>
<publisher>
<publisher-name><![CDATA[Escuela de ingenieria de Antioquia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1794-12372014000200005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[PROPUESTA PARA EXTENDER SEMÁNTICAMENTE EL PROCESO DE RECUPERACIÓN DE INFORMACIÓN]]></article-title>
<article-title xml:lang="en"><![CDATA[PROPOSAL TO SEMANTICALLY EXTEND THE INFORMATION RETRIEVAL PROCESS]]></article-title>
<article-title xml:lang="pt"><![CDATA[PROPOSTA PARA ESTENDER SEMÂNTICAMENTE O PROCESSO DE RECUPERAÇÃO DE INFORMAÇÃO]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Solarte Pabón]]></surname>
<given-names><![CDATA[Oswaldo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Millán González]]></surname>
<given-names><![CDATA[Martha Elena del Socorro]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad del Valle Escuela de Ingeniería de Sistemas y Computación ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad del Valle Escuela de Ingeniería de Sistemas y Computación ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2014</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2014</year>
</pub-date>
<numero>22</numero>
<fpage>51</fpage>
<lpage>65</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S1794-12372014000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S1794-12372014000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S1794-12372014000200005&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En los modelos clásicos de recuperación de información los documentos se representan mediante un conjunto de términos o palabras clave. Una desventaja de esta representación es que los resultados de una consulta se limitan solo a la frecuencia de aparición de los términos. No se tiene en cuenta el significado de los términos ni las relaciones semánticas que puedan existir entre los documentos. Una de las alternativas para resolver este problema es usar tecnologías de la web semántica con el objetivo de asignarle a los datos un significado bien definido. En este artículo se describe una propuesta para extender el proceso de recuperación de información usando tecnologías de la web semántica. Los documentos se enriquecen semánticamente por medio de anotaciones que se obtienen a partir de una ontología de dominio. La recuperación de información extendida semánticamente tiene en cuenta tanto las palabras clave expresadas en la consulta del usuario como también su significado, el cual se representa mediante una ontología. La recuperación de información extendida semánticamente mejora los resultados en términos de precision y recall en comparación con los obtenidos en la recuperación de información clásica.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[In classical information retrieval models, documents are represented by a set of terms or keywords. A disadvantage of this representation is that the query results are limited only to the frequency of occurrence of terms. No considers the meaning of terms and semantic relationships that may exist between the documents. One alternative to solve this problem is using Semantic Web technologies in order to assign data a well defined meaning. This article describes a proposal to extend the information retrieval process using Semantic Web technologies. Documents are semantically enriched with annotations that are obtained from domain ontology. The extended semantic retrieval takes into account both, keywords expressed in the user query as well, its meaning, which is represented by ontology. The extended semantic retrieval improves results in terms of precision and recall compared with those obtained in classic information retrieval.]]></p></abstract>
<abstract abstract-type="short" xml:lang="pt"><p><![CDATA[Em modelos convencionais de recuperação de informação os documentos são representados por um conjunto de termos ou palavras-chave. A desvantagem desta representação é que os resultados da consulta são limitados apenas para a frequência de ocorrência dos termos. Não é levado em conta o significado dos termos nem as relações semânticas que possam existir entre os documentos. Uma das alternativas para resolver este problema é a utilização de tecnologias da Web Semântica, com o objetivo de dar aos dados um significado bem definido. Este artigo descreve uma proposta para estender o processo de recuperação de informação utilizando tecnologias de web semântica. Os documentos são semanticamente enriquecidos por anotações que são derivados de uma ontologia de domínio. A recuperação de informação estendida semanticamente leva em conta tanto as palavras-chave expressas na consulta do usuário, bem como o seu significado, que é representado por uma ontologia. A recuperação da informação estendida semântica melhora os resultados em termos de precisão e recall comparados com os obtidos na recuperação de informação convencional.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[recuperación de información (IR)]]></kwd>
<kwd lng="es"><![CDATA[web semántica]]></kwd>
<kwd lng="es"><![CDATA[ontologías]]></kwd>
<kwd lng="es"><![CDATA[anotaciones semánticas]]></kwd>
<kwd lng="en"><![CDATA[Information Retrieval (IR)]]></kwd>
<kwd lng="en"><![CDATA[Semantic Web]]></kwd>
<kwd lng="en"><![CDATA[Ontologies]]></kwd>
<kwd lng="en"><![CDATA[Semantic Annotations]]></kwd>
<kwd lng="pt"><![CDATA[Recuperação da informação (IR)]]></kwd>
<kwd lng="pt"><![CDATA[Web semântica]]></kwd>
<kwd lng="pt"><![CDATA[Ontologias]]></kwd>
<kwd lng="pt"><![CDATA[Anotações semânticas]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">     <p align="center"><font size="4"><b>PROPUESTA PARA EXTENDER SEM&Aacute;NTICAMENTE EL PROCESO DE RECUPERACI&Oacute;N DE INFORMACI&Oacute;N</b></font></p>     <p align="center"><font size="3"><b>PROPOSAL TO SEMANTICALLY EXTEND THE INFORMATION RETRIEVAL PROCESS</b></font></p>     <p align="center"><font size="3"><b>PROPOSTA PARA ESTENDER SEM&Acirc;NTICAMENTE O PROCESSO DE RECUPERA&Ccedil;&Atilde;O DE INFORMA&Ccedil;&Atilde;O</b></font></p>     <p>&nbsp;</p>     <p><b>Oswaldo  Solarte Pab&oacute;n<sup>1</sup>,  Martha Elena  del Socorro Mill&aacute;n  Gonz&aacute;lez<sup>2</sup></b></p>     <p>1 Ingeniero  de sistemas. Mag&iacute;ster en Ingenier&iacute;a de Sistemas y Computaci&oacute;n de la Universidad  del Valle. Profesor de la Escuela de Ingenier&iacute;a de Sistemas y Computaci&oacute;n,  Universidad del Valle. &nbsp;Ed. 331, Segundo  piso Ciudad Universitaria Mel&eacute;ndez. Tel: (572) 321 22 83. Correo electr&oacute;nico: <a href="mailto:oswaldo.solarte@correounivalle.edu.co">oswaldo.solarte@correounivalle.edu.co</a>.    <br> 2 Licenciada  en Matem&aacute;ticas y F&iacute;sica. Mag&iacute;ster en Ingenier&iacute;a Industrial y de Sistemas de la  Universidad del Valle. Mag&iacute;ster en Ingenier&iacute;a del Conocimiento y PhD. en  Inform&aacute;tica de la Universidad Polit&eacute;cnica de Madrid - Espa&ntilde;a. Profesora de la  Escuela de Ingenier&iacute;a de Sistemas y Computaci&oacute;n, Universidad del Valle.</p>     <p>Art&iacute;culo  recibido: 22-IV-2013 / Aprobado: 19-VIII-2014    <br> Disponible  online: 30 de agosto de 2014    ]]></body>
<body><![CDATA[<br> Discusi&oacute;n abierta hasta diciembre de 2015</p> <hr size="1" />     <p><b><font size="3">RESUMEN</font></b></p>     <p>En los modelos cl&aacute;sicos de recuperaci&oacute;n de informaci&oacute;n los documentos se representan mediante un conjunto de   t&eacute;rminos o palabras clave. Una desventaja de esta representaci&oacute;n es que los resultados de una consulta se limitan solo   a la frecuencia de aparici&oacute;n de los t&eacute;rminos. No se tiene en cuenta el significado de los t&eacute;rminos ni las relaciones sem&aacute;nticas   que puedan existir entre los documentos. Una de las alternativas para resolver este problema es usar tecnolog&iacute;as   de la web sem&aacute;ntica con el objetivo de asignarle a los datos un significado bien definido. En este art&iacute;culo se describe   una propuesta para extender el proceso de recuperaci&oacute;n de informaci&oacute;n usando tecnolog&iacute;as de la <i>web</i> sem&aacute;ntica. Los   documentos se enriquecen sem&aacute;nticamente por medio de anotaciones que se obtienen a partir de una ontolog&iacute;a de dominio.   La recuperaci&oacute;n de informaci&oacute;n extendida sem&aacute;nticamente tiene en cuenta tanto las palabras clave expresadas   en la consulta del usuario como tambi&eacute;n su significado, el cual se representa mediante una ontolog&iacute;a. La recuperaci&oacute;n   de informaci&oacute;n extendida sem&aacute;nticamente mejora los resultados en t&eacute;rminos de <i>precision</i> y <i>recall</i> en comparaci&oacute;n con los obtenidos en la recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica.</p>     <p><font size="3"><b>PALABRAS CLAVES</b></font>: recuperaci&oacute;n de informaci&oacute;n (IR); <i>web</i> sem&aacute;ntica; ontolog&iacute;as; anotaciones sem&aacute;nticas.</p> <hr size="1" />     <p><font size="3"><b>ABSTRACT</b></font></p>     <p>In classical information retrieval models, documents are represented by a set of terms or keywords. A disadvantage   of this representation is that the query results are limited only to the frequency of occurrence of terms. No considers   the meaning of terms and semantic relationships that may exist between the documents. One alternative to solve   this problem is using Semantic Web technologies in order to assign data a well defined meaning. This article describes   a proposal to extend the information retrieval process using Semantic Web technologies. Documents are semantically   enriched with annotations that are obtained from domain ontology. The extended semantic retrieval takes into account   both, keywords expressed in the user query as well, its meaning, which is represented by ontology. The extended semantic retrieval improves results in terms of precision and recall compared with those obtained in classic information retrieval.</p>     <p><font size="3"><b>KEY WORDS</b></font>: Information Retrieval (IR); Semantic Web; Ontologies; Semantic Annotations.</p> <hr size="1" />     <p><font size="3"><b>RESUMO</b></font></p>     <p>Em modelos convencionais de recupera&ccedil;&atilde;o de informa&ccedil;&atilde;o os documentos s&atilde;o representados por um conjunto de   termos ou palavras-chave. A desvantagem desta representa&ccedil;&atilde;o &eacute; que os resultados da consulta s&atilde;o limitados apenas para   a frequ&ecirc;ncia de ocorr&ecirc;ncia dos termos. N&atilde;o &eacute; levado em conta o significado dos termos nem as rela&ccedil;&otilde;es sem&acirc;nticas que   possam existir entre os documentos. Uma das alternativas para resolver este problema &eacute; a utiliza&ccedil;&atilde;o de tecnologias da Web   Sem&acirc;ntica, com o objetivo de dar aos dados um significado bem definido. Este artigo descreve uma proposta para estender   o processo de recupera&ccedil;&atilde;o de informa&ccedil;&atilde;o utilizando tecnologias de web sem&acirc;ntica. Os documentos s&atilde;o semanticamente   enriquecidos por anota&ccedil;&otilde;es que s&atilde;o derivados de uma ontologia de dom&iacute;nio. A recupera&ccedil;&atilde;o de informa&ccedil;&atilde;o estendida semanticamente   leva em conta tanto as palavras-chave expressas na consulta do usu&aacute;rio, bem como o seu significado, que   &eacute; representado por uma ontologia. A recupera&ccedil;&atilde;o da informa&ccedil;&atilde;o estendida sem&acirc;ntica melhora os resultados em termos de precis&atilde;o e recall comparados com os obtidos na recupera&ccedil;&atilde;o de informa&ccedil;&atilde;o convencional.</p>     <p><font size="3"><b>PALAVRAS-CHAVE</b></font>: Recupera&ccedil;&atilde;o da informa&ccedil;&atilde;o (IR); Web sem&acirc;ntica; Ontologias; Anota&ccedil;&otilde;es sem&acirc;nticas.</p> <hr size="1" />     ]]></body>
<body><![CDATA[<p><font size="3"><b>1. INTRODUCCI&Oacute;N</b></font></p>     <p>Los  modelos cl&aacute;sicos de recuperaci&oacute;n de informaci&oacute;n se  usan ampliamente como soporte para el  desarrollo de herramientas de b&uacute;squeda<b>. </b>En  estos modelos,  los documentos se representan como un conjunto de t&eacute;rminos  (Baeza-Yates y Ribeiro-Neto, 1999). Los  sistemas desarrollados con base en estos modelos le  permiten al usuario buscar informaci&oacute;n mediante un mecanismo  de consulta basado en palabras clave. Dada una  consulta, se retorna un conjunto de documentos que en  cierta forma satisface las necesidades de informaci&oacute;n del  usuario (TrivikRam, 2007). Al momento de realizar una  consulta, estos modelos se basan en la frecuencia de aparici&oacute;n  de los t&eacute;rminos para asignar cierta importancia a los  documentos. Los resultados obtenidos se muestran en un  orden de relevancia con respeto a los t&eacute;rminos de  consulta. A pesar de que se han construido muchos sistemas  usando los modelos cl&aacute;sicos de recuperaci&oacute;n de informaci&oacute;n,  en estos sistemas se usa &uacute;nicamente la frecuencia de  aparici&oacute;n de los t&eacute;rminos, sin tener en cuenta su  significado (Wei-Wang, Barnaghi y Bargiela 2007).</p>     <p>Una de  las propuestas para mejorar la efectividad de los  resultados obtenidos en los sistemas de recuperaci&oacute;n de  informaci&oacute;n, incluye el uso de tecnolog&iacute;as la <i>web </i>sem&aacute;ntica. La <i>web </i>sem&aacute;ntica es una  extensi&oacute;n de la <i>web </i>actual, en la cual se da un significado, bien definido  a los datos, facilitando a las computadoras y las  personas trabajar en cooperaci&oacute;n (Lee, Hendler y Lassila,  2001). Una de las ventajas que ofrece la <i>web</i> sem&aacute;ntica,  es que se tiene en cuenta el significado de las  palabras dentro de los documentos. De esta forma, al  ofrecer la posibilidad de buscar informaci&oacute;n considerando aspectos  sem&aacute;nticos de los datos, se pueden obtener  mejores resultados en una consulta.</p>     <p>En  este art&iacute;culo se presenta una propuesta para extender  el proceso de recuperaci&oacute;n de informaci&oacute;n usando  tecnolog&iacute;as de la <i>web </i>sem&aacute;ntica. Los  documentos se  enriquecen sem&aacute;nticamente por medio de anotaciones  que se obtienen a partir de una ontolog&iacute;a de  dominio. Las consultas de usuario se expanden a trav&eacute;s  de las propiedades de anotaci&oacute;n e instancias definidas  en la ontolog&iacute;a. En el proceso de b&uacute;squeda de  documentos se combina la recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica  con la recuperaci&oacute;n basada en anotaciones sem&aacute;nticas.  La recuperaci&oacute;n de informaci&oacute;n extendida con  anotaciones sem&aacute;nticas mejora los resultados en t&eacute;rminos  de <i>precision </i>y <i>recall</i>, en  comparaci&oacute;n con los obtenidos  en la recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica.</p>     <p>El  resto del art&iacute;culo est&aacute; organizado de la siguiente manera:  en la secci&oacute;n 2 se presentan algunos trabajos  relacionados, en los cuales se utilizan tecnolog&iacute;as de la <i>web </i>sem&aacute;ntica para mejorar el proceso de  recuperaci&oacute;n de informaci&oacute;n. En la secci&oacute;n 3, se describe un modelo para extender sem&aacute;nticamente el proceso de recuperaci&oacute;n de informaci&oacute;n mediante el uso de anotaciones sem&aacute;nticas. En en la secci&oacute;n 4, un mecanismo autom&aacute;tico para anotar sem&aacute;nticamente documentos de texto. En la secci&oacute;n 5 se describe una estrategia para buscar documentos enriquecidos sem&aacute;nticamente. En la secci&oacute;n 6, la implementaci&oacute;n de un prototipo y las pruebas realizadas. Por &uacute;ltimo, en la secci&oacute;n 7 se presentan las conclusiones y trabajo futuro.</p>     <p><b><font size="3">2. TRABAJOS RELACIONADOS</font></b></p>     <p>En los &uacute;ltimos a&ntilde;os, diferentes trabajos se han   desarrollado buscando mejorar la recuperaci&oacute;n de   informaci&oacute;n usando tecnolog&iacute;as de la <i>web </i>sem&aacute;ntica   (Vallet-Weadon, Fern&aacute;ndez-S&aacute;nchez y Castells-Azpilicueta,   2005; Castells-Azpilicueta, Fern&aacute;ndez-S&aacute;nchez   y Vallet-Weadon<i>, </i>2007; Bhagdev, <i>et al</i>., 2008<i>)</i>. Estos   trabajos se enmarcan dentro del campo de la b&uacute;squeda   sem&aacute;ntica, haciendo referencia a sistemas que usan tecnolog&iacute;as   de la <i>web </i>sem&aacute;ntica para mejorar las diferentes   partes del proceso de recuperaci&oacute;n de informaci&oacute;n. La   b&uacute;squeda sem&aacute;ntica, de acuerdo con Mangold (2007),   se define como el proceso de recuperaci&oacute;n de documentos   que aprovecha el conocimiento de un dominio,   y que se puede formalizar mediante una ontolog&iacute;a. Para   Wei-Wang, Barnaghi y Bargiela (2008), la b&uacute;squeda   sem&aacute;ntica tiene como objetivo mejorar las t&eacute;cnicas y los   m&eacute;todos convencionales de recuperaci&oacute;n de informaci&oacute;n. Por su parte Nagypal (2007), clasifica los sistemas de b&uacute;squeda en dos categor&iacute;as: los que se enfocan en la recuperaci&oacute;n de instancias a partir de una ontolog&iacute;a y los que se enfocan en la recuperaci&oacute;n de documentos. Este art&iacute;culo se enfoca en la segunda categor&iacute;a, y tiene como prop&oacute;sito mejorar la recuperaci&oacute;n de informaci&oacute;n sobre documentos de texto, usando ontolog&iacute;as y anotaciones sem&aacute;nticas. Los sistemas de b&uacute;squeda sem&aacute;ntica orientados a mejorar la recuperaci&oacute;n de documentos se pueden ver como una extensi&oacute;n de la recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica. En estos sistemas, los documentos se anotan sem&aacute;nticamente con base en una ontolog&iacute;a de dominio. El proceso de recuperaci&oacute;n se lleva a cabo haciendo coincidir las consultas de los usuarios con las anotaciones sem&aacute;nticas extra&iacute;das de los documentos (Wei-Wang, Barnaghi y Bargiela,  2008).</p>     <p><b><font size="3">2.1 Criterios para analizar sistemas de b&uacute;squeda sem&aacute;ntica</font></b></p>     <p>Varios autores, Manglod (2007), Wei-Wang,   Barnaghi y Bargiela (2008) y Strasunskas y Tomassen   (2010) han clasificado diferentes sistemas de b&uacute;squeda   sem&aacute;ntica bas&aacute;ndose en un conjunto de criterios que permiten   analizar sus caracter&iacute;sticas m&aacute;s importantes. Con   el objetivo de facilitar el an&aacute;lisis de sistemas de b&uacute;squeda   sem&aacute;ntica orientados a la recuperaci&oacute;n de documentos,   se seleccionaron los siguientes criterios: el nivel de  transparencia   del sistema, el lenguaje de representaci&oacute;n del   conocimiento (<i>RDF, OWL,  DAML+OIL</i>), el mecanismo de   anotaci&oacute;n sem&aacute;ntica y la forma en que el usuario hace las   consultas. El nivel de transparencia se refiere a la forma   de interacci&oacute;n del usuario con el sistema de b&uacute;squeda   sem&aacute;ntica. Esta puede ser invisible, si las capacidades   sem&aacute;nticas est&aacute;n ocultas para el usuario, interactiva, si   el sistema le pide al usuario retroalimentaci&oacute;n para hacer   cambios en la consulta, o h&iacute;brida, si es una combinaci&oacute;n   de las dos anteriores. Por su parte, el mecanismo de anotaci&oacute;n   puede ser manual, semiautom&aacute;tico o autom&aacute;tico. La anotaci&oacute;n manual es un proceso dif&iacute;cil y costoso en t&eacute;rminos de tiempo y personas que se necesita para realizarlo (Corcho, 2006). En la anotaci&oacute;n semiautom&aacute;tica se requiere una m&iacute;nima intervenci&oacute;n del usuario y las anotaciones se hacen con base en las sugerencias realizadas por alg&uacute;n proceso autom&aacute;tico (Oren, <i>et al., </i>2006). Por su parte, en la anotaci&oacute;n autom&aacute;tica, las anotaciones sem&aacute;nticas se hacen casi sin intervenci&oacute;n del usuario y reducen los costos en t&eacute;rminos de tiempo y personas requeridos para realizarlas.</p>     <p>La forma en que los usuarios hacen las consultas al sistema de b&uacute;squeda sem&aacute;ntica puede ser: basada en palabras clave, en formularios, en lenguaje natural o basada en un lenguaje formal de consulta <i>(</i>e.g., SPARQL, es un acr&oacute;nimo recursivo del ingl&eacute;s SPARQL <i>Protocol and</i> <i>RDF Query Language</i>, se trata de un  lenguaje estandarizado para la consulta de grafos RDF, normalizado por el RDF <i>Data Access Working Group </i>(DAWG) del World Wide Web Consortium (W3C). Para ampliar m&aacute;s informaci&oacute;n en: <a href="http://www.w3.org/TR/rdf-sparql-query/" target="_blank">http://www.w3.org/TR/rdf-sparql-query/</a>).</p>     ]]></body>
<body><![CDATA[<p>Los sistemas basados en palabras clave se caracterizan por la facilidad de uso que ofrecen a los usuarios. Los que se basan en formularios, presentan gr&aacute;ficamente al usuario partes de la estructura de la ontolog&iacute;a  para que &eacute;l seleccione las clases con las cuales realizar&aacute; la b&uacute;squeda. Estos sistemas tienen una desventaja: son poco flexibles ya que el usuario s&oacute;lo puede seleccionar los elementos que le muestra el formulario (Uren, <i>et al.</i>, 2007). Adem&aacute;s, el usuario consume mucho tiempo navegando por la estructura de la ontolog&iacute;a. Por su parte, los sistemas basados en lenguaje natural, ofrecen respuestas precisas a las consultas del usuario (<i>Query Answering</i>). Por &uacute;ltimo, algunos sistemas de b&uacute;squeda sem&aacute;ntica requieren que la consulta se exprese usando un lenguaje formal de consulta. Esto puede ser una desventaja, ya que representa un alto nivel de complejidad para los usuarios.</p>     <p><b><font size="3">2.2 Propuestas que usan tecnolog&iacute;as la <i>web </i>sem&aacute;ntica para mejorar la recuperaci&oacute;n de informaci&oacute;n</font></b></p>     <p>Una de las primeras propuestas que busca mejorar   el proceso de recuperaci&oacute;n de informaci&oacute;n usando   tecnolog&iacute;as de la <i>web </i>sem&aacute;ntica se presenta en Shah,   <i>et al</i>., (2002). En esta propuesta, los  documentos se enriquecen   con anotaciones sem&aacute;nticas que se obtienen   autom&aacute;ticamente aplicando t&eacute;cnicas de extracci&oacute;n de   informaci&oacute;n. Las anotaciones se almacenan dentro del   mismo documento y una consulta se puede expresar   mediante palabras clave o usando el lenguaje de consulta   <i>DQL </i>(<i>DAML+OIL Query Language</i>). En Popov, <i>et al.</i>   <i>(</i>2004) y Kiryakov, <i>et al. (</i>2005), se describe KIM, un <i>framework </i>que tambi&eacute;n usa un mecanismo  autom&aacute;tico   de anotaci&oacute;n sem&aacute;ntica de documentos. Las anotaciones   se representan como enlaces entre conceptos incluidos   en el documento y clases de una ontolog&iacute;a. A diferencia   de la propuesta anterior, las anotaciones sem&aacute;nticas se   almacenan en una base de conocimiento separada de   los documentos y se representan mediante tripletas   <i>RDF </i>(<i>Resource Description Framework </i>en ingl&eacute;s,  modelo   est&aacute;ndar para intercambio de datos en la web, m&aacute;s   informaci&oacute;n en www.w3.org/RDF). En <i>KIM</i>,cuando se   lanza una consulta, primero se buscan las instancias   de la ontolog&iacute;a asociadas a los t&eacute;rminos de la consulta,   luego se recuperan los documentos anotados con estas   instancias. En <i>KIM </i>no se tiene en cuenta la relevancia   de las anotaciones, por lo tanto es dif&iacute;cil aplicar un   algoritmo de <i>ranking </i>que permita mostrar ordenadamente   los documentos de acuerdo a la relevancia de las   anotaciones sem&aacute;nticas.</p>     <p>Por su parte, en Vallet-Weadon, Fern&aacute;ndez- S&aacute;nchez y Castells-Azpilicueta (2005) y Castells-Azpilicueta, Fern&aacute;ndez-S&aacute;nchez y Vallet-Weadon (2007) se adapta el modelo de espacio vectorial para facilitar la b&uacute;squeda sem&aacute;ntica de documentos bas&aacute;ndose en la relevancia de las anotaciones. Los autores proponen un algoritmo de <i>ranking </i>para calcular el grado de relevancia de las anotaciones sem&aacute;nticas. El grado de relevancia depende de la frecuencia de las clases de la ontolog&iacute;a con las cuales se anotaron los documentos. Este algoritmo de <i>ranking </i>ordena los documentos de acuerdo a la relevancia de las anotaciones sem&aacute;nticas. El sistema toma como entrada una consulta expresada en <i>Sparql </i>y retorna una lista de instancias de la ontolog&iacute;a. A partir de estas instancias, se expande la consulta explorando las jerarqu&iacute;as de clase en la ontolog&iacute;a. Finalmente, los documentos anotados con las instancias de la ontolog&iacute;a se recuperan y se ordenan de acuerdo a la similitud entre la consulta y las anotaciones sem&aacute;nticas. En consonancia con los autores, la b&uacute;squeda sem&aacute;ntica mejora los resultados con respecto a la b&uacute;squeda que se basa &uacute;nicamente en modelos cl&aacute;sicos de recuperaci&oacute;n de informaci&oacute;n<i>. </i>Sin embargo, la b&uacute;squeda sem&aacute;ntica puede fallar cuando las anotaciones sem&aacute;nticas son incompletas y no cubren toda la informaci&oacute;n de un documento. Una desventaja de esta propuesta es que la consulta se debe expresar en <i>Sparql</i>, lo cual puede representar un nivel de complejidad alto para los usuarios del sistema.</p>     <p>En Bhagdev, <i>et al. </i>(2008), y Bikakis, <i>et  al. </i>(2010), se aplica el concepto de b&uacute;squeda h&iacute;brida que combina los resultados de la b&uacute;squeda basada en modelos cl&aacute;sicos de <i>IR, </i>con resultados de la b&uacute;squeda basada en anotaciones sem&aacute;nticas. La b&uacute;squeda basada en modelos cl&aacute;sicos de <i>IR </i>(e.g., Modelo de espacio vectorial) tiene en cuenta &uacute;nicamente la frecuencia de aparici&oacute;n de las palabras clave. Por otro lado, la b&uacute;squeda basada en anotaciones sem&aacute;nticas puede fallar cuando la ontolog&iacute;a utilizada como base de anotaci&oacute;n no cubre toda la sem&aacute;ntica de un documento. La b&uacute;squeda h&iacute;brida trata estos problemas combinando la b&uacute;squeda basada en modelos cl&aacute;sicos de <i>IR </i>con la que se basa en anotaciones sem&aacute;nticas. Esto es una ventaja ya que se mejoran los resultados en t&eacute;rminos de <i>precision </i>y <i>recall </i>en el promedio de los casos. Sin embargo, una desventaja de esta propuesta es la forma de interactuar con el sistema; el usuario debe navegar por la estructura jer&aacute;rquica de la  ontolog&iacute;a y seleccionar manualmente las clases con las cuales se orientar&aacute; el proceso de b&uacute;squeda. El usuario necesita invertir una gran cantidad de tiempo seleccionando las clases, adem&aacute;s, se requiere conocer la estructura de la ontolog&iacute;a.</p>     <p>Por &uacute;ltimo, en Rodr&iacute;guez-Garc&iacute;a, <i>et al. </i>(2014a, 2014b), se describe una plataforma para enriquecer sem&aacute;nticamente el descubrimiento de servicios en la nube <i>(Cloud services</i>). Esta plataforma usa la descripci&oacute;n de los servicios en la nube como documentos y, a partir de estos, se crean anotaciones sem&aacute;nticas autom&aacute;ticamente. En el proceso de anotaci&oacute;n se pueden usar m&uacute;ltiples ontolog&iacute;as y formatos de documentos y las anotaciones sem&aacute;nticas se indexan adaptando el modelo cl&aacute;sico de espacio vectorial. Para cada documento se crea un vector donde cada dimensi&oacute;n representa el nivel de relevancia de un concepto de la ontolog&iacute;a para dicho documento. La plataforma permite la b&uacute;squeda sem&aacute;ntica de documentos por medio de palabras clave, lo cual facilita la interacci&oacute;n con el usuario. Uno de los aspectos m&aacute;s interesantes en esta propuesta, es que se sugiere un m&oacute;dulo para soportar la evoluci&oacute;n de ontolog&iacute;as. Con esto se busca enriquecer, mejorar y aumentar el conocimiento representado en las ontolog&iacute;as. Para soportar este proceso, se propone un algoritmo que busca informaci&oacute;n en <i>Wikipedia </i>de aquellos t&eacute;rminos que no est&aacute;n representados en la ontolog&iacute;a. Con estos t&eacute;rminos se busca en <i>Wikipedia </i>los art&iacute;culos que coincidan con los t&eacute;rminos de b&uacute;squeda; luego se crea un nuevo concepto que contiene sin&oacute;nimos tanto en ingl&eacute;s como en espa&ntilde;ol, y a&ntilde;ade a la ontolog&iacute;a.</p>     <p><b><font size="3">3. MODELO PARA EXTENDER SEM&Aacute;NTICAMENTE EL PROCESO DE RECUPERACI&Oacute;N DE INFORMACI&Oacute;N</font></b></p>     <p>De acuerdo con Baeza-Yates y Ribeiro-Neto   (1999), e l p roceso d e r ecuperaci&oacute;n d e i nformaci&oacute;n   incluye etapas como el modelado de la informaci&oacute;n, la   indexaci&oacute;n, la consulta y el <i>ranking </i>de los resultados. En el modelo de la <a href="#fig1">Figura  1</a>, se extiende este proceso mediante una etapa de anotaci&oacute;n sem&aacute;ntica con el fin de darle significado a los t&eacute;rminos de un documento. De acuerdo con Bontcheva, <i>et  al. </i>(2006), las anotaciones sem&aacute;nticas permiten crear enlaces entre las entidades presentes en un texto y sus descriptores definidos en una estructura sem&aacute;ntica como una ontolog&iacute;a. Este modelo se diferencia de otras propuestas de b&uacute;squeda sem&aacute;ntica en la forma en que el usuario interact&uacute;a con el sistema. Bajo este modelo, el usuario expresa las consultas usando solo palabras clave, no necesita seleccionar manualmente clases de la ontolog&iacute;a, ni conocer su estructura. Tampoco necesita conocer lenguajes formales de consulta para acceder a las anotaciones sem&aacute;nticas. De acuerdo con Tran-Duc Than, <i>et al. </i>(2009), el usuario est&aacute; acostumbrado a expresar las consultas mediante interfaces de consulta usables, las cuales, generalmente, se basan en palabras clave. El modelo de la <a href="#fig1">Figura 1</a> est&aacute; formado por dos componentes principales: El procesamiento de documentos (<i>Document  processing)</i>, que se muestra en la parte superior de la figura y la b&uacute;squeda extendida sem&aacute;nticamente (<i>Semantically  extended</i> <i>search)</i>, en la parte inferior.</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05fig1.gif"><a name="fig1"></a></p>     <p>El  procesamiento de documentos se divide en dos m&oacute;dulos:  el primero (<i>classical IR</i>),  donde los documentos se  procesan por medio de la aplicaci&oacute;n de t&eacute;cnicas como  la divisi&oacute;n del texto en <i>tokens, </i>la  eliminaci&oacute;n de <i>stopwords </i>y la aplicaci&oacute;n de algoritmos de <i>stemming</i>. En este m&oacute;dulo,  cada documento se representa mediante un  conjunto de t&eacute;rminos usando el modelo cl&aacute;sico de  espacio vectorial (Salton, Wong-Andrew y Yang- Chungshu  1975). Una descripci&oacute;n detallada de este m&oacute;dulo se presenta en la secci&oacute;n 4. El segundo m&oacute;dulo (<i>Semantic Annotation), </i>se encarga de hacer anotaciones sem&aacute;nticas con base en una ontolog&iacute;a de dominio. En el m&oacute;dulo de anotaci&oacute;n sem&aacute;ntica, los documentos se representan mediante un conjunto de anotaciones, las cuales tienen un significado bien definido en la ontolog&iacute;a. En la secci&oacute;n 5 se describe detalladamente el proceso de anotaci&oacute;n sem&aacute;ntica.</p>     ]]></body>
<body><![CDATA[<p>Por su parte, la b&uacute;squeda extendida sem&aacute;nticamente, permite buscar documentos combinando la recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica, con una b&uacute;squeda basada en anotaciones sem&aacute;nticas. Los resultados obtenidos separadamente se mezclan y se muestran al usuario usando un <i>ranking </i>h&iacute;brido que se muestra en la f&oacute;rmula 1. El <i>ranking </i>h&iacute;brido se calcula combinando la relevancia de la b&uacute;squeda basada en t&eacute;cnicas cl&aacute;sicas de <i>IR </i>(<i>ir-score</i>), con la relevancia de la b&uacute;squeda basada anotaciones sem&aacute;nticas (<i>semantic-score</i>).</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05for1.gif"><a name="for1"></a></p>     <p>Los factores <i>&lambda; </i>y <i>&omega; </i>representan el grado de importancia   de la b&uacute;squeda basada en t&eacute;cnicas cl&aacute;sicas <i>IR </i>y de   la basada en anotaciones sem&aacute;nticas, respectivamente. Los valores de <i>&lambda; </i>y <i>&omega; </i>est&aacute;n entre 0.0 y 1.0. Si el valor para <i>&lambda; </i>y <i>&omega; </i>es 0,5 significa que ambos tipos de b&uacute;squeda tienen la misma importancia. El uso de estos factores se explica detalladamente en la secci&oacute;n 5, donde se aborda la b&uacute;squeda de documentos extendida sem&aacute;nticamente.</p>     <p><b><font size="3">3.1 Procesamiento de documentos basado en t&eacute;cnicas cl&aacute;sicas de IR</font></b></p>     <p>En esta propuesta, las t&eacute;cnicas cl&aacute;sicas de <i>IR </i>se   refieren al uso del modelo de espacio vectorial para   representar los documentos como vectores de t&eacute;rminos   (Salton, Wong-Andrew y  Yang-Chungshu 1975) y   adem&aacute;s que la relevancia de un t&eacute;rmino depende s&oacute;lo   de su frecuencia de aparici&oacute;n en los documentos. Este   procesamiento se divide en dos fases: el an&aacute;lisis y la   indexaci&oacute;n; en la primera, se aplica una serie de t&eacute;cnicas   como la divisi&oacute;n del texto en <i>tokens, </i>la eliminaci&oacute;n de   acentos y <i>stopwords </i>y la reducci&oacute;n de los t&eacute;rminos a   su ra&iacute;z, usando el algoritmo de <i>stemming </i>propuesto en   Porter (1997). La fase de indexaci&oacute;n toma como entrada   el conjunto de t&eacute;rminos que se obtuvieron en la fase   anterior y los representa mediante el modelo de espacio   vectorial. Bajo este modelo, un documento se representa   como un vector de t&eacute;rminos. Cada t&eacute;rmino tiene asociado   un grado de relevancia que se calcula usando el   algoritmo TF-IDF (Manning, Raghavan y Sch&uuml;tze, 2008). La relevancia depende &uacute;nicamente de la frecuencia del t&eacute;rmino (TF) en el documento, y la frecuencia inversa del documento (IDF), es decir, la ocurrencia del t&eacute;rmino en la colecci&oacute;n de documentos. El resultado de esta fase es un &iacute;ndice donde a cada documento le corresponde un vector y cada componente del vector representa el grado de relevancia que tiene un t&eacute;rmino para el documento.</p>     <p><b><font size="3">4. ANOTACI&Oacute;N SEM&Aacute;NTICA DE DOCUMENTOS</font></b></p>     <p>El proceso de anotaci&oacute;n sem&aacute;ntica se dividi&oacute; en   dos partes: en la primera parte se implement&oacute; la ontolog&iacute;a   que se usa como base para anotar los documentos de   texto. En la segunda parte se desarroll&oacute; un mecanismo   autom&aacute;tico de anotaci&oacute;n sem&aacute;ntica basado en el <i>API </i>de   la herramienta <i>GATE </i>(el significado de estas siglas en   ingl&eacute;s, <i>General Architecture for  Text Engineering</i>, m&aacute;s   informaci&oacute;n <a href="http://gate.ac.uk/" target="_blank">http://gate.ac.uk/</a>.</p>     <p><i>API </i>(<i>Application Programming Interface </i>por su sigla en ingl&eacute;s.Conjunto de subrutinas, funciones y procedimientos -o m&eacute;todos, en la programaci&oacute;n orientada a objetos- que ofrece cierta biblioteca para ser utilizado por otro <i>software </i>como una capa de abstracci&oacute;n).</p>     <p>A continuaci&oacute;n se describe cada una de estas partes.</p>     <p><b><font size="3">4.1 Ontolog&iacute;a base para el proceso   de anotaci&oacute;n sem&aacute;ntica</font></b></p>     ]]></body>
<body><![CDATA[<p>Durante el proceso de anotaci&oacute;n sem&aacute;ntica se   us&oacute; la ontolog&iacute;a propuesta por ACM (como se puede   observar en <a href="www.computer.org/portal/web/publications/acmtaxonomy" target="_blank">www.computer.org/portal/web/publications/acmtaxonomy</a>), que describe el dominio de ciencias  de   la computaci&oacute;n. Esta se implement&oacute; en <i>Proteg&eacute; </i>usando   el lenguaje <i>OWL. </i>Cada clase de la ontolog&iacute;a representa   un &aacute;rea de conocimiento en este dominio. Para cada   clase se definieron varias propiedades de anotaci&oacute;n:   <i>english_name, spanish_name </i>y <i>related_content</i>. Las dos   primeras se usan para asociar a cada clase una etiqueta   tanto en ingl&eacute;s como en espa&ntilde;ol, respectivamente. La   propiedad <i>related_content </i>se usa para describir sin&oacute;nimos   o formas alternativas de representar textualmente los conceptos en  el dominio. En la <a href="#tab1">Tabla 1</a> se muestra un   ejemplo de las propiedades de anotaci&oacute;n y sus valores,   definidos para la clase "#<i>Association_rules</i>". Todos los   valores en esta tabla est&aacute;n relacionados sem&aacute;nticamente. Durante el proceso de anotaci&oacute;n sem&aacute;ntica se tienen en cuenta todas las propiedades de anotaci&oacute;n definidas previamente y tambi&eacute;n las instancias de clase, es decir, se tienen en cuenta las diferentes formas de representar un concepto del dominio en el texto para crear enlaces entre los documentos y las clases de la ontolog&iacute;a.</p>     <p><b><font size="3">4.2 Anotaci&oacute;n autom&aacute;tica de documentos basada en GATE</font></b></p>     <p><i>GATE </i>es un <i>framework </i>para el procesamiento de   texto y se puede acceder a sus funcionalidades por medio   de una interfaz gr&aacute;fica, o usando un <i>API </i>que permite   integrarlo a otras aplicaciones. En esta propuesta se   usa el <i>API </i>de forma embebida para crear un mecanismo   autom&aacute;tico de anotaci&oacute;n de documentos. Para realizar   el proceso de anotaci&oacute;n sem&aacute;ntica se crearon recursos   del lenguaje y recursos de procesamiento. Los recursos   del lenguaje permiten definir la ontolog&iacute;a que guiar&aacute;   el proceso de anotaci&oacute;n y los documentos que ser&aacute;n   anotados. Los recursos de procesamiento analizan los   documentos y crean las anotaciones sem&aacute;nticas. La <a href="#fig2">Figura   2</a> muestra los recursos de procesamiento  que definieron   en <i>GATE </i>para realizar el proceso de anotaci&oacute;n   autom&aacute;ticamente. El recurso <i>Sentence  splitter </i>divide el   texto en sentencias, que pueden ser oraciones o frases y,   el recurso <i>Tokenizer </i>divide el texto en <i>tokens.  POS Tagger</i> y <i>Morphological Analyzer </i>se usan para asignar a cada   palabra en el texto su categor&iacute;a gramatical (e.g., verbo,   art&iacute;culo, adverbio, pronombre). Finalmente, el recurso   <i>Onto-Root Gazetter </i>permite asociar  los conceptos encontrados   en el texto con las clases, de la ontolog&iacute;a. El   resultado de este proceso es una lista de anotaciones   sem&aacute;nticas que representan enlaces entre el texto y las   clases de la ontolog&iacute;a.</p>       <p align="center"><a href="img/revistas/eia/n22/n22a05fig2.gif" target="_blank">Figura 2</a><a name="fig2"></a></p>     <p>La <a href="#fig3">Figura 3</a> muestra el algoritmo que se utiliza para hacer anotaci&oacute;n sem&aacute;ntica de forma autom&aacute;tica. Este algoritmo recibe como entrada una lista con los documentos que ser&aacute;n anotados (<i>CorpusDocuments</i>) y un archivo (<i>gateApp</i>) que describe los recursos de procesamiento que se definieron previamente en <i>GATE</i>. Para cada documento, se obtiene su identificador (<i>docID</i>) y luego se ejecuta el proceso de anotaci&oacute;n definido en el archivo <i>gateApp </i>(l&iacute;nea 5). El m&eacute;todo <i>gateApp. execute</i> devuelve el conjunto de anotaciones sem&aacute;nticas realizadas al documento. Luego, se analiza este conjunto (l&iacute;nea 7-12), y para cada anotaci&oacute;n se obtienen atributos de la ontolog&iacute;a como: la clase (<i>concept</i>), la <i>uri </i>y la propiedad de anotaci&oacute;n con la cual se anot&oacute; el documento. El algoritmo retorna una lista que contiene las anotaciones de cada uno de los documentos procesados.</p>     <p align="center"><a href="img/revistas/eia/n22/n22a05fig3.gif" target="_blank">Figura 3</a><a name="fig3"></a></p>     <p>En el proceso de anotaci&oacute;n sem&aacute;ntica presentado en la <a href="#fig3">Figura 3</a>, un documento se puede anotar con varias clases en la ontolog&iacute;a y una clase se puede usar para anotar diferentes documentos. Dada esta situaci&oacute;n, algunas anotaciones sem&aacute;nticas pueden ser m&aacute;s relevantes que otras. Por esta raz&oacute;n, despu&eacute;s de que el algoritmo de la <a href="#fig3">Figura 3</a> finaliza su ejecuci&oacute;n, se procede a  calcular la relevancia de las anotaciones sem&aacute;nticas. La relevancia permite identificar qu&eacute; clases de la ontolog&iacute;a son m&aacute;s importantes para cada documento<i>. </i>El grado de relevancia sem&aacute;ntico se obtiene mediante la <a href="#for2">F&oacute;rmula 2</a>, y se basa en la propuesta de  Castells-Azpilicueta, Fern&aacute;ndez-S&aacute;nchez y Vallet-Weadon (2007).</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05for2.gif"><a name="for2"></a></p>     <p>El peso <i>W</i><i><sub>i,j</sub> </i>es el grado de relevancia que tiene   la anotaci&oacute;n <b><i>i </i></b>para el documento <b><i>j</i></b>. Para calcular este   peso, primero se calcula la frecuencia de la clase ( <i>f</i><i><sub>i,j</sub></i>),   que es el n&uacute;mero de anotaciones sem&aacute;nticas que tiene el   documento <b><i>j </i></b>con respecto la clase <b><i>i </i></b>de la ontolog&iacute;a. Esta   frecuencia se normaliza dividi&eacute;ndola entre la m&aacute;xima   frecuencia (<i>maxl freq</i><i><sub>l,j</sub></i>). La frecuencia de la clase ( <i>f<sub>i,j</sub></i>),   se multiplica por la frecuencia inversa del documento,   donde <i>N </i>es el n&uacute;mero de documentos en la colecci&oacute;n y <i>n</i><i>i </i>es el n&uacute;mero de documentos anotados con la clase <b><i>i</i></b>. Una anotaci&oacute;n sem&aacute;ntica se representa mediante tres atributos: el identificador del documento (<i>doc_id), </i>la clase de la ontolog&iacute;a con la cual se hizo la anotaci&oacute;n (<i>ontology_</i> <i>class</i>) y el grado de relevancia entre la  clase y el documento (<i>relevance)</i>. Despu&eacute;s de calcular la relevancia, cada documento tiene s&oacute;lo una anotaci&oacute;n por cada clase de la ontolog&iacute;a y su respectivo grado de relevancia. Finalmente, las anotaciones sem&aacute;nticas se almacenan en forma de tripletas <i>RDF </i>usando el <i>framework  Jena</i>.</p>     <p>La <a href="#tab2">Tabla 2</a> muestra un ejemplo donde se ha creado una anotaci&oacute;n sem&aacute;ntica (<i>annotation_1</i>), que se enlaza con el documento (<i>document_3</i>), a trav&eacute;s de la propiedad "<i>linked_to</i>". De esta forma, se puede decir que <i>document_3</i> fue anotado sem&aacute;nticamente con la clase "<i>Database_Systems</i>" y esta anotaci&oacute;n tiene un grado de relevancia de 0,25.</p>     ]]></body>
<body><![CDATA[<p align="center"><img src="img/revistas/eia/n22/n22a05tab2.gif"><a name="tab2"></a></p>     <p><b><font size="3">4.3 Anotaci&oacute;n sem&aacute;ntica extendida</font></b></p>     <p>En esta etapa se usa la estructura jer&aacute;rquica de   la ontolog&iacute;a y el concepto de distancia sem&aacute;ntica para   descubrir nuevas clases con las cuales se relaciona un   documento. De acuerdo con Nesic, <i>et al</i><i>. </i>(2010), la distancia   sem&aacute;ntica se puede entender como el n&uacute;mero   de saltos que se debe dar en la ontolog&iacute;a para llegar de   un nodo a otro. En este caso se asume que cada nodo   representa una clase en la ontolog&iacute;a. Para descubrir las   nuevas clases, se parte de aquellas que se obtuvieron   con la herramienta <i>GATE</i>, a las cuales se les llama clases   base. A partir de las clases base, se explora la estructura   jer&aacute;rquica de la ontolog&iacute;a y mediante la propiedad   <i>rdf:subClassOf </i>se obtienen las clases  antecesoras a la   clase base. Con las nuevas clases descubiertas se crean anotaciones  sem&aacute;nticas a las cuales se les asigna un grado   de relevancia que depende de la distancia sem&aacute;ntica   y del grado de relevancia de la clase base. Cuanto m&aacute;s   peque&ntilde;a sea la distancia que hay entre la clase base y   la nueva clase descubierta, mayor ser&aacute; el grado de relevancia   de la nueva anotaci&oacute;n. Por el contrario, cuanto   m&aacute;s grande sea la distancia sem&aacute;ntica, menor ser&aacute; el   grado de relevancia de la nueva anotaci&oacute;n.</p>     <p>Por otro lado, la jerarqu&iacute;a de conceptos en la ontolog&iacute;a puede ser muy grande, lo que implica que haya distancias muy largas entre un concepto y otro. Para evitar hacer anotaciones entre conceptos que son muy distantes en la estructura jer&aacute;rquica, es necesario definir un l&iacute;mite en la distancia sem&aacute;ntica. En esta propuesta, el l&iacute;mite se puede especificar de dos formas: la primera es definir un valor manualmente cada vez que se inicia el proceso de anotaci&oacute;n; la segunda es configurar un valor l&iacute;mite por defecto. En Samper-Zapater, <i>et al. </i>(2008), se recomienda usar un l&iacute;mite menor o igual a tres, ya que los conceptos cuya distancia es mayor a tres, no representan una relaci&oacute;n sem&aacute;ntica bien definida debido a la forma en que la jerarqu&iacute;a de conceptos se construye. La <a href="#fig4">Figura 4</a> muestra una parte de la ontolog&iacute;a que  se us&oacute; durante el proceso de anotaci&oacute;n sem&aacute;ntica.</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05fig4.gif"><a name="fig4"></a></p>     <p>Si se toma como clase base a "<i>Transaction_procesing"</i>, identificada con la etiqueta <i>C</i><i>0</i>, entonces la distancia sem&aacute;ntica entre <i>C</i><i><sub>0</sub> </i><i>y C</i><i><sub>1</sub> </i>es menor que la distancia sem&aacute;ntica que hay entre <i>C</i><i><sub>0</sub> </i>y <i>C</i><i><sub>3</sub></i>. Bas&aacute;ndose en esta distancia sem&aacute;ntica, se puede decir que para la clase "<i>Transaction_procesing"</i> es m&aacute;s relevante la clase "<i>Database_Systems" </i>que la clase "<i>Information_Tecnology_and_Systems". </i>La anotaci&oacute;n sem&aacute;ntica extendida crea nuevas anotaciones con su respectivo grado de relevancia, el cual se calcula con base en la <a href="#for3">F&oacute;rmula 3</a>. El grado de relevancia de una clase  relacionada (<i>Wrc</i>), depende de la distancia sem&aacute;ntica (<i>SemDistance</i>) y del grado de relevancia de la clase base (<i>Wbc</i>), el cual se obtuvo previamente usando la <a href="#for2">F&oacute;rmula  2</a> (Secci&oacute;n 4.2). El grado de relevancia <i>Wrc </i>ser&aacute; m&aacute;s alto entre m&aacute;s peque&ntilde;a sea la distancia sem&aacute;ntica que hay entre las clases.</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05for3.gif"><a name="for3"></a></p>     <p><b><font size="3">5. CONSULTAS DE USUARIO EXTENDIDAS SEM&Aacute;NTICAMENTE</font></b></p>     <p>Una consulta se procesa en tres fases, tal como   se muestra en la <a href="#fig5">Figura  5</a>. En la fase 1, se recuperan los documentos  con base en el modelo de espacio vectorial   y la  m&eacute;trica <i>TD-IDF </i>(T&eacute;cnicas cl&aacute;sicas de <i>IR</i>). En  la fase   2, la  recuperaci&oacute;n se hace con base en anotaciones sem&aacute;nticas.</p>       <p align="center"><img src="img/revistas/eia/n22/n22a05fig5.gif"><a name="fig5"></a></p>     ]]></body>
<body><![CDATA[<p>Las  dos fases anteriores se pueden ejecutar concurrentemente,  ya que se procesan sobre repositorios separados.  En la fase 3, los resultados obtenidos en las dos primeras fases se mezclan  usando un algoritmo de <i>ranking </i>h&iacute;brido y se muestran al usuario.</p>     <p><b><i>Fase 1</i></b><b>: </b>A esta  fase se le denomina b&uacute;squeda tradicional ya que  se basa en t&eacute;cnicas cl&aacute;sicas de <i>IR. </i>Los  documentos se  representan como vectores y se recuperan teniendo  en cuenta solo la frecuencia de los t&eacute;rminos. El  resultado es una lista ordenada de documentos, cuya relevancia  se calcula comparando la similitud entre el vector  consulta y los vectores de cada documento<i>. </i>Para implementar  esta fase se us&oacute; el <i>API </i>de <i>Apache  Lucene</i> (es  una API de c&oacute;digo abierto para recuperaci&oacute;n de informaci&oacute;n,  originalmente implementada en Java por Doug  Cutting, para ampliar este concepto <a href="http://lucene.apache.org/core/" target="_blank">http://lucene.apache.org/core/</a>)  , una herramienta <i>open source </i>que implementa  el modelo de espacio vectorial.</p>     <p><b><i>Fase 2</i></b><b>: </b>En  esta fase, la b&uacute;squeda de documentos se  basa en las anotaciones sem&aacute;nticas y se hace en tres  pasos: transformaci&oacute;n de las palabras clave en un conjunto  de clases de la ontolog&iacute;a, b&uacute;squeda de los documentos anotados  con estas clases y ordenamiento de los  documentos recuperados, de acuerdo al grado de relevancia  de las anotaciones sem&aacute;nticas.</p>     <p>La  transformaci&oacute;n de palabras clave a clases de la ontolog&iacute;a,  se hace por medio de un &iacute;ndice de conceptos que  almacena parejas de la forma (<i>class</i>, <i>text</i>). El  elemento <i>class </i>corresponde a la <i>URI </i>de la  clase en la ontolog&iacute;a, el  elemento <i>text </i>contiene el texto que  se ha extra&iacute;do de las  propiedades de anotaci&oacute;n que tiene la clase. El &iacute;ndice  de conceptos se crea previamente haciendo un pre-procesamiento  de la ontolog&iacute;a y permite obtener autom&aacute;ticamente  las clases que orientar&aacute;n el proceso de  b&uacute;squeda. Los usuarios expresan las consultas mediante  palabras clave, mientras que las anotaciones sem&aacute;nticas  se almacenan en forma de tripletas <i>RDF</i>. Teniendo  en cuenta que la forma de representar las consultas  de usuario y las anotaciones sem&aacute;nticas es diferente,  fue necesario crear el &iacute;ndice de conceptos, que permite  interpretar una consulta expresada en palabras clave  y relacionarla con las clases de la ontolog&iacute;a. Por ejemplo,  si la consulta expresada por el usuario es "<i>Reglas</i> <i>de  asociaci&oacute;n en miner&iacute;a de datos</i>", se obtienen las clases  de la ontolog&iacute;a que se muestran en la <a href="#tab3">Tabla 3</a>. Con las  clases obtenidas se crea un vector que representa la consulta  y este se usar&aacute; m&aacute;s adelante, al momento de calcular  la similitud entre los documentos y la consulta. Si el  usuario hubiera expresado esta consulta en ingl&eacute;s, se  obtendr&iacute;an las mismas clases de la ontolog&iacute;a de la <a href="#tab2">Tabla  2</a>. Esto gracias a las propiedades de anotaci&oacute;n <i>english_name  y spanish_name </i>que tiene cada clase.</p>     <p align="center"><img src="img/revistas/eia/n22/n22a05tab2.gif"><a name="tab2"></a></p>     <p>Despu&eacute;s  de transformar las palabras clave a clases  de la ontolog&iacute;a se genera autom&aacute;ticamente una consulta <i>Sparql</i>. Cada clase obtenida en el paso anterior se  agrega a la cl&aacute;usula <i>WHERE </i>de la consulta. En la <a href="#fig6">Figura 6</a> se muestra una parte de la consulta generada. La  consulta <i>Sparql </i>retorna una lista de  anotaciones sem&aacute;nticas,  donde cada elemento de la lista contiene el  identificador del documento, la clase de la ontolog&iacute;a y el  grado de relevancia de la anotaci&oacute;n sem&aacute;ntica. Por ejemplo,  la consulta "<i>Reglas de asociaci&oacute;n en miner&iacute;a de</i> <i>datos</i>" se  expande sem&aacute;nticamente con palabras clave como "<i>Algoritmo  Apriori</i>" y "<i>Algoritmo FP-growth</i>", ya que  estos conceptos est&aacute;n relacionados sem&aacute;nticamente con la  clase "#<i>Association_rules</i>",  como se muestra en la <a href="#tab3">Tabla  3</a>. Despu&eacute;s de retornar la lista de anotaciones que  coinciden con la b&uacute;squeda expresada por el usuario,  se calcula la relevancia entre la consulta y los documentos.  Tanto la consulta como los documentos se representan  como vectores, cada posici&oacute;n del vector corresponde  a una clase de la ontolog&iacute;a. La relevancia se  calcula por medio de la similitud coseno (Tan, Pang- Ning,  Steinbach y Kumar, 2006). La recuperaci&oacute;n basada en  anotaciones sem&aacute;nticas tambi&eacute;n expande la consulta con  clases relacionadas en la ontolog&iacute;a, partiendo de las  clases del vector consulta se buscan las clases que est&aacute;n  relacionadas sem&aacute;nticamente en la ontolog&iacute;a. Esta  expansi&oacute;n permite ofrecer m&aacute;s posibilidades de b&uacute;squeda  al usuario, como la b&uacute;squeda de documentos relacionados  o la recomendaci&oacute;n de documentos.</p>     <p align="center"><a href="img/revistas/eia/n22/n22a05fig6.gif" target="_blank">Figura 6</a><a name="fig6"></a></p>     <p><b><i>Fase 3</i></b><b>: </b>En  esta fase se combinan los documentos que se  obtuvieron en la b&uacute;squeda que se basa en t&eacute;cnicas  cl&aacute;sicas de <i>IR </i>con los documentos obtenidos en la b&uacute;squeda basada en anotaciones sem&aacute;nticas (Fase 1 y 2). La combinaci&oacute;n de documentos se realiza aplicando un mecanismo de <i>ranking </i>h&iacute;brido en el que se tiene en cuenta un factor de importancia para cada tipo de b&uacute;squeda, como se mostr&oacute; en la f&oacute;rmula 1. Los factores &lambda; y <i>&omega; </i>se ajustan dependiendo de las condiciones de la consulta:</p>     <p><b>Condici&oacute;n 1</b>: La consulta se puede  representar   completamente con los conceptos de la ontolog&iacute;a (clases,   propiedades de anotaci&oacute;n, instancias), se da mayor   importancia a la b&uacute;squeda basada en anotaciones sem&aacute;nticas   (<i>&omega; &gt; &lambda;). </i>En este caso <i>&omega; = 0.7 </i>y <i>&lambda; = 0.3</i></p>     <p><b>Condici&oacute;n 2</b>: La consulta no se puede  representar   en su totalidad con los conceptos de la ontolog&iacute;a. El   factor de importancia sem&aacute;ntico tendr&aacute; un valor m&aacute;s   bajo, entonces (<i>&omega; &lt; &lambda;). </i>En este caso <i>&omega; = 0.4 </i>y <i>&lambda; = 0.6</i></p>     ]]></body>
<body><![CDATA[<p>Los valores de <i>&lambda; </i>y <i>&omega; </i>se obtuvieron a partir de   pruebas supervisadas construidas sobre un conjunto   de documentos y a partir de consultas de usuario   representadas completa y parcialmente usando los   conceptos de la ontolog&iacute;a. La verificaci&oacute;n de la consulta   con respecto a la informaci&oacute;n de la ontolog&iacute;a permite   darle m&aacute;s valor a la b&uacute;squeda sem&aacute;ntica en aquellos   casos donde la consulta del usuario se puede representar   completamente con los conceptos de la ontolog&iacute;a y   disminuir este valor cuando no se puede representar   en su totalidad. Finalmente, despu&eacute;s de combinar los   documentos se muestran al usuario.</p>     <p><b><font size="3">6. IMPLEMENTACI&Oacute;N Y PRUEBAS</font></b></p>     <p>La <a href="#fig7">Figura 7</a> muestra un diagrama de dise&ntilde;o del prototipo   que se desarroll&oacute; para mejorar la b&uacute;squeda   documentos en una biblioteca digital de ciencias de la   computaci&oacute;n. En la implementaci&oacute;n se utiliz&oacute; el lenguaje   de programaci&oacute;n Java y se integraron algunas herramientas   <i>open source </i>como <i>Apache Lucene</i>, <i>Apache Tika</i>, <i>GATE </i>y <i>Apache Jena. </i>El  prototipo est&aacute; integrado por   cuatro  componentes: <i>Document processor, </i>procesa  los   documentos,  como se describi&oacute; en las secciones 3 y 4. <i>Persistence </i>almacena la informaci&oacute;n obtenida durante el  procesamiento de documentos en dos repositorios: "<i>Lucene index file</i>" y "<i>Semantic annotations</i>". En el  primero, los  documentos se representan como vectores de  t&eacute;rminos. El segundo repositorio contiene las anotaciones sem&aacute;nticas  obtenidas durante el proceso de anotaci&oacute;n,  las cuales se guardan en forma de tripletas <i>RDF. </i>El componente <i>Searching </i>incluye  las funciones de  b&uacute;squeda ofrecidas al usuario y est&aacute; integrado por tres m&oacute;dulos: <i>IR search, </i>que procesa las consultas de usuario  bas&aacute;ndose en t&eacute;cnicas cl&aacute;sicas de recuperaci&oacute;n de  informaci&oacute;n, <i>Semantic search, </i>que  las procesa bas&aacute;ndose en las  anotaciones sem&aacute;nticas, e <i>Hybrid search,</i> que  combina los resultados de las dos anteriores. Por &uacute;ltimo,  el componente <i>GUI </i>le permite al usuario  buscar documentos  enriquecidos sem&aacute;nticamente por medio de  palabras clave.</p>       <p align="center"><img src="img/revistas/eia/n22/n22a05fig7.gif"><a name="fig7"></a></p>     <p>El  usuario no necesita conocer la estructura de la  ontolog&iacute;a o de lenguajes formales de consulta para recuperar  sem&aacute;nticamente los documentos; el proceso de  b&uacute;squeda es trasparente para el usuario.</p>     <p>El  escenario de pruebas est&aacute; compuesto por una  colecci&oacute;n de documentos, las consultas de usuario expresadas  en palabras clave, la ontolog&iacute;a de dominio y las  anotaciones sem&aacute;nticas. La colecci&oacute;n de documentos tiene  aproximadamente 2.000 ejemplares de ciencias de la  computaci&oacute;n. La ontolog&iacute;a de dominio contiene alrededor de 840  clases. Las pruebas incluyeron tanto consultas que se  pod&iacute;an representar completamente con la informaci&oacute;n  de la ontolog&iacute;a como tambi&eacute;n aquellas que s&oacute;lo  se pod&iacute;an representar parcialmente, o no se pod&iacute;an representar  en la ontolog&iacute;a. Cada consulta se ejecut&oacute; usando  tres estrategias de b&uacute;squeda: la que se basa en t&eacute;cnicas  cl&aacute;sicas de IR (<i>IR based search</i>), la  sem&aacute;ntica o  basada en anotaciones sem&aacute;nticas (<i>Semantic based</i> <i>search</i>) y la  b&uacute;squeda h&iacute;brida (<i>Hybrid based search</i>). Los resultados  obtenidos en cada una de estas estrategias se  analizaron con base en las medidas <i>precision y  recall</i>. Para  cada consulta se tomaron 10 niveles de recall, (10 %, 20 %,  30 %,...100 %) y para cada nivel de <i>recall </i>se  calcul&oacute; la  medida <i>precision</i>.</p>     <p>La <a href="#tab4">Tabla  4</a> muestra algunos ejemplos de las   consultas  que se usaron en las pruebas. Las primeras   tres  consultas corresponden a ejemplos donde todas   las  palabras expresadas por el usuario se pueden interpretar   por  medio de los conceptos representados   en la  ontolog&iacute;a. En este caso, la b&uacute;squeda basada en   anotaciones  sem&aacute;nticas tiene un desempe&ntilde;o superior a   la  b&uacute;squeda cl&aacute;sica. Esto se debe a que los documentos   se han  enriquecido con las anotaciones sem&aacute;nticas y   estas  tienen en cuenta las propiedades de anotaci&oacute;n y   las  instancias asociadas a las clases de la ontolog&iacute;a. Por   otro  lado, las dos &uacute;ltimas filas de la tabla son consultas   que no  se pueden interpretar completamente con los   conceptos  de la ontolog&iacute;a. Algunas palabras como "<i>medicina</i>",   y "<i>polinizaci&oacute;n  de abejas</i>", no est&aacute;n representadas   en la  ontolog&iacute;a que se us&oacute; en el proceso de anotaci&oacute;n   sem&aacute;ntica.  En este caso, la b&uacute;squeda sem&aacute;ntica falla   porque  no existen anotaciones que est&eacute;n relacionadas   con  todas las palabras expresadas por el usuario. En la   consulta  4, la b&uacute;squeda sem&aacute;ntica se hace teniendo en   cuenta  solo el concepto "<i>Miner&iacute;a de datos</i>", lo  cual afecta   su  rendimiento, como se puede ver en la <a href="#tab4">Tabla 4</a>.</p>       <p align="center"><a href="img/revistas/eia/n22/n22a05tab4.gif" target="_blank">Tabla 4</a><a name="tab4"></a></p>     <p>De  acuerdo con la <a href="#fig8">Figura 8</a>, en el promedio de los  casos, la b&uacute;squeda cl&aacute;sica (<i>IR based search</i>)  tiene un desempe&ntilde;o  inferior que la b&uacute;squeda sem&aacute;ntica y que la b&uacute;squeda  h&iacute;brida. Por ejemplo, en la b&uacute;squeda cl&aacute;sica, para  niveles de <i>recall </i>cercanos a 0,5, la m&eacute;trica <i>precision</i> tambi&eacute;n  toma valores aproximados a 0,5<i>. </i>A  partir de este nivel, <i>precision </i>decrece r&aacute;pidamente hasta  llegar a cero. Por otro lado, en la b&uacute;squeda sem&aacute;ntica, para valores de <i>recall </i>cercanos a 0,5 se obtuvieron valores de <i>precision </i>cercanos a 0,8.</p>     <p align="center"><a href="img/revistas/eia/n22/n22a05fig8.gif" target="_blank">Figura 8</a><a name="fig8"></a></p>     ]]></body>
<body><![CDATA[<p>Adem&aacute;s, en b&uacute;squeda sem&aacute;ntica se obtienen mejores niveles de <i>recall</i>, porque las consultas se expanden por medio de las propiedades de anotaci&oacute;n y las instancias de clase de la ontolog&iacute;a. Por su parte, la b&uacute;squeda h&iacute;brida tiene un desempe&ntilde;o superior que la b&uacute;squeda sem&aacute;ntica en el promedio de los casos. La b&uacute;squeda sem&aacute;ntica funciona muy bien cuando el usuario expresa consultas que se pueden interpretar completamente con la informaci&oacute;n representada en la ontolog&iacute;a; sin embargo, su rendimiento es inferior cuando no hay anotaciones sem&aacute;nticas que permitan interpretar completamente una consulta de usuario. La b&uacute;squeda h&iacute;brida funciona mejor, ya que aprovecha las ventajas de la b&uacute;squeda cl&aacute;sica y de la b&uacute;squeda sem&aacute;ntica. Esto se logra porque el <i>ranking </i>h&iacute;brido se calcula dependiendo de las condiciones de la consulta, como se describi&oacute; en la fase 3 de la secci&oacute;n 5.</p>     <p><b><font size="3">7. CONCLUSIONES Y TRABAJO FUTURO</font></b></p>     <p>En este trabajo se desarroll&oacute; un prototipo de   sistema de recuperaci&oacute;n de informaci&oacute;n extendido   sem&aacute;nticamente. Este sistema presenta un mejor   desempe&ntilde;o en t&eacute;rminos de <i>precision </i>y <i>recall</i>, que un   sistema que se basa solo en t&eacute;cnicas cl&aacute;sicas de <i>IR</i>. Las   anotaciones sem&aacute;nticas y la ontolog&iacute;a de dominio son   una parte fundamental de este sistema. Cuando las consultas   de usuario se pueden interpretar completamente   con los conceptos de la ontolog&iacute;a, la b&uacute;squeda basada   en anotaciones sem&aacute;nticas ofrece mejores resultados   que la b&uacute;squeda cl&aacute;sica. Sin embargo, si la ontolog&iacute;a es   incompleta, la b&uacute;squeda sem&aacute;ntica puede fallar porque   las anotaciones no cubren toda la sem&aacute;ntica de los documentos. Por esta raz&oacute;n, esta propuesta se basa en el paradigma de la b&uacute;squeda h&iacute;brida que aprovecha las ventajas de recuperaci&oacute;n de informaci&oacute;n cl&aacute;sica y de la recuperaci&oacute;n basada en anotaciones sem&aacute;nticas. Otras propuestas como la de Rodr&iacute;guez-Garc&iacute;a, <i>et al</i>., (2014b) y Bikakis, <i>et al</i>. (2010) se basan solo en anotaciones sem&aacute;nticas que se obtienen a partir de las ontolog&iacute;as.</p>     <p>En t&eacute;rminos de <i>precision </i>y <i>recall</i>, un sistema de recuperaci&oacute;n de informaci&oacute;n extendido sem&aacute;nticamente ofrece mejores resultados que un sistema que se basa solamente en la aplicaci&oacute;n de t&eacute;cnicas cl&aacute;sicas de <i>IR</i>. La medida <i>precision </i>se mejor&oacute; porque en la b&uacute;squeda de documentos se tienen en cuenta los conceptos representados en una ontolog&iacute;a, los cuales tienen un significado expl&iacute;citamente definido. La medida <i>recall </i>se mejor&oacute; porque las consultas se expanden por medio de instancias y propiedades de anotaci&oacute;n asociadas a las clases de la ontolog&iacute;a. El sistema extendido sem&aacute;nticamente recupera documentos no solo con las palabras expresadas por el usuario, sino que, se extiende con los conceptos que est&aacute;n relacionados sem&aacute;nticamente en la ontolog&iacute;a.</p>     <p>Las ontolog&iacute;as ayudan a mejorar los resultados obtenidos en los sistemas de recuperaci&oacute;n de informaci&oacute;n. Estas, generalmente, se implementan en OWL o RDF y se consultan usando lenguajes como <i>Sparql</i>. Como en esta propuesta el usuario expresa las consultas usando palabras clave, fue necesario crear un &iacute;ndice de conceptos para relacionar una consulta de usuario con las clases representadas en la ontolog&iacute;a. El &iacute;ndice de conceptos permite a los usuarios acceder a las anotaciones sem&aacute;nticas y a la informaci&oacute;n representada en la ontolog&iacute;a, sin necesidad de conocer lenguajes de consulta como <i>Sparql. </i>Esta propuesta se diferencia de otros trabajos como el de Castells-Azpilicueta, Fern&aacute;ndez- S&aacute;nchez y Vallet-Weadon (2007), donde la consulta se expresa mediante <i>Sparql</i>, lo cual puede representar un alto nivel de complejidad para los usuarios.</p>     <p>En esta propuesta, se ofrece la posibilidad de buscar sem&aacute;nticamente documentos sin necesidad que el usuario conozca la estructura de la ontolog&iacute;a que se us&oacute; durante el proceso de anotaci&oacute;n. La recuperaci&oacute;n de informaci&oacute;n es transparente para el usuario, este s&oacute;lo expresa un conjunto de palabras clave y el sistema selecciona autom&aacute;ticamente las clases de la ontolog&iacute;a que orientar&aacute;n el proceso de b&uacute;squeda. En este sentido, la propuesta presentada se diferencia de otros trabajos como Bhagdev, <i>et al. </i>(2008) y Bikakis, <i>et  al</i>. (2013), donde es el usuario quien debe conocer la estructura de la ontolog&iacute;a y seleccionar manualmente las clases que se usar&aacute;n en la b&uacute;squeda de documentos.</p>     <p>En el desarrollo de este trabajo se integraron herramientas que provienen del campo de la recuperaci&oacute;n de informaci&oacute;n y tambi&eacute;n de la <i>web </i>sem&aacute;ntica. La integraci&oacute;n de estas &aacute;reas de conocimiento ofrece grandes ventajas para mejorar la efectividad y el desempe&ntilde;o de los sistemas orientados a la recuperaci&oacute;n de documentos. Las pruebas se realizaron con una ontolog&iacute;a de ciencias de la computaci&oacute;n; sin embargo, el prototipo permite configurar una ontolog&iacute;a de cualquier dominio. El mejoramiento de los resultados depende de la calidad y la completitud de la informaci&oacute;n representada en la ontolog&iacute;a.</p>     <p><b><font size="3">Trabajo futuro</font></b></p>     <p>Como trabajo futuro se plantea incluir m&uacute;ltiples   ontolog&iacute;as de dominio en el proceso de anotaci&oacute;n y   recuperaci&oacute;n de documentos, tambi&eacute;n trabajar con   ontolog&iacute;as que ofrezcan m&aacute;s relaciones, adem&aacute;s de las   jer&aacute;rquicas, con el objeto de poder soportar consultas   de usuario m&aacute;s complejas. Tambi&eacute;n es necesario seguir   explorando t&eacute;cnicas que permitan al usuario acceder   a la informaci&oacute;n almacenada en las ontolog&iacute;as de manera   usable y natural, sin que este tenga que conocer   de lenguajes formales de consulta. Otro aspecto es el   relacionado con la escalabilidad de las herramientas   de b&uacute;squeda basadas en anotaciones sem&aacute;nticas. Se   deben buscar mecanismos que permitan acceder a   las anotaciones sem&aacute;nticas en entornos a gran escala   con tiempos de respuesta m&iacute;nimos. En este trabajo no   se eval&uacute;o este requerimiento, p ero se debe t ener en   cuenta si se quiere implementar un sistema donde muchos   usuarios concurrentes accedan a las anotaciones   sem&aacute;nticas.</p>     <p><b><font size="3">REFERENCIAS</font></b></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Baeza-Yates, R.; Ribeiro-Neto, B.A. (1999). Modern Information   Retrieval. ACM Press/New York,  Addison-Wesley.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000103&pid=S1794-1237201400020000500001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Bikakis, N.; Giannopoulos, G.;  Dalamagas, T.; Sellis, T. (2010). Integrating Keywords and  Semantics on Document Annotation and Search. <i>Springer-Verlag</i> Berlin, Heidelberg, pp. 921-938.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000105&pid=S1794-1237201400020000500002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Bhagdev, R.; Chapman, S.;  Ciravegna, F.; Lanfranchi, V.; Petrelli, D. (2008). Hybrid  Search: Effectively Combining keywords and Semantics Searches. <i>Springer Berlin</i> Heidelberg, LNCS 5021, pp.  554-568.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000107&pid=S1794-1237201400020000500003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Bontcheva, K.; Cunningham, H.;  Kiryakov, A.; Tablan, V. (2006). Semantic Annotation and  Human Language Technology. Semantic Web  Technologies: Trends and Research in Ontology-based  Systems, Davies, J.; Studer, R.; Warren, P. John Wiley and  Sons, Ltd, pp.  29-50.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000109&pid=S1794-1237201400020000500004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Castells-Azpilicuieta, P.; Fern&aacute;ndez-S&aacute;nchez, M.; Vallet-Weadon, D. (2007). An Adaptation  of the Vector-Space Model for Ontology-Based Information  Retrieval. <i>IEEE</i> <i>Transactions on Knowledge  and data Engineering</i>, 19(2), pp.  261-272.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000111&pid=S1794-1237201400020000500005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Corcho, O. (2006). Ontology Based  Document Annotation: Trends and Open Research Problems. <i>Inderscience</i> <i>Publishers</i>, 1(1), pp.  47-57.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000113&pid=S1794-1237201400020000500006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Kiryakov, A.; Popov, B.; Ognyanoff,  D.; Manov, D.; Terziev, I. (2004). Semantic Annotation,  Indexing, and Retrieval. J<i>ournal of Web Semantics: Science, Services  and Agents</i> <i>on the World Wide Web</i>, 2(1), pp.  49-79.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000115&pid=S1794-1237201400020000500007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Lee, T., Hendler, J., Lassila, O.  (2001). The Semantic Web, <i>Scientific American</i>, 284(5), pp.  34-43.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000117&pid=S1794-1237201400020000500008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Lei-Yuangui.; Uren, V.; Motta, E. (2006).  Semsearch: A Search Engine for the Semantic Web. <i>Springer Berlin</i> Heidelberg, 4248, pp. 238-245.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000119&pid=S1794-1237201400020000500009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Mangold, C. (2007). A Survey and  Classification of Semantic Search Approaches. <i>International Journal of Metadata,</i> <i>Semantics and Ontologies</i>, 2(1), pp. 23-34.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000121&pid=S1794-1237201400020000500010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Manning, C.D.; Raghavan, P.; Sch&uuml;tze, H.  (2008). Introduction to Information Retrieval. Cambridge University Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000123&pid=S1794-1237201400020000500011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Nagypal, G. (2005). Possibly Imperfect  Ontologies for Effective Information Retrieval. PhD thesis,  University of Karlsruhe,  3762, pp. 780-789.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000125&pid=S1794-1237201400020000500012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Nesic S.; Jazayeri M.; Crestani, F.; Gasevic,  D. (2010). Concept-Based Semantic Annotation Indexing  and Retrieval of Document Units. In <i>Proceedings of the 9th</i> <i>International conference on Adaptivity,  Personalization</i> <i>and Fusion of Heterogeneous Information</i>. Paris,   France, RIAO, pp. 234-237.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000127&pid=S1794-1237201400020000500013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Oren, E.; Moller, K.; Scerri, S.; Handschuh,  S.; Sintek, M. (2006). What are Semantic Annotations.  Technical report, DERI Galway.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000129&pid=S1794-1237201400020000500014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Popov, B.; Kiryakov, A.; Ognyanoff, D.; Manov,  D.; Kirilov A.; Goranov, M. (2004). KIM Semantic Platform for Information Extraction and Retrieval Journal. <i>Natural</i> <i>Language Engineering</i>, 10(3-4), pp.  375-392.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000131&pid=S1794-1237201400020000500015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Porter, M.F. (1997). An algorithm for suffix  stripping. In Readings in Information Retrieval, Sparck, K. and  Willett, P. Morgan Kaufmann Publishers Inc., San Francisco, CA,  USA 313-316.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000133&pid=S1794-1237201400020000500016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Rodr&iacute;guez-Garc&iacute;a,  M.A.; Valencia-Garc&iacute;a, R.; Garc&iacute;a-S&aacute;nchez, F.; Samper-Zapater, J.J. (2014a).  Creating a Semantically-Enhanced Cloud Services  Environment through Ontology Evolution. <i>Future Generations in</i> <i>Computer Systems</i>, 32, pp.  295-306.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000135&pid=S1794-1237201400020000500017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Rodr&iacute;guez-Garc&iacute;a,  M.A.; Valencia-Garc&iacute;a, R.; Garc&iacute;a-S&aacute;nchez, F.; Samper-Zapater, J.J. (2014b). Ontology-based Annotation and Retrieval of Services in the  Cloud. <i>Knowledge-Based Systems</i>, 56, pp.  15-25.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000137&pid=S1794-1237201400020000500018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Salton, G.; Wong-Andrew.; Yang-Chungshu  (1975). A Vector Space Model for Automatic Indexing. <i>Communications</i> <i>of the ACM</i>, 18(11), pp.  613-620.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000139&pid=S1794-1237201400020000500019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Samper-Zapater,  J.J.; Adell-Aguilar, F.J.; Van den Berg, L.; Mart&iacute;nez,  J.J. (2008). Improving Semantic Web  Service Discovery. <i>Journal of Networks </i>(JNW), 3(1), pp. 35-42.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000141&pid=S1794-1237201400020000500020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Shah, U.; Finin, T.; Joshi, A.; Scott Cost,  R.; Matfield, J. (2002). Information Retrieval on the Semantic  Web. <i>International Conference on Information  and Knowledge</i> <i>Management</i>, New York,  pp.  461-468.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000143&pid=S1794-1237201400020000500021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Strasunskas, D.; Tomassen, S. (2010). On  Variety of Semantic Search Systems and Their Evaluation Methods. International Conference on Information  Management and Evaluation. South Africa. A<i>cademic Conferences</i> <i>Publishing</i>, pp.  380-387.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000145&pid=S1794-1237201400020000500022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Tan, Pang-Ning; Steinbach M.; Kumar, V.  Introduction to Data Mining. Addison-Wesley, chapter 2, pp 74.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000147&pid=S1794-1237201400020000500023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Tran-Duc Than.; Wang-Haofen; Rudolph, S.;  Cimiano, P. (2009). Top-k Exploration of Query Candidates  for Efficient Keyword Search on Graph-Shaped  (RDF). <i>Data Engineering Conference, IEEE 25th  International</i>, pp.  405-416.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000149&pid=S1794-1237201400020000500024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>TrivikRam, I.,  (2007). A Hibrid Approach to Retrieving Web Documents and Semantic data. Phd. tesis Wright State University, pp.  30.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000151&pid=S1794-1237201400020000500025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Vallet-Weadon, D.; Fern&aacute;ndez-S&aacute;nchez, M.;  Castells-Azpilicueta, P. (2005). An Ontology-Based Information Retrieval Model. <i>The Semantic Web: Research and Applications.</i> <i>Springer Berlin</i> / Heidelberg, 3532, pp.  455-470.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000153&pid=S1794-1237201400020000500026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Wang-Haofen; Zhang-Kang.; Liu-Qiaoling.;  Tran-Thanh.; Yu-Yong. (2008). Q2semantic: A Lightweight  Keyword Interface to Semantic Search. <i>The Semantic Web: Research</i> <i>and Applications. Springer </i>Berlin / Heidelberg, 5021, pp.  584-598.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000155&pid=S1794-1237201400020000500027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Wei-Wang.; Barnaghi, P.M.; Bargiela, A.  (2007). Semantic-Enhanced Information search and Retrieval. <i>Conference</i> <i>on Advanced Language Processing and Web  Information</i> <i>Technology, </i>Luoyang, Henan, China, pp.  218-223.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000157&pid=S1794-1237201400020000500028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Wei-Wang, W.; Barnaghi, P.M.; Bargiela, A. (2008).  Search with Meanings: An Overview of Semantic Search  Systems. <i>Inter. Journal of Communications of  SIWN</i>, 3, pp. 76-82.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000159&pid=S1794-1237201400020000500029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Uren, V.; Lei-Yuangui.; L&oacute;pez, V.;  Liu-Haiming; Motta, E.; Giordano, M. (2007). The Usability of Semantic  Search Tools: A Review. <i>The Knowledge Engineering Review</i>, 22(4), pp. 361-377.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000161&pid=S1794-1237201400020000500030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Zhou-Qi.; Wang-Chong; Xiong-Miao; Wang-Haofen;  Yu-Yong (2007). SPARK: Adapting Keyword Query to  Semantic Search. In <i>Proceedings of the 6th international The semantic</i> <i>Web. Springer-Verlag</i>, Berlin, Heidelberg, 4825, pp.  694-707.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000163&pid=S1794-1237201400020000500031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Baeza-Yates]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Ribeiro-Neto]]></surname>
<given-names><![CDATA[B.A]]></given-names>
</name>
</person-group>
<source><![CDATA[Modern Information Retrieval]]></source>
<year>1999</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[ACM PressAddison-Wesley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bikakis]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Giannopoulos]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Dalamagas]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Sellis]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Integrating Keywords and Semantics on Document Annotation and Search]]></source>
<year>2010</year>
<page-range>921-938</page-range><publisher-loc><![CDATA[BerlinHeidelberg ]]></publisher-loc>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bhagdev]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Chapman]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Ciravegna]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Lanfranchi]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Petrelli]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Hybrid Search: Effectively Combining keywords and Semantics Searches]]></source>
<year>2008</year>
<page-range>554-568</page-range><publisher-loc><![CDATA[Heidelberg ]]></publisher-loc>
<publisher-name><![CDATA[Springer Berlin]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bontcheva]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Cunningham]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Kiryakov]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Tablan]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<source><![CDATA[Semantic Annotation and Human Language Technology. Semantic Web Technologies: Trends and Research in Ontology-based Systems]]></source>
<year>2006</year>
<page-range>29-50</page-range><publisher-name><![CDATA[Davies, J.Studer, R.Warren, PJohn Wiley and Sons, Ltd]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Castells-Azpilicuieta]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández-Sánchez]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Vallet-Weadon]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Adaptation of the Vector-Space Model for Ontology-Based Information Retrieval]]></article-title>
<source><![CDATA[IEEE Transactions on Knowledge and data Engineering]]></source>
<year>2007</year>
<volume>19</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>261-272</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Corcho]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Ontology Based Document Annotation: Trends and Open Research Problems]]></article-title>
<source><![CDATA[Inderscience Publishers]]></source>
<year>2006</year>
<volume>1</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>47-57</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kiryakov]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Popov]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Ognyanoff]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Manov]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Terziev]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Semantic Annotation, Indexing, and Retrieval]]></article-title>
<source><![CDATA[Journal of Web Semantics: Science, Services and Agents on the World Wide Web]]></source>
<year>2004</year>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>49-79</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Hendler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Lassila]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Semantic Web]]></article-title>
<source><![CDATA[Scientific American]]></source>
<year>2001</year>
<volume>284</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>34-43</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lei-Yuangui]]></surname>
</name>
<name>
<surname><![CDATA[Uren]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Motta]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Semsearch: A Search Engine for the Semantic Web]]></source>
<year>2006</year>
<volume>4248</volume>
<page-range>238-245</page-range><publisher-loc><![CDATA[Heidelberg ]]></publisher-loc>
<publisher-name><![CDATA[Springer Berlin]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mangold]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Survey and Classification of Semantic Search Approaches]]></article-title>
<source><![CDATA[International Journal of Metadata, Semantics and Ontologies]]></source>
<year>2007</year>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>23-34</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Manning]]></surname>
<given-names><![CDATA[C.D.]]></given-names>
</name>
<name>
<surname><![CDATA[Raghavan]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Schütze]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Information Retrieval]]></source>
<year>2008</year>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nagypal]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Possibly Imperfect Ontologies for Effective Information Retrieval]]></source>
<year>2005</year>
<volume>3762</volume>
<page-range>780-789</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nesic]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Jazayeri]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Crestani]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Gasevic]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Concept-Based Semantic Annotation Indexing and Retrieval of Document Units]]></article-title>
<source><![CDATA[]]></source>
<year>2010</year>
<conf-name><![CDATA[9th International conference on Adaptivity, Personalization and Fusion of Heterogeneous Information]]></conf-name>
<conf-loc>Paris </conf-loc>
<page-range>234-237</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Oren]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Moller]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Scerri]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Handschuh]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Sintek]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[What are Semantic Annotations: Technical report]]></source>
<year>2006</year>
<publisher-name><![CDATA[DERI Galway]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Popov]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Kiryakov]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Ognyanoff]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Manov]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Kirilov]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Goranov]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[KIM Semantic Platform for Information Extraction and Retrieval Journal]]></article-title>
<source><![CDATA[Natural Language Engineering]]></source>
<year>2004</year>
<volume>10</volume>
<numero>3-4</numero>
<issue>3-4</issue>
<page-range>375-392</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Porter]]></surname>
<given-names><![CDATA[M.F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An algorithm for suffix stripping]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Sparck]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Willett]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Readings in Information Retrieval]]></source>
<year>1997</year>
<publisher-loc><![CDATA[San Francisco^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Morgan Kaufmann Publishers Inc.313-316]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rodríguez-García]]></surname>
<given-names><![CDATA[M.A.]]></given-names>
</name>
<name>
<surname><![CDATA[Valencia-García]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[García-Sánchez]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Samper-Zapater]]></surname>
<given-names><![CDATA[J.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Creating a Semantically-Enhanced Cloud Services Environment through Ontology Evolution]]></article-title>
<source><![CDATA[Future Generations in Computer Systems]]></source>
<year>2014</year>
<volume>32</volume>
<page-range>295-306</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rodríguez-García]]></surname>
<given-names><![CDATA[M.A.]]></given-names>
</name>
<name>
<surname><![CDATA[Valencia-García]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[García-Sánchez]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Samper-Zapater]]></surname>
<given-names><![CDATA[J.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Ontology-based Annotation and Retrieval of Services in the Cloud]]></article-title>
<source><![CDATA[Knowledge-Based Systems]]></source>
<year>2014</year>
<volume>56</volume>
<page-range>15-25</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salton]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Wong-Andrew]]></surname>
</name>
<name>
<surname><![CDATA[Yang-Chungshu]]></surname>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Vector Space Model for Automatic Indexing]]></article-title>
<source><![CDATA[Communications of the ACM]]></source>
<year>1975</year>
<volume>18</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>613-620</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Samper-Zapater]]></surname>
<given-names><![CDATA[J.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Adell-Aguilar]]></surname>
<given-names><![CDATA[F.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Van den Berg]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Martínez]]></surname>
<given-names><![CDATA[J.J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Improving Semantic Web Service Discovery]]></article-title>
<source><![CDATA[Journal of Networks]]></source>
<year>2008</year>
<volume>3</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>35-42</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shah]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
<name>
<surname><![CDATA[Finin]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[Joshi]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Scott Cost]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Matfield]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Information Retrieval on the Semantic Web]]></source>
<year>2002</year>
<conf-name><![CDATA[ International Conference on Information and Knowledge Management]]></conf-name>
<conf-loc>New York </conf-loc>
<page-range>461-468</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Strasunskas]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Tomassen]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[On Variety of Semantic Search Systems and Their Evaluation Methods]]></source>
<year>2010</year>
<conf-name><![CDATA[ International Conference on Information Management and Evaluation]]></conf-name>
<conf-loc>South Africa </conf-loc>
<page-range>380-387</page-range><publisher-name><![CDATA[Academic Conferences Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tan]]></surname>
<given-names><![CDATA[Pang-Ning]]></given-names>
</name>
<name>
<surname><![CDATA[Steinbach]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Kumar]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Data Mining]]></source>
<year></year>
<page-range>74</page-range><publisher-name><![CDATA[Addison-Wesley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tran-Duc]]></surname>
<given-names><![CDATA[Than]]></given-names>
</name>
<name>
<surname><![CDATA[Wang-Haofen]]></surname>
</name>
<name>
<surname><![CDATA[Rudolph]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Cimiano]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Top-k Exploration of Query Candidates for Efficient Keyword Search on Graph-Shaped (RDF)]]></source>
<year>2009</year>
<conf-name><![CDATA[ Data Engineering Conference, IEEE 25th International]]></conf-name>
<conf-loc> </conf-loc>
<page-range>405-416</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[TrivikRam]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
</person-group>
<source><![CDATA[A Hibrid Approach to Retrieving Web Documents and Semantic data]]></source>
<year>2007</year>
<page-range>30</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vallet-Weadon]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández-Sánchez]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Castells-Azpilicueta]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[An Ontology-Based Information Retrieval Model: The Semantic Web: Research and Applications]]></source>
<year>2005</year>
<volume>3532</volume>
<page-range>455-470</page-range><publisher-loc><![CDATA[Heidelberg ]]></publisher-loc>
<publisher-name><![CDATA[Springer Berlin]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang-Haofen]]></surname>
</name>
<name>
<surname><![CDATA[Zhang-Kang]]></surname>
</name>
<name>
<surname><![CDATA[Liu-Qiaoling]]></surname>
</name>
<name>
<surname><![CDATA[Tran-Thanh]]></surname>
</name>
<name>
<surname><![CDATA[Yu-Yong]]></surname>
</name>
</person-group>
<source><![CDATA[Q2semantic: A Lightweight Keyword Interface to Semantic Search. The Semantic Web: Research and Applications]]></source>
<year>2008</year>
<volume>5021</volume>
<page-range>584-598</page-range><publisher-loc><![CDATA[Heidelberg ]]></publisher-loc>
<publisher-name><![CDATA[Springer Berlin]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wei-Wang.]]></surname>
</name>
<name>
<surname><![CDATA[Barnaghi]]></surname>
<given-names><![CDATA[P.M.]]></given-names>
</name>
<name>
<surname><![CDATA[Bargiela]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Semantic-Enhanced Information search and Retrieval]]></source>
<year>2007</year>
<conf-name><![CDATA[ Conference on Advanced Language Processing and Web Information Technology]]></conf-name>
<conf-loc>Luoyang Henan</conf-loc>
<page-range>218-223</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wei-Wang]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Barnaghi]]></surname>
<given-names><![CDATA[P.M.]]></given-names>
</name>
<name>
<surname><![CDATA[Bargiela]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Search with Meanings: An Overview of Semantic Search Systems]]></article-title>
<source><![CDATA[Inter. Journal of Communications of SIWN]]></source>
<year>2008</year>
<volume>3</volume>
<page-range>76-82</page-range></nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Uren]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Lei-Yuangui]]></surname>
</name>
<name>
<surname><![CDATA[López]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Liu-Haiming]]></surname>
</name>
<name>
<surname><![CDATA[Motta]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Giordano]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Usability of Semantic Search Tools: A Review]]></article-title>
<source><![CDATA[The Knowledge Engineering Review]]></source>
<year>2007</year>
<volume>22</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>361-377</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhou-Qi]]></surname>
</name>
<name>
<surname><![CDATA[Wang-Chong]]></surname>
</name>
<name>
<surname><![CDATA[Xiong-Miao]]></surname>
</name>
<name>
<surname><![CDATA[Wang-Haofen]]></surname>
</name>
<name>
<surname><![CDATA[Yu-Yong]]></surname>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[SPARK: Adapting Keyword Query to Semantic Search]]></article-title>
<source><![CDATA[]]></source>
<year>2007</year>
<volume>4825</volume>
<conf-name><![CDATA[6th international The semantic Web]]></conf-name>
<conf-loc>Berlin </conf-loc>
<page-range>694-707</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
