<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0121-8123</journal-id>
<journal-title><![CDATA[Revista Colombiana de Reumatología]]></journal-title>
<abbrev-journal-title><![CDATA[Rev.Colomb.Reumatol.]]></abbrev-journal-title>
<issn>0121-8123</issn>
<publisher>
<publisher-name><![CDATA[Asociación Colombiana de Reumatología]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0121-81232015000200004</article-id>
<article-id pub-id-type="doi">10.1016/j.rcreu.2015.05.005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Modelo computacional para la identificación de endofenotipos y clasificación de pacientes con artritis reumatoide a partir de datos genéticos, serológicos y clínicos, utilizando técnicas de inteligencia computacional]]></article-title>
<article-title xml:lang="en"><![CDATA[Computational model for the identification of endophenotypes and classification of rheumatoid arthritis patients from genetic, serological, and clinical data using computational intelligence techniques]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Morales Muñoz]]></surname>
<given-names><![CDATA[Luis]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Quintana]]></surname>
<given-names><![CDATA[Gerardo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Niño]]></surname>
<given-names><![CDATA[Luis Fernando]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Medicina ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Nacional de Colombia Departamento de Ingeniería de Sistemas e Industrial ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>04</month>
<year>2015</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>04</month>
<year>2015</year>
</pub-date>
<volume>22</volume>
<numero>2</numero>
<fpage>90</fpage>
<lpage>103</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0121-81232015000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0121-81232015000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0121-81232015000200004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Objetivo: Utilizar modelos de inteligencia computacional para la clasificación e identificación de endofenotipos (relación entre fenotipo y marcadores genéticos) en pacientes con artritis reumatoide y controles sanos, a partir de información genética, principalmente el HLA DRB1 (antígeno leucocitario humano) y la teoría del epítope compartido. Esto hace referencia a la asociación entre la artritis reumatoide y el HLA DRB1, principalmente los alelos que contienen un motivo común de aminoácidos de las secuencias QKRAA, QRRAA o RRRAA en las posiciones 70 a 74 de la cadena del DRB1, los cuales confieren una susceptibilidad particular de la enfermedad a los individuos. Métodos: Desarrollamos modelos computacionales para clasificación, utilizando técnicas de inteligencia computacional como son las redes neuronales, redes bayesianas y métodos como k-means. Como datos de entrada se utilizaron variables como: factor reumatoide, anticuerpos contra péptido citrulinado, proteína C reactiva, número de articulaciones inflamadas y dolorosas, rigidez matinal, edad, género, antecedentes de comorbilidades y la información del alelo HLA DRB1. Se utilizaron técnicas de bioinformática para la búsqueda de secuencias de aminoácidos relacionadas con la severidad de la enfermedad. Resultados: Se obtuvieron resultados importantes para el diagnóstico de la enfermedad, así como también para su categorización y como potencial aplicación en la medicina personalizada de los individuos afectados por esta enfermedad. Se diseñaron modelos computacionales para clasificación, dentro de los cuales la red neuronal utilizando 5 variables obtuvo una sensibilidad del 92,3% con una especificidad del 86,66% y la red bayesiana logró una sensibilidad del 92,3% y una especificidad del 93,33%. La red neuronal utilizando 11 variables obtuvo una sensibilidad del 84,61% y una especificidad del 93,33% mientras que la red bayesiana consiguió una sensibilidad del 92,3% con una especificidad del 93,33%. Un método de agrupamiento tipo k-means fue utilizado para dividir en 2 grupos la totalidad de pacientes y controles. Además, se logró separar 2 grupos entre los pacientes para definir su severidad. Finalmente, se consiguió obtener un árbol de distancia entre secuencias de aminoácidos de los distintos alelos HLADRB1,lo cual permite visualizar grupos con cercanía genética y lograr determinar que posiblemente existen más grupos fuera de los propuestos en las distintas teorías. Conclusión: Los métodos utilizados permiten una mejor estratificación de la enfermedad en relación con la predicción de fenotipos y posibles desenlaces de la enfermedad, así como para la potencial prevención primaria de la enfermedad.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Objective: To use computational intelligence models for the classification and identification of endophenotype (relationships between phenotype and genetic markers) in patients with rheumatoid arthritis and healthy controls from genetic information, primarily the DRB1 HLA (human leukocyte antigen) and the shared epitope theory. This refers to the association between rheumatoid arthritis and the HLA-DRB1 alleles mainly containing amino acid common motif sequences QKRAA, RRRAA, QRRAA or at positions 70 to 74 DRB1 chain, which have been associated to susceptibility of this disease. Methods: Computational models were developed for classification using computational intelligence techniques, such as neural networks, Bayesian networks, and methods such as k-means. The input data consisted of variables such as: rheumatoid factor, anti-citrullinated protein antibody, C-reactive protein, number of swollen and tender joints, morning stiffness, age, gender, history of comorbidities, and the information on the HLA-DRB1. Bioinfor-matics techniques were used to search for amino acid sequences related to disease severity. Results: Promising results for the diagnosis of the disease were obtained, as well as its categorisation as potential application in personalised medicine for individuals suffering from this disease. Computational models were designed for the classification, in which the neural network using 5 variables obtained a sensitivity of 92.3% with a specificity of 86.66%, and the Bayesian network obtained a sensitivity of 92.3% and a specificity of 93.33%. The neural network using 11 variables had a sensitivity of 84.61% and a specificity of 93.33%, while the Bayesian network obtained a sensitivity of 92.3% with a specificity of 93.33%. K-means clustering method type was used to divide all patients and controls into two groups of data. It also managed to obtain two patient groups to define severity. Finally, a tree distance was obtained between amino acid sequences of the different alleles HLA DRB1, which allows genetic proximity groups to be visualised and to determine and ensure that there are may be more groups outside the proposed different theories. Conclusion: The proposed method can be used to provide better stratification of the disease in relation to the predicted phenotypes, and the potential for primary prevention of this disease.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[HLA antígeno leucocitario humano]]></kwd>
<kwd lng="es"><![CDATA[Epítope compartido]]></kwd>
<kwd lng="es"><![CDATA[Inteligencia computacional]]></kwd>
<kwd lng="es"><![CDATA[Artritis reumatoide]]></kwd>
<kwd lng="en"><![CDATA[HLA human leukocyte antigen]]></kwd>
<kwd lng="en"><![CDATA[Epitope shared]]></kwd>
<kwd lng="en"><![CDATA[Computational intelligence]]></kwd>
<kwd lng="en"><![CDATA[Rheumatoid arthritis]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font size="2" face="Verdana">      <p><a href="http://dx.doi.Org/10.1016/j.rcreu.2015.05.005" target="_blank">http://dx.doi.Org/10.1016/j.rcreu.2015.05.005</a></p>      <p><b>Investigaci&oacute;n original</b></p>        <p align="center"><font size="4"><b>Modelo computacional para la identificaci&oacute;n de endofenotipos y clasificaci&oacute;n de pacientes con artritis reumatoide a partir de datos gen&eacute;ticos, serol&oacute;gicos y cl&iacute;nicos, utilizando t&eacute;cnicas de inteligencia computacional</b></font></p>      <p align="center"><font size="3"><b>Computational model for the identification of endophenotypes and classification of rheumatoid arthritis patients from genetic, serological, and clinical data using computational intelligence techniques</b></font></p>      <p align="center"><b><i>Luis Morales Mu&ntilde;oz</i></b><sup>a,*</sup><b><i>, Gerardo Quintana</i></b><sup>a</sup> <b><i>y Luis Fernando Ni&ntilde;o</i></b><sup>b</sup></p>      <p><sup>a</sup><i> Facultad de Medicina, Universidad Nacional de Colombia, Bogot&aacute;, Colombia</i>    <br>  <sup>b</sup> <i>Departamento de Ingenier&iacute;a de Sistemas e Industrial, Universidad Nacional de Colombia, Bogot&aacute;, Colombia</i></p>      <p><i>*</i><i> Autor para correspondencia. </i>Correo electr&oacute;nico: <a href="mailto:lamoralesmu@unal.edu.co">lamoralesmu@unal.edu.co</a> (L. Morales Mu&ntilde;oz). </p>      <p><i>Historia del art&iacute;culo:&nbsp;</i>Recibido el 14 de noviembre de 2013&nbsp;Aceptado el 25 de mayo de 2015&nbsp;<i>On-line </i>el 2 de julio de 2015</p>  <hr>      ]]></body>
<body><![CDATA[<p><font size="3"><b>Resumen</b></font></p>      <p><i>Objetivo: </i>Utilizar modelos de inteligencia computacional para la  clasificaci&oacute;n e identificaci&oacute;n de  endofenotipos (relaci&oacute;n entre fenotipo y marcadores gen&eacute;ticos) en pacientes con  artritis reumatoide  y controles sanos, a partir de informaci&oacute;n gen&eacute;tica, principalmente el HLA DRB1 (ant&iacute;geno  leucocitario humano) y la teor&iacute;a del ep&iacute;tope compartido. Esto hace referencia a la  asociaci&oacute;n entre la artritis reumatoide y el HLA DRB1, principalmente los  alelos que contienen  un motivo com&uacute;n de amino&aacute;cidos de las secuencias QKRAA, QRRAA o RRRAA en las  posiciones 70 a 74 de la cadena del DRB1, los cuales confieren una  susceptibilidad particular  de la enfermedad a los individuos.</p>       <p><i>M&eacute;todos: </i>Desarrollamos modelos computacionales para clasificaci&oacute;n,  utilizando t&eacute;cnicas de  inteligencia computacional como son las redes neuronales, redes bayesianas y  m&eacute;todos como <i>k-means</i>.  Como datos de entrada se utilizaron variables como: factor reumatoide, anticuerpos  contra p&eacute;ptido citrulinado, prote&iacute;na C reactiva, n&uacute;mero de articulaciones  inflamadas y  dolorosas, rigidez matinal, edad, g&eacute;nero, antecedentes de comorbilidades y la informaci&oacute;n  del alelo HLA DRB1. Se utilizaron t&eacute;cnicas de bioinform&aacute;tica para la b&uacute;squeda de  secuencias de amino&aacute;cidos relacionadas con la severidad de la enfermedad.</p>      <p><i>Resultados: </i>Se obtuvieron resultados importantes para el diagn&oacute;stico de la  enfermedad, as&iacute; como  tambi&eacute;n para su categorizaci&oacute;n y como potencial aplicaci&oacute;n en la medicina personalizada  de los individuos afectados por esta enfermedad. Se dise&ntilde;aron modelos computacionales  para clasificaci&oacute;n, dentro de los cuales la red neuronal utilizando 5 variables obtuvo  una sensibilidad del 92,3% con una especificidad del 86,66% y la red bayesiana logr&oacute; una  sensibilidad del 92,3% y una especificidad del 93,33%. La red neuronal  utilizando 11  variables obtuvo una sensibilidad del 84,61% y una especificidad del 93,33%  mientras que la red  bayesiana consigui&oacute; una sensibilidad del 92,3% con una especificidad del 93,33%.  Un m&eacute;todo de  agrupamiento tipo <i>k-means </i>fue  utilizado para dividir en 2 grupos la totalidad de pacientes y controles. Adem&aacute;s, se logr&oacute; separar 2 grupos entre los pacientes para definir su severidad. Finalmente, se consigui&oacute; obtener un &aacute;rbol de distancia entre secuencias de amino&aacute;cidos de los distintos alelos HLADRB1,lo cual permite visualizar grupos con cercan&iacute;a gen&eacute;tica y lograr determinar que posiblemente existen m&aacute;s grupos fuera de los propuestos en las distintas teor&iacute;as.</p>      <p><i>Conclusi&oacute;n: </i>Los m&eacute;todos utilizados permiten una mejor estratificaci&oacute;n de la enfermedad en relaci&oacute;n con la predicci&oacute;n de fenotipos y posibles desenlaces de la enfermedad, as&iacute; como para la potencial prevenci&oacute;n primaria de la enfermedad.</p>      <p><i><b>Palabras clave</b>:</i> HLA ant&iacute;geno leucocitario humano, Ep&iacute;tope compartido, Inteligencia computacional, Artritis reumatoide.</p>   <hr>      <p><font size="3"><b>Abstract</b></font></p>     <p><i>Objective:</i> To use computational intelligence models for the classification and identification of endophenotype (relationships between phenotype and genetic markers) in patients with rheumatoid arthritis and healthy controls from genetic information, primarily the DRB1 HLA (human leukocyte antigen) and the shared epitope theory. This refers to the association between rheumatoid arthritis and the HLA-DRB1 alleles mainly containing amino acid common motif sequences QKRAA, RRRAA, QRRAA or at positions 70 to 74 DRB1 chain, which have been associated to susceptibility of this disease.</p>      <p><i>Methods:</i> Computational models were developed for classification using computational intelligence techniques, such as neural networks, Bayesian networks, and methods such as k-means. The input data consisted of variables such as: rheumatoid factor, anti-citrullinated protein antibody, C-reactive protein, number of swollen and tender joints, morning stiffness, age, gender, history of comorbidities, and the information on the HLA-DRB1. Bioinfor-matics techniques were used to search for amino acid sequences related to disease severity.</p>      <p><i>Results:</i> Promising results for the diagnosis of the disease were obtained, as well as its categorisation as potential application in personalised medicine for individuals suffering from this disease. Computational models were designed for the classification, in which the neural network using 5 variables obtained a sensitivity of 92.3% with a specificity of 86.66%, and the Bayesian network obtained a sensitivity of 92.3% and a specificity of 93.33%. The neural network using 11 variables had a sensitivity of 84.61% and a specificity of 93.33%, while the Bayesian network obtained a sensitivity of 92.3% with a specificity of 93.33%. K-means clustering method type was used to divide all patients and controls into two groups of data. It also managed to obtain two patient groups to define severity. Finally, a tree distance was obtained between amino acid sequences of the different alleles HLA DRB1, which allows genetic proximity groups to be visualised and to determine and ensure that there are may be more groups outside the proposed different theories.</p>      ]]></body>
<body><![CDATA[<p><i>Conclusion: </i>The proposed method can be used to provide better stratification of the disease in relation to the predicted phenotypes, and the potential for primary prevention of this disease.</p>        <p><i>Objective: </i>To use computational intelligence models for the classification and identification of endophenotype (relationships between phenotype and genetic markers) in patients with rheumatoid arthritis and healthy controls from genetic information, primarily the DRB1 HLA (human leukocyte antigen) and the shared epitope theory. This refers to the association between rheumatoid arthritis and the HLA-DRB1 alleles mainly containing amino acid</p>      <p><i><b>Keywords</b>:</i> HLA human leukocyte antigen, Epitope shared, Computational intelligence, Rheumatoid arthritis.</p>  <hr>      <p><font size="3"><b>Introducci&oacute;n</b></font></p>      <p>La artritis reumatoide (AR) es una enfermedad autoinmune que afecta al 0,5-1% de la poblaci&oacute;n humana. Existen algunos marcadores gen&eacute;ticos implicados en esta enfermedad<sup>1</sup>. Est&aacute; asociada con discapacidad progresiva, complicaciones sist&eacute;micas, muerte temprana y altos costos socioecon&oacute;micos. La causa es desconocida y su pron&oacute;stico es reservado<sup>2</sup>.</p>      <p>El m&aacute;s importante factor de riesgo gen&eacute;tico para la AR se encuentra en el HLA. En particular los que contengan las secuencias de amino&aacute;cidos QKRAA, QRRAA o RRRAA en las posiciones 70-74 de la cadena DRB1. Esto es conocido como ep&iacute;tope compartido (EC)<sup>1,2</sup>.</p>      <p>El curso cl&iacute;nico de la enfermedad difiere de un individuo a otro y los factores gen&eacute;ticos ligados a HLA DR han surgido como potencial factor pron&oacute;stico de esta enfermedad. El EC ha sido asociado con la predisposici&oacute;n y progresi&oacute;n de la enfermedad<sup>3,4</sup>.</p>      <p>Los criterios para el diagn&oacute;stico de AR est&aacute;n definidos por el Colegio Americano de Reumatolog&iacute;a y el EULAR 2010<sup>5</sup>. Existe predominio en el g&eacute;nero femenino con una relaci&oacute;n mujer hombre de 3:1, la herencia de la AR es polig&eacute;nica y no sigue un patr&oacute;n mendeliano. La importancia de encontrar factores gen&eacute;ticos asociados con la AR radica en la contribuci&oacute;n a la comprensi&oacute;n de los mecanismos patog&eacute;nicos de la enfermedad y su posible aplicaci&oacute;n cl&iacute;nica para la identificaci&oacute;n de marcadores, diagn&oacute;stico y pron&oacute;stico.</p>      <p>Modelos computacionales, como las redes neuronales artificiales, son sistemas basados en la computaci&oacute;n paralela masiva que permiten realizar tareas de control y de clasificaci&oacute;n. Una red neural biol&oacute;gica puede ser modelada matem&aacute;ticamente por un grafo dirigido con nodos (neuronas) interconectados. Los nodos artificiales son casi siempre funciones simples cuyos argumentos son las sumas de las entradas al nodo; algunos trabajos sobre redes neuronales utilizan funciones de nodo que manejan solo valores binarios<sup>6,7</sup>.</p>      <p>Los enfoques bayesianos proporcionan una forma consistente para hacer inferencia, mediante la integraci&oacute;n de la evidencia de los datos con conocimientos previos del problema. Una red bayesiana puede superar la principal dificultad de controlar la complejidad del modelo en la construcci&oacute;n de una red neuronal est&aacute;ndar. Un enfoque bayesiano ofrece herramientas eficaces para evitar el sobreajuste, incluso con modelos muy complejos y, adem&aacute;s, facilita la estimaci&oacute;n de los intervalos de confianza de los resultados<sup>8</sup>.</p>      ]]></body>
<body><![CDATA[<p>Los problemas de agrupamiento surgen en muchas aplicaciones diferentes, como la miner&iacute;a de datos y descubrimiento de conocimiento, compresi&oacute;n de datos, reconocimiento de patrones y clasificaci&oacute;n de patrones. La noci&oacute;n de lo que constituye un buen grupo depende de la aplicaci&oacute;n y hay muchos m&eacute;todos para encontrar grupos como <i>k-means</i><i><sup>9</sup>.</i></p>      <p>El coeficiente silueta es utilizado para representar las particiones obtenidas por diferentes t&eacute;cnicas; cada grupo es representado por un coeficiente llamado silueta, el cual se basa en la comparaci&oacute;n de cercan&iacute;a y separaci&oacute;n entre los elementos de los grupos, lo cual muestra qu&eacute; objetos se encuentran correctamente dentro de un grupo y cu&aacute;les est&aacute;n simplemente en alg&uacute;n lugar entre las agrupaciones. Esta combinaci&oacute;n de los coeficientes silueta permite una apreciaci&oacute;n de la calidad de los grupos y una visi&oacute;n general de la configuraci&oacute;n de los datos. Esta informaci&oacute;n proporciona una evaluaci&oacute;n de la agrupaci&oacute;n y podr&iacute;a ser utilizada para seleccionar un n&uacute;mero adecuado de agrupaciones<sup>10,11</sup>. El coeficiente silueta es una medida de un enfoque que compara las distancias entre los distintos grupos formados<sup>12</sup>.</p>      <p>Para el an&aacute;lisis de los datos se us&oacute; la herramienta de software WEKA, un software de c&oacute;digo abierto. Este sistema fue desarrollado en la Universidad de Waikato en Nueva Zelanda. WEKA representa un entorno para an&aacute;lisis de datos y est&aacute; escrito en el lenguaje orientado por objetos Java. WEKA proporciona implementaciones de avanzados algoritmos de miner&iacute;a de datos y algoritmos de aprendizaje de m&aacute;quina. Adem&aacute;s, contiene m&oacute;dulos de preprocesamiento de datos, clasificaci&oacute;n, agrupamiento y extracci&oacute;n de reglas de asociaci&oacute;n<sup>13</sup>.</p>     <p><font size="3"><b>Metodolog&iacute;a</b></font></p>      <p>En la selecci&oacute;n del conjunto de datos utilizados por los modelos computacionales se obtuvo informaci&oacute;n de pacientes con AR y controles sanos, con previo consentimiento informado por parte de los pacientes. Al inicio del estudio se contaba con 135 pacientes y 140 controles sanos, para un total de 275 registros. Al realizar el preprocesamiento de los datos, varios de los registros fueron eliminados por presentar informaci&oacute;n faltante o inconsistente. Finalmente, se logr&oacute; tener una muestra completa con 138 datos que correspond&iacute;an a 63 pacientes y 75 controles sanos (tabla 1).</p>      <p align="center"><a name="tab1"><img src="img/revistas/rcre/v22n2/v22n2a04t1.jpg"></a></p>      <p>Los datos utilizados en este estudio corresponden a informaci&oacute;n cl&iacute;nica, serol&oacute;gica y gen&eacute;tica de 138 personas, entre pacientes con AR y controles sanos. Su distribuci&oacute;n se puede observar en la tabla 2.</p>      <p align="center"><a name="tab2"><img src="img/revistas/rcre/v22n2/v22n2a04t2.jpg"></a></p>      <p>Despu&eacute;s del preprocesamiento de los datos se realiz&oacute; el an&aacute;lisis estad&iacute;stico de las variables cuyos resultados se presentan en la <a href="#tab3">tabla 3</a>.</p>      <p align="center"><a name="tab3"><img src="img/revistas/rcre/v22n2/v22n2a04t3.jpg"></a></p>       ]]></body>
<body><![CDATA[<p>La metodolog&iacute;a general utilizada en el trabajo se representa en el esquema de la figura 1.</p>      <p align="center"><a name="fig1"><img src="img/revistas/rcre/v22n2/v22n2a04f1.jpg"></a></p>      <p>Se realiz&oacute; la b&uacute;squeda y selecci&oacute;n de la informaci&oacute;n cl&iacute;nica y gen&eacute;tica, principalmente el HLA DRB1 de los pacientes y controles. De los 138 registros, que corresponden a 63 pacientes y 75 controles, se seleccion&oacute; el 80% de los datos para entrenamiento y el 20% de los datos para prueba de manera estratificada (<a href="#tab3">tabla 3</a>).</p>      <p>Para el proceso de b&uacute;squeda de las secuencias de amino&aacute;cidos para cada uno de los alelos correspondientes a los datos, se realiz&oacute; la b&uacute;squeda de los amino&aacute;cidos correspondientes a cada alelo en bases de datos biol&oacute;gicos que contienen esta informaci&oacute;n. Se utiliz&oacute;, principalmente, la base de datos IMGT/HLA (ImMunoGeneTics Project). Posteriormente, se realiz&oacute; un alineamiento entre las secuencias obtenidas utilizando una matriz tipo Blosum. Finalmente, se aplicaron m&eacute;todos computacionales para la clasificaci&oacute;n y t&eacute;cnicas de bioinform&aacute;tica, para la identificaci&oacute;n de endofenotipos.</p>      <p>Para el modelamiento e implementaci&oacute;n de los modelos computacionales basados en t&eacute;cnicas de inteligencia computacional, como redes neuronales tipo perceptr&oacute;n, perceptr&oacute;n multicapa, redes bayesianas y m&eacute;todos de agrupamiento como <i>k-means, </i>se utilizaron herramientas computacionales como WEKA, Rapidminer y Jalview.</p>      <p>WEKA y Rapidminer se usaron para implementar las redes neuronales, las redes bayesianas y para realizar los procesos de agrupaci&oacute;n. Por otro lado, se utiliz&oacute; Jalview para analizar las secuencias de amino&aacute;cidos. Jalview permite realizar alineamientos m&uacute;ltiples, editarlos alineamientos y realizar estudios de cercan&iacute;a gen&eacute;tica para efectuar estudios espec&iacute;ficos.</p>      <p>Para la agrupaci&oacute;n de los datos entre pacientes y controles se utiliz&oacute; <i>k-means </i>y como criterio de selecci&oacute;n del n&uacute;mero de grupos se utiliz&oacute; el coeficiente de silueta.</p>      <p><font size="3"><b>Resultados</b></font></p>      <p>Los resultados obtenidos se evaluaron usando las medidas de desempe&ntilde;o como: sensibilidad, especificidad, precisi&oacute;n y exactitud, que son definidas con base en verdaderos positivos (VP), verdaderos negativos (VN), falsos positivos (FP), falsos negativos (FN), n&uacute;mero de muestras positivas (P) y n&uacute;mero de muestras negativas (N). Las ecuaciones correspondientes se presentan a continuaci&oacute;n:</p>      <p align="center"><img src="img/revistas/rcre/v22n2/v22n2a04img1.jpg"></p>      ]]></body>
<body><![CDATA[<p>La matriz de confusi&oacute;n que se utiliz&oacute; para presentar los resultados de las medidas de desempen˜ o de cada modelo se presenta en la <a href="#tab4">tabla 4</a>.</p>      <p align="center"><a name="tab4"><img src="img/revistas/rcre/v22n2/v22n2a04t4.jpg"></a></p>      <p>El primer escenario que se plantea es utilizar los criterios del Colegio Americano de Reumatolog&iacute;a para clasificaci&oacute;n de la AR, para lo cual se usaron las 5 variables implicadas en estos criterios: articulaciones inflamadas, articulaciones dolorosas, factor reumatoide (FR), prote&iacute;na C reactiva (PCR) y anticuerpos contra p&eacute;ptido citrulinado (anti-CCP), entre otras.</p>      <p>Como preprocesamiento de los datos se normalizaron todas las variables, se utiliz&oacute; una red neuronal tipo perceptr&oacute;n multicapa con una capa oculta que contiene 7 neuronas, se optimizaron par&aacute;metros, se utiliz&oacute; el 80% de los datos para entrenamiento y el 20% para prueba. En la <a href="#fig2">figura 2</a> se puede observar la red neuronal que se obtuvo.</p>      <p align="center"><a name="fig2"><img src="img/revistas/rcre/v22n2/v22n2a04f2.jpg"></a></p>       <p>La matriz de confusi&oacute;n y las medidas de desempe&ntilde;o utilizando la red neuronal con 5 variables se presentan en la <a href="#tab5">tabla 5</a>, la cual muestra que el modelo presenta una exactitud del 89,28%, una precisi&oacute;n del 85,71%, con una sensibilidad del 92,3% y una especificidad del 86,66%.</p>      <p align="center"><a name="tab5"><img src="img/revistas/rcre/v22n2/v22n2a04t5.jpg"></a></p>      <p>Despu&eacute;s se implement&oacute; una red bayesiana utilizando las 5 variables propuestas por el Colegio Americano de Reumatolog&iacute;a, la red bayesiana fue desarrollada utilizando un estimador simple y un algoritmo de b&uacute;squeda TAN <i>(Tree Augmented Naive Bayes), </i>la red obtenida se muestra en la <a href="#fig3">figura 3</a>.</p>      <p align="center"><a name="fig3"><img src="img/revistas/rcre/v22n2/v22n2a04f3.jpg"></a></p>      <p>El dise&ntilde;o de la red bayesiana muestra la relaci&oacute;n de la variable PCR con las otras variables FR, anti-CCP, articulaciones dolorosas y articulaciones inflamadas. De esta manera, la probabilidad de determinar AR o no AR se da a partir de la tabla de probabilidad de PCR, la cual est&aacute; directamente relacionada con las otras variables.</p>      ]]></body>
<body><![CDATA[<p>La matriz de confusi&oacute;n y los valores de las medidas de desempe&ntilde;o de la red bayesiana utilizando 5 variables se pueden observar en la <a href="#tab6">tabla 6</a>.</p>      <p align="center"><a name="tab6"><img src="img/revistas/rcre/v22n2/v22n2a04t6.jpg"></a></p>       <p>En la <a href="#fig4">figura 4</a> se muestran las curvas ROC para los 2 clasificadores de red neuronal y red bayesiana utilizando 2 variables, el color rojo corresponde a la red bayesiana tipo perceptr&oacute;n multicapa y la curva azul corresponde a la red neuronal. En la <a href="#fig4">figura 4</a> se observa que, seg&uacute;n la curva ROC, el clasificador bayesiano, representado en color rojo, tiene un mejor desempe&ntilde;o que el clasificador neuronal, representado en color azul.</p>      <p align="center"><a name="fig4"><img src="img/revistas/rcre/v22n2/v22n2a04f4.jpg"></a></p>      <p>Tambi&eacute;n se utiliz&oacute; <i>k-means </i>como m&eacute;todo de agrupaci&oacute;n para los datos, considerando 5 variables seg&uacute;n los criterios del Colegio Americano de Reumatolog&iacute;a: PCR, FR, anti CCP, n&uacute;mero de articulaciones dolorosas y n&uacute;mero de articulaciones inflamadas. Se utiliz&oacute; el coeficiente silueta para determinar el mejor <i>k </i>utilizando una distancia euclidiana. En la <a href="#fig5">figura 5</a> se muestra la gr&aacute;fica que presenta el coeficiente silueta con respecto a cada <i>k </i>posible, en la cual se comprueba que el mejor coeficiente se obtiene con un <i>k </i>igual a 2.</p>      <p align="center"><a name="fig5"><img src="img/revistas/rcre/v22n2/v22n2a04f5.jpg"></a></p>      <p>A partir de los 138 datos se realiz&oacute; el agrupamiento utilizando <i>k-means </i>sobre las variables normalizadas. Los 2 grupos se conformaron de la siguiente manera: el primer grupo con 56 instancias y el segundo con 82 instancias. El an&aacute;lisis estad&iacute;stico de los 2 grupos obtenidos se puede observar en las <a href="#tab7">tablas 7</a> y <a href="#tab8">8</a>.</p>      <p align="center"><a name="tab7"><img src="img/revistas/rcre/v22n2/v22n2a04t7.jpg"></a></p>     <p align="center"><a name="tab8"><img src="img/revistas/rcre/v22n2/v22n2a04t8.jpg"></a></p>       <p>En el grupo 1 se observa que el valor del promedio del FR es de 63,54, el cual es un valor positivo con respecto a los valores normales para dicho examen de laboratorio y, adem&aacute;s, es mayor al obtenido en el grupo 2 que fue de 4,2. La desviaci&oacute;n est&aacute;ndar del anti-CCP del grupo 1 es de 76,05 con respecto a 40,28 del grupo 2, con lo cual se deduce que los grupos no son homog&eacute;neos como se esperaba.</p>      ]]></body>
<body><![CDATA[<p>Los promedios del n&uacute;mero de articulaciones inflamadas y dolorosas del grupo 1 fueron de 23,71 y 25, respectivamente. En contraste, los promedios del grupo 2 fueron de 1,183 y 0,792. Lo anterior indica que los individuos del grupo 1 tienen un compromiso articular mayor con respecto al grupo 2.</p>      <p>En el grupo 2 el promedio de los datos para la variable PCR fue de 0,11, el cual corresponde a un valor cualitativo negativo para dicho examen de laboratorio, siendo el m&aacute;ximo de 2,4 en este grupo.</p>      <p>Por otro lado, en el grupo 1 el promedio fue de 2,34 con un valor m&aacute;ximo de 11,6.</p>      <p>Los valores promedio de anti-CCP var&iacute;an considerablemente en los 2 grupos, siendo el promedio del grupo 1 de 109,11 y el del grupo 2 de 10,13. Lo que indica, seg&uacute;n lo reportado en la literatura, una predisposici&oacute;n mayor a presentar la enfermedad. Al examinar estos resultados se puede afirmar que los individuos del grupo 1 presentan una actividad mayor de la enfermedad con respecto a los individuos del grupo 2.</p>      <p>Los estudios han demostrado que una caracter&iacute;stica de la AR es la presencia de autoanticuerpos. En la enfermedad el FR puede detectarse con una sensibilidad del 60-70% y una especificidad del 80-90%. Sin embargo, ensayos de detecci&oacute;n de anticuerpos anti-CCP tienen una mayor especificidad (98%), con una sensibilidad del 68-80%. Estudios retrospectivos, realizados en diferentes pa&iacute;ses, han demostrado que los autoanticuerpos, incluyendo anti-CCP, anticuerpos contra ant&iacute;genos que contiene el amino&aacute;cido citrulina y FR, pueden ser detectados en pacientes varios a&ntilde;os antes de que los s&iacute;ntomas cl&iacute;nicos de la AR se presenten y que est&aacute;n asociados directamente con la enfermedad, por lo tanto, la presencia de anticuerpos anti-CCP son un factor de riesgo para presentar AR<sup>14</sup>.</p>      <p>En la <a href="#fig6">figura 6</a> se grafican las variables FR y anti CCP represent&aacute;ndose con color rojo el grupo 1 y con color azul el grupo 2. En el gr&aacute;fico se puede observar que los individuos del grupo 1 tienen valores mayores en la variables anti-CCP con respecto a los de los individuos del grupo 2, lo cual confirma los resultados reportados previamente en la literatura.</p>      <p align="center"><a name="fig6"><img src="img/revistas/rcre/v22n2/v22n2a04f6.jpg"></a></p>       <p>Tambi&eacute;n se dise&ntilde;aron e implementaron modelos computacionales utilizando 11 variables: 2 variables gen&eacute;ticas correspondientes a los 2 alelos del HLA DRB1; las variables serol&oacute;gicas PCR, FR y anticuerpos anti-CCP y 6 variables cl&iacute;nicas: edad, antecedente de tabaquismo, antecedente de hipertensi&oacute;n arterial, antecedente de dislipidemia, n&uacute;mero de articulaciones dolorosas y n&uacute;mero de articulaciones inflamadas.</p>      <p>La red neuronal dise&ntilde;ada tuvo 7 neuronas para una capa oculta. Se aplic&oacute; filtro de nominal a binario para las variables de entrada, con una tasa de aprendizaje de 0,3 y momento 0,2. La red neuronal se entren&oacute; a trav&eacute;s del m&eacute;todo de retro-propagaci&oacute;n. Por otro lado, para la red bayesiana se utiliz&oacute; un estimador simple y el algoritmo de b&uacute;squeda tipo TAN. Finalmente, se realiz&oacute; agrupaci&oacute;n con <i>k-means </i>usando una distancia euclidiana y para calcular el mejor <i>k </i>se utiliz&oacute; el coeficiente de silueta.</p>      <p>La red neuronal tipo perceptr&oacute;n multicapa utilizando 11 variables obtuvo una exactitud de 89,28% que corresponde a 25 instancias correctamente clasificadas de 28 instancias de prueba. La correspondiente matriz de confusi&oacute;n y las medidas de desempe&ntilde;o se presentan en la <a href="#tab9">tabla 9</a>.</p>      ]]></body>
<body><![CDATA[<p align="center"><a name="tab9"><img src="img/revistas/rcre/v22n2/v22n2a04t9.jpg"></a></p>      <p>En la <a href="#fig7">figura 7</a> se observa la red bayesiana implementada utilizando 11 variables para clasificaci&oacute;n entre pacientes y controles, en la cual se aprecian las dependencias probabil&iacute;sticas entre las variables utilizadas.</p>      <p align="center"><a name="fig7"><img src="img/revistas/rcre/v22n2/v22n2a04f7.jpg"></a></p>      <p>En la red bayesiana observamos las relaciones que se presentan entre las distintas variables gen&eacute;ticas, cl&iacute;nicas y serol&oacute;gicas, principalmente la dependencia que se ve entre la variable alelo 1 y las variables cl&iacute;nicas articulaciones inflamadas y articulaciones dolorosas; esto nos demuestra la relaci&oacute;n existente entre la gen&eacute;tica de la enfermedad y sus manifestaciones cl&iacute;nicas.</p>     <p>Con la red bayesiana se obtuvieron los siguientes resultados: de las 28 instancias de prueba se clasificaron adecuadamente 25, que corresponde al 92,85%, e incorrectamente 3 instancias, que corresponde al 7,15%, con una sensibilidad del 92,3% y una especificidad del 93,33%. La matriz de confusi&oacute;n y las medidas de desempe&ntilde;o se presentan en la <a href="#tab10">tabla 10</a>.</p>      <p align="center"><a name="tab10"><img src="img/revistas/rcre/v22n2/v22n2a04t10.jpg"></a></p>       <p>Los nodos en la red bayesiana se relacionan mediante probabilidades de que un suceso ocurra.</p>      <p>Tambi&eacute;n se realiz&oacute; una agrupaci&oacute;n con los datos de los 63 pacientes. Esto forma parte del estudio de clasificaci&oacute;n de severidad de la enfermedad. Se utiliz&oacute; el valor del coeficiente silueta para determinar el mejor n&uacute;mero de grupos. La <a href="#fig8">figura 8</a> muestra los valores del coeficiente silueta para varios valores de k. El mejor valor del coeficiente silueta se obtiene para <i>k </i>= 2.</p>      <p align="center"><a name="fig8"><img src="img/revistas/rcre/v22n2/v22n2a04f8.jpg"></a></p>       <p>Para esto se utiliz&oacute; <i>k-means </i>sobre las variables normalizadas para identificar entre los pacientes los aspectos relacionados con la severidad de la enfermedad. Se hizo una agrupaci&oacute;n en 2 grupos, los cuales quedaron conformados de la siguiente manera: el primer grupo con 40 individuos y el segundo con 23. El an&aacute;lisis estad&iacute;stico de los 2 grupos obtenidos se puede observar en las <a href="#tab11">tablas 11</a> y <a href="#tab12">12</a>.</p>      ]]></body>
<body><![CDATA[<p align="center"><a name="tab11"><img src="img/revistas/rcre/v22n2/v22n2a04t11.jpg"></a></p>     <p align="center"><a name="tab12"><img src="img/revistas/rcre/v22n2/v22n2a04t12.jpg"></a></p>       <p>Al comparar los 2 grupos, se identific&oacute; que el promedio de articulaciones inflamadas y dolorosas entre estos fue similar, siendo en el grupo 1 de 23,26 y 24,08, respectivamente, y en el grupo 2 de 22,25 y 22,78, respectivamente, por lo cual estas 2 variables no son discriminantes. Por el contrario, el promedio de la variable anti-CCP del grupo 1 fue de 32,13 y del grupo 2 fue de 155,05, lo que puede indicar una enfermedad m&aacute;s activa en el grupo 2 con respecto al grupo 1. Tambi&eacute;n, al analizar las desviaciones est&aacute;ndar del anti-CCP se puede inferir que esta variable puede llegar a ser discriminante.</p>      <p>Por otro lado, para la identificaci&oacute;n de endofenotipos se realiz&oacute; el alineamiento de las secuencias de amino&aacute;cidos de los distintos alelos correspondientes a pacientes con un desenlace en com&uacute;n. Esto se hizo usando clustalw. Para este caso se seleccionaron los alelos de los pacientes con 28 articulaciones comprometidas como criterio de severidad y se realiz&oacute; el alineamiento de las secuencias correspondientes. Como resultado se encontraron secuencias comunes, adem&aacute;s de las secuencias de la teor&iacute;a del EC.</p>      <p>Se realiz&oacute; primero la identificaci&oacute;n de la identidad entre las secuencias de amino&aacute;cidos que corresponden a pacientes con 28 articulaciones comprometidas; el resultado se muestra en la <a href="#fig9">figura 9</a>.</p>      <p align="center"><a name="fig9"><img src="img/revistas/rcre/v22n2/v22n2a04f9.jpg"></a></p>       <p>En la <a href="#fig10">figura 10</a> se observa que las secuencias de amino&aacute;cidos QVKH y WQPKR son comunes en pacientes que tienen 28 articulaciones comprometidas, lo cual indica que est&aacute;n asociadas con este desenlace.</p>      <p align="center"><a name="fig10"><img src="img/revistas/rcre/v22n2/v22n2a04f10.jpg"></a></p>       <p>En el recuadro rojo se resalta el &aacute;rea correspondiente al EC. En este estudio se logr&oacute; determinar que, adem&aacute;s de las secuencias de amino&aacute;cidos comunes entre pacientes con AR, tambi&eacute;n existen otras secuencias de amino&aacute;cidos comunes entre pacientes, las cuales pueden ser candidatas para la posible identificaci&oacute;n de desenlaces de la enfermedad.</p>      <p>Se realiz&oacute; un an&aacute;lisis de los datos tipificados en el HLA DRB1 y la informaci&oacute;n cl&iacute;nica de los pacientes con AR y de los controles. Esto se realiz&oacute; a partir de la hip&oacute;tesis del EC, para lo cual se calcul&oacute; la frecuencia de cada alelo entre los pacientes y los controles. En la <a href="#tab13">tabla 13</a> se muestran los resultados obtenidos. De las 138 personas que participaron en el estudio se identificaron 59 alelos diferentes para el HLA DRB1, de los cuales 8 son homocigotos y pertenecen a 4 pacientes (0101, 0103, 0441, 0701) y 4 controles (0701,1101, 0802,1303).</p>      ]]></body>
<body><![CDATA[<p align="center"><a name="tab13"><img src="img/revistas/rcre/v22n2/v22n2a04t13.jpg"></a></p>       <p>Los alelos m&aacute;s frecuentes en los pacientes se presentan en la <a href="#tab15">tabla 14</a>.</p>      <p align="center"><a name="tab14"><img src="img/revistas/rcre/v22n2/v22n2a04t14.jpg"></a></p>       <p>Las secuencias QKRAA, QRRAA y RRRAA, que corresponden a los amino&aacute;cidos de los alelos del EC, se repitieron 98 veces en los datos analizados. Esto significa que estas secuencias hacen parte de las reportadas en la literatura como EC.</p>      <p>En varios estudios se ha demostrado que algunas variantes gen&eacute;ticas se asocian con aumento del riesgo de desarrollar AR. Como en este estudio, en el cual un an&aacute;lisis de la interacci&oacute;n de polimorfismos se utiliz&oacute; para analizar los polimorfismos de nucle&oacute;tido &uacute;nico (SNP) que contribuyen a la AR, los pares de SNP adquiridos se utilizaron para construir una red SNP-SNP. Se realiz&oacute; el an&aacute;lisis de cada m&oacute;dulo de genes que pueden ser utilizados para investigar la funci&oacute;n de genes agrupados, para una mejor comprensi&oacute;n de la patog&eacute;nesis de la AR<sup>15</sup>.</p>      <p>A partir de esta informaci&oacute;n, para cada uno de los alelos en estudio se encontraron las secuencias que se muestran en la <a href="#tab15">tabla 15</a>.</p>      <p align="center"><a name="tab15"><img src="img/revistas/rcre/v22n2/v22n2a04t15.jpg"></a></p>      <p>Se realiz&oacute; un alineamiento entre las distintas secuencias de amino&aacute;cidos de los alelos. El resultado de este alineamiento se muestra en la <a href="#fig11">figura 11</a>.</p>      <p align="center"><a name="fig11"><img src="img/revistas/rcre/v22n2/v22n2a04f11.jpg"></a></p>       <p>Con los datos utilizados en el presente estudio se confirma la hip&oacute;tesis del EC en los pacientes colombianos con AR, esto a partir de que los alelos m&aacute;s frecuentes y que corresponden a las secuencias QKRAA, QRRAA y RRRAA est&aacute;n presentes en los pacientes con AR, se logra identificar que el alelo 0101, implicado en la AR, es el m&aacute;s frecuente en pacientes con AR.</p>      ]]></body>
<body><![CDATA[<p>Finalmente, se cre&oacute; un &aacute;rbol entre los alelos de los pacientes con AR por el m&eacute;todo de distancia promedio <i>(average distance) </i>usando Blosum62 con el fin de buscar cercan&iacute;a gen&eacute;tica entre los alelos, para posteriormente asociarlos con lo reportado en la literatura. En la <a href="#fig12">figura 12</a> se presenta el &aacute;rbol encontrado, el cual fue obtenido usando <i>Jalview.</i></p>      <p align="center"><a name="fig12"><img src="img/revistas/rcre/v22n2/v22n2a04f12.jpg"></a></p>       <p>En la <a href="#fig12">figura 12</a> se observan los grupos que se forman a partir de informaci&oacute;n de los pacientes. All&iacute; se identifican algunos grupos que verifican lo que ha sido reportado en la literatura sobre criterios de severidad. Particularmente se forman grupos con riesgo alto que corresponden a los alelos 0401 y 1303; riesgo intermedio 0101, 0102, 0404, 0405, 0408, 1001, 1402; y riesgo bajo 0103, 0402, 03, 0403, 0407, 0411, 07, 08, 09, 1101, 1102, 1103, 1104, 12, 1301, 1302, 1323, 1401, 1404, 15, 16.</p>      <p>La clasificaci&oacute;n propuesta en un estudio previo fue la siguiente, el HLA-DRB1 se dividi&oacute; primero en 2 grupos de acuerdo con la presencia o ausencia de la secuencia RAA en la posici&oacute;n 72-74, que se denota como S y alelos X, respectivamente. El grupo S incluye alelos que se clasifican como EX en la primera clasificaci&oacute;n. Los alelos S se puede dividir posteriormente en 4 grupos de acuerdo con el amino&aacute;cido en la posici&oacute;n 71: una alanina (A), un &aacute;cido glut&aacute;mico (E), una lisina (K), o una arginina (R). Cuatro diferentes alelos fueron definidos en la nueva clasificaci&oacute;n, as&iacute;: S1 para ARAA y ERAA, S2 para KRAA, S3 para RRAA y X para todos los motivos no RAA.</p>      <p>Por otra parte, el estudio indica que el amino&aacute;cido en la posici&oacute;n 70 puede influir en la susceptibilidad a la AR; de hecho, un &aacute;cido asp&aacute;rtico (D) se supone que es de protecci&oacute;n en comparaci&oacute;n con la presencia de una glutamina (Q) o una arginina (R). Por lo tanto, 2 alelos adicionales se definieron: S3D para DRRAA y S3P para QRRAA o RRRAA. Alelos S2 no podr&iacute;an ser divididos debido a su peque&ntilde;a frecuencia<sup>16,17</sup>.</p>      <p>En la <a href="#tab16">tabla 16</a> se presentan los grupos obtenidos por cercan&iacute;a gen&eacute;tica a partir de la secuencia de amino&aacute;cidos correspondiente a cada alelo, los cuales son comparables con resultados previos obtenidos en otros estudios.</p>      <p align="center"><a name="tab16"><img src="img/revistas/rcre/v22n2/v22n2a04t16.jpg"></a></p>      <p><font size="3"><b>Discusi&oacute;n</b></font></p>      <p>Mediante t&eacute;cnicas computacionales, como las redes neuronales, utilizando 5 variables, se logr&oacute; clasificar a pacientes con AR y controles sanos; utilizando los criterios del Colegio Americano de Reumatolog&iacute;a se logr&oacute; mejorar el desempe&ntilde;o de los modelos. En el caso de la red neuronal se consigui&oacute; clasificar adecuadamente el 89,28% de los datos. Con la red bayesiana con 5 variables se clasific&oacute; adecuadamente el 92,85% de los datos. Por otro lado, la red neuronal utilizando 11 variables clasific&oacute; adecuadamente el 89,28% y la red bayesiana clasific&oacute; adecuadamente el 92,85% de los datos.</p>      <p>Los resultados obtenidos con <i>k-means </i>con el grupo de 138 individuos permitieron determinar que el grupo 1 presentaba una susceptibilidad mayor a presentar AR dada por los resultados de las variables analizadas.</p>      ]]></body>
<body><![CDATA[<p>Posteriormente, se realiz&oacute; un nuevo agrupamiento de pacientes para determinar la severidad de la enfermedad. Al utilizar el coeficiente silueta se determin&oacute; que el mejor agrupamiento se logra con 2 grupos. Al comparar los 2 grupos, se identific&oacute; que el promedio de articulaciones inflamadas y dolorosas fue similar, por lo cual, estas 2 variables no son discriminantes. En contraste, la variable anti-CCP result&oacute; discriminante para la condici&oacute;n de severidad de la enfermedad. Por otro lado, los valores para la variable FR son cualitativamente positivos, lo cual solo indica que los individuos pertenecientes a estos grupos presentan una actividad de la enfermedad. Algo similar se puede observar para las articulaciones inflamadas y dolorosas.</p>      <p>Adicionalmente, en la red bayesiana se identificaron relaciones significativas entre las variables, tales como la relaci&oacute;n entre el n&uacute;mero de articulaciones inflamadas y dolorosas con las variables serol&oacute;gicas y las variables gen&eacute;ticas. Este hallazgo est&aacute; acorde con los resultados obtenidos en el estudio de Li et al.<sup>18</sup>, donde analizaron las relaciones existentes entre los fenotipos y biomarcadores en un estudio de AR. Por lo cual, en este estudio a trav&eacute;s de los m&eacute;todos computacionales mencionados se encontraron relaciones de dependencia entre estas variables, principalmente usando los modelos bayesianos. Las tablas de los valores de las probabilidades correspondientes indican la posibilidad de que una persona presente AR.</p>      <p>Seg&uacute;n algunos estudios, las redes bayesianas proporcionan un marco conveniente para la sistematizaci&oacute;n de datos para deducir un orden de probabilidad y modelos de variables que interact&uacute;an en enfermedades como la AR. Estos estudios se han concentrado en la estimaci&oacute;n de las relaciones estructurales en el sistema en estudio o en la identificaci&oacute;n de las asociaciones de la enfermedad con los polimorfismos gen&eacute;ticos. Por esto las redes bayesianas se pueden utilizar para predecir el resultado de las intervenciones espec&iacute;ficas en esta enfermedad<sup>19</sup>.</p>      <p><font size="3"><b>Conclusiones</b></font></p>      <p>En este trabajo se realiz&oacute; el an&aacute;lisis de un conjunto de datos de pacientes con AR aplicando m&eacute;todos de inteligencia computacional, con el fin de tratar de identificar endofenotipos para la enfermedad. Los datos inclu&iacute;an informaci&oacute;n gen&eacute;tica, cl&iacute;nica y serol&oacute;gica. Tambi&eacute;n se trataron de obtener marcadores para determinar la severidad de la enfermedad en los pacientes.</p>      <p>Se identificaron las relaciones de dependencia entre algunas de las variables a trav&eacute;s de una red bayesiana. Espec&iacute;ficamente se estableci&oacute; que las variables anti-CCP y el FR est&aacute;n implicadas de manera significativa en la enfermedad. Tambi&eacute;n, se identificaron endofenotipos relacionados con la severidad de la enfermedad en pacientes; particularmente se identificaron secuencias de amino&aacute;cidos comunes entre pacientes con el mismo desenlace.</p>      <p>Se concluy&oacute; que utilizando t&eacute;cnicas de inteligencia computacional y bioinform&aacute;tica fue posible desarrollar modelos computacionales que, usando informaci&oacute;n gen&eacute;tica y cl&iacute;nica, logran clasificar entre pacientes y controles sanos, as&iacute; como tambi&eacute;n clasificar seg&uacute;n criterios de severidad a los pacientes.</p>      <p><font size="3"><b>Trabajo futuro</b></font></p>      <p>Se propone trabajar en la b&uacute;squeda de m&aacute;s secuencias comunes entre los distintos pacientes con grados de severidad similares y para ello se podr&aacute;n utilizar otras variables como son niveles elevados del FR, niveles elevados de anticuerpos anti-CCP, HAQ elevados y otras posibles variables que se pueden cuantificar.</p>      <p>Se recomienda en un trabajo futuro desarrollar una aplicaci&oacute;n web que permita automatizar la metodolog&iacute;a de an&aacute;lisis aplicada en esta investigaci&oacute;n, as&iacute; como realizar trabajos futuros con un n&uacute;mero mayor de pacientes.</p>      ]]></body>
<body><![CDATA[<p>Finalmente, se recomienda implementar y validar otras t&eacute;cnicas de inteligencia computacional, tales como m&aacute;quinas de soporte vectorial o t&eacute;cnicas como <i>boosting </i>y <i>bagging, </i>para clasificar y diferenciar entre pacientes y controles sanos.</p>      <p><font size="3"><b>Responsabilidades &eacute;ticas</b></font></p>      <p><b>Protecci&oacute;n de personas y animales</b>. Los autores declaran que los procedimientos seguidos se conformaron a las normas &eacute;ticas del comit&eacute; de experimentaci&oacute;n humana responsable y de acuerdo con la Asociaci&oacute;n M&eacute;dica Mundial y la Declaraci&oacute;n de Helsinki.</p>      <p><b>Confidencialidad de los datos</b>. Los autores declaran que han seguido los protocolos de su centro de trabajo sobre la publicaci&oacute;n de datos de pacientes.</p>      <p><b>Derecho a la privacidad y consentimiento informado</b>. Los autores han obtenido el consentimiento informado de los pacientes y/o sujetos referidos en el art&iacute;culo. Este documento obra en poder del autor de correspondencia.</p>      <p><font size="3"><b>Conflicto de intereses</b></font></p>      <p>Los autores declaran no tener ning&uacute;n conflicto de intereses.</p>  <hr>      <p><font size="3"><b>Bibliograf&iacute;a</b></font></p>      <!-- ref --><p>1. Bax m, van Heemst J, Huizinga TWJ, Toes rem. Genetics of rheumatoid arthritis: What have we learned? Immunogenetics. 2011;63:459-66.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835426&pid=S0121-8123201500020000400001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>2. McInnes IB, Schett G. The pathogenesis of rheumatoid arthritis. New Engl J Med. 2011;365:2205-19.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835428&pid=S0121-8123201500020000400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>3. Massardo L, Gareca N, Cartes MA, Cervilla V.Gonzalez A, Jacobelli S. The presence of the HLA-DRB1 shared epitope correlates with erosive disease in Chilean patients with rheumatoid arthritis. Rheumatology. 2002;41:153-6.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835430&pid=S0121-8123201500020000400003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>4. Mattey DL, Thomson W, Ollier WER, Batley M, Davies PG, Gough a K, et al. Association of DRB1 shared epitope genotypes with early mortality in rheumatoid arthritis: Results of eighteen years of followup from the early rheumatoid arthritis study. Arthritis Rheum. 2007;56:1408-16.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835432&pid=S0121-8123201500020000400004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>5. Aletaha D, Neogi T, Silman AJ, Funovits J, Felson DT, Bingham CO, et al. 2010 Rheumatoid arthritis classification criteria: an American College of Rheumatology/European League Against Rheumatism collaborative initiative. Arthritis Rheum. 2010;62:2569-81.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835434&pid=S0121-8123201500020000400005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>6. Schmidhuber J. Deep learning in neural networks: An overview. Neural Networks. 2015;61:85-117.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835436&pid=S0121-8123201500020000400006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>7. Meireles MRG, Almeida PEM, Member S, Simões MG, Member S. A comprehensive review for industrial applicability of artificial neural networks. IEEE Transactions on Industrial Electronics. 2003;50:585-601.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835438&pid=S0121-8123201500020000400007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>8. Fan C, Gao F, Sun S, Cui F. Bayesian neural networks and its application. 2008 Fourth International Conference on Natural Computation. IEEE; 2008 &#91;2014&#93;;446-50 &#91;consultado 23 Sep 2012&#93;. Disponible en:  <a href="http://ieeexplore.ieee.org/xpl/login.jsp?tp=&amp;arnumber=4667178&amp;url=http%3A%2F%2Fieeexplore.ieee.org%2Fiel5%2F4666791%2F4667081%2F04667178.pdf%3Farnumber%3D4667178" target="_blank">http://ieeexplore.ieee.org/xpl/login.jsp?tp=&amp;arnumber=4667178&amp;url=http%3A%2F%2Fieeexplore.ieee.org%2Fiel5%2F4666791%2F4667081%2F04667178.pdf%3Farnumber%3D4667178</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835440&pid=S0121-8123201500020000400008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>9. Kanungo T, Member S, Mount DM, Netanyahu NS, Piatko CD, Silverman R, et al. An efficient k-means clustering algorithm: Analysis and implementation. IEEE Xplore Digital Library. 2002;24:881-92.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835442&pid=S0121-8123201500020000400009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>10. Rousseeuw PJ. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics. 1987;20:53-65.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835444&pid=S0121-8123201500020000400010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>11. Pollard KS, van der Laan M.J. A method to identify significant clusters in gene expression data. U.C. Berkeley Division of Biostatistics Working Paper Series, paper 107, 2002.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835446&pid=S0121-8123201500020000400011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>12. Kodinariya TM, Makwana PR. Review on determining number of cluster in k-means clustering. International Journal of Advance Research in Computer Science and Management Studies. 2013;1:90-5.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835448&pid=S0121-8123201500020000400012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>13. Holmes G, Donkin A, Witten IH. WEKA: a machine learning workbench. En: Proc Second Australian and New Zealand Intelligent Information Systems Conference. 1994. p. 357-61.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835450&pid=S0121-8123201500020000400013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>14. Van Gaalen FA, Linn-Rasker SP, Van Venrooij WJ, De Jong BA, Breedveld FC, Verweij CL, et al. Autoantibodies to cyclic citrullinated peptides predict progression to rheumatoid arthritis in patients with undifferentiated arthritis: A prospective cohort study. Arthritis Rheum. 2015;50:709-15, 2004.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835452&pid=S0121-8123201500020000400014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>15. Hua L, Lin H, Li D, Li L, Liu Z. Mining functional gene modules linked with rheumatoid arthritis using a SNP-SNP network. Genomics Proteomics Bioinformatics &#91;Internet&#93;. 2012;10:23-34.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835454&pid=S0121-8123201500020000400015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>16. Du Montcel ST, Michou L, Petit-Teixeira E, Osorio J, Lemaire I, Lasbleiz S, et al. New classification of HLA-DRB1 alleles supports the shared epitope hypothesis of rheumatoid arthritis susceptibility. Arthritis Rheum. 2005;52: 1063-8.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835456&pid=S0121-8123201500020000400016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>17. Gourraud P-A, Boyer J-F, Barnetche T, Abbal M, Cambon-Thomsen A, Cantagrel A, et al. A new classification of HLA-DRB1 allele differentiates predisposing and protective alleles for rheumatoid arthritis structural severity. Arthritis Rheum. 2006;54:593-9.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835458&pid=S0121-8123201500020000400017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>18. Li W,Wang M, Irigoyen P, Gregersen PK. Inferring causal relationships among intermediate phenotypes and biomarkers: a case study of rheumatoid arthritis. Bioinformatics. 2006;22:1503-7.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835460&pid=S0121-8123201500020000400018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>19. Xing H, McDonagh PD, Bienkowska J, Cashorali T, Runge K, Miller RE, et al. Causal modeling using network ensemble simulations of genetic and gene expression data predicts genes involved in rheumatoid arthritis. PLoS Computational Biology. 2011;7:e1001105.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2835462&pid=S0121-8123201500020000400019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[m]]></surname>
<given-names><![CDATA[Bax]]></given-names>
</name>
<name>
<surname><![CDATA[van Heemst]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Huizinga]]></surname>
<given-names><![CDATA[TWJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Toes rem. Genetics of rheumatoid arthritis: What have we learned?]]></article-title>
<source><![CDATA[Immunogenetics]]></source>
<year>2011</year>
<volume>63</volume>
<page-range>459-66</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McInnes]]></surname>
<given-names><![CDATA[IB]]></given-names>
</name>
<name>
<surname><![CDATA[Schett]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The pathogenesis of rheumatoid arthritis]]></article-title>
<source><![CDATA[New Engl J Med]]></source>
<year></year>
<volume>2011</volume><volume>365</volume>
<page-range>2205-19</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Massardo]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Gareca]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Cartes]]></surname>
<given-names><![CDATA[MA]]></given-names>
</name>
<name>
<surname><![CDATA[Cervilla]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Gonzalez]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Jacobelli]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The presence of the HLA-DRB1 shared epitope correlates with erosive disease in Chilean patients with rheumatoid arthritis]]></article-title>
<source><![CDATA[Rheumatology]]></source>
<year>2002</year>
<volume>41</volume>
<page-range>153-6</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mattey]]></surname>
<given-names><![CDATA[DL]]></given-names>
</name>
<name>
<surname><![CDATA[Thomson]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Ollier]]></surname>
<given-names><![CDATA[WER]]></given-names>
</name>
<name>
<surname><![CDATA[Batley]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Davies]]></surname>
<given-names><![CDATA[PG]]></given-names>
</name>
<name>
<surname><![CDATA[Gough a]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Association of DRB1 shared epitope genotypes with early mortality in rheumatoid arthritis: Results of eighteen years of followup from the early rheumatoid arthritis study]]></article-title>
<source><![CDATA[Arthritis Rheum]]></source>
<year>2007</year>
<volume>56</volume>
<page-range>1408-16</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aletaha]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Neogi]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Silman]]></surname>
<given-names><![CDATA[AJ]]></given-names>
</name>
<name>
<surname><![CDATA[Funovits]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Felson]]></surname>
<given-names><![CDATA[DT]]></given-names>
</name>
<name>
<surname><![CDATA[Bingham]]></surname>
<given-names><![CDATA[CO]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[2010 Rheumatoid arthritis classification criteria: an American College of Rheumatology/European League Against Rheumatism collaborative initiative]]></article-title>
<source><![CDATA[Arthritis Rheum]]></source>
<year>2010</year>
<volume>62</volume>
<page-range>2569-81</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schmidhuber]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Deep learning in neural networks: An overview]]></article-title>
<source><![CDATA[Neural Networks]]></source>
<year>2015</year>
<volume>61</volume>
<page-range>85-117</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Meireles]]></surname>
<given-names><![CDATA[MRG]]></given-names>
</name>
<name>
<surname><![CDATA[Almeida]]></surname>
<given-names><![CDATA[PEM]]></given-names>
</name>
<name>
<surname><![CDATA[Member]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Simões]]></surname>
<given-names><![CDATA[MG]]></given-names>
</name>
<name>
<surname><![CDATA[Member]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comprehensive review for industrial applicability of artificial Neural Networks]]></article-title>
<source><![CDATA[IEEE Transactions on Industrial Electronics]]></source>
<year>2003</year>
<volume>50</volume>
<page-range>585-601</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fan]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Gao]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Sun]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Cui]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<source><![CDATA[Bayesian Neural Networks and its application]]></source>
<year>2008</year>
<conf-name><![CDATA[Fourth International Conference on Natural Computation]]></conf-name>
<conf-date>2008</conf-date>
<conf-loc> </conf-loc>
<page-range>446-50</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kanungo]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Member]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mount]]></surname>
<given-names><![CDATA[DM]]></given-names>
</name>
<name>
<surname><![CDATA[Netanyahu]]></surname>
<given-names><![CDATA[NS]]></given-names>
</name>
<name>
<surname><![CDATA[Piatko]]></surname>
<given-names><![CDATA[CD]]></given-names>
</name>
<name>
<surname><![CDATA[Silverman]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An efficient k-means clustering algorithm: Analysis and implementation]]></article-title>
<source><![CDATA[IEEE Xplore Digital Library]]></source>
<year>2002</year>
<volume>24</volume>
<page-range>881-92</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rousseeuw]]></surname>
<given-names><![CDATA[PJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Silhouettes: A graphical aid to the interpretation and validation of cluster analysis]]></article-title>
<source><![CDATA[Journal of Computational and Applied Mathematics]]></source>
<year>1987</year>
<volume>20</volume>
<page-range>53-65</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pollard]]></surname>
<given-names><![CDATA[KS]]></given-names>
</name>
<name>
<surname><![CDATA[van der Laan]]></surname>
<given-names><![CDATA[M.J]]></given-names>
</name>
</person-group>
<source><![CDATA[A method to identify significant clusters in gene expression data]]></source>
<year>2002</year>
<volume>107</volume>
<publisher-name><![CDATA[Berkeley Division of Biostatistics Working Paper Series]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kodinariya]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
<name>
<surname><![CDATA[Makwana]]></surname>
<given-names><![CDATA[PR]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Review on determining number of cluster in k-means clustering]]></article-title>
<source><![CDATA[International Journal of Advance Research in Computer Science and Management Studies]]></source>
<year>2013</year>
<volume>1</volume>
<page-range>90-5</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Holmes]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Donkin]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Witten]]></surname>
<given-names><![CDATA[IH]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[WEKA: a machine learning workbench]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ Proc Second Australian and New Zealand Intelligent Information Systems Conference]]></conf-name>
<conf-date>1994</conf-date>
<conf-loc> </conf-loc>
<page-range>357-61</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Van Gaalen]]></surname>
<given-names><![CDATA[FA]]></given-names>
</name>
<name>
<surname><![CDATA[Linn-Rasker]]></surname>
<given-names><![CDATA[SP]]></given-names>
</name>
<name>
<surname><![CDATA[Van Venrooij]]></surname>
<given-names><![CDATA[WJ]]></given-names>
</name>
<name>
<surname><![CDATA[De Jong]]></surname>
<given-names><![CDATA[BA]]></given-names>
</name>
<name>
<surname><![CDATA[Breedveld]]></surname>
<given-names><![CDATA[FC]]></given-names>
</name>
<name>
<surname><![CDATA[Verweij]]></surname>
<given-names><![CDATA[CL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Autoantibodies to cyclic citrullinated peptides predict progression to rheumatoid arthritis in patients with undifferentiated arthritis: A prospective cohort study]]></article-title>
<source><![CDATA[Arthritis Rheum]]></source>
<year>2015</year>
<month>20</month>
<day>04</day>
<volume>50</volume>
<page-range>709-15</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hua]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Lin]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mining functional gene modules linked with rheumatoid arthritis using a SNP-SNP network]]></article-title>
<source><![CDATA[Genomics Proteomics Bioinformatics]]></source>
<year>2012</year>
<volume>10</volume>
<page-range>23-34</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Du Montcel]]></surname>
<given-names><![CDATA[ST]]></given-names>
</name>
<name>
<surname><![CDATA[Michou]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Petit-Teixeira]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Osorio]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Lemaire]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Lasbleiz]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[New classification of HLA-DRB1 alleles supports the shared epitope hypothesis of rheumatoid arthritis susceptibility]]></article-title>
<source><![CDATA[Arthritis Rheum]]></source>
<year>2005</year>
<volume>52</volume>
<page-range>1063-8</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gourraud]]></surname>
<given-names><![CDATA[P-A]]></given-names>
</name>
<name>
<surname><![CDATA[Boyer]]></surname>
<given-names><![CDATA[J-F]]></given-names>
</name>
<name>
<surname><![CDATA[Barnetche]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Abbal]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Cambon-Thomsen]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Cantagrel]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A new classification of HLA-DRB1 allele differentiates predisposing and protective alleles for rheumatoid arthritis structural severity]]></article-title>
<source><![CDATA[Arthritis Rheum]]></source>
<year>2006</year>
<volume>54</volume>
<page-range>593-9</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Irigoyen]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Gregersen]]></surname>
<given-names><![CDATA[PK]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Inferring causal relationships among intermediate phenotypes and biomarkers: a case study of rheumatoid arthritis]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2006</year>
<volume>22</volume>
<page-range>1503-7</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xing]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[McDonagh]]></surname>
<given-names><![CDATA[PD]]></given-names>
</name>
<name>
<surname><![CDATA[Bienkowska]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Cashorali]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Runge]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Miller]]></surname>
<given-names><![CDATA[RE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Causal modeling using network ensemble simulations of genetic and gene expression data predicts genes involved in rheumatoid arthritis]]></article-title>
<source><![CDATA[PLoS Computational Biology]]></source>
<year>2011</year>
<volume>7</volume>
<page-range>e1001105</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
