<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0121-7488</journal-id>
<journal-title><![CDATA[Ciencia en Desarrollo]]></journal-title>
<abbrev-journal-title><![CDATA[Ciencia en Desarrollo]]></abbrev-journal-title>
<issn>0121-7488</issn>
<publisher>
<publisher-name><![CDATA[Universidad Pedagógica y Tecnológica de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0121-74882016000100003</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Una técnica de clasificación con variables categóricas]]></article-title>
<article-title xml:lang="en"><![CDATA[A Classification Technique With Categorical Variables]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Clavijo M]]></surname>
<given-names><![CDATA[J. A]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Granada D]]></surname>
<given-names><![CDATA[H. A]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad del Tolima Facultad de Ciencias Departamento de Matemáticas y Estadística]]></institution>
<addr-line><![CDATA[Tolima ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2016</year>
</pub-date>
<volume>7</volume>
<numero>1</numero>
<fpage>15</fpage>
<lpage>20</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0121-74882016000100003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0121-74882016000100003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0121-74882016000100003&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Resumen Presenta un algoritmo de clasificación para elementos caracterizados por variables categóricas, usando k-modas, un algoritmo similar a k-medias. A la vez, se incluyen diagramas de flujo para la implementación del algoritmo en cualquier lenguaje de programación. También se presenta un ejemplo con datos reales que ilustra la propuesta.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Abstract This paper presents a classification algorithm for elements characterized by categorical variables, using k-modes, a procedure analogous to k-means. At the same time we have included flowcharts for the algorithm implementation in any programming language. We also present a simple example, with real data, illustrating the proposal.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[conglomerado]]></kwd>
<kwd lng="es"><![CDATA[distancia]]></kwd>
<kwd lng="es"><![CDATA[disimilaridad]]></kwd>
<kwd lng="es"><![CDATA[k-medias]]></kwd>
<kwd lng="es"><![CDATA[k-modas]]></kwd>
<kwd lng="en"><![CDATA[Cluster]]></kwd>
<kwd lng="en"><![CDATA[Distance]]></kwd>
<kwd lng="en"><![CDATA[Dissimilarity]]></kwd>
<kwd lng="en"><![CDATA[k-means]]></kwd>
<kwd lng="en"><![CDATA[k-modes]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="Verdana" size="2">      <p align="center"><font size="4"><b>Una t&eacute;cnica de clasificaci&oacute;n con variables categ&oacute;ricas </b></font></p>      <p align="center"><font size="3"><b>A Classification Technique With Categorical Variables </b></font></p>      <p align="center">J. A. Clavijo M.<Sup>a,*</Sup>    <br>  H. A. Granada D.<Sup>a </Sup></p>      <p><Sup>a</Sup> Universidad del Tolima, Facultad de Ciencias, Departamento de Matem&aacute;ticas y Estad&iacute;stica. Tolima, Colombia    <br>  <sub>*</sub> Autor de correspondencia: <a href="mailto:jaclavijom@ut.edu.co">jaclavijom@ut.edu.co</a>. </p>      <p>Recepci&oacute;n: 15-oct-2015 Aceptaci&oacute;n: 20-ene-2016 </p>  <hr>     <p><b>Resumen </b></p>      <p>Presenta un algoritmo de clasificaci&oacute;n para elementos caracterizados por variables categ&oacute;ricas, usando <i>k-modas</i>, un algoritmo similar a <i>k-medias</i>. A la vez, se incluyen diagramas de flujo para la implementaci&oacute;n del algoritmo en cualquier lenguaje de programaci&oacute;n. Tambi&eacute;n se presenta un ejemplo con datos reales que ilustra la propuesta. </p>      ]]></body>
<body><![CDATA[<p><b><i>Palabras clave</i>:</b> conglomerado, distancia, disimilaridad, <i>k</i>-medias, <i>k</i>-modas. </p>  <hr>     <p><b>Abstract </b></p>      <p>This paper presents a classification algorithm for elements characterized by categorical variables, using <i>k-modes</i>, a procedure analogous to <i>k-means</i>. At the same time we have included flowcharts for the algorithm implementation in any programming language. We also present a simple example, with real data, illustrating the proposal. </p>      <p><b><i>Key words</i>:</b> Cluster, Distance, Dissimilarity, <i>k</i>-means, <i>k</i>-modes. </p>  <hr>     <p><font size="3"><b>1. Introducci&oacute;n </b></font></p>      <p>La clasificaci&oacute;n de individuos en diferentes conglomerados a partir de los valores que tome un conjunto de variables definidas sobre ellos es un procedimiento de gran inter&eacute;s en estad&iacute;stica, ya que tiene numerosas aplicaciones en las que se busca determinar segmentos muy homog&eacute;neos de una poblaci&oacute;n. </p>      <p>El caso en que todas las variables que describen a los individuos sean de tipo num&eacute;rico es ampliamente conocido &#91;2, 4, 5&#93;, y se han proporcionado varias t&eacute;cnicas para formar conglomerados: unas de tipo jer&aacute;rquico, como el <i>single linkage </i>oel <i>m&eacute;todo de Ward</i>, y otras de tipo no jer&aacute;rquico, como el <i>m&eacute;todo k-means</i>. Sin embargo, el caso en que las variables observadas sean de tipo categ&oacute;rico ha sido menos estudiado y pr&aacute;cticamente no existen t&eacute;cnicas que de manera directa conduzcan a la formaci&oacute;n de conglomerados. Podr&iacute;a citarse un m&eacute;todo indirecto, subproducto del an&aacute;lisis de correspondencias, en el que se pueden calcular las coordenadas de los individuos y de las categor&iacute;as sobre un <i>biplot </i>para agruparlos aplicando t&eacute;cnicas del caso num&eacute;rico a dichas coordenadas. </p>      <p>El prop&oacute;sito de este art&iacute;culo es presentar un m&eacute;todo de clasificaci&oacute;n que act&uacute;e directamente sobre los valores de las variables categ&oacute;ricas y agrupe los individuos bas&aacute;ndose en la semejanza de los valores categ&oacute;ricos que ellos asumen. El m&eacute;todo que se propone es una adaptaci&oacute;n del m&eacute;todo <i>k-means </i>de variables num&eacute;ricas, utilizando el concepto de moda, en vez del concepto de media, idea que ha sido propuesta por varios autores, entre ellos &#91;1, 6, 7&#93;, y que ha servido de inspiraci&oacute;n para este trabajo. </p>      <p><b>2. Disimilaridad entre individuos </b></p>      <p>Todos los m&eacute;todos de clasificaci&oacute;n buscan reunir en un solo grupo los individuos que m&aacute;s se parecen entre s&iacute; de acuerdo con los valores que ellos asumen en las variables que se estudian. Si se consideran <i>p </i>variables <i>X<sub>1</sub>,X<sub>2</sub>,...,X<sub>p</sub></i>, donde cada variable <i>X<sub>k</sub></i> tiene <i>n<sub>k</sub></i> categor&iacute;as, cada individuo <i>x<sub>i</sub></i> se asocia con una <i>p</i>-upla <i>x<sub>i</sub> = (ci</i><sub>1</sub>1,<i>ci</i><sub>2</sub>2,...,<i>ci<sub>p</sub>p</i>), donde 1 &le; <i>ik </i>&le; <i>nk </i>y <i>cik </i>=<i>ci<sub>k</sub>k </i>es la categor&iacute;a que dicho individuo adopta en la variable <i>X<sub>k</sub> </i>con <i>k </i>= 1,2,...,<i>p</i>. Naturalmente, dos individuos se parecen m&aacute;s cuando coinciden en un n&uacute;mero alto de categor&iacute;as en las <i>p</i>-uplas correspondientes y se diferencian seg&uacute;n el n&uacute;mero de discrepancias que tengan.</p>      ]]></body>
<body><![CDATA[<p><b>Definici&oacute;n 1.</b> Dados dos individuos x<i><sub>i</sub> </i>= (<i>c<sub>i1</sub>,c<sub>i2</sub>, ...,c<sub>ip</sub></i>) y x<i><sub>j</sub> </i>=(<i>c<sub>j1</sub>,c<sub>j2</sub>,...,c<sub>jp</sub></i>) diremos que entre ellos hay una discrepancia en la <i>k</i>-&eacute;sima variable si <i>i </i>&&ne;j, la cual se representa mediante la m&eacute;trica discreta:</p>      <p><a name="ec1"></a><img src="img/revistas/cide/v7n1/v17n1a03ec1.jpg"></p>      <p><b>Definici&oacute;n 2.</b> Para todo par de individuos <i>x<sub>i</sub>, x<sub>j</sub> </i>definimos la disimilaridad: </p>      <p><a name="ec2"></a><img src="img/revistas/cide/v7n1/v17n1a03ec2.jpg"></p>      <p><b>Observaci&oacute;n 1.</b> Dados dos individuos <i>x<sub>i</sub> </i>y <i>x<sub>j</sub>, d<sub>ij</sub> </i>= 0 indica una <i>m&aacute;xima semejanza </i>entre los dos individuos, mientras que <i>d<sub>ij</sub> =p </i>indica <i>m&aacute;xima diferencia </i>o ning&uacute;n parecido entre ellos. </p>      <p><b>3. Moda de un conjunto </b></p>      <p><b>Definici&oacute;n 3.</b> Consideremos el conjunto <i>X = &#123;x<sub>1</sub>,...,x<sub>n</sub></i>&#125; de <i>n </i>individuos descritos por <i>p </i>variables categ&oacute;ricas <i>X<sub>1</sub>,...,X<sub>p</sub></i>. Definimos una moda de <i>X </i>como una <i>p</i>-upla <i>Q =(q<sub>1</sub>,...,q<sub>p</sub></i>) tal que <a name="ec3"></a><img src="img/revistas/cide/v7n1/v17n1a03ec3.jpg"> sea m&iacute;nima &#91;1&#93;. </p>      <p><b>Observaci&oacute;n 2.</b> Se garantiza la existencia de un m&iacute;nimo para <i>D</i>, ya que es una suma finita de n&uacute;meros enteros y est&aacute; acotada por: </p>      <p align="center"><a name="ec4"></a><img src="img/revistas/cide/v7n1/v17n1a03ec4.jpg"></p>      <p><b>Ejemplo 1.</b> Sea <i>X </i>el conjunto formado por seis individuos definidos por: </p>      ]]></body>
<body><![CDATA[<p align="center"><a name="ec5"></a><img src="img/revistas/cide/v7n1/v17n1a03ec5.jpg"></p>      <p>Estas triplas han sido definidas como respuesta a tres variables categ&oacute;ricas, as&iacute;: </p>      <p><i>X</i><sub>1</sub> con dos categor&iacute;as codificadas como 1 y 2.    <br>  <i>X</i><sub>2</sub> con tres categor&iacute;as codificadas como 1, 2 y 3.    <br>  <i>X</i><sub>3</sub> con tres categor&iacute;as codificadas como 1, 2 y 3. </p>      <p>Las posibilidades de respuesta son en total 18,y la moda de <i>X </i>ser&aacute; una terna <i>Q </i>que haga m&iacute;nimo el valor <a name="ec6"></a><img src="img/revistas/cide/v7n1/v17n1a03ec6.jpg">. Como se puede ver en la <a href="#t1">tabla 1</a>, hay 6 posibles modas para el conjunto dado, a saber: (1,1,1), (1,1,2), (1,2,3), (2,1,1), (2,1,2) y (2,1,3). </p>      <p align="center"><a name="t1"></a><img src="img/revistas/cide/v7n1/v17n1a03t1.jpg"></p>      <p>Es claro que el procedimiento descrito en el ejemplo anterior no es eficiente para encontrar una moda. Ser&aacute; particularmente engorroso cuando se manejen muchos individuos y un n&uacute;mero grande de variables categ&oacute;ricas. Por ejemplo, una encuesta con solo 20 preguntas categ&oacute;ricas, cada una con 5 modalidades o categor&iacute;as, exige un c&aacute;lculo de m&aacute;s de 95 billones de sumas con tantos sumandos como individuos hayan contestado la encuesta, lo que genera un alto costo computacional! </p>      <p><b>Definici&oacute;n 4.</b> Dado un subconjunto cualquiera <i>Y </i>&sube; <i>X </i>con <i>r</i> &le; <i>n</i>elementos y una variable categ&oacute;rica <i>X<sub>j</sub></i>, para cada categor&iacute;a <i>c<sub>kj</sub> </i>de <i>X<sub>j</sub> </i>se define la frecuencia relativa como el n&uacute;mero: </p>      <p align="center"><a name="ec8"></a><img src="img/revistas/cide/v7n1/v17n1a03ec8.jpg"></p>      ]]></body>
<body><![CDATA[<p>donde <a name="ec9"></a><img src="img/revistas/cide/v7n1/v17n1a03ec9.jpg"> es la cantidad de veces que <i>c<sub>kj</sub> </i>pertenece a las <i>p</i>-uplas asociadas a los <i>r </i>elementos de <i>Y</i>. </p>      <p>Una manera pr&aacute;ctica de obtener las frecuencias es mediante tablas de frecuencias relativas. </p>      <p><b>Ejemplo 2.</b> Consideremos el conjunto <i>Y </i>=&#123;<i>y</i><sub>1</sub>, <i>y</i><sub>2</sub>,<i>y</i><sub>3</sub>&#125; =&#123;<i>x</i><sub>2</sub>,<i>x</i><sub>3</sub>,<i>x</i><sub>6</sub>&#125; de <i>r </i>=3 elementos (ver <a href="#t1">tabla 1</a>), calculamos las frecuencias relativas: </p>      <p align="center"><a name="ec10 "></a><img src="img/revistas/cide/v7n1/v17n1a03ec10.jpg"></p>      <p>De manera similar se calculan las dem&aacute;s frecuencias relativas de las variables <i>X<sub>i</sub></i> en <i>Y </i>dadas por las <a href="#t2">tablas 2</a> y <a href="#t3">3</a>. </p>      <p align="center"><a name="t2"></a><img src="img/revistas/cide/v7n1/v17n1a03t2.jpg"></p>      <p align="center"><a name="t3"></a><img src="img/revistas/cide/v7n1/v17n1a03t3.jpg">3</p>      <p>El Teorema 1 referenciado en &#91;1&#93; proporciona una forma eficiente de encontrar una moda para los elementos de un subconjunto <i>Y </i>de <i>X</i>. </p>      <p><b>Teorema 1.</b> El valor <i>D ( Q,Y )</i>es m&iacute;nimo si y solo si <i>fr ( X<sub>j</sub> </i>=<i><sub>qj</sub></i>|<i>Y )</i>&le; <i>fr ( X<sub>j</sub></i>= <i>c<sub>kj</sub></i>) para <i>q<sub>j</sub>&ne;c<sub>kj</sub></i> y <i>j</i> = 1,...,<i>p</i>.</p>      <p>En esencia, este teorema nos dice que la moda <i>Q </i>para <i>Y </i>es la <i>p</i>-upla <i>Q </i>= ( <i>q</i><sub>1</sub>,...,<i>q<sub>p </sub></i>), formada por las categor&iacute;as <i>q</i><sub>1</sub>,...,<i>q<sub>p</sub> </i>correspondientes a las m&aacute;ximas frecuencias en las tablas de frecuencia de cada variable. </p>      ]]></body>
<body><![CDATA[<p>As&iacute;, por ejemplo, para el conjunto <i>Y </i>del ejemplo anterior, <i>Q </i>debe ser la tripla <i>Q </i>= ( <i>c<sub>21</sub>, c<sub>22</sub>, c<sub>33 </sub></i>) = ( 2, 2, 3 ), como se puede apreciar en la &uacute;ltima columna de la <a href="#t1">tabla 1</a>. Este vector <i>Q </i>es uno de los dos vectores que hacen m&iacute;nima la suma <a name="ec11"></a><img src="img/revistas/cide/v7n1/v17n1a03ec11.jpg"> con <i>yi </i>&isin; <i>Y</i>. </p>      <p><b>4. El algoritmo <i>k</i>-Modas </b></p>      <p>Ya que hemos establecido una metodolog&iacute;a para encontrar modas en un conjunto de individuos determinados por variables categ&oacute;ricas, proponemos un algoritmo para agrupar dichos individuos en <i>k </i>conglomerados. El algoritmo que se propone es an&aacute;logo al conocido m&eacute;todo <i>k</i>-means para el caso de variables num&eacute;ricas, pero usando modas en vez de medias. Es por esto que el mejor nombre que podemos elegir para identificar la propuesta es el de algoritmo de <i>k</i>-modas. Dicho algoritmo se define por medio de los cuatro pasos siguientes: </p>      <p><b>Paso 1:</b> si se tienen <i>n </i>individuos en <i>X </i>que se pretenden agrupar en <i>k </i>clusters ( <i>k </i>&lt; <i>n </i>), comenzamos por elegir <i>k </i>de dichos individuos para que act&uacute;en como n&uacute;cleos de aglutinamiento. Hay varias formas de elegir estos n&uacute;cleos: aleatoriamente, a partir de una lista predefinida o simplemente tomando los <i>k </i>primeros. Estos primeros n&uacute;cleos act&uacute;an como modas transitorias. La &uacute;ltima opci&oacute;n es la que adoptamos en este trabajo. </p>      <p><b>Paso 2:</b> examinamos uno a uno los <i>n </i>- <i>k </i>individuos restantes y asignamos cada uno al n&uacute;cleo que le sea m&aacute;s cercano con la distancia <i>d </i>de la Definici&oacute;n 2. De esta manera vamos formando los diferentes grupos. En caso de empate en la distancia, el elemento en consideraci&oacute;n se puede asignar aleatoriamente a uno de los n&uacute;cleos que producen el empate. Una vez asignado un elemento a uno de los grupos, utilizamos el teorema visto anteriormente para actualizar la moda de dicho grupo. La nueva moda asumir&aacute; el papel de n&uacute;cleo para el grupo en consideraci&oacute;n. </p>      <p><b>Paso 3:</b> una vez se hayan asignado todos los elementos de <i>X </i>a alguno de los grupos, se revisa la disimilaridad de cada elemento en cada grupo respecto a su propio n&uacute;cleo y a los n&uacute;cleos de los dem&aacute;s grupos. Si se encontrase un elemento que est&aacute; m&aacute;s cercano al n&uacute;cleo de un grupo que no es el suyo, reasignamos dicho elemento a ese grupo y actualizamos las modas tanto del grupo receptor como del emisor. Como antes, las nuevas modas actuar&aacute;n como n&uacute;cleos de estos dos grupos. </p>      <p><b>Paso 4:</b> repetir el paso 3 cuantas veces sea necesario hasta que no se produzcan m&aacute;s cambios. </p>      <p><b>4.1. Implementaci&oacute;n del m&eacute;todo </b></p>      <p>Como se puede apreciar, el algoritmo es relativamente simple, pero es demasiado dispendioso por la cantidad de veces en que se debe buscar una moda para actualizar una ya existente en cada conglomerado. Es este un proceso que dif&iacute;cilmente puede llevarse a cabo en forma manual, siendo necesario el uso de procedimientos computacionales. Se programaron en Matlab las rutinas necesarias para implementar el m&eacute;todo anterior, que fue probado en la clasificaci&oacute;n de 45 usuarios de los sistemas de salud del Tolima. La muestra fue recolectada en las ciudades de Ibagu&eacute; y Espinal, mediante la aplicaci&oacute;n de una encuesta de 7 preguntas con respuestas categ&oacute;ricas, relacionadas con la percepci&oacute;n que tienen los usuarios de las EPS que les prestan servicios m&eacute;dicos. Este trabajo fue realizado por las estudiantes Nataly J. Roa y Luisa Fernanda Pastr&aacute;n, dentro de su trabajo de grado, relacionado con este tema &#91;3&#93;. En este trabajo presentaremos &uacute;nicamente los diagramas de flujo de la programaci&oacute;n del algoritmo, el cual se desarrolla en dos fases cuyos fines son los siguientes: </p>      <p><b>Fase 1.</b> B&uacute;squeda del n&uacute;cleo m&aacute;s cercano para cada elemento y c&aacute;lculo de la moda del grupo receptor. </p>      ]]></body>
<body><![CDATA[<p><b>Fase 2.</b> Comparaci&oacute;n de todos los elementos de cada grupo con los diferentes n&uacute;cleos para determinar si siguen en su grupo o si deben ser reasignados a otro grupo. Actualizaci&oacute;n de las modas tanto en el grupo emisor como en el grupo receptor en caso de alguna transferencia de elementos. </p>      <p><b>4.2. Diagramas de flujo </b></p>      <p>Como se mencion&oacute; anteriormente, el algoritmo de <i>k</i>-modas se realiza en dos fases, donde se hace necesario implementar una subrutina para b&uacute;squeda de modas y otra para el c&aacute;lculo de disimilaridades. Los diagramas de flujo presentados en este trabajo fueron implementados en el software Matlab, y es por esta raz&oacute;n que damos por conocidas las funciones internas: cell, length, find, min, max y unique. </p>      <p align="center"><a name="di1"></a><img src="img/revistas/cide/v7n1/v17n1a03di1.jpg"></p>      <p><b>5. Aplicaci&oacute;n del m&eacute;todo <i>k</i>-Modas </b></p>      <p>La <a href="#t4">tabla 4</a> proporciona los resultados de aplicar una encuesta de 7 preguntas de tipo categ&oacute;rico a 45 usuarios de EPS de las ciudades de Ibagu&eacute; y Espinal, en el Tolima &#91;3&#93;. </p>      <p align="center"><a name="t4"></a><img src="img/revistas/cide/v7n1/v17n1a03t4.jpg"></p>      <p>Los datos de la <a href="#t4">tabla 4</a> fueron procesados aplicando las rutinas antes mencionadas para realizar una clasificaci&oacute;n en tres grupos, obteni&eacute;ndose los resultados de la clasificaci&oacute;n en las <a href="#t5">tablas 5</a>, <a href="#t6">6</a> y <a href="#t7">7</a>. En la <a href="#t8">tabla 8</a> se presentan las modas de cada uno de los grupos.</p>      <p align="center"><a name="t5"></a><img src="img/revistas/cide/v7n1/v17n1a03t5.jpg"></p>      <p align="center"><a name="t6"></a><img src="img/revistas/cide/v7n1/v17n1a03t6.jpg"></p>      ]]></body>
<body><![CDATA[<p align="center"><a name="t7"></a><img src="img/revistas/cide/v7n1/v17n1a03t7.jpg"></p>      <p align="center"><a name="t8"></a><img src="img/revistas/cide/v7n1/v17n1a03t8.jpg"></p>      <p><font size="3"><b>Conclusiones</b></font></p>      <p>Un examen de caracterizaci&oacute;n o tipolog&iacute;a de estos grupos mediante la tabla de frecuencias de la <a href="#t9">tabla 9</a>, muestra que el grupo mayoritario, con 33 individuos, est&aacute; conformado por personas satisfechas con el servicio m&eacute;dico, que consideran que las instalaciones son buenas y que han conseguido sus citas m&eacute;dicas oportunamente en menos de una semana, que a la vez han recibido a tiempo sus medicamentos y que creen que la imagen de su EPS mejora cada vez m&aacute;s.</p>      <p align="center"><a name="t9"></a><img src="img/revistas/cide/v7n1/v17n1a03t9.jpg"></p>      <p>El grupo mediano, con 10 individuos, es un grupo de usuarios inconformes que han dado una baja calificaci&oacute;n a las instalaciones y al sistema de citas, pues han tardado m&aacute;s de una semana para conseguirlas. En general, son individuos insatisfechos con el ser vicio m&eacute;dico. Finalmente, se form&oacute; un grupo at&iacute;pico con dos individuos que no encajaron adecuadamente en ninguno de los dos grupos anteriores. </p>  <hr>     <p><font size="3"><b>Referencias</b></font></p>      <!-- ref --><p>&#91;1&#93; Z. Huang, "Extensions to the <i>k</i>-Means Algorithm for Clustering Large Data Sets with Categorical Values Data Mining and Knowledge Discovery", <i>Kluwer Academic Publishers,</i> vol. 2, no. 3, pp. 283-304, 1998.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891847&pid=S0121-7488201600010000300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;2&#93; A. C. Rencher, "Methods of multivariate analysis", <i>John Wiley &#38; Sons,</i> vol. 492, 2003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891849&pid=S0121-7488201600010000300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;3&#93; N. Roa y L. F. Pastr&aacute;n, "Una t&eacute;cnica de Clasificaci&oacute;n con Variables Categ&oacute;ricas", <i>Trabajo de Grado, Universidad del Tolima</i>, Colombia, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891851&pid=S0121-7488201600010000300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;4&#93; W. Dillon, and M. Goldstein, "Multivariate Analysis, Methods and Applications", <i>Jhon Wiley and Sons</i>, pp. 186-190, 1984.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891853&pid=S0121-7488201600010000300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;5&#93; D. F. Morrison, "Multivariate Statistical Methods", <i>Mc Graw Hill</i>, pp. 389-391, 1990.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891855&pid=S0121-7488201600010000300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;6&#93; B. Tian, C. A. Kulikowsky, G. Leiguang, Y. Bin, H. Lan, and Z. Chunguang, "A Global Kmodes Algorithm for Clustering Categorical Data", <i>Chinesse Journal of Electronics</i>, vol. 21, no. 3, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891857&pid=S0121-7488201600010000300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;7&#93; S. Mingoti, and R. Matos, "Clustering Algorithms for Categorical Data: A Monte Carlo Study", <i>International Journal of Statistics and Applications, </i>vol. 2, no. 4, pp. 24-32, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5891859&pid=S0121-7488201600010000300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[Z.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values Data Mining and Knowledge Discovery]]></article-title>
<source><![CDATA[Kluwer Academic Publishers]]></source>
<year>1998</year>
<volume>2</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>283-304</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rencher]]></surname>
<given-names><![CDATA[A. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Methods of multivariate analysis]]></article-title>
<source><![CDATA[John Wiley & Sons]]></source>
<year>2003</year>
<volume>492</volume>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Roa]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[Pastrán]]></surname>
<given-names><![CDATA[L. F.]]></given-names>
</name>
</person-group>
<source><![CDATA[Una técnica de Clasificación con Variables Categóricas]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dillon]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
<name>
<surname><![CDATA[Goldstein]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Multivariate Analysis, Methods and Applications]]></source>
<year>1984</year>
<page-range>186-190</page-range><publisher-name><![CDATA[Jhon Wiley and Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Morrison]]></surname>
<given-names><![CDATA[D. F.]]></given-names>
</name>
</person-group>
<source><![CDATA[Multivariate Statistical Methods]]></source>
<year>1990</year>
<page-range>389-391</page-range><publisher-name><![CDATA[Mc Graw Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tian]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Kulikowsky]]></surname>
<given-names><![CDATA[C. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Leiguang]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Bin]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Lan]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Chunguang]]></surname>
<given-names><![CDATA[Z.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Global Kmodes Algorithm for Clustering Categorical Data]]></article-title>
<source><![CDATA[Chinesse Journal of Electronics]]></source>
<year>2012</year>
<volume>21</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mingoti]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Matos]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Clustering Algorithms for Categorical Data: A Monte Carlo Study]]></article-title>
<source><![CDATA[International Journal of Statistics and Applications]]></source>
<year>2012</year>
<volume>2</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>24-32</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
