<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0120-6230</journal-id>
<journal-title><![CDATA[Revista Facultad de Ingeniería Universidad de Antioquia]]></journal-title>
<abbrev-journal-title><![CDATA[Rev.fac.ing.univ. Antioquia]]></abbrev-journal-title>
<issn>0120-6230</issn>
<publisher>
<publisher-name><![CDATA[Facultad de Ingeniería, Universidad de Antioquia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0120-62302009000100010</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Segmentación de la región de la boca en imágenes faciales: Revisión bibliográfica]]></article-title>
<article-title xml:lang="en"><![CDATA[Mouth Segmentation in Images: A Review]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[Juan Bernardo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[Flavio]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Redarce]]></surname>
<given-names><![CDATA[Tanneguy]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional de Colombia Sede Manizales Departamento de Ingeniería Eléctrica, Electrónica y Computación ]]></institution>
<addr-line><![CDATA[Manizales Caldas]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Laboratoire Ampère  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
<country>France</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>03</month>
<year>2009</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>03</month>
<year>2009</year>
</pub-date>
<numero>47</numero>
<fpage>103</fpage>
<lpage>116</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0120-62302009000100010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0120-62302009000100010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0120-62302009000100010&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En este artículo presentamos una revisión bibliográfica de las técnicas de segmentación de la región de la boca en imágenes faciales. Nos concentramos especialmente en los avances hechos en la última década. Para que la interpretación y comparación de las técnicas sea sencilla, éstas se presentan en forma taxonómica. Diferentes etapas del proceso de segmentación son tratadas, que abarcan desde la representación de color hasta la parametrización de la región de interés. Se realiza una comparación de algunos de los métodos revisados. Finalmente, se presenta una discusión de cada etapa de la segmentación.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This article presents a review on lip segmentation techniques, focusing in the advances of the last decade. The methods are introduced in a taxonomic manner, making it easier for interpretation and comparison. Each stage in lip segmentation process is highlighted, from the prior color representation study until the later mouth parameterization. A comparison between different methods is presented, when available. Finally, a discussion on each stage in lip segmentation is presented.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Boca]]></kwd>
<kwd lng="es"><![CDATA[segmentación]]></kwd>
<kwd lng="es"><![CDATA[imágenes faciales]]></kwd>
<kwd lng="es"><![CDATA[labios]]></kwd>
<kwd lng="en"><![CDATA[Mouth]]></kwd>
<kwd lng="en"><![CDATA[segmentation]]></kwd>
<kwd lng="en"><![CDATA[facial images]]></kwd>
<kwd lng="en"><![CDATA[lips]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="center"><font face="Verdana" size="4"> <b>Segmentaci&oacute;n de la regi&oacute;n de la boca en im&aacute;genes faciales: Revisi&oacute;n bibliogr&aacute;fica</b></font></p>     <p align="center"><font face="Verdana" size="4"> <b>Mouth Segmentation in Images: A Review</b></font></p>     <p> <font face="Verdana" size="2"> <i>Juan Bernardo G&oacute;mez<sup>1,2*</sup> , Flavio Prieto<sup>1</sup>, Tanneguy Redarce<sup>2</sup></i></font></p>     <p> <font face="Verdana" size="2"> <sup> 1</sup> Departamento de Ingenier&iacute;a El&eacute;ctrica, Electr&oacute;nica y Computaci&oacute;n, Universidad Nacional de Colombia Sede Manizales, Carrera 27 N<sup>o</sup> 64-60, Manizales, Caldas, Colombia</font></p>     <p> <font face="Verdana" size="2"> <sup> 2</sup> Laboratoire Amp&egrave;re, Cnrs, Umr 5005, 25 avenue Jean Capelle, INSA de Lyon, Antoine de Saint-Exupery, 69621 Villeurbanne Cedex, France</font></p>      <p><font face="Verdana" size="2">&nbsp;</font></p> <hr noshade size="1">      <p><font face="Verdana" size="3"> <b>Resumen</b></font></p>     <p><font face="Verdana" size="2">En este art&iacute;culo presentamos una revisi&oacute;n bibliogr&aacute;fica de las t&eacute;cnicas de segmentaci&oacute;n de la regi&oacute;n de la boca en im&aacute;genes faciales. Nos concentramos especialmente en los avances hechos en la &uacute;ltima d&eacute;cada. Para que la interpretaci&oacute;n y comparaci&oacute;n de las t&eacute;cnicas sea sencilla, &eacute;stas se presentan en forma taxon&oacute;mica. Diferentes etapas del proceso de segmentaci&oacute;n son tratadas, que abarcan desde la representaci&oacute;n de color hasta la parametrizaci&oacute;n de la regi&oacute;n de inter&eacute;s. Se realiza una comparaci&oacute;n de algunos de los m&eacute;todos revisados. Finalmente, se presenta una discusi&oacute;n de cada etapa de la segmentaci&oacute;n.</font></p>      <p><font face="Verdana" size="2"><b>Palabras clave:</b> Boca, segmentaci&oacute;n, im&aacute;genes faciales, labios </font></p>     <p><font face="Verdana" size="2">&nbsp;</font></p> <hr noshade size="1">     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="3"><b>Abstract</b></font></p>     <p><font face="Verdana" size="2">This article presents a review on lip segmentation techniques, focusing in the advances of the last decade. The methods are introduced in a taxonomic manner, making it easier for interpretation and comparison. Each stage in lip segmentation process is highlighted, from the prior color representation study until the later mouth parameterization. A comparison between different methods is presented, when available. Finally, a discussion on each stage in lip segmentation is presented.</font></p>      <p><font face="Verdana" size="2"><b>Keywords:</b> Mouth, segmentation, facial images, lips.</font></p>       <p><font face="Verdana" size="2">&nbsp;</font></p> <hr noshade size="1">       <p><font face="Verdana" size="3"><b>Introducci&oacute;n</b></font></p>      <p><font face="Verdana" size="2">El permanente avance en los sistemas de c&oacute;mputo, en cuanto a su capacidad de c&aacute;lculo, a precios cada vez m&aacute;s accesibles, ha impulsado en la &uacute;ltima d&eacute;cada, el estudio y desarrollo de diferentes tareas como la detecci&oacute;n autom&aacute;tica de la regi&oacute;n de la boca en im&aacute;genes. La segmentaci&oacute;n y caracterizaci&oacute;n de los labios es una tarea com&uacute;n en aplicaciones como: la lectura audio visual del habla, lectura autom&aacute;tica de los labios, antropometr&iacute;a de los labios, interacci&oacute;n hombre m&aacute;quina a trav&eacute;s de gestos, etc [1 - 4]. La detecci&oacute;n de los labios es un proceso compuesto por tres grandes etapas, las cuales se encuentran casi en todo sistema de visi&oacute;n artificial. La primera etapa est&aacute; relacionada con la selecci&oacute;n de la regi&oacute;n de inter&eacute;s dentro de la imagen completa. La siguiente etapa es la segmentaci&oacute;n de los elementos de la imagen, en esta se deben separar los labios del resto de la imagen en la regi&oacute;n de inter&eacute;s. Finalmente, una etapa que en ocasiones es omitida, es la parametrizaci&oacute;n de la regi&oacute;n de la boca, la cual se obtiene generalmente mediante la extracci&oacute;n de los contornos internos y externos. La parametrizaci&oacute;n de la boca se utiliza con frecuencia como paso inicial en la detecci&oacute;n de gestos y en el reconocimiento de rostros, por lo que el proceso es orientado a la selecci&oacute;n de puntos de referencia y a la extracci&oacute;n de caracter&iacute;sticas. Esta revisi&oacute;n est&aacute; organizada siguiendo las siguientes etapas: Despu&eacute;s de la introducci&oacute;n, discutimos como algunas representaciones de color han sido ajustadas para la segmentaci&oacute;n de los labios. Luego se presentan las tendencias en segmentaci&oacute;n autom&aacute;tica de los labios y un resumen de las diferentes t&eacute;cnicas empleadas en el modelado param&eacute;trico de la regi&oacute;n de la boca. Posteriormente, se presentan las t&eacute;cnicas m&aacute;s comunes para medir la calidad de la segmentaci&oacute;n y parametrizaci&oacute;n de los labios. Finalmente, se presentan las conclusiones.</font></p>       <p><font face="Verdana" size="2"><b>Realce de la boca mediante transformaciones del color</b></font></p>      <p><font face="Verdana" size="2">En muchas aplicaciones en visi&oacute;n artificial es posible encontrar transformaciones de color lineal, las cuales permiten resaltar las regiones de inter&eacute;s del resto de la imagen. En tales aplicaciones, una vez que la imagen ha sido resaltada o transformada, una simple umbralizaci&oacute;n es suficiente para realizar la segmentaci&oacute;n. Por ejemplo, en [5] se presenta una interesante revisi&oacute;n en la representaci&oacute;n en los espacios de color para detecci&oacute;n de la piel.</font></p>       <p><font face="Verdana" size="2">Es conocido que el problema de clasificar la piel y el color de los labios no es un problema linealmente separable [6 - 8]. Sin embargo, aun cuando el Tono y sus variantes, han mostrado que realzan la regi&oacute;n de los labios, ellas no est&aacute;n desacopladas de la luminancia. Para manejar estas limitaciones, se han propuesto dos t&eacute;cnicas diferentes. La primera, que puede ser llamada basada en p&iacute;xel, se fundamenta en la realizaci&oacute;n de una separaci&oacute;n no lineal entre las clases. En este caso, cada color representa una variable en el espacio de caracter&iacute;sticas. La segunda, llamada basada en imagen, depende de los par&aacute;metros intr&iacute;nsecos que pueden ser ajustados para cada imagen diferente. Algunas transformaciones basadas en p&iacute;xel son presentadas en [9 - 11]. Combinaciones de transformaciones basadas en p&iacute;xel y basadas en imagen se pueden encontrar en [3, 12, 13].</font></p>       <p><font face="Verdana" size="2"><b>Transformaciones basadas en p&iacute;xel</b></font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">La regi&oacute;n de los labios es muy similar, en cuanto al color, al resto de la piel. Por esta raz&oacute;n diferentes transformaciones de color han sido desarrolladas. Como ejemplo, la transformaci&oacute;n de semitono, propuesta en el trabajo de Hurlbert y Poggio [14], exhibe las diferencias entre labios y piel bajo condiciones de iluminaci&oacute;n controladas. </font></p>       <p><font face="Verdana" size="2">Una versi&oacute;n normalizada de la transformaci&oacute;n de semitono puede ser encontrada en [12]. El semitono lleva a un resultado muy similar al que se logra utilizando la transformada de tono. Sin embargo, el semitono se concentra en la relaci&oacute;n entre la informaci&oacute;n de rojo y verde de cada p&iacute;xel. Un ejemplo en im&aacute;genes faciales, representado en semitono, puede verse en la <a href="#figura1">Figura 1&#40;b&#41;</a>. Esta transformaci&oacute;n es usada junto con el canal de luminancia, para obtener la transformaci&oacute;n conocida como <i>curve map</i> [12, 15] &#40;ver la <a href="#figura1">Figura 1&#40;c&#41;</a>&#41;.</font></p>       <p><font face="Verdana" size="2">Algunas transformaciones lineales del espacio de color RGB han permitido lograr buenos resultados, en t&eacute;rminos de separabilidad de color entre labios y piel. Guan [11], y Mor&aacute;n y Pinto [16] hacen uso de la transformada discreta de Hartley &#40;DHT&#41;, para mejorar la representaci&oacute;n de color en la regi&oacute;n de los labios. La componente C<sub>3</sub> de la transformaci&oacute;n DHT resalta correctamente el &aacute;rea de los labios en sujetos con piel clara y sin barba, como se muestra la<a href="#figura1"> Figura 1&#40;d&#41;</a>.</font></p>        <p align="center"><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i01.gif" ><a name="figura1"></a></p>         <p><font face="Verdana" size="2"><b>Figura 1</b> Efectos de las trasformaciones de color en im&aacute;genes</font></p>       <p><font face="Verdana" size="2">El uso de las transformaciones perceptuales no lineales basadas en p&iacute;xel, las cuales presentan mejor constancia de color sobre variaciones de intensidad peque&ntilde;as, ha sido una de las grandes tendencias desde finales de los a&ntilde;os 90. Dos transformaciones perceptuales bien conocidas, presentadas por la comisi&oacute;n internacional de iluminaci&oacute;n &#40;Comission Internationale de l’Eclairage, CIE&#41;, son el CIELAB y el CIELUV. El principio detr&aacute;s de estas transformaciones es la compensaci&oacute;n del comportamiento logar&iacute;tmico del sensor. Trabajos como los presentados en [2, 17] hacen uso de estas representaciones de color, con el objeto de facilitar el proceso de segmentaci&oacute;n de los labios. Salazar <i><i>et. a</i>l</i>. [18] utilizan YCbCr e informaci&oacute;n de la transformaci&oacute;n de tono para esta segmentaci&oacute;n.</font></p>       <p><font face="Verdana" size="2">Algunas veces, hay condiciones no controladas en el proceso de adquisici&oacute;n que producen cambios inesperados en la imagen de color o luminancia. Para sobrellevar este problema, un conjunto de transformaciones de color impl&iacute;citas ha sido desarrollado [19]. Una transformaci&oacute;n remarcable, orientada a la segmentaci&oacute;n del labio, es presentada en el trabajo de Hsu <i><i>et. a</i>l</i>. [20]. La transformaci&oacute;n, llamada <i>Mouth Map</i>, ajusta la compensaci&oacute;n global de color en funci&oacute;n de los valores de color en la imagen completa. Con esto se evita tener que calcular un umbral diferente para cada imagen, pero el proceso se hace m&aacute;s sensible frente a artefactos &#40;tales como presencia/ ausencia de barba, dientes, etc.&#41;. En [12], una forma normalizada de semitono es presentada, esta considera los valores m&aacute;ximo y m&iacute;nimo del semitono, con el objeto de compensar disparidades debidas a efectos de iluminaci&oacute;n. En [3], la componente de color verde es normalizada contra los valores m&aacute;ximo y m&iacute;nimo de intensidad, para mejorar la estabilidad del umbral. Sin embargo, la transformaci&oacute;n es sensible a la presencia de dientes.</font></p>       <p><font face="Verdana" size="2"><b>Segmentaci&oacute;n basada en operaciones de p&iacute;xel y de regi&oacute;n</b></font></p>      <p><font face="Verdana" size="2">Las t&eacute;cnicas basadas en p&iacute;xel son las m&aacute;s simples y en general, la alternativa m&aacute;s r&aacute;pida para realizar la segmentaci&oacute;n de la imagen. Ellas utilizan comparaciones l&oacute;gicas entre un conjunto de umbrales y los valores de color en los p&iacute;xeles de la imagen. El valor de la comparaci&oacute;n l&oacute;gica define si el p&iacute;xel pertenece o no a una regi&oacute;n espec&iacute;fica en la imagen. Ejemplos de segmentaci&oacute;n basada en p&iacute;xel se encuentran en [3, 21]. En G&oacute;mez <i>et. a</i>l. [3], una mezcla de tres diferentes espacios de color es usada como paso precedente a un proceso de umbralizaci&oacute;n. La mezcla de los espacios de color &#40;componente verde del espacio RGB, la componente de tono y el <i>Mouth Map</i> [20]&#41;, hace que el algoritmo sea m&aacute;s selectivo, llevando a un decremento de las regiones espurias en la segmentaci&oacute;n. Los autores realizan un recorte de la regi&oacute;n de inter&eacute;s &#40;ROI&#41;, con el objeto de descartar la regi&oacute;n de los orificios de la nariz. Un ejemplo de una imagen segmentada usando esta t&eacute;cnica se observa en la <a href="#figura2">Figura 2</a>.</font></p>       <p><font face="Verdana" size="2">La principal desventaja de las t&eacute;cnicas basada en p&iacute;xel es la ausencia de restricciones de conectividad en el m&eacute;todo. Por esto, trabajos como [22] consideran la conectividad en la umbralizaci&oacute;n. No obstante, las t&eacute;cnicas basadas en color requieren, generalmente, una etapa de postproceso para la eliminaci&oacute;n de regiones espurias en la segmentaci&oacute;n final [22].</font></p>       ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">T&eacute;cnicas basadas en p&iacute;xel son muy sensibles a cambios peque&ntilde;os en el color, debidos esencialmente a cambios de la iluminaci&oacute;n. Para tratar con esto, se han presentado algunos algoritmos para la selecci&oacute;n autom&aacute;tica del umbral. Lucey <i><i>et. a</i>l</i>. [22] propusieron un algoritmo de segmentaci&oacute;n basado en una t&eacute;cnica de umbralizaci&oacute;n din&aacute;mica. El primer paso en este m&eacute;todo es presentar la imagen en una versi&oacute;n restringida de la relaci&oacute;n <i>R/G</i>. Posteriormente, una funci&oacute;n de entrop&iacute;a, que mide la incertidumbre entre clases &#40;fondo y labios&#41;, es minimizada con respecto a los par&aacute;metros de la funci&oacute;n de membres&iacute;a. Zhang e<i>t. al</i>. [23] utilizan un an&aacute;lisis discriminante lineal &#40;LDA&#41; de Fisher, para encontrar la transformaci&oacute;n lineal que maximiza la diferencia entre el color de la piel y los labios. Seguidamente, desarrollan una selecci&oacute;n autom&aacute;tica del umbral, de acuerdo a la transformaci&oacute;n de color encontrada en una etapa previa. Rongben <i><i>et. a</i>l</i>. [24] tambi&eacute;n proponen una t&eacute;cnica de LDA de Fisher, orientado a un proceso de selecci&oacute;n autom&aacute;tica del umbral. Kim <i><i>et. a</i>l</i>. [25] sugieren el uso de datos con marcas manuales con el objeto de entrenar un sistema de inferencia difuso, el cual es usado como un &iacute;ndice de confianza para la selecci&oacute;n autom&aacute;tica del umbral. M&aacute;quinas de vectores de soporte &#40;SVM&#41;, tambi&eacute;n han sido utilizadas para modelar la diferencia entre los labios y la piel [26].</font></p>        <p align="center"><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i02.gif" ><a name="figura2"></a></p>        <p><font face="Verdana" size="2"><b>Figura 2</b> Ejemplo de segmentaci&oacute;n de la boca presentada en [3]</font></p>       <p><font face="Verdana" size="2"><i>Modelado estad&iacute;stico de los labios</i></font></p>      <p><font face="Verdana" size="2">Otro m&eacute;todo para segmentar la regi&oacute;n de la boca es mediante el modelado de la regi&oacute;n y/o el color de los labios, y la distinci&oacute;n entre ese modelo y el fondo. Este proceso de modelado puede ser determinista &#40;como el modelado de contorno en la Secci&oacute;n 3&#41;, o estoc&aacute;stico, revisado en esta secci&oacute;n. Una t&eacute;cnica com&uacute;n de modelado estoc&aacute;stico para segmentaci&oacute;n de im&aacute;genes corresponde al modelado por campos aleatorios de Markov &#40;Markov Random Field, MRF&#41;. En MRF, la imagen es presentada como una realizaci&oacute;n de una variable estoc&aacute;stica en la cual cada elemento &#40;p&iacute;xel&#41; es descrito en t&eacute;rminos de relaciones de vecindario. Formalmente, se dice que un objeto aleatorio X en una red S con vecindario &ensp;s es un MRF si para todo s &ensp;S se cumple la <a href="#Ecuaci&oacute;n1">Ecuaci&oacute;n 1</a>,</font></p>       <p><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i03.gif" ><a name="Ecuaci&oacute;n1"></a></p>       <p><font face="Verdana" size="2">Se ha mostrado que, si <i>P {X=x}&gt;0</i> para todo x –esto es generalmente asumido–, entonces <i>P {X}</i>tiene la forma de una distribuci&oacute;n de Gibbs. Una distribuci&oacute;n com&uacute;n usada en segmentaci&oacute;n de im&aacute;genes es la MRF no gaussiana, basada en un par de intervalos y dada por la formulaci&oacute;n presentada en la <a href="#Ecuaci&oacute;n2">Ecuaci&oacute;n 2</a>:</font></p>       <p><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i04.gif" ><a name="Ecuaci&oacute;n2"></a></p>       <p><font face="Verdana" size="2">Donde Z es la constante de normalizaci&oacute;n de la densidad, C es el conjunto de intervalos,  &ensp; es el t&eacute;rmino de escala de nivel de gris, y  &ensp; es la funci&oacute;n potencial. Informaci&oacute;n adicional sobre MRF se puede encontrar en [27, 28]. </font></p>       <p><font face="Verdana" size="2">Li&eacute;vin y Luthon [6] hacen uso de MRF para selecci&oacute;n de etiquetas en el proceso de segmentaci&oacute;n. En este caso, la MRF es usada para el etiquetado correcto, dadas las caracter&iacute;sticas din&aacute;micas y est&aacute;ticas de cada p&iacute;xel. La caracter&iacute;stica est&aacute;tica corresponde a la etiqueta binaria obtenida a partir del valor del tono rojo &#40;semitono&#41;, mientras que la caracter&iacute;stica din&aacute;mica es calculada de las etiquetas obtenidas a partir de la diferencia &#40;sin signo&#41; entre dos im&aacute;genes consecutivas en una secuencia de video. La etiqueta en la siguiente iteraci&oacute;n depende s&oacute;lo de la etiqueta del p&iacute;xel en la iteraci&oacute;n precedente y de las etiquetas de sus n vecinos. La regi&oacute;n de inter&eacute;s &#40;ROI&#41; debe ser recortada antes de la ejecuci&oacute;n del algoritmo, con el prop&oacute;sito de reducir el efecto de regiones espurias en la segmentaci&oacute;n. Zhang y Mersereau [10] usan una mezcla de tono y el valor en el espacio de color de semitono. Las etiquetas obtenidas en cada imagen son usadas en un MRF, para mejorar la detecci&oacute;n del contorno interno y externo de los labios. Algunas restricciones son impuestas en las funciones de energ&iacute;a MRF, con el prop&oacute;sito de restringir el etiquetado final del contorno. Los autores reportaron que, aun en los casos donde las fronteras de los labios no son suaves, es posible calcular con precisi&oacute;n los puntos de referencia sobre la segmentaci&oacute;n.</font></p>       ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">Mezclas de modelos tambi&eacute;n se han usado para modelar algunas caracter&iacute;sticas espec&iacute;ficas en las im&aacute;genes. En el trabajo de Sadeghi <i><i>et. a</i>l</i>. [29], un modelo de mezclas gausianas &#40;Gaussian Mixture Model, GMM&#41; es usado para modelar el color en la regi&oacute;n del labio. Un muestreo Sobol es usado para reducir la carga computacional del algoritmo. En Gacon <i><i>et. a</i>l</i>. [30], se propone un m&eacute;todo para la caracterizaci&oacute;n din&aacute;mica del color del labio y para su segmentaci&oacute;n. El m&eacute;todo es basado en modelos gaussianos estad&iacute;sticos del color de la cara. Los modelos son entrenados con im&aacute;genes con marcas manuales. El m&eacute;todo es capaz de modelar caracter&iacute;sticas din&aacute;micas y est&aacute;ticas en el color del p&iacute;xel y en la forma de la boca, permitiendo que el algoritmo compense cambios de iluminaci&oacute;n y movimientos r&aacute;pidos de la boca. Los autores tambi&eacute;n proponen un m&eacute;todo para modelado est&aacute;tico de la comisura de los labios. La segmentaci&oacute;n global es desarrollada optimizando la posici&oacute;n de un modelo cuadriculado de los labios. Como el modelo tiene varios cientos de puntos, la optimizaci&oacute;n es un problema de dimensi&oacute;n alta. En Goswami <i>et. a</i>l. [31], se presenta un m&eacute;todo de segmentaci&oacute;n autom&aacute;tica del labio basado en estimadores estad&iacute;sticos. Un estimador del determinante de covarianza m&iacute;nimo &#40;Minimum Covariance Determinant Estimator MCD&#41;, y un estimador no robusto son utilizados para estimar la regi&oacute;n de la piel en el espacio de color. La regi&oacute;n de los labios es hallada como la mayor regi&oacute;n conectada que no sea piel. Los autores reportan una mejora significativa sobre los resultados presentados en [15]. El m&eacute;todo asume que la regi&oacute;n de la piel puede ser detectada con mayor facilidad que la regi&oacute;n de los labios. Otra t&eacute;cnica estad&iacute;stica para la separaci&oacute;n del color es presentada en [32]. En Bouvier <i>et. a</i>l. [33], se presenta un algoritmo para la extracci&oacute;n del contorno externo de los labios. Los autores se centran en la detecci&oacute;n de la ROI antes de la parametrizaci&oacute;n del contorno de los labios. Ellos realizan una estimaci&oacute;n del &aacute;rea de los labios usando m&aacute;xima esperanza. Posteriormente, se halla un mapa de membres&iacute;a del labio a partir de la distribuci&oacute;n de color de la piel. Realizan una optimizaci&oacute;n del umbral, basada en el gradiente y en informaci&oacute;n de la m&aacute;scara. La extracci&oacute;n del contorno de los labios se realiza aproximando un conjunto de curvas de B&eacute;zier en un mapa multiescala del contorno de la boca. </font></p>       <p><font face="Verdana" size="2"><i>Segmentaci&oacute;n C-Media difuso &#40;FCM&#41;</i></font></p>       <p><font face="Verdana" size="2">Es una t&eacute;cnica com&uacute;n de agrupamiento usada en segmentaci&oacute;n de im&aacute;genes, introducida en clasificaci&oacute;n de patrones a finales de los a&ntilde;os 60 [34]. Las bases del FCM son presentadas en el texto de Bezdek [35, 36].</font></p>        <p><font face="Verdana" size="2">La segmentaci&oacute;n FCM est&aacute; basada en el principio de disimilaridad de caracter&iacute;sticas: dado<img src="/img/revistas/rfiua/n47/n47a10i05.gif" >   un conjunto de caracter&iacute;sticas que corresponden a la imagen I de tama&ntilde;o <i>N×M</i>, cada x<sub>r,s</sub><img src="/img/revistas/rfiua/n47/n47a10i13.gif" >  R<sup>q</sup> es el vector de caracter&iacute;sticas del p&iacute;xel correspondiente en <i>I</i>; y <i>C </i>el n&uacute;mero de cl&uacute;steres difusos en la imagen, la meta es encontrar un conjunto <img src="/img/revistas/rfiua/n47/n47a10i06.gif" > de C diferentes centroides <b>v</b><sub>i</sub><img src="/img/revistas/rfiua/n47/n47a10i13.gif" >  R<sup>q</sup>, y una matriz <b>U</b> con tama&ntilde;o <i>N×M</i> la cual es una partici&oacute;n difusa de <b>X</b>, tal que minimice la funci&oacute;n de costo <i>J</i>&#40;<b>U, V</b>&#41; en la <a href="#Ecuaci&oacute;n3">Ecuaci&oacute;n 3</a>, con las restricciones impuestas en la <a href="#Ecuaci&oacute;n4">Ecuaci&oacute;n 4</a>.</font></p>        <p><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i07.gif" ><a name="Ecuaci&oacute;n3"></a></p>       <p><font face="Verdana" size="2">Sujeto a</font></p>         <p><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i08.gif" ><a name="Ecuaci&oacute;n4"></a></p>       <p><font face="Verdana" size="2">D<sub>i,r,s</sub> es un t&eacute;rmino que refleja la distancia entre el vector de caracter&iacute;sticas <b>x</b><sub>r,s</sub> y el centroide <b>v</b><sub>i</sub>. El conjunto de caracter&iacute;sticas <b>X</b> est&aacute; compuesto generalmente por diferentes representaciones de color, como las descritas en la Secci&oacute;n 1. Generalmente, la partici&oacute;n difusa <b>U</b> es comparada con un umbral, con el objeto de obtener un conjunto cl&aacute;sico de regiones disjuntas en la imagen fuente.</font></p>       <p><font face="Verdana" size="2">Con el objeto de extender la evoluci&oacute;n FCM, no s&oacute;lo en el espacio de caracter&iacute;sticas sino tambi&eacute;n en el de forma, algunas modificaciones han sido aplicadas a la funci&oacute;n b&aacute;sica de costo, presentada en la <a href="#Ecuaci&oacute;n3">Ecuaci&oacute;n 3</a>. En el trabajo de Wang <i><i>et. a</i>l</i>. [17, 37] un nuevo conjunto de par&aacute;metros fue introducido en el t&eacute;rmino de distancia D<sub>i,r,s</sub>. Ellos propusieron el uso de funci&oacute;n de base espacial con forma el&iacute;ptica, buscando mejorar la segmentaci&oacute;n de los labios. Restricciones en la forma, ayudan a reducir el efecto de algunos p&iacute;xeles espurios fuera de la regi&oacute;n de la boca, los cuales producen un efecto indeseado en la funci&oacute;n b&aacute;sica de costo. Liew <i><i>et. a</i>l</i>. [38] tambi&eacute;n usan una t&eacute;cnica basada en FCM en el espacio de caracter&iacute;sticas de color con constricciones en la geometr&iacute;a.</font></p>        <p><font face="Verdana" size="2">Artefactos en las im&aacute;genes &#40;como la barba&#41;, tambi&eacute;n han sido tratados con modificaciones de FCM. Wang <i><i>et. a</i>l</i>. [8, 39], proponen el uso de FCM con el objeto de modelar la regi&oacute;n de los labios en un cl&uacute;ster, mientras que el fondo es modelado con muchos cl&uacute;steres. Las funciones objetivos del FCM son modificadas para incluir en la optimizaci&oacute;n una constricci&oacute;n en la forma param&eacute;trica, como en [37]. Su esquema de segmentaci&oacute;n, tambi&eacute;n llamado MS-FCS &#40;multi-class, shape-guided FCM&#41;, muestra una gran reducci&oacute;n del error de segmentaci&oacute;n en presencia de barba, comparado con el FCM tradicional y con el trabajo de Zhang y Mersereau [10]. </font></p>       ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2"><i>Otras t&eacute;cnicas de segmentaci&oacute;n</i></font></p>      <p><font face="Verdana" size="2">La inteligencia artificial tambi&eacute;n ha sido utilizada en segmentaci&oacute;n de los labios. Mitsukura <i>et. a</i>l. [40, 41] usan dos Redes Neuronales &#40;RN&#41; de propagaci&oacute;n hacia adelante previamente entrenadas para modelar el color de la piel y los labios. Restricciones en la forma son incluidas en los pesos de la RN para detecci&oacute;n de los labios. Una vez que los candidatos a boca son detectados, una prueba de piel es desarrollada en su vecindario, usando la RN para detecci&oacute;n de piel. Posteriormente, se usa una RN para detecci&oacute;n de los labios y as&iacute; seleccionar la regi&oacute;n de la boca. En otro trabajo, los autores presentan un segundo esquema [42], basado en algoritmos evolutivos para el modelado de los labios. Para resaltar el &aacute;rea de la boca Lie <i>et. a</i>l. [43] usan un conjunto de operaciones morfol&oacute;gicas en im&aacute;genes con diferencias temporales.</font></p>       <p><font face="Verdana" size="2"><b>Segmentaci&oacute;n de labios por ajuste a plantillas parametrizables</b></font></p>      <p><font face="Verdana" size="2">El modelado de contorno se desarrolla encontrando un conjunto de puntos que controlan el modelo, y el conjunto de funciones de modelado. Una t&eacute;cnica b&aacute;sica que muestra el proceso completo se encuentra en Rao y Mersereau [44]. En este trabajo, los autores usan operadores lineales para encontrar el contorno horizontal de los labios y posteriormente aproximan el contorno con dos par&aacute;bolas. Este m&eacute;todo no es adecuado para aplicaciones antropom&eacute;tricas, ya que una par&aacute;bola no es suficiente, en general, para modelar el labio superior o inferior [4].</font></p>       <p><font face="Verdana" size="2"><b>Modelo de forma activa &#40;ASM&#41; y Modelo de apariencia activa &#40;AAM&#41;</b></font></p>      <p><font face="Verdana" size="2">Estos dos m&eacute;todos estad&iacute;sticos para ajuste de plantillas, surgieron a mediados de los 90. ASM son modelos estad&iacute;sticos de la forma del objeto que se deforma iterativamente, para ajustar un objeto determinado en una nueva imagen [45]. Las formas est&aacute;n restringidas por un modelo estad&iacute;stico de forma, para variar s&oacute;lo en las formas precisadas en el conjunto de entrenamiento, compuesto por ejemplos etiquetados. Los puntos de referencia est&aacute;n localizados, generalmente, en los contornos. De otra parte, AMM es una generalizaci&oacute;n de la t&eacute;cnica ASM, pero usa toda la informaci&oacute;n cubierta por el objeto destino en la regi&oacute;n de la imagen y no s&oacute;lo los bordes [46]. </font></p>       <p><font face="Verdana" size="2">En el trabajo de Caplier [47], se presenta un m&eacute;todo para la detecci&oacute;n y el seguimiento autom&aacute;tico de los labios. El m&eacute;todo hace uso de una inicializaci&oacute;n autom&aacute;tica de puntos de referencia, previamente presentada en [48]. Una vez realizado el proceso de inicializaci&oacute;n, las varianzas resultantes de un proceso de ajuste de plantillas son usadas para extraer un conjunto reducido de caracter&iacute;sticas. Finalmente, las caracter&iacute;sticas son utilizadas para seleccionar y adaptar un ASM que describe el gesto de la boca. El fi ltrado de Kalman es usado para acelerar la convergencia del algoritmo. Turkmani y Hilton [49] usan AAM en secuencias de habla, para localizar contornos internos y externos de la boca. En Jiang <i>et. a</i>l. [50], se usa una mezcla de un modelo determinista de fi ltrado de part&iacute;culas y un modelo estoc&aacute;stico ASM, con el prop&oacute;sito de mejorar la convergencia y la precisi&oacute;n en el seguimiento de los labios. En [51] se propone un fi ltrado de part&iacute;culas guiado por atractores.</font></p>       <p><font face="Verdana" size="2"><i>Contornos activos</i></font></p>      <p><font face="Verdana" size="2">Contornos activos o snakes, son curvas generadas por computador que se mueven dentro de las im&aacute;genes para encontrar fronteras de objetos, en este caso, el contorno interno o externo de la boca. Un contorno activo puede ser definido como una curva <b>v</b><i>&#40;u,t&#41; = &#40;x&#40;u,t&#41;, y&#40;u,t&#41;&#41;, u</i> &ensp;[0,1], con <i>t</i> la posici&oacute;n temporal del punto en la secuencia que se mueve en el espacio de la imagen [52]. La evoluci&oacute;n de la curva es controlada por la funci&oacute;n de energ&iacute;a presentada en la <a href="#Ecuaci&oacute;n5">Ecuaci&oacute;n 5</a>.</font></p>         <p><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i09.gif" ><a name="Ecuaci&oacute;n5"></a></p>        ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">E<sub>int</sub> representa la energ&iacute;a interna de la curva, y controla las propiedades de estiramiento y doblado de la curva. E<sub>im</sub> es la imagen energ&iacute;a y est&aacute; relacionada con las propiedades de la imagen. E<sub>ext</sub> es una energ&iacute;a externa que generalmente representa constricciones espec&iacute;ficas en la evoluci&oacute;n de la curva. Un ejemplo de la extracci&oacute;n del contorno externo de los labios, mediante el uso de contornos activos se observa en la <a href="#figura3">Figura 3</a>.</font></p>        <p align="center"><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i10.gif" ><a name="figura3"></a></p>       <p><font face="Verdana" size="2"><b>Figura 3</b> Parametrizaci&oacute;n del contorno de los labios mediante contornos activos [18], [52]</font></p>       <p><font face="Verdana" size="2">Una t&eacute;cnica llamada flujo del vector gradiente &#40;Gradient Vector Flow, GVF&#41;, ha sido utilizada para mejorar la convergencia y precisi&oacute;n en la representaci&oacute;n de fronteras con alta curvatura. Desde la introducci&oacute;n del concepto de GVF en contornos activos [53, 54], han surgido diferentes t&eacute;cnicas de segmentaci&oacute;n parametrizada que utilizan este concepto. Mor&aacute;n y Pinto [16] usan GVF para restringir la aproximaci&oacute;n de un contorno param&eacute;trico, limitado por un conjunto de puntos de referencia, conformando un modelo activo de forma. La caja, regi&oacute;n frontera de la boca, es encontrada cortando los ejes horizontales y verticales en la proyecci&oacute;n perpendicular de cada eje. El GVF es calculado en el espacio de color C<sub>3</sub>+U, donde <i>U</i> representa la componente <i>u</i> en el espacio de color CIELUV. Otra aproximaci&oacute;n que usa GVF es la presentada en [55]. En este caso, el detector de rostro propuesto por Viola-Jones [56], es usado para detectar la caja envolvente del rostro y la caja envolvente de la boca. Despu&eacute;s de esto, una formulaci&oacute;n de contornos activos que utiliza un m&eacute;todo de selecci&oacute;n de nivel sin reinicializaci&oacute;n es implementado, con el prop&oacute;sito de ajustar el modelo. Hern&aacute;ndez <i>et. a</i>l. [52] presentan una forma simplificada de GVF para contornos activos y la aplican a la segmentaci&oacute;n de la boca. Una parametrizaci&oacute;n simplificada del contorno externo, el cual utiliza polinomios de cuarto orden despu&eacute;s de la convergencia del contorno activo, se puede encontrar en [4]. El contorno externo de la boca puede ser descrito con precisi&oacute;n utilizando esta t&eacute;cnica, pero es altamente dependiente de la segmentaci&oacute;n precedente.</font></p>       <p><font face="Verdana" size="2">En Eveno <i>et. a</i>l. [15] desarrollaron una manera simple de representaci&oacute;n del contorno de los labios, mediante la b&uacute;squeda de un conjunto de puntos clave en las proyecciones de intensidad horizontal y vertical de la regi&oacute;n de la boca, y luego aproximan un conjunto de polinomios a los puntos encontrados. La b&uacute;squeda de los puntos y el ajuste fino es controlada por un gradiente especial de la imagen llamado <i>hybrid edges</i>, basado en la luminancia y el semitono. Su trabajo evolucion&oacute; a una nueva t&eacute;cnica llamada <i>jumping snake</i> [57, 58]. Este m&eacute;todo permite una detecci&oacute;n del contorno de los labios, con s&oacute;lo la indicaci&oacute;n de un punto arbitrario sobre la regi&oacute;n del labio en la imagen. En cada iteraci&oacute;n, un nuevo par de nodos es adicionado a las esquinas de cada modelo. Seyedarabi <i>et. a</i>l. [59] usan una t&eacute;cnica de contornos activos de dos pasos para aproximar el contorno externo de los labios. Primero, un operador de Canny es utilizado, luego, mediante un umbral alto se extrae el contorno externo del labio superior. Despu&eacute;s de la convergencia, un segundo umbral de valor bajo es usado para ajustar un contorno activo, el cual s&oacute;lo se detiene al hallar el contorno inferior del mismo labio. Beaumesnil y Luthon [1] presentaron una t&eacute;cnica de contorno activo en tiempo real para la segmentaci&oacute;n de la boca, en el cual el modelo 3D del rostro es ajustado directamente a la imagen. La precisi&oacute;n no fue una restricci&oacute;n en ese trabajo, ya que la meta es sintetizar la expresi&oacute;n del rostro en un modelo generado por computador.</font></p>       <p><font face="Verdana" size="2"><i>Otras t&eacute;cnicas param&eacute;tricas</i></font></p>      <p><font face="Verdana" size="2">En Werda <i>et. a</i>l. [60], se propone un algoritmo que combina segmentaci&oacute;n param&eacute;trica y segmentaci&oacute;n basada en p&iacute;xel. Un conjunto de colores y operaciones morfol&oacute;gicas es aplicado para obtener una segmentaci&oacute;n inicial de los labios. Posteriormente, el modelo param&eacute;trico es pegado y el contorno externo de los labios encontrado. La representaci&oacute;n final contiene un modelo geom&eacute;trico de parametrizaci&oacute;n fuerte, cuyos par&aacute;metros permiten que el contorno sea deformado en un conjunto restringido de formas posibles. Otro ejemplo de parametrizaci&oacute;n fuerte del contorno de los labios se encuentra en [61]. Moghaddam y Safabakhsh [62] presentan un algoritmo r&aacute;pido para la extracci&oacute;n del contorno externo que utiliza mapas auto-organizados. Xie <i>et. a</i>l. [63] proponen una segmentaci&oacute;n de los labios que combina ASM y proyecciones acumulativas, para mejorar la robustez en la detecci&oacute;n del contorno.</font></p>       <p><font face="Verdana" size="2"><b>Medidas de desempe&ntilde;o</b></font></p>      <p><font face="Verdana" size="2">La mayor&iacute;a de los algoritmos de parametrizaci&oacute;n son creados para suministrar informaci&oacute;n a procesos posteriores, como reconocimiento audiovisual del habla [2]. En este sentido, en general, las medidas de calidad est&aacute;n orientadas a mostrar el desempe&ntilde;o espec&iacute;fico de la aplicaci&oacute;n, m&aacute;s que de la segmentaci&oacute;n. Sin embargo, algunas medidas han sido realizadas para medir el desempe&ntilde;o de la segmentaci&oacute;n. En la <a href="#Tabla1">Tabla 1</a> se muestra un resumen de algunas t&eacute;cnicas utilizadas para la medici&oacute;n del error en la segmentaci&oacute;n y la detecci&oacute;n de labios en im&aacute;genes.</font></p>       <p><font face="Verdana" size="2"><b>Tabla 1</b> Medidas de desempe&ntilde;o de la segmentaci&oacute;n de los labios</font></p>         ]]></body>
<body><![CDATA[<p align="center"><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i11.gif" ><a name="Tabla1"></a></p>           <p align="center"><font face="Verdana" size="2"><img src="/img/revistas/rfiua/n47/n47a10i12.gif" ><a name="Tabla1"></a></p>       <p><font face="Verdana" size="3"><b>Conclusiones</b></font></p>      <p><font face="Verdana" size="2">Existen bastantes trabajos en modelado del color de la piel y los labios. Sin embargo, se ha observado que la separaci&oacute;n entre estas regiones es altamente dependiente de las condiciones de iluminaci&oacute;n y, por lo tanto, dif&iacute;cil de predecir. Algunas transformaciones de color muestran un buen realce para labios y/o piel de color espec&iacute;fico. Sin embargo, ellos tienen problemas cuando los sujetos poseen caracter&iacute;sticas de color diferentes. Las t&eacute;cnicas revisadas, aunque tratan de predecir estos cambios de color inesperados, fallan con pieles oscuras o en presencia de ruido especular o de los dientes en a imagen.</font></p>       <p><font face="Verdana" size="2">Las t&eacute;cnicas de segmentaci&oacute;n que utilizan restricciones geom&eacute;tricas en general est&aacute;n dise&ntilde;adas para condiciones espec&iacute;ficas de la imagen, y aunque permiten rechazar regiones espurias, las restricciones hacen que los m&eacute;todos no sean aplicables cuando no se tiene informaci&oacute;n a priori, sobre el tama&ntilde;o y la forma de la boca en la imagen. Algunos algoritmos han mostrado un buen desempe&ntilde;o en im&aacute;genes con presencia de barbas, pero fallan cuando se cambia la iluminaci&oacute;n. Pocos trabajos han sido implementados para funcionar en tiempo real.</font></p>       <p><font face="Verdana" size="2">Un gran n&uacute;mero de los m&eacute;todos de parametrizaci&oacute;n son muy sensitivos al algoritmo de inicializaci&oacute;n. T&eacute;cnicas como la presentada en [4] son muy precisas en el modelado del contorno externo y el modelo obtenido es f&aacute;cilmente interpretable. Sin embargo, ellas requieren una buena segmentaci&oacute;n inicial de la boca y una parametrizaci&oacute;n gruesa del contorno del labio. Algoritmos param&eacute;tricos como AAM y ASM, tambi&eacute;n son sensibles al proceso de inicializaci&oacute;n. Cuando la inicializaci&oacute;n est&aacute; alejada del objeto destino, ellos pueden converger hacia m&iacute;nimos locales.</font></p>      <p><font face="Verdana" size="2">No existe unanimidad, por parte de los autores, en la selecci&oacute;n de los datos de entrenamiento y prueba. En general, ellos son seleccionados para aplicaciones espec&iacute;ficas. Tampoco existe una estandarizaci&oacute;n en la forma de reportar los resultados. Estas diferencias dificultan los procesos de evaluaci&oacute;n de las t&eacute;cnicas de segmentaci&oacute;n de los labios.</font></p>       <p><font face="Verdana" size="3"><b>Referencias</b></font></p>      <p><font face="Verdana" size="2">1. B. Beaumesnil, F. Luthon.&ldquo;Real time tracking for 3D realistic lip animation&rdquo;. Proceedings of the 18<sup>th</sup> International Conference on Pattern Recognition. ICPR 2006. Vol. 1. 2006. pp. 219-222.</font></p>      <p><font face="Verdana" size="2">2. I. Arsic, R. Vilagut, J. P. Thiran.&ldquo;Automatic extraction of geometric lip features with application to multimodal speaker identification&rdquo;. 2006 IEEE International Conference on Multimedia and Expo. 2006. pp. 161- 164.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">3. J. B. G&oacute;mez, J. E. Hern&aacute;ndez, F. Prieto, T. Redarce.&ldquo;Real-time robot manipulation using mouth gestures in facial video sequences&rdquo;. Lecture Notes in Computer Science. Vol. 4729. 2007. pp. 224-233.</font></p>      <p><font face="Verdana" size="2">4. A. E. Salazar, J. E Hern&aacute;ndez, F. Prieto.&ldquo;Automatic quantitative mouth shape analysis&rdquo;. Lecture Notes in Computer Science. Vol. 4673. 2007. pp. 416-423.</font></p>      <p><font face="Verdana" size="2">5. V. Vezhnevets, V. Sazonov, A. Andreeva.&ldquo;A survey on pixel-based skin color detection techniques&rdquo;. Proceedings of GraphiCon 2003. pp. 8. Disponible On Line: <a href="http://citeseer.ist.psu.edu/676368.html" target="_blank">http://citeseer.ist.psu.edu/676368.html</a>. Consultada el 1 de marzo de 2008.</font></p>      <p><font face="Verdana" size="2">6. M. Li&eacute;vin, F. Luthon.&ldquo;Unsupervised lip segmentation under natural conditions&rdquo;. IEEE International Conference on Acoustics, Speech, and Signal Processing. ICASSP’99: Vol. 6. 1999. pp. 3065-3068.</font></p>      <p><font face="Verdana" size="2">7. Z. Jian, M. N. Kaynak, A. D. Cheok, K. C. Chung.&ldquo;Real-time lip tracking for virtual lip implementation in virtualenvironments and computer games&rdquo;. The 10<sup>th</sup> IEEE International Conference on Fuzzy Systems. Vol. 3. 2001. pp. 1359-1362.</font></p>      <p><font face="Verdana" size="2">8. S. L. Wang, W. H. Lau, A.W.C. Liew, S. H. Leung.&ldquo;Robust lip region segmentation for lip images with complex background&rdquo;. Pattern Recognition. Vol. 40. 2007. pp. 3481-3491.</font></p>      <p><font face="Verdana" size="2">9. G. I. Chiou, J. N. Hwang.&ldquo;Lipreading from color video&rdquo;. IEEE Transactions on Image Processing. Vol. 6. 1997. pp. 1192-1195.</font></p>      <p><font face="Verdana" size="2">10. X. Zhang, R. M. Mersereau.&ldquo;Lip feature extraction towards an automatic speechreading system&rdquo;. Proceedings of IEEE International Conference on Image Processing. Vol. 3. 2000. pp. 226-229.</font></p>      <p><font face="Verdana" size="2">11. Y. P. Guan.&ldquo;Automatic extraction of lip based on wavelet edge detection&rdquo;. Eighth International Symposium on Symbolic and Numeric Algorithms for Scientific Computing, SYNASC ’06. 2006. pp. 125- 132.</font></p>      <p><font face="Verdana" size="2">12. N. Eveno, A. Caplier, P. Y. Coulon.&ldquo;New color transformation for lips segmentation&rdquo;. IEEE Fourth Workshop on Multimedia Signal Processing. 2001. pp. 3 - 8.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">13. J. Loaiza, J. B. G&oacute;mez, A. Ceballos.&ldquo;An&aacute;lisis de discriminancia y selecci&oacute;n de caracter&iacute;sticas de color en im´agenes de labios utilizando redes neuronales&rdquo;. Memorias del XII Simposio de Tratamiento de Se&ntilde;ales, Im&aacute;genes y Visi&oacute;n Artificial STSIVA07. 2007. pp. 4.</font></p>      <p><font face="Verdana" size="2">14. A. C. Hurlbert, T. A. Poggio.&ldquo;Synthesizing a color algorithm from examples&rdquo;. Science. -1988. Vol. 239. Pp. 447-514.</font></p>      <p><font face="Verdana" size="2">15. N. Eveno, A. Caplier, P. Y. Coulon.&ldquo;A parametric model for realistic lip segmentation&rdquo;. Seventh International Conference on Control, Automation, Robotics And Vision &#40;ICARCV’O2&#41;. 2002. pp. 1426-1431.</font></p>      <p><font face="Verdana" size="2">16. L. E. Mor&aacute;n, R. Pinto.&ldquo;Automatic extraction of the lips shape via statistical lips modelling and chromatic feature&rdquo;. Electronics, Robotics and Automotive Mechanics Conference &#40;CERMA 2007&#41;. 2007. pp. 241- 246.</font></p>      <p><font face="Verdana" size="2">17. S. L. Wang, S. H. Leung, W. H. Lau.&ldquo;Lip segmentation by fuzzy clustering incorporating with shape function&rdquo;. IEEE International Conference on Acoustics, Speech, and Signal Processing. ICASSP’02. 2002. Vol. 1. pp. 1077-1080.</font></p>      <p><font face="Verdana" size="2">18. A. Salazar, F. Prieto.&ldquo;Extracci&oacute;n y clasificaci&oacute;n de posturas labiales en ni&ntilde;os entre 5 y 10 a&ntilde;os de la ciudad de Manizales&rdquo;. DYNA. 2006. Vol. 73. pp. 175-188.</font></p>      <p><font face="Verdana" size="2">19. R. Collins, Y. Liu, M. Leordeanu.&ldquo;On-line selection of discriminative tracking features&rdquo;. IEEE Transaction on Pattern Analysis and Machine Intelligence. Vol. 27. 2005. pp. 1631-1643. </font></p>      <p><font face="Verdana" size="2">20. R. L. Hsu, M. Abdel-Mottaleb, A. K. Jain.&ldquo;Face detection in color images&rdquo;. IEEE Trans. on Pattern Analysis and Machine Intelligence. Vol. 24. 2002. pp. 696-706.</font></p>      <p><font face="Verdana" size="2">21. J. A. Dargham, A. Chekima.&ldquo;Lips detection in the normalised RGB colour scheme&rdquo;. Proceedings of 2<sup>nd</sup> Information and Communication Technologies. ICTTA. Vol. 1. 2006. pp. 1546-1551.</font></p>      <p><font face="Verdana" size="2">22. S. Lucey, S. Sridharan, V. Chandran.&ldquo;Chromatic lip tracking using a connectivity based fuzzy thresholding technique&rdquo;. Proceedings of the Fifth International Symposium on Signal Processing and its Applications. ISSPA ’99. 1999. pp. 669-672.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">23. J. M. Zhang, D. J. Wang, L. M. Niu, Y. Z. Zhan.&ldquo;Research and implementation of real time approach to lip detection in video sequences&rdquo;. Proceedings of the Second International Conference on Machine Learning and Cybernetics. 2003. pp. 2795-2799.</font></p>      <p><font face="Verdana" size="2">24. W. Rongben, G. Lie, T. Bingliang, J. Lisheng.&ldquo;Monitoring mouth movement for driver fatigue or distraction with one camera&rdquo;. Proceedings of he 7<sup>th</sup> International IEEE Conference on Intelligent Transportation Systems. 2004. pp. 314-319.</font></p>      <p><font face="Verdana" size="2">25. J. Y. Kim, S.Y. Na, R. Cole.&ldquo;Lip detection using confidence-based adaptive thresholding&rdquo;. Lecture Notes in Computer Science. Vol. 4291. 2006. pp. 731- 740.</font></p>      <p><font face="Verdana" size="2">26. A. Khan, W. Christmas, J. Kittler.&ldquo;Lip contour segmentation using kernel methods and level sets&rdquo;. Lecture Notes in Computer Science. Vol. 4842. 2007. pp. 86-95.</font></p>      <p><font face="Verdana" size="2">27. H. Bunke, T. Caelli.&ldquo;Hidden Markov Models: Applications in Computer Vision&rdquo;. World Scientific Series In Machine Perception And Artificial Intelligence Series. Vol. 45. World Scientific Publishing Co. 2001. pp. 244.</font></p>      <!-- ref --><p><font face="Verdana" size="2">28. R. Chellappa, A. K. Jain. Markov Random Fields: Theory and Application. Ed.Academic Press. 1993. pp. 581. </font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000108&pid=S0120-6230200900010001000028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p><font face="Verdana" size="2">29. M. Sadeghi, J. Kittler, K. Messer.&ldquo;Real time segmentation of lip pixels for lip tracker initialization&rdquo;. Lecture Notes in Computer Science. Vol. 2124. 2001. pp. 317-324.</font></p>      <p><font face="Verdana" size="2">30. P. Gacon, P. Y. Coulon, G. Bailly.&ldquo;Statistical active model for mouth components segmentation&rdquo;. Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP’ 05. Vol. 2. 2005. pp. 1021-1024.</font></p>      <p><font face="Verdana" size="2">31. B. Goswami, W. J. Christmas, J. Kittler.&ldquo;Statistical estimators for use in automatic lip segmentation&rdquo;. Proceedings of the 3<sup>rd</sup> European Conference on Visual Media Production &#40;CVMP&#41;. 2006. pp. 79-86.</font></p>      <p><font face="Verdana" size="2">32. I. Mpiperis, S. Malassiotis, M. G. Strintzis.&ldquo;Expression compensation for face recognition using a polar geodesic representation&rdquo;. Proceedings of the Third International Symposium on 3D Data Processing, Visualization, and Transmission &#40;3DPVT’06&#41;. 2006. pp. 224-231.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">33. C. Bouvier, P. Y. Coulon, X. Maldague.&ldquo;Unsupervised lips segmentation based on ROI optimisation and parametric model&rdquo;. IEEE International Conference on Image Processing, ICIP 2007. Vol. 4. 2007. pp. 301- 304.</font></p>      <p><font face="Verdana" size="2">34. A. K. Jain, M. N. Murty, P. J. Flynn.&ldquo;Data clustering: A review. ACM Computer Surveys&rdquo;. Vol. 31. 1999. pp. 264-323.</font></p>      <!-- ref --><p><font face="Verdana" size="2">35. J. C. Bezdek. Pattern Recognition With Fuzzy Objective Function Algorithms. Plenum Press, 1981. pp. 256.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000115&pid=S0120-6230200900010001000035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> 36. A. K. Jain, M. N. Murty, P. J. Flynn.&ldquo;Data clustering: a review&rdquo;. ACM Computing Surveys. Vol. 31. 1999. pp. 264-323.</font></p>      <p><font face="Verdana" size="2">37. S. H. Leung, S. L. Wang, W. H. Lau.&ldquo;Lip Image Segmentation Using Fuzzy Clustering Incorporating an Elliptic Shape Function&rdquo;. IEEE Transactions on Image Processing. Vol. 13. 2004. pp. 51-62. </font></p>      <p><font face="Verdana" size="2">38. A. W. C. Liew, S. H. Leung, W. H. Lau.&ldquo;Segmentation of color lip images by spatial fuzzy clustering&rdquo;. IEEE Transactions on Fuzzy Systems. Vol. II. 2003. pp. 542- 549.</font></p>      <p><font face="Verdana" size="2">39. S. L. Wang, W. H. Lau, S. H. Leung, A. W. C. Liew.&ldquo;Lip segmentation with the presence of beards&rdquo;. IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP’04. Vol. 3. 2004. pp. 529- 532.</font></p>      <p><font face="Verdana" size="2">40. Y. Mitsukura, M. Fukumi, N. Akamatsu.&ldquo;A design of face detection system by using lip detection neuralnetwork and skin distinction neural network&rdquo;. Proceedings of IEEE International Conference on Systems, Man, and Cybernetics. Vol. 4. 2000. pp. 2789 - 2793.</font></p>      <p><font face="Verdana" size="2">41. H. Takimoto, Y. Mitsukura, M. Fukumi, N. Akamatsu&ldquo;Face detection and emotional extraction system using double structure neural network&rdquo;. Proceedings of the International Joint Conference on Neural Networks. Vol. 2. 2003. pp. 1253 - 1257.</font></p>      <p><font face="Verdana" size="2">42. Y. Mitsukura, M. Fukumi, N. Akamatsu.&ldquo;A design of face detection system using evolutionary computation&rdquo;. Proceedings of TENCON 2000. Vol. 2. 2000. pp. 398 - 402.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">43. W. N. Lie, H. C. Hsieh.&ldquo;Lips detection by morphological image processing&rdquo;. Proceedings of the 1998 Fourth International Conference on Signal Processing, ICSP’98. Vol. 2. 1998. pp. 1084 - 1087. </font></p>      <p><font face="Verdana" size="2">44. R. A. Rao, R. M. Mersereau.&ldquo;Lip modeling for visual speech recognition&rdquo;. 1994 Conference Record of the Twenty-Eighth Asilomar Conference on Signals, Systems and Computers. Vol. 1. 1994. pp. 587-590.</font></p>      <p><font face="Verdana" size="2">45. T. F. Cootes, D. Cooper, C. J. Taylor, J. Graham.&ldquo;Active shape models - their training and application&rdquo;. Computer Vision and Image Understanding. Vol. 61. 1995. pp. 38 - 59.</font></p>      <p><font face="Verdana" size="2">46. T. F. Cootes, G. J. Edwards, C. J. Taylor.&ldquo;Active appearance models&rdquo;. Proceedings of the European Conference on Computer Vision. Vol. 2. 1998. pp. 484- 498.</font></p>      <p><font face="Verdana" size="2">47. A. Caplier.&ldquo;Lip detection and tracking&rdquo;. Proceedings of 11th International Conference on Image Analysis and Processing. 2001. pp. 8 - 13.</font></p>      <p><font face="Verdana" size="2">48. A. Caplier, P. Delmas, D. Lam.&ldquo;Robust initialisation for lips edges detection&rdquo;. Proceedings of 11<sup>th</sup> Scandinavian Conference on Image Analysis. 1999. pp. 523-528.</font></p>      <p><font face="Verdana" size="2">49. A. Turkmani, A. Hilton.&ldquo;Appearance-based inner-lip detection&rdquo;. Proceedings of the 3<sup>rd</sup> European Conference on Visual Media Production &#40;CVMP 2006&#41;. 2006. pp. 176-176.</font></p>      <p><font face="Verdana" size="2">50. M. Jiang, Z. H. Gan, G. M. He, W. Y. Gao.&ldquo;Combining particle filter and active shape models for lip tracking&rdquo;. Proceedings of the 6<sup>th</sup> World Congress on Intelligent Control and Automation &#40;WCICA 2006&#41;. Vol. 2. 2006. pp. 9897- 9901.</font></p>      <p><font face="Verdana" size="2">51. Y. D. Jian, W. Y. Chang, C. S. Chen.&ldquo;Attractor-guided particle filtering for lip contour tracking&rdquo;. Lecture Notes in Computer Science. Vol. 3851. 2006. pp. 653 - 663.</font></p>      <p><font face="Verdana" size="2">52. J. E. Hern&aacute;ndez, F. Prieto, T. Redarce.&ldquo;Fast active contours for sampling&rdquo;. Proceedings of Electronics, Robotics and Automotive Mechanics Conference. Vol. 2. 2006. pp. 9 - 13.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">53. C. Xu, J. L. Prince.&ldquo;Gradient Vector Flow: A new external force for snakes&rdquo;. Proceedings of Computer Vision and Pattern Recognition &#40;CVPR‘97&#41;. San Juan, Puerto Rico. 1997. pp. 66-71.</font></p>      <p><font face="Verdana" size="2">54. C. Xu, J. L. Prince.&ldquo;Snakes, shapes, and gradient vector flow&rdquo;. IEEE Transactions on Image Processing. Vol. 7. 1998. pp. 359-369.</font></p>      <p><font face="Verdana" size="2">55. A. S. M. Sohail, P. Bhattacharya.&ldquo;Automated lip contour detection using the level set segmentation method&rdquo;. 14<sup>th</sup> International Conference on Image Analysis and Processing &#40;ICIAP 2007&#41;. 2007. pp. 425- 430.</font></p>      <p><font face="Verdana" size="2">56. P. Viola, M. J. Jones.&ldquo;Robust real-time face detection&rdquo;. International Journal of Computer Vision. Vol. 57. 2004. pp. 137-154.</font></p>      <p><font face="Verdana" size="2">57. N. Eveno, A. Caplier, P. Y. Coulon.&ldquo;Accurate and quasi-automatic lip tracking&rdquo;. IEEE Trans. on Circuits and Systems for Video Technology. Vol. 14. 2004. pp. 706-715.</font></p>      <p><font face="Verdana" size="2">58. Z. Hammal, N. Eveno, A. Caplier, P. Y. Coulon.&ldquo;Parametric models for facial features segmentation&rdquo;. Signal Processing. Vol. 86. 2005. pp. 399-413.</font></p>      <p><font face="Verdana" size="2">59. H. Seyedarabi, W. S. Lee, A. Aghagolzadeh.&ldquo;Automatic lip tracking and action units classification using two-step active contours and probabilistic neural networks&rdquo;. Proc. of the Canadian Conf. on Electrical and Computer Engineering, CCECE’06. 2006. pp. 2021-2024.</font></p>      <p><font face="Verdana" size="2">60. S. Werda, W. Mahdi, A. B. Hamadou.&ldquo;Colour and geometric based model for lip localisation: Application for lip-reading system&rdquo;. 14<sup>th</sup> International Conference on Image Analysis and Processing &#40;ICIAP 2007&#41;. 2007. pp. 9-14.</font></p>      <p><font face="Verdana" size="2">61. J. S. Chang, E.Y. Kim, S. H. Park.&ldquo;Lip contour extraction using level set curve evolution with shape constraint&rdquo;. Lecture Notes in Computer Science. Vol. 4552. 2007. pp. 583-588.</font></p>      <p><font face="Verdana" size="2">62. M. K. Moghaddam, R. Safabakhsh.&ldquo;TASOM-based lip tracking using the color and geometry of the face&rdquo;. Proceedings of the Fourth International Conference on Machine Learning and Applications, ICMLA’05. 2005. pp. 6.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">63. L. Xie, X. L. Cai, Z. H. Fu, R. C. Zhao, D. M. Jiang.&ldquo;A robust hierarchical lip tracking approach for lipreading and audio visual speech recognition&rdquo;. Proceedings of 2004 International Conference on Machine Learning and Cybernetics. Vol. 6. 2004. pp. 3620-3624. </font></p>      <p><font face="Verdana" size="2">64. K. Messer, J. Matas, J. Kittler, J. Luettin, G. Maitre.&ldquo;XM2VTSDB: the extended M2VTS database&rdquo;. Proceedings of the Second International Conference on Audio- and Video-based Biometric Person Authentication, AVBPA’99. 1999. pp. 72-77.</font></p>      <p><font face="Verdana" size="2">65. A. M. Mart&iacute;nez, R. Benavente.&ldquo;The AR face database&rdquo;. Technical Report 24. Computer Vision Center &#40;CVC&#41;. Universidad Aut&oacute;noma de Bacelona, Barcelona, Espa&ntilde;a. 1998.</font></p>      <p><font face="Verdana" size="2">66. G. Chetty, M. Wagner.&ldquo;Automated lip feature extraction for liveness verification in audio-video authentication&rdquo;. Proceedings of Image and Vision Computing. 2004. pp. 17-22.</font></p>       <p><font face="Verdana" size="2">&#40;Recibido el 15 de marzo de 2008. Aceptado el 6 de noviembre de 2008&#41;</font></p>       <p><font face="Verdana" size="2">  <sup>*</sup>Autor de correspondencia: tel&eacute;fono: + 57 + 6 + 887 94 98, correo electr&oacute;nico: <a href="mailto:jbgomezm@unal.edu.co">jbgomezm@unal.edu.co</a> &#40;J. G&oacute;mez&#41;.</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Beaumesnil]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Luthon]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real time tracking for 3D realistic lip animation: Proceedings of the 18th International Conference on Pattern Recognition]]></article-title>
<source><![CDATA[ICPR 2006]]></source>
<year>2006</year>
<volume>1</volume>
<page-range>219-222</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Arsic]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Vilagut]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Thiran]]></surname>
<given-names><![CDATA[J. P]]></given-names>
</name>
</person-group>
<source><![CDATA[Automatic extraction of geometric lip features with application to multimodal speaker identification]]></source>
<year></year>
<conf-name><![CDATA[ 2006 IEEE International Conference on Multimedia and Expo]]></conf-name>
<conf-date>2006</conf-date>
<conf-loc> </conf-loc>
<page-range>161- 164</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[J. B]]></given-names>
</name>
<name>
<surname><![CDATA[Hernández]]></surname>
<given-names><![CDATA[J. E]]></given-names>
</name>
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Redarce]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real-time robot manipulation using mouth gestures in facial video sequences]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2007</year>
<volume>4729</volume>
<page-range>224-233</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salazar]]></surname>
<given-names><![CDATA[A. E]]></given-names>
</name>
<name>
<surname><![CDATA[Hernández]]></surname>
<given-names><![CDATA[J. E]]></given-names>
</name>
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Automatic quantitative mouth shape analysis]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2007</year>
<volume>4673</volume>
<page-range>416-423</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vezhnevets]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Sazonov]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Andreeva]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[A survey on pixel-based skin color detection techniques: Proceedings of GraphiCon]]></source>
<year>2003</year>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Liévin]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Luthon]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Unsupervised lip segmentation under natural conditions: IEEE International Conference on Acoustics, Speech, and Signal Processing]]></article-title>
<source><![CDATA[ICASSP’99]]></source>
<year>1999</year>
<volume>6</volume>
<page-range>3065-3068</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jian]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Kaynak]]></surname>
<given-names><![CDATA[M. N]]></given-names>
</name>
<name>
<surname><![CDATA[Cheok]]></surname>
<given-names><![CDATA[A. D]]></given-names>
</name>
<name>
<surname><![CDATA[Chung]]></surname>
<given-names><![CDATA[K. C]]></given-names>
</name>
</person-group>
<source><![CDATA[Real-time lip tracking for virtual lip implementation in virtualenvironments and computer games]]></source>
<year>2001</year>
<volume>3</volume>
<conf-name><![CDATA[10 IEEE International Conference on Fuzzy Systems]]></conf-name>
<conf-loc> </conf-loc>
<page-range>1359-1362</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[W. H]]></given-names>
</name>
<name>
<surname><![CDATA[Liew]]></surname>
<given-names><![CDATA[A.W]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Robust lip region segmentation for lip images with complex background]]></article-title>
<source><![CDATA[Pattern Recognition]]></source>
<year>2007</year>
<volume>40</volume>
<page-range>3481-3491</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chiou]]></surname>
<given-names><![CDATA[G. I]]></given-names>
</name>
<name>
<surname><![CDATA[Hwang]]></surname>
<given-names><![CDATA[J. N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lipreading from color video]]></article-title>
<source><![CDATA[IEEE Transactions on Image Processing]]></source>
<year>1997</year>
<volume>6</volume>
<page-range>1192-1195</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Mersereau]]></surname>
<given-names><![CDATA[R. M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lip feature extraction towards an automatic speechreading system]]></article-title>
<source><![CDATA[Proceedings of IEEE International Conference on Image Processing]]></source>
<year>2000</year>
<volume>3</volume>
<page-range>226-229</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guan]]></surname>
<given-names><![CDATA[Y. P]]></given-names>
</name>
</person-group>
<source><![CDATA[Automatic extraction of lip based on wavelet edge detection]]></source>
<year></year>
<conf-name><![CDATA[Eighth International Symposium on Symbolic and Numeric Algorithms for Scientific Computing]]></conf-name>
<conf-date>2006</conf-date>
<conf-loc> </conf-loc>
<page-range>125- 132</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eveno]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
</person-group>
<source><![CDATA[New color transformation for lips segmentation: IEEE Fourth Workshop on Multimedia Signal Processing]]></source>
<year>2001</year>
<page-range>3 - 8</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Loaiza]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[J. B]]></given-names>
</name>
<name>
<surname><![CDATA[Ceballos]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis de discriminancia y selección de características de color en im´agenes de labios utilizando redes neuronales]]></source>
<year></year>
<conf-name><![CDATA[XII Simposio de Tratamiento de Señales, Imágenes y Visión Artificial STSIVA07]]></conf-name>
<conf-date>2007</conf-date>
<conf-loc> </conf-loc>
<page-range>4</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hurlbert]]></surname>
<given-names><![CDATA[A. C]]></given-names>
</name>
<name>
<surname><![CDATA[Poggio]]></surname>
<given-names><![CDATA[T. A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Synthesizing a color algorithm from examples]]></article-title>
<source><![CDATA[Science]]></source>
<year>1988</year>
<volume>239</volume>
<page-range>447-514</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eveno]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
</person-group>
<source><![CDATA[A parametric model for realistic lip segmentation]]></source>
<year></year>
<conf-name><![CDATA[Seventh International Conference on Control, Automation, Robotics And Vision (ICARCV’O2)]]></conf-name>
<conf-date>2002</conf-date>
<conf-loc> </conf-loc>
<page-range>1426-1431</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Morán]]></surname>
<given-names><![CDATA[L. E]]></given-names>
</name>
<name>
<surname><![CDATA[Pinto]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Automatic extraction of the lips shape via statistical lips modelling and chromatic feature]]></source>
<year></year>
<conf-name><![CDATA[ Electronics, Robotics and Automotive Mechanics Conference (CERMA 2007)]]></conf-name>
<conf-date>2007</conf-date>
<conf-loc> </conf-loc>
<page-range>241- 246</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[W. H]]></given-names>
</name>
</person-group>
<source><![CDATA[Lip segmentation by fuzzy clustering incorporating with shape function]]></source>
<year></year>
<volume>1</volume>
<conf-name><![CDATA[ IEEE International Conference on Acoustics, Speech, and Signal Processing]]></conf-name>
<conf-loc> </conf-loc>
<page-range>1077-1080</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salazar]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Extracción y clasificación de posturas labiales en niños entre 5 y 10 años de la ciudad de Manizales]]></article-title>
<source><![CDATA[DYNA]]></source>
<year>2006</year>
<volume>73</volume>
<page-range>175-188</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Collins]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Leordeanu]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On-line selection of discriminative tracking features]]></article-title>
<source><![CDATA[IEEE Transaction on Pattern Analysis and Machine Intelligence]]></source>
<year>2005</year>
<volume>27</volume>
<page-range>1631-1643</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hsu]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
<name>
<surname><![CDATA[Abdel-Mottaleb]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Jain]]></surname>
<given-names><![CDATA[A. K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Face detection in color images]]></article-title>
<source><![CDATA[IEEE Trans. on Pattern Analysis and Machine Intelligence]]></source>
<year>2002</year>
<volume>24</volume>
<page-range>696-706</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dargham]]></surname>
<given-names><![CDATA[J. A]]></given-names>
</name>
<name>
<surname><![CDATA[Chekima]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Lips detection in the normalised RGB colour scheme]]></source>
<year>2006</year>
<volume>1</volume>
<conf-name><![CDATA[2 Information and Communication Technologies]]></conf-name>
<conf-loc> </conf-loc>
<page-range>1546-1551</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lucey]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Sridharan]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Chandran]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<source><![CDATA[Chromatic lip tracking using a connectivity based fuzzy thresholding technique]]></source>
<year>1999</year>
<conf-name><![CDATA[ Proceedings of the Fifth International Symposium on Signal Processing and its Applications]]></conf-name>
<conf-loc> </conf-loc>
<page-range>669-672</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[J. M]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[D. J]]></given-names>
</name>
<name>
<surname><![CDATA[Niu]]></surname>
<given-names><![CDATA[L. M]]></given-names>
</name>
<name>
<surname><![CDATA[Zhan]]></surname>
<given-names><![CDATA[Y. Z]]></given-names>
</name>
</person-group>
<source><![CDATA[Research and implementation of real time approach to lip detection in video sequences]]></source>
<year>2003</year>
<conf-name><![CDATA[ Proceedings of the Second International Conference on Machine Learning and Cybernetics]]></conf-name>
<conf-loc> </conf-loc>
<page-range>2795-2799</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rongben]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Lie]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Bingliang]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Lisheng]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Monitoring mouth movement for driver fatigue or distraction with one camera]]></source>
<year></year>
<conf-name><![CDATA[7 International IEEE Conference on Intelligent Transportation Systems]]></conf-name>
<conf-date>2004</conf-date>
<conf-loc> </conf-loc>
<page-range>314-319</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kim]]></surname>
<given-names><![CDATA[J. Y]]></given-names>
</name>
<name>
<surname><![CDATA[Na]]></surname>
<given-names><![CDATA[S.Y]]></given-names>
</name>
<name>
<surname><![CDATA[Cole]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lip detection using confidence-based adaptive thresholding]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2006</year>
<volume>4291</volume>
<page-range>731- 740</page-range></nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Khan]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Christmas]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Kittler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lip contour segmentation using kernel methods and level sets]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2007</year>
<volume>4842</volume>
<page-range>86-95</page-range></nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bunke]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Caelli]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Hidden Markov Models: Applications in Computer Vision]]></source>
<year>2001</year>
<volume>45</volume>
<page-range>244</page-range><publisher-name><![CDATA[World Scientific Publishing Co]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chellappa]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Jain]]></surname>
<given-names><![CDATA[A. K]]></given-names>
</name>
</person-group>
<source><![CDATA[Markov Random Fields: Theory and Application]]></source>
<year>1993</year>
<page-range>581</page-range><publisher-name><![CDATA[Ed.Academic Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sadeghi]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Kittler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Messer]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Real time segmentation of lip pixels for lip tracker initialization]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2001</year>
<volume>2124</volume>
<page-range>317-324</page-range></nlm-citation>
</ref>
<ref id="B30">
<label>30</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gacon]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
<name>
<surname><![CDATA[Bailly]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical active model for mouth components segmentation]]></source>
<year>2005</year>
<volume>2</volume>
<page-range>1021-1024</page-range></nlm-citation>
</ref>
<ref id="B31">
<label>31</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goswami]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Christmas]]></surname>
<given-names><![CDATA[W. J]]></given-names>
</name>
<name>
<surname><![CDATA[Kittler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical estimators for use in automatic lip segmentation]]></source>
<year></year>
<conf-name><![CDATA[3 European Conference on Visual Media Production (CVMP)]]></conf-name>
<conf-date>2006</conf-date>
<conf-loc> </conf-loc>
<page-range>79-86</page-range></nlm-citation>
</ref>
<ref id="B32">
<label>32</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mpiperis]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Malassiotis]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Strintzis]]></surname>
<given-names><![CDATA[M. G]]></given-names>
</name>
</person-group>
<source><![CDATA[Expression compensation for face recognition using a polar geodesic representation]]></source>
<year></year>
<conf-name><![CDATA[ Proceedings of the Third International Symposium on 3D Data Processing, Visualization, and Transmission (3DPVT’06)]]></conf-name>
<conf-date>2006</conf-date>
<conf-loc> </conf-loc>
<page-range>224-231</page-range></nlm-citation>
</ref>
<ref id="B33">
<label>33</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bouvier]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
<name>
<surname><![CDATA[Maldague]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
</person-group>
<source><![CDATA[Unsupervised lips segmentation based on ROI optimisation and parametric model: IEEE International Conference on Image Processing, ICIP 2007]]></source>
<year>2007</year>
<volume>4</volume>
<page-range>301- 304</page-range></nlm-citation>
</ref>
<ref id="B34">
<label>34</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jain]]></surname>
<given-names><![CDATA[A. K]]></given-names>
</name>
<name>
<surname><![CDATA[Murty]]></surname>
<given-names><![CDATA[M. N]]></given-names>
</name>
<name>
<surname><![CDATA[Flynn]]></surname>
<given-names><![CDATA[P. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data clustering: A review]]></article-title>
<source><![CDATA[ACM Computer Surveys]]></source>
<year>1999</year>
<volume>31</volume>
<page-range>264-323</page-range></nlm-citation>
</ref>
<ref id="B35">
<label>35</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bezdek]]></surname>
<given-names><![CDATA[J. C]]></given-names>
</name>
</person-group>
<source><![CDATA[Pattern Recognition With Fuzzy Objective Function Algorithms]]></source>
<year>1981</year>
<page-range>256</page-range><publisher-name><![CDATA[Plenum Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B36">
<label>36</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jain]]></surname>
<given-names><![CDATA[A. K]]></given-names>
</name>
<name>
<surname><![CDATA[Murty]]></surname>
<given-names><![CDATA[M. N]]></given-names>
</name>
<name>
<surname><![CDATA[Flynn]]></surname>
<given-names><![CDATA[P. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data clustering: a review]]></article-title>
<source><![CDATA[ACM Computing Surveys]]></source>
<year>1999</year>
<volume>31</volume>
<page-range>264-323</page-range></nlm-citation>
</ref>
<ref id="B37">
<label>37</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[W. H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lip Image Segmentation Using Fuzzy Clustering Incorporating an Elliptic Shape Function]]></article-title>
<source><![CDATA[IEEE Transactions on Image Processing]]></source>
<year>2004</year>
<volume>13</volume>
<page-range>51-62</page-range></nlm-citation>
</ref>
<ref id="B38">
<label>38</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Liew]]></surname>
<given-names><![CDATA[A. W]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Segmentation of color lip images by spatial fuzzy clustering]]></article-title>
<source><![CDATA[IEEE Transactions on Fuzzy Systems]]></source>
<year>2003</year>
<volume>II</volume>
<page-range>542- 549</page-range></nlm-citation>
</ref>
<ref id="B39">
<label>39</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[S. L]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[W. H]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
<name>
<surname><![CDATA[Liew]]></surname>
<given-names><![CDATA[A. W. C]]></given-names>
</name>
</person-group>
<source><![CDATA[Lip segmentation with the presence of beards]]></source>
<year>2004</year>
<volume>3</volume>
<conf-name><![CDATA[ IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP’04]]></conf-name>
<conf-loc> </conf-loc>
<page-range>529- 532</page-range></nlm-citation>
</ref>
<ref id="B40">
<label>40</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mitsukura]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Fukumi]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Akamatsu]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[A design of face detection system by using lip detection neuralnetwork and skin distinction neural network]]></source>
<year>2000</year>
<volume>4</volume>
<conf-name><![CDATA[ Proceedings of IEEE International Conference on Systems, Man, and Cybernetics]]></conf-name>
<conf-loc> </conf-loc>
<page-range>2789 - 2793</page-range></nlm-citation>
</ref>
<ref id="B41">
<label>41</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Takimoto]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Mitsukura]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Fukumi]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Akamatsu]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Face detection and emotional extraction system using double structure neural network]]></source>
<year>2003</year>
<volume>2</volume>
<conf-name><![CDATA[ Proceedings of the International Joint Conference on Neural Networks]]></conf-name>
<conf-loc> </conf-loc>
<page-range>1253 - 1257</page-range></nlm-citation>
</ref>
<ref id="B42">
<label>42</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mitsukura]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Fukumi]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Akamatsu]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[A design of face detection system using evolutionary computation]]></source>
<year>2000</year>
<volume>2</volume>
<conf-name><![CDATA[ TENCON 2000]]></conf-name>
<conf-loc> </conf-loc>
<page-range>398 - 402</page-range></nlm-citation>
</ref>
<ref id="B43">
<label>43</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lie]]></surname>
<given-names><![CDATA[W. N]]></given-names>
</name>
<name>
<surname><![CDATA[Hsieh]]></surname>
<given-names><![CDATA[H. C]]></given-names>
</name>
</person-group>
<source><![CDATA[Lips detection by morphological image processing]]></source>
<year>1998</year>
<volume>2</volume>
<conf-name><![CDATA[Fourth International Conference on Signal Processing, ICSP’98]]></conf-name>
<conf-loc> </conf-loc>
<page-range>1084 - 1087</page-range></nlm-citation>
</ref>
<ref id="B44">
<label>44</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rao]]></surname>
<given-names><![CDATA[R. A]]></given-names>
</name>
<name>
<surname><![CDATA[Mersereau]]></surname>
<given-names><![CDATA[R. M]]></given-names>
</name>
</person-group>
<source><![CDATA[Lip modeling for visual speech recognition]]></source>
<year>1994</year>
<volume>1</volume>
<conf-name><![CDATA[ 1994 Conference Record of the Twenty-Eighth Asilomar Conference on Signals, Systems and Computers]]></conf-name>
<conf-loc> </conf-loc>
<page-range>587-590</page-range></nlm-citation>
</ref>
<ref id="B45">
<label>45</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cootes]]></surname>
<given-names><![CDATA[T. F]]></given-names>
</name>
<name>
<surname><![CDATA[Cooper]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Taylor]]></surname>
<given-names><![CDATA[C. J]]></given-names>
</name>
<name>
<surname><![CDATA[Graham]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Active shape models - their training and application]]></article-title>
<source><![CDATA[Computer Vision and Image Understanding]]></source>
<year>1995</year>
<volume>61</volume>
<page-range>38 - 59</page-range></nlm-citation>
</ref>
<ref id="B46">
<label>46</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cootes]]></surname>
<given-names><![CDATA[T. F]]></given-names>
</name>
<name>
<surname><![CDATA[Edwards]]></surname>
<given-names><![CDATA[G. J]]></given-names>
</name>
<name>
<surname><![CDATA[Taylor]]></surname>
<given-names><![CDATA[C. J]]></given-names>
</name>
</person-group>
<source><![CDATA[Active appearance models]]></source>
<year>1998</year>
<volume>2</volume>
<conf-name><![CDATA[ Proceedings of the European Conference on Computer Vision]]></conf-name>
<conf-loc> </conf-loc>
<page-range>484- 498</page-range></nlm-citation>
</ref>
<ref id="B47">
<label>47</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Lip detection and tracking]]></source>
<year>2001</year>
<conf-name><![CDATA[11 International Conference on Image Analysis and Processing]]></conf-name>
<conf-loc> </conf-loc>
<page-range>8 - 13</page-range></nlm-citation>
</ref>
<ref id="B48">
<label>48</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Delmas]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Lam]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Robust initialisation for lips edges detection]]></source>
<year>1999</year>
<conf-name><![CDATA[11 Scandinavian Conference on Image Analysis]]></conf-name>
<conf-loc> </conf-loc>
<page-range>523-528</page-range></nlm-citation>
</ref>
<ref id="B49">
<label>49</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Turkmani]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Hilton]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Appearance-based inner-lip detection]]></source>
<year>2006</year>
<conf-name><![CDATA[3 European Conference on Visual Media Production (CVMP 2006)]]></conf-name>
<conf-loc> </conf-loc>
<page-range>176-176</page-range></nlm-citation>
</ref>
<ref id="B50">
<label>50</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jiang]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Gan]]></surname>
<given-names><![CDATA[Z. H]]></given-names>
</name>
<name>
<surname><![CDATA[He]]></surname>
<given-names><![CDATA[G. M]]></given-names>
</name>
<name>
<surname><![CDATA[Gao]]></surname>
<given-names><![CDATA[W. Y]]></given-names>
</name>
</person-group>
<source><![CDATA[Combining particle filter and active shape models for lip tracking]]></source>
<year>2006</year>
<volume>2</volume>
<conf-name><![CDATA[6 World Congress on Intelligent Control and Automation (WCICA 2006)]]></conf-name>
<conf-loc> </conf-loc>
<page-range>9897- 9901</page-range></nlm-citation>
</ref>
<ref id="B51">
<label>51</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jian]]></surname>
<given-names><![CDATA[Y. D]]></given-names>
</name>
</person-group>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2006</year>
<volume>3851</volume>
<page-range>653 - 663</page-range></nlm-citation>
</ref>
<ref id="B52">
<label>52</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hernández]]></surname>
<given-names><![CDATA[J. E]]></given-names>
</name>
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Redarce]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<source><![CDATA[Fast active contours for sampling]]></source>
<year>2006</year>
<volume>2</volume>
<conf-name><![CDATA[ Proceedings of Electronics, Robotics and Automotive Mechanics Conference]]></conf-name>
<conf-loc> </conf-loc>
<page-range>9 - 13</page-range></nlm-citation>
</ref>
<ref id="B53">
<label>53</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xu]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Prince]]></surname>
<given-names><![CDATA[J. L]]></given-names>
</name>
</person-group>
<source><![CDATA[Gradient Vector Flow: A new external force for snakes]]></source>
<year>1997</year>
<conf-name><![CDATA[ Proceedings of Computer Vision and Pattern Recognition (CVPR‘97)]]></conf-name>
<conf-loc>San Juan </conf-loc>
<page-range>66-71</page-range></nlm-citation>
</ref>
<ref id="B54">
<label>54</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xu]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Prince]]></surname>
<given-names><![CDATA[J. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Snakes, shapes, and gradient vector flow]]></article-title>
<source><![CDATA[IEEE Transactions on Image Processing]]></source>
<year>1998</year>
<volume>7</volume>
<page-range>359-369</page-range></nlm-citation>
</ref>
<ref id="B55">
<label>55</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sohail]]></surname>
<given-names><![CDATA[A. S. M]]></given-names>
</name>
<name>
<surname><![CDATA[Bhattacharya]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Automated lip contour detection using the level set segmentation method]]></source>
<year>2007</year>
<conf-name><![CDATA[14 International Conference on Image Analysis and Processing (ICIAP 2007)]]></conf-name>
<conf-loc> </conf-loc>
<page-range>425- 430</page-range></nlm-citation>
</ref>
<ref id="B56">
<label>56</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Viola]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Jones]]></surname>
<given-names><![CDATA[M. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Robust real-time face detection]]></article-title>
<source><![CDATA[International Journal of Computer Vision]]></source>
<year>2004</year>
<volume>57</volume>
<page-range>137-154</page-range></nlm-citation>
</ref>
<ref id="B57">
<label>57</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eveno]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Accurate and quasi-automatic lip tracking]]></article-title>
<source><![CDATA[IEEE Trans. on Circuits and Systems for Video Technology]]></source>
<year>2004</year>
<volume>14</volume>
<page-range>706-715</page-range></nlm-citation>
</ref>
<ref id="B58">
<label>58</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hammal]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Eveno]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Caplier]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Coulon]]></surname>
<given-names><![CDATA[P. Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Parametric models for facial features segmentation]]></article-title>
<source><![CDATA[Signal Processing]]></source>
<year>2005</year>
<volume>86</volume>
<page-range>399-413</page-range></nlm-citation>
</ref>
<ref id="B59">
<label>59</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Seyedarabi]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[W. S]]></given-names>
</name>
<name>
<surname><![CDATA[Aghagolzadeh]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Automatic lip tracking and action units classification using two-step active contours and probabilistic neural networks: Proc. of the Canadian Conf. on Electrical and Computer Engineering, CCECE’06.]]></source>
<year>2006</year>
<page-range>2021-2024</page-range></nlm-citation>
</ref>
<ref id="B60">
<label>60</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Werda]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mahdi]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Hamadou]]></surname>
<given-names><![CDATA[A. B]]></given-names>
</name>
</person-group>
<source><![CDATA[Colour and geometric based model for lip localisation: Application for lip-reading system]]></source>
<year>2007</year>
<conf-name><![CDATA[14 International Conference on Image Analysis and Processing (ICIAP 2007)]]></conf-name>
<conf-loc> </conf-loc>
<page-range>9-14</page-range></nlm-citation>
</ref>
<ref id="B61">
<label>61</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[J. S]]></given-names>
</name>
<name>
<surname><![CDATA[Kim]]></surname>
<given-names><![CDATA[E.Y]]></given-names>
</name>
<name>
<surname><![CDATA[Park]]></surname>
<given-names><![CDATA[S. H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Lip contour extraction using level set curve evolution with shape constraint]]></article-title>
<source><![CDATA[Lecture Notes in Computer Science]]></source>
<year>2007</year>
<volume>4552</volume>
<page-range>583-588</page-range></nlm-citation>
</ref>
<ref id="B62">
<label>62</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moghaddam]]></surname>
<given-names><![CDATA[M. K]]></given-names>
</name>
<name>
<surname><![CDATA[Safabakhsh]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[TASOM-based lip tracking using the color and geometry of the face]]></source>
<year>2005</year>
<conf-name><![CDATA[Fourth International Conference on Machine Learning and Applications, ICMLA’05]]></conf-name>
<conf-loc> </conf-loc>
<page-range>6</page-range></nlm-citation>
</ref>
<ref id="B63">
<label>63</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xie]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Cai]]></surname>
<given-names><![CDATA[X. L]]></given-names>
</name>
<name>
<surname><![CDATA[Fu]]></surname>
<given-names><![CDATA[Z. H]]></given-names>
</name>
<name>
<surname><![CDATA[Zhao]]></surname>
<given-names><![CDATA[R. C]]></given-names>
</name>
<name>
<surname><![CDATA[Jiang]]></surname>
<given-names><![CDATA[D. M]]></given-names>
</name>
</person-group>
<source><![CDATA[A robust hierarchical lip tracking approach for lipreading and audio visual speech recognition]]></source>
<year>2004</year>
<volume>6</volume>
<conf-name><![CDATA[ International Conference on Machine Learning and Cybernetics]]></conf-name>
<conf-loc> </conf-loc>
<page-range>3620-3624</page-range></nlm-citation>
</ref>
<ref id="B64">
<label>64</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Messer]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Matas]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Kittler]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Luettin]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Maitre]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<source><![CDATA[XM2VTSDB: the extended M2VTS database]]></source>
<year>1999</year>
<conf-name><![CDATA[Second International Conference on Audio- and Video-based Biometric Person Authentication, AVBPA’99]]></conf-name>
<conf-loc> </conf-loc>
<page-range>72-77</page-range></nlm-citation>
</ref>
<ref id="B65">
<label>65</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martínez]]></surname>
<given-names><![CDATA[A. M]]></given-names>
</name>
<name>
<surname><![CDATA[Benavente]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[The AR face database: Technical Report 24]]></source>
<year>1998</year>
<publisher-loc><![CDATA[Barcelona ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Autónoma de Bacelona]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B66">
<label>66</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chetty]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Wagner]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<source><![CDATA[Automated lip feature extraction for liveness verification in audio-video authentication: Proceedings of Image and Vision Computing]]></source>
<year>2004</year>
<page-range>17-22</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
