<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0123-2126</journal-id>
<journal-title><![CDATA[Ingeniería y Universidad]]></journal-title>
<abbrev-journal-title><![CDATA[Ing. Univ.]]></abbrev-journal-title>
<issn>0123-2126</issn>
<publisher>
<publisher-name><![CDATA[Pontificia Universidad Javeriana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0123-21262009000200004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Síntesis de imágenes a partir de imágenes reales de una escena mediante un algoritmo parcialmente autónomo]]></article-title>
<article-title xml:lang="en"><![CDATA[Image Synthesis from Real Scene Images by Means of a Partially Autonomous Algorithm]]></article-title>
<article-title xml:lang="pt"><![CDATA[Síntese de imagens a partir de imagens não retificadas de uma cena]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Fajardo-Jaimes]]></surname>
<given-names><![CDATA[Arturo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Vizcaya-Guarín]]></surname>
<given-names><![CDATA[Pedro Raúl]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Pontificia Universidad Javeriana  ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Pontificia Universidad Javeriana Rensselaer Polytechnic Institute ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>07</month>
<year>2009</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>07</month>
<year>2009</year>
</pub-date>
<volume>13</volume>
<numero>2</numero>
<fpage>281</fpage>
<lpage>307</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0123-21262009000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0123-21262009000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0123-21262009000200004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En este artículo se presenta un algoritmo de síntesis de imágenes que brinda una solución al problema de sintetizar vistas de una escena real tomadas por una cámara virtual, ubicada entre dos cámaras reales. En particular, se presenta cómo bajo ciertas condiciones de las escenas un par de vistas base es suficiente para determinar todo el conjunto de vistas posibles sobre la línea que une sus centros ópticos, conocida como la línea base, sin necesidad de reconstruir explícitamente un modelo en 3D. Los resultados experimentales muestran cómo el algoritmo funciona adecuadamente en escenas simples (compuestas por un objeto de geometría sencilla, opacos y sin oclusiones).]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This paper presents an image synthesis algorithm for rendering views of a real scene taken with a virtual camera which is located between two real cameras. Specifically, this paper presents how, under certain conditions, a pair of views is enough to obtain a full set of possible views by following the line that joins their optical centers (baseline) without reconstructing explicit 3D models. Test results show the viability of the proposed algorithm for simple scenes (an object with a simple geometry, which is opaque, and does not present any occlusions).]]></p></abstract>
<abstract abstract-type="short" xml:lang="pt"><p><![CDATA[Neste artigo apresenta-se um algoritmo de síntese de imagens que oferece uma solução ao problema de sintetizar vistas de uma cena real tomadas por uma câmera virtual, localizada entre das câmeras reais. Em particular, apresenta- se como sob certas condições das cenas um par de vistas base é suficiente para determinar todo o conjunto de vistas possíveis sobre a linha que une seus centros óticos, conhecida como a línea base, sem necessidade de reconstruir explicitamente um modelo em 3D. Os resultados experimentais mostram como o algoritmo funciona adequadamente em cenas simples (compostas por um objeto de geometria simples, opacos e sem oclusões).]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Algoritmos]]></kwd>
<kwd lng="es"><![CDATA[procesamiento de imágenes]]></kwd>
<kwd lng="es"><![CDATA[cámaras fotográficas digitales]]></kwd>
<kwd lng="en"><![CDATA[Algorithms]]></kwd>
<kwd lng="en"><![CDATA[image processing]]></kwd>
<kwd lng="en"><![CDATA[digital cameras]]></kwd>
<kwd lng="pt"><![CDATA[Algoritmos]]></kwd>
<kwd lng="pt"><![CDATA[processamento de imagens]]></kwd>
<kwd lng="pt"><![CDATA[câmaras fotográficas digitais]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[   <font size="2" face="verdana">      <p align="center"><font size="4"><b>S&iacute;ntesis de im&aacute;genes a partir de im&aacute;genes reales de una escena mediante un algoritmo parcialmente aut&oacute;nomo</b></font><sup>*</sup></p>      <p align="center"><font size="3"><b>Image Synthesis from Real Scene Images by Means of a Partially Autonomous Algorithm</b></font><sup>**</sup></p>      <p align="center"><font size="3"><b>S&iacute;ntese de imagens a partir de imagens n&atilde;o retificadas de uma cena</b></font><sup>***</sup></p>      <p>    <center><i>Arturo Fajardo-Jaimes</i><sup>****</sup>    <br> <i>Pedro Ra&uacute;l Vizcaya-Guar&iacute;n</i><sup>*****</sup></center></p>      <br>      <p><sup>*</sup> Este art&iacute;culo se deriva del proyecto de investigaci&oacute;n <i>S&iacute;ntesis de im&aacute;genes a partir de vistas de una escena</i>, desarrollado por el Departamento de Electr&oacute;nica de la Pontificia Universidad Javeriana.    <br>  <sup>**</sup> This article results from the research project on <i>Image Synthesis of Views from a Scene</i>, developed by the Electronics Department at the Pontificia Universidad Javeriana.    ]]></body>
<body><![CDATA[<br>  <sup>***</sup>  Data de aceita&ccedil;&atilde;o para publica&ccedil;&atilde;o: 23 de julho de 2009. Este artigo deriva do projeto de pesquisa em s&iacute;ntese de imagens a partir de vistas de una cena, desenvolvido pelo Departamento de Eletr&ocirc;nica da Pontif&iacute;cia Universidade Javeriana.    <br>  <sup>****</sup> Ingeniero electr&oacute;nico. Mag&iacute;ster en Ingenier&iacute;a Electr&oacute;nica, Pontificia Universidad Javeriana, Bogot&aacute;, Colombia. Profesor asistente de la Pontificia Universidad Javeriana. Correo electr&oacute;nico: <a href="mailto:fajardoa@javeriana.edu.co">fajardoa@javeriana.edu.co</a>.    <br>  <sup>*****</sup> Ingeniero electr&oacute;nico, Pontificia Universidad Javeriana, Bogot&aacute;, Colombia. M&aacute;ster y doctor en Ingenier&iacute;a El&eacute;ctrica, Rensselaer Polytechnic Institute, New York, Estados Unidos. Profesor titular de la Pontificia Universidad Javeriana. Correo electr&oacute;nico: <a href="mailto:pvizcaya@javeriana.edu.co">pvizcaya@javeriana.edu.co</a>.</center></p>      <p>Fecha de recepci&oacute;n: 11 de mayo de 2009. Fecha de aceptaci&oacute;n para publicaci&oacute;n: 23 de julio de 2009.    <br> Submitted on: May 11, 2009. Accepted on: July 23, 2009.    <br> Data de recep&ccedil;&atilde;o: 11 de maio de 2009. Data de aceita&ccedil;&atilde;o para publica&ccedil;&atilde;o: 23 de julho de 2009</p>  <hr>      <p><font size="3"><b>Resumen</b></font></p>      <p>En este art&iacute;culo se presenta un algoritmo de s&iacute;ntesis de im&aacute;genes que brinda una soluci&oacute;n al problema de sintetizar vistas de una escena real tomadas por una c&aacute;mara virtual, ubicada entre dos c&aacute;maras reales. En particular, se presenta c&oacute;mo bajo ciertas condiciones de las escenas un par de vistas base es suficiente para determinar todo el conjunto de vistas posibles sobre la l&iacute;nea que une sus centros &oacute;pticos, conocida como la l&iacute;nea base, sin necesidad de reconstruir expl&iacute;citamente un modelo en 3D. Los resultados experimentales muestran c&oacute;mo el algoritmo funciona adecuadamente en escenas simples (compuestas por un objeto de geometr&iacute;a sencilla, opacos y sin oclusiones).</p>      <p><b>Palabras clave</b>: Algoritmos, procesamiento de im&aacute;genes, c&aacute;maras fotogr&aacute;ficas digitales.    <p>  <hr>      ]]></body>
<body><![CDATA[<p><font size="3"><b>Abstract</b></font></p>      <p>This paper presents an image synthesis algorithm for rendering views of a real scene taken with a virtual camera which is located between two real cameras. Specifically, this paper presents how, under certain conditions, a pair of views is enough to obtain a full set of possible views by following the line that joins their optical centers (baseline) without reconstructing explicit 3D models. Test results show the viability of the proposed algorithm for simple scenes (an object with a simple geometry, which is opaque, and does not present any occlusions).</p>      <p><b>Key words</b>: Algorithms, image processing, digital cameras.</p>  <hr>      <p><font size="3"><b>Resumo</b></font></p>      <p>Neste artigo apresenta-se um algoritmo de s&iacute;ntese de imagens que oferece uma solu&ccedil;&atilde;o ao problema de sintetizar vistas de uma cena real tomadas por uma c&acirc;mera virtual, localizada entre das c&acirc;meras reais. Em particular, apresenta- se como sob certas condi&ccedil;&otilde;es das cenas um par de vistas base &eacute; suficiente para determinar todo o conjunto de vistas poss&iacute;veis sobre a linha que une seus centros &oacute;ticos, conhecida como a l&iacute;nea base, sem necessidade de reconstruir explicitamente um modelo em 3D. Os resultados experimentais mostram como o algoritmo funciona adequadamente em cenas simples (compostas por um objeto de geometria simples, opacos e sem oclus&otilde;es).</p>      <p><b>Palavras-Chave</b>: Algoritmos, processamento de imagens, c&acirc;maras fotogr&aacute;ficas digitais.</p>  <hr>      <p><font size="3"><b>Introducci&oacute;n</b></font></p>      <p>La soluci&oacute;n al problema de sintetizar im&aacute;genes a partir de vistas conocidas de una escena abre vastas posibilidades en cuanto al an&aacute;lisis de escenas complejas presentes en la vida cotidiana (Inamoto y Saito, 2007). En el caso particular de escenas de seguridad donde se tengan varias c&aacute;maras fijas, se podr&iacute;an encontrar vistas no observadas por alguna de las c&aacute;maras, lo cual permitir&iacute;a la posterior identificaci&oacute;n de una persona. Para abordar el problema de la predicci&oacute;n de nuevas vistas a partir de vistas base se puede obtener el modelo tridimensional de una escena para despu&eacute;s reproyectarlo y as&iacute; sintetizar nuevas vistas (Kubota <i>et al</i>., 2006; Zheng y Wu, 2001). Las principales desventajas de este tipo de soluci&oacute;n son la complejidad y la acumulaci&oacute;n de error en que se incurre al reconstruir el modelo en 3D.</p>      <p>En el SIGGRAPH 92, Beier y Nelly (1992) introdujeron una t&eacute;cnica de procesamiento de im&aacute;genes llamada conformaci&oacute;n (<i>morphing</i>) para la metamorfosis de una imagen a otra. Esta t&eacute;cnica permiti&oacute; generar nuevas vistas a trav&eacute;s de la interpolaci&oacute;n lineal de puntos correspondientes en ambas im&aacute;genes (Chen y Williams, 1993). Dicha investigaci&oacute;n se concentr&oacute; en encontrar qu&eacute; interpolaci&oacute;n produc&iacute;a vistas f&iacute;sicamente v&aacute;lidas de la escena, es decir, aquella que simula la vista producida por una c&aacute;mara real en otra posici&oacute;n, donde encontraron que s&oacute;lo algunas vistas interpoladas resultaban serlo. Seitz y Dyeer (1995 y 1996) demostraron que s&oacute;lo bajo ciertas condiciones de la geometr&iacute;a epipolar la interpolaci&oacute;n lineal produce vistas f&iacute;sicamente v&aacute;lidas.</p>      <p>En este art&iacute;culo se presenta el desarrollo y la validaci&oacute;n de un algoritmo implementado en Matlab&reg;, que permite sintetizar nuevas vistas f&iacute;sicamente v&aacute;lidas de una escena a partir de vistas conocidas de esta, bas&aacute;ndose en el m&eacute;todo propuesto por Seitz y Dyer. Se empieza por exponer brevemente el modelo de la c&aacute;mara utilizado y la geometr&iacute;a epipolar, para despu&eacute;s describir el algoritmo. Finalmente, se ilustran algunos resultados relevantes y las principales conclusiones a las que se llegaron al realizar la investigaci&oacute;n, junto con algunas sugerencias para mejorar el desempe&ntilde;o del algoritmo en trabajos posteriores. El algoritmo que se presenta se diferencia de los algoritmos existentes por ser parcialmente aut&oacute;nomo, ya que una vez calibradas las c&aacute;maras, sintetiza las vistas sin interactuar con el usuario.</p>      ]]></body>
<body><![CDATA[<p><font size="3"><b>1. Desarrollo y m&eacute;todos</b></font></p>      <p><i>1.1 Modelo de la c&aacute;mara</i></p>      <p>La proyecci&oacute;n en perspectiva (Nalwa, 1993) es la proyecci&oacute;n de puntos tridimensionales del espacio sobre una superficie bidimensional por medio de l&iacute;neas rectas que pasan a trav&eacute;s de un solo punto, llamado el centro &oacute;ptico. En la <a href="#fig1">Figura 1</a> se observa la formaci&oacute;n de la imagen.</p>      <p>    <center><a name="fig1"><img src="img/revistas/inun/v13n2/v13n2a04f1.jpg"></center></p>      <p>La distancia entre el centro &oacute;ptico de la c&aacute;mara y el plano imagen es conocida como <i>distancia focal</i> (f). Del modelo de proyecci&oacute;n perspectiva se obtiene que:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e1.jpg"></p>      <p>Donde <i>x</i> y <i>y</i> son las coordenadas del punto en la imagen y <i>X, Y</i> y <i>Z</i> son las coordenadas del punto en 3D. Estas ecuaciones son no lineales, lo cual impide su formulaci&oacute;n de forma matricial. Sin embargo, como se expone en (Nalwa, 1993; Gonz&aacute;lez, 2000), al reescribir el punto 3D en coordenadas homog&eacute;neas como &#91;<i>kX kY kZ k</i>&#93;<i><sup>T</sup></i>, donde <i>k</i> es una constante arbitraria, la proyecci&oacute;n de un punto tridimensional se puede escribir como sigue:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e2.jpg"></p>      <p>Donde <i>w<sub>h</sub></i> representa un punto en tercera dimensi&oacute;n en coordenadas homog&eacute;neas, y <i>m<sub>h</sub></i>, su proyecci&oacute;n en el plano imagen en coordenadas homog&eacute;neas.</p>      ]]></body>
<body><![CDATA[<p>La matriz <i>P</i> se denomina <i>matriz de transformaci&oacute;n perspectiva</i> (MPP). La tercera componente del vector resultante carece de significado, por lo cual en muchas aplicaciones la tercera fila de dicha matriz es eliminada. La ecuaci&oacute;n es v&aacute;lida si el sistema de coordenadas del mundo real y el del plano imagen son coincidentes; sin embargo, en la mayor&iacute;a de aplicaciones se presenta una situaci&oacute;n donde los dos sistemas no son coincidentes, por ello es necesario hacer coincidir los sistemas de coordenadas. La MPP bajo estas condiciones est&aacute; descrita por (Gonz&aacute;lez, 2000; Fusiello <i>et al</i>., 1999).</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e3.jpg"></p>      <p>La matriz <i>A<sub>3x3</sub></i> contiene los par&aacute;metros intr&iacute;nsecos de la c&aacute;mara, mientras que los par&aacute;metros extr&iacute;nsecos de la c&aacute;mara (posici&oacute;n y orientaci&oacute;n) se encuentran codificados en la matriz de rotaci&oacute;n <i>R<sub>3x3</sub></i> y en el vector de translaci&oacute;n <i>t<sub>3x1</sub></i>.</p>      <p><i>1.2 Geometr&iacute;a epipolar</i></p>      <p>La geometr&iacute;a epipolar es la construcci&oacute;n b&aacute;sica que relaciona dos im&aacute;genes de una misma escena. En la <a href="#fig2">Figura 2</a>, sea <i>c<sub>1</sub></i> el centro &oacute;ptico de la primera c&aacute;mara (izquierda) y sea <i>c<sub>2</sub></i> el centro &oacute;ptico de la segunda c&aacute;mara (derecha), la l&iacute;nea que forman <i>c<sub>1</sub></i> y <i>c<sub>2</sub></i> se proyecta en los planos <i>R<sub>1</sub></i> y <i>R<sub>2</sub></i> en dos puntos llamados epipolos (<i>e<sub>1</sub></i> y <i>e<sub>2</sub></i>). Las l&iacute;neas pertenecientes a los planos <i>R<sub>1</sub></i> y <i>R<sub>2</sub></i>, que pasan por los epipolos, se llaman l&iacute;neas epipolares (<i>l<sub>1</sub>, l<sub>2</sub></i>). El plano definido por el punto 3D y los centros &oacute;pticos se llama <i>plano epipolar</i>; este plano contiene tambi&eacute;n los epipolos y la proyecci&oacute;n del punto 3D en el plano imagen de ambas c&aacute;maras, <i>m<sub>1</sub></i> y <i>m<sub>2</sub></i>, los cuales constituyen un par de puntos correspondientes.</p>      <p>    <center><a name="fig2"><img src="img/revistas/inun/v13n2/v13n2a04f2.jpg"></center></p>      <p><i>1.3 Montaje f&iacute;sico</i></p>      <p>Para obtener vistas se dise&ntilde;&oacute; un montaje f&iacute;sico (C&oacute;rdoba <i>et al</i>., 2002), que consisti&oacute; en una base met&aacute;lica ilustrada en la <a href="#fig3">Figura 3</a>a, la cual permiti&oacute; obtener vistas de la escena en varias posiciones con una sola c&aacute;mara, como se muestra en la <a href="#fig3">Figura 3</a>b. El uso de una sola c&aacute;mara garantiz&oacute; que los par&aacute;metros intr&iacute;nsecos involucrados en la adquisici&oacute;n de cada vista fueran los mismos.</p>      <p>    ]]></body>
<body><![CDATA[<center><a name="fig3"><img src="img/revistas/inun/v13n2/v13n2a04f3.jpg"></center></p>      <p>Como el centro &oacute;ptico de la c&aacute;mara no coincide con su eje de rotaci&oacute;n, al rodarla sobre su eje y desplazar la base horizontalmente, su centro &oacute;ptico forma una trayectoria curva ilustrada en la <a href="#fig4">Figura 4</a>a. Como el movimiento de los centros &oacute;pticos debe describir una l&iacute;nea recta para que coincida con la trayectoria te&oacute;rica planteada en el m&eacute;todo de s&iacute;ntesis de im&aacute;genes, el montaje f&iacute;sico fue ajustado para tratar que la trayectoria del centro mec&aacute;nico de rotaci&oacute;n de la c&aacute;mara permitiera que la trayectoria descrita por el centro &oacute;ptico de la c&aacute;mara fuera en l&iacute;nea recta, como se ilustra en la <a href="#fig4">Figura 4</a>b.</p>      <p>    <center><a name="fig4"><img src="img/revistas/inun/v13n2/v13n2a04f4.jpg"></center></p>      <p><i>1.4 S&iacute;ntesis de im&aacute;genes</i></p>      <p>En el algoritmo planteado en este art&iacute;culo se utilizan t&eacute;cnicas que combinan interpolaciones bidimensionales de forma y color para crear efectos de transici&oacute;n entre im&aacute;genes. Estas se conocen como t&eacute;cnicas de conformaci&oacute;n (<i>morphing</i>) y se caracterizan por producir resultados convincentes con un bajo costo computacional. Sin embargo, al aplicar estas t&eacute;cnicas directamente a las im&aacute;genes, no necesariamente se producen vistas f&iacute;sicamente v&aacute;lidas. La &uacute;nica forma de asegurar este resultado es contar con im&aacute;genes en que las l&iacute;neas epipolares sean paralelas (Seitz y Dyer, 1995 y 1996; C&oacute;rdoba <i>et al</i>., 2002).</p>      <p>Para obtener a partir de vistas no rectificadas im&aacute;genes f&iacute;sicamente v&aacute;lidas, es necesario seguir un proceso cuyo diagrama en bloque se muestra en la <a href="#fig5">Figura 5</a>b. En primer lugar, a partir de la calibraci&oacute;n de la c&aacute;mara, las vistas se rectifican para hacer coincidir sus l&iacute;neas epipolares; en este punto, el problema de sintetizar nuevas vistas se restringe a interpolar vistas paralelas. Una vez se tiene la vista interpolada en el plano com&uacute;n, se debe reproyectar la imagen del plano com&uacute;n al plano imagen deseado. Este &uacute;ltimo se puede definir de muchas maneras, la m&aacute;s natural es definir su orientaci&oacute;n interpolando las orientaciones de los planos imagen de las vistas reales. De forma geom&eacute;trica se ilustra este proceso en la <a href="#fig5">Figura 5</a>a.</p>      <p>    <center><a name="fig5"><img src="img/revistas/inun/v13n2/v13n2a04f5.jpg"></center></p>      <p>1.4.1 Calibraci&oacute;n</p>      ]]></body>
<body><![CDATA[<p>La calibraci&oacute;n consiste en determinar los par&aacute;metros de la trasformaci&oacute;n entre puntos 3D de la escena y puntos 2D de la imagen, es decir, encontrar la MPP. Calibrar la c&aacute;mara implica determinar los doce elementos de la matriz <i>P</i>, para lo cual es necesario plantear un sistema de ecuaciones con un m&iacute;nimo de seis puntos. Para n puntos se tiene el siguiente sistema de ecuaciones:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e4.jpg"></p>      <p>Puesto que el sistema de ecuaciones resultante es homog&eacute;neo, existen infinitas soluciones que hacen necesario fijar una de las inc&oacute;gnitas (Gonz&aacute;lez, 2000); en este caso se fij&oacute; <i>p44=1</i>, donde <i>W<sub>2nx11</sub></i> es una matriz obtenida a partir de los puntos de calibraci&oacute;n, <i>X<sub>11x1</sub></i> es la matriz de inc&oacute;gnitas y <i>C<sub>2nx1</sub></i> es la matriz de cuyos elementos son los pares de coordenadas de los puntos proyectados. La soluci&oacute;n que minimiza el error de m&iacute;nimos cuadrados es:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e5.jpg"></p>      <p>Puesto que el m&iacute;nimo se logra cuando la derivada se hace cero, se tiene que:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e6.jpg"></p>      <p>Al obtener el vector <i>X</i>, se obtiene la matriz de trasformaci&oacute;n perspectiva <i>P</i> y, por lo tanto, los par&aacute;metros de la c&aacute;mara.</p>      <p>1.4.2 Rectificaci&oacute;n</p>      <p>El proceso de rectificaci&oacute;n consiste en encontrar nuevas proyecciones en las cuales las l&iacute;neas epipolares sean colineales y paralelas a uno de los ejes de la imagen. Esto se ilustra en la <a href="#fig6">Figura 6</a>a, donde los p&iacute;xeles <i>m<sub>1</sub></i> y <i>m<sub>2</sub></i> corresponden a la proyecci&oacute;n del mismo punto <i>w</i> en los planos imagen, y <i>m<sub>r1</sub></i> y <i>m<sub>r2</sub></i>, a su proyecci&oacute;n en los planos rectificados. Para rectificar, el algoritmo rota las c&aacute;maras sobre su centro &oacute;ptico hasta que los planos imagen sean coplanares (<a href="#fig6">Figura 6</a>b). Esto se logra promediando los par&aacute;metros intr&iacute;nsecos de las c&aacute;maras y redefiniendo la orientaci&oacute;n del plano imagen de tal forma que sea paralelo a la l&iacute;nea base. Una vez calculadas las transformaciones para llevar cada una de las im&aacute;genes originales al plano rectificado, estas se aplican a las im&aacute;genes originales para producir las im&aacute;genes rectificadas (Fusiello <i>et al</i>., 1999).</p>      <p>    ]]></body>
<body><![CDATA[<center><a name="fig6"><img src="img/revistas/inun/v13n2/v13n2a04f6.jpg"></center></p>      <p>1.4.3 Correspondencia</p>      <p>Esta etapa consiste en encontrar los puntos que corresponden a la proyecci&oacute;n de un mismo punto tridimensional en ambas im&aacute;genes. El algoritmo implementado extrae de la imagen bordes que delimiten cambios entre superficies o regiones de las superficies, presentes en los objetos, para luego aplicar el proceso de correspondencia a ellas. A fin de obtener los bordes de las im&aacute;genes se utiliz&oacute; el extractor de bordes de Canny, el cual genera bordes definidos que delimitan las superficies y captura mejor los detalles presentes, gracias a que tiene como par&aacute;metros de minimizaci&oacute;n el error de detecci&oacute;n, el error de localizaci&oacute;n y el error de respuesta m&uacute;ltiple, simult&aacute;neamente, a diferencia de otros operadores (Gonz&aacute;lez, 2000).</p>      <p>Para mejorar el rendimiento del extractor se implement&oacute; una etapa de preprocesamiento que suaviza las texturas de las superficies, lo cual evita detectar algunos bordes que no pertenezcan a l&iacute;mites entre superficies de alto contraste. Dicha etapa se puso en funcionamiento disminuyendo la resoluci&oacute;n de la imagen y aplicando a estas im&aacute;genes los filtros <i>wiener</i> y <i>medfilt2</i> del <i>toolbox</i> de im&aacute;genes de Matlab&reg;, para luego aplicar el extractor de bordes a la imagen preprocesada. De los bordes obtenidos se descartaron aquellos que no pertenecen al objeto, es decir, producidos por texturas del fondo de la imagen. Para ello es necesario diferenciar entre el fondo de la imagen y el objeto, lo que se logra bajo el supuesto de que la intensidad predominante determina el fondo y genera una m&aacute;scara que elimina los bordes encontrados en el fondo de la imagen.</p>      <p>Posteriormente, la imagen de bordes se ajusta al tama&ntilde;o de la imagen original, de manera que la posici&oacute;n de los bordes en la imagen original sea conocida. Del procedimiento anterior a&uacute;n existen algunos peque&ntilde;os bordes que no representan caracter&iacute;sticas importantes en la imagen; para eliminarlos se realiza otro procedimiento, en el que se compara el tama&ntilde;o en p&iacute;xeles de cada uno de los bordes en la imagen con un tama&ntilde;o m&iacute;nimo permitido.</p>      <p>Finalmente se le hace un posprocesamiento a la imagen de bordes, que consiste en completar contornos, a fin de obtener una imagen de bordes que representa los cambios entre superficies o regiones de alto contraste. Para este procedimiento se hallan los puntos terminales de los bordes y se conectan a cada uno un m&aacute;ximo de dos puntos terminales, los m&aacute;s cercanos dentro de una vecindad de tama&ntilde;o definido por el usuario. Todo este proceso se ilustra en la <a href="#fig7">Figura 7</a>.</p>      <p>    <center><a name="fig7"><img src="img/revistas/inun/v13n2/v13n2a04f7.jpg"></center></p>      <p>A partir de los bordes extra&iacute;dos de las im&aacute;genes se genera un espacio de b&uacute;squeda de posibles correspondencias. Debido al proceso de rectificaci&oacute;n realizado previamente en las im&aacute;genes, los puntos de correspondencia se encuentran sobre la misma l&iacute;nea horizontal en ambas im&aacute;genes. Este espacio de b&uacute;squeda se ilustra en la <a href="#fig8">Figura 8</a>, donde la l&iacute;nea vertical muestra las posiciones de los bordes en la l&iacute;nea de b&uacute;squeda derecha, y la horizontal, las posiciones de los bordes en la l&iacute;nea de b&uacute;squeda izquierda.</p>      <p>    ]]></body>
<body><![CDATA[<center><a name="fig8"><img src="img/revistas/inun/v13n2/v13n2a04f8.jpg"></center></p>      <p>En este plano de b&uacute;squeda se definen como nodos las intersecciones de los bordes, y son numerados de izquierda a derecha en cada l&iacute;nea de b&uacute;squeda de 0 a <i>M</i> en la l&iacute;nea derecha y de 0 a <i>N</i> en la l&iacute;nea izquierda. Por conveniencia, el inicio y el final de cada l&iacute;nea de b&uacute;squeda se consideran un borde. En esta configuraci&oacute;n la b&uacute;squeda de correspondencias se reduce a encontrar un camino &oacute;ptimo desde el nodo (00) al (NM). Para encontrar este camino se us&oacute; un algoritmo basado en el m&eacute;todo de b&uacute;squeda por l&iacute;nea (Otha y Kanade, 1985). Una vez se ha encontrado el camino de correspondencia, se dice que todo nodo &#91;<i>m,n</i>&#93; que pertenece al camino &oacute;ptimo conforma un par de bordes <i>m</i> y <i>n</i> correspondientes en la l&iacute;nea epipolar analizada.</p>      <p>Los c&aacute;lculos de los costos en este algoritmo de b&uacute;squeda se basan en el costo de un camino primitivo en el plano bidimensional de b&uacute;squeda. El costo de un camino primitivo se define como la similitud entre intervalos delimitados por bordes en ambas im&aacute;genes. Si <i>a<sub>1</sub>... a<sub>k</sub></i> y <i>b<sub>1</sub>... b<sub>l</sub></i> son los valores de la intensidad de los p&iacute;xeles contenidos en los dos intervalos, entonces la media y la varianza de todos los p&iacute;xeles en los dos intervalos se calcula como:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e7.jpg"></p>      <p>En esta definici&oacute;n los dos intervalos contribuyen por igual al valor de la media y la varianza aunque sus longitudes sean diferentes. El costo de un camino primitivo que determina correspondencia entre estos dos intervalos se define como:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e8.jpg"></p>      <p>De manera intuitiva, el significado de esta definici&oacute;n puede expresarse de la siguiente manera. Se asumen que los p&iacute;xeles en los dos intervalos vienen de una superficie homog&eacute;nea en el espacio tridimensional y que, por lo tanto, deben tener intensidades similares, es decir, su varianza debe ser peque&ntilde;a. Para que el algoritmo de b&uacute;squeda por l&iacute;nea encuentre correspondencias v&aacute;lidas, las escenas deben ser mon&oacute;tonas (Otha y Kanade, 1985; Seitz y Dyer, 1995), es decir, todos los puntos correspondientes aparecen en el mismo orden a lo largo de las l&iacute;neas epipolares conjugadas de las im&aacute;genes.</p>      <p>1.4.4 Interpolaci&oacute;n</p>      <p>Debido al proceso de rectificaci&oacute;n hecho en las im&aacute;genes, el problema de dos vistas de una escena se reduce a las condiciones mostradas en la <a href="#fig9">Figura 9</a>a. Por conveniencia se supone que la c&aacute;mara es movida desde el origen del mundo hacia la posici&oacute;n (<i>c<sub>x</sub>, c<sub>y</sub></i>, 0) y la distancia focal cambia de <i>f<sub>0</sub></i> a <i>f<sub>1</sub></i>. Por lo que las MPP para las im&aacute;genes izquierda (<i>P<sub>0</sub></i>) y derecha (<i>P<sub>1</sub></i>) son de la forma:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e9.jpg"></p>      ]]></body>
<body><![CDATA[<p>Sean <i>m<sub>0</sub></i> &#8712; <i>I<sub>0</sub></i> y <i>m<sub>1</sub></i> &#8712; <i>I<sub>1</sub></i> proyecciones del mismo punto tridimensional <i>w</i> = &#91;<i>X Y Z 1</i>&#93;<sup>T</sup>. Al desarrollar una interpolaci&oacute;n lineal de los p&iacute;xeles <i>m<sub>0</sub></i>, <i>m<sub>1</sub></i>, tenemos que:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e10.jpg"></p>      <p>Donde:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e11.jpg"></p>      <p>Por lo que la interpolaci&oacute;n de las im&aacute;genes produce una nueva vista f&iacute;sicamente v&aacute;lida con matriz de proyecci&oacute;n <i>P<sub>s</sub></i>, producto de la interpolaci&oacute;n lineal de <i>P<sub>0</sub></i> y <i>P<sub>1</sub></i>. Esta nueva vista tiene una distancia focal <i>f<sub>s</sub></i> y centro &oacute;ptico cs determinados por:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e12.jpg"></p>      <p>Como se observa de (12), la imagen interpolada est&aacute; definida por un par&aacute;metro de interpolaci&oacute;n s, el cual determina la ubicaci&oacute;n del centro &oacute;ptico y la distancia focal de la c&aacute;mara virtual generada por la interpolaci&oacute;n. Para interpolar un segmento correspondiente, en principio, se interpolan linealmente las posiciones de los bordes. Luego se usa una estrategia para encontrar el color del segmento interpolado, igualando las longitudes de los dos segmentos originales a la longitud del mayor. Ya con los segmentos de igual longitud se realiza una interpolaci&oacute;n lineal del color, p&iacute;xel a p&iacute;xel. Una vez obtenido el color del segmento, es necesario ajustar su longitud a la longitud calculada a partir de la interpolaci&oacute;n de los bordes que definen sus extremos. Con el procedimiento para cada segmento correspondiente se genera la l&iacute;nea epipolar interpolada (<a href="#fig9">Figura 9</a>b).</p>      <p>    <center><a name="fig9"><img src="img/revistas/inun/v13n2/v13n2a04f9.jpg"></center></p>      <p>1.4.5 Derrectificaci&oacute;n</p>      ]]></body>
<body><![CDATA[<p>Una vez se han interpolado las im&aacute;genes rectificadas, se desea llevar las im&aacute;genes obtenidas a un plano que simule un movimiento natural de la c&aacute;mara virtual, a la vez simuladas por el algoritmo a lo largo de una l&iacute;nea recta. Esto se logra aplicando a cada una de las im&aacute;genes interpoladas una transformaci&oacute;n lineal para llevar la imagen del plano rectificado a la posici&oacute;n del plano imagen deseado. El c&aacute;lculo de dicha transformaci&oacute;n se presenta en (C&oacute;rdoba <i>et al</i>., 2002). La trayectoria descrita por la c&aacute;mara virtual se muestra en la <a href="#fig10">Figura 10</a>, y esta se consigue a trav&eacute;s de la interpolaci&oacute;n de los par&aacute;metros intr&iacute;nsecos de las MPP derecha e izquierda y redefiniendo la orientaci&oacute;n del plano imagen para cada posici&oacute;n de la c&aacute;mara virtual.</p>      <p>    <center><a name="fig10"><img src="img/revistas/inun/v13n2/v13n2a04f10.jpg"></center></p>      <p>La orientaci&oacute;n del plano imagen se obtiene de la interpolaci&oacute;n de las orientaciones de los planos im&aacute;genes originales respecto al plano rectificado. Para este proceso se obtienen los &aacute;ngulos que determinan las rotaciones aplicadas en el proceso de rectificaci&oacute;n a cada uno de los planos imagen, para ser llevados al plano rectificado. Una vez conocidos estos &aacute;ngulos, se determina la rotaci&oacute;n del plano imagen interpolado, para llevarlo al plano imagen deseado. El &aacute;ngulo de rotaci&oacute;n (&theta;s) sobre el eje Y de la imagen sintetizada se obtiene interpolando los &aacute;ngulos en que se rotaron los planos im&aacute;genes originales sobre el eje Y, para ser rectificados (&theta;1,&theta;2), mediante la siguiente relaci&oacute;n:</p>      <p><img src="img/revistas/inun/v13n2/v13n2a04e13.jpg"></p>      <p>Entre tanto, para las rotaciones sobre los ejes X y Z se realiza una interpolaci&oacute;n lineal de los &aacute;ngulos en que se rotaron los planos im&aacute;genes originales sobre dichos ejes, para ser rectificados.</p>      <p><font size="3"><b>2. Resultados</b></font></p>      <p><i>2.1 Calibraci&oacute;n</i></p>      <p>Se trabaj&oacute; con una sola c&aacute;mara digital Sony MVC-FD83, calibrada en dos diferentes posiciones. Las im&aacute;genes tomadas por la c&aacute;mara en dichas posiciones se toman como vistas base. La calibraci&oacute;n se llev&oacute; a cabo usando una plantilla de calibraci&oacute;n que posee un alto n&uacute;mero de puntos f&aacute;cilmente localizables en la imagen. En la <a href="#fig11">Figura 11</a> se puede observar que el procedimiento comienza con la extracci&oacute;n de la proyecci&oacute;n de los puntos tridimensionales, discriminando por color de las circunferencias de la plantilla en la imagen, con lo que se genera una imagen binaria a la cual se le extraen los contornos formados por la proyecci&oacute;n de las esferas.</p>      <p>    ]]></body>
<body><![CDATA[<center><a name="fig11"><img src="img/revistas/inun/v13n2/v13n2a04f11.jpg"></center></p>      <p>Ya con los contornos establecidos, se calcula el centro de cada contorno que define la proyecci&oacute;n del punto tridimensional conocido en la imagen. Para validar la calibraci&oacute;n se encontr&oacute; el error cuadr&aacute;tico medio de la proyecci&oacute;n en p&iacute;xeles, de los puntos 3D conocidos; estos se agruparon en puntos de prueba y puntos de calibraci&oacute;n de forma aleatoria, a fin de observar el comportamiento del error de proyecci&oacute;n de los puntos de calibraci&oacute;n y de los puntos de prueba a medida que se toman m&aacute;s puntos para calibrar las c&aacute;maras, con una poblaci&oacute;n de prueba del 20% y de calibraci&oacute;n del 80%, sobre el total de puntos en la plantilla de calibraci&oacute;n. Los resultados se observan en la <a href="#fig12">Figura 12</a>, en la cual se puede observar que la calibraci&oacute;n modela adecuadamente el espacio donde se encuentran los puntos 3D conocidos, dado que el comportamiento de los errores es asint&oacute;tico, tendiendo estos a un error de aproximadamente tres p&iacute;xeles.</p>      <p>    <center><a name="fig12"><img src="img/revistas/inun/v13n2/v13n2a04f12.jpg"></center></p>      <p><i>2.2 Rectificaci&oacute;n</i></p>      <p>Al realizar la transformaci&oacute;n, la imagen rectificada result&oacute; ser m&aacute;s grande que la original, por lo que se proyect&oacute; un p&iacute;xel de la imagen original en varios p&iacute;xeles en el plano rectificado. Por otra parte, las coordenadas de los p&iacute;xeles de las im&aacute;genes rectificadas no estaban sujetas a proyectarse en una regi&oacute;n espec&iacute;fica de la imagen; por lo tanto, se traslad&oacute; cada imagen rectificada para visualizar los resultados.</p>      <p>Despu&eacute;s de este proceso, y ante la imposibilidad de cuantificar el error del proceso de forma autom&aacute;tica, se decidi&oacute; hacer una inspecci&oacute;n manual de las im&aacute;genes para comprobar si efectivamente las l&iacute;neas epipolares en las im&aacute;genes rectificadas eran paralelas y coincidentes. En la <a href="#fig13">Figura 13</a> se ilustran algunos resultados de esta verificaci&oacute;n, donde se observa c&oacute;mo efectivamente las im&aacute;genes rectificadas son adecuadas para el resto del proceso de s&iacute;ntesis.</p>      <p>    <center><a name="fig13"><img src="img/revistas/inun/v13n2/v13n2a04f13.jpg"></center></p>      <p><i>2.3 Correspondencia e interpolaci&oacute;n</i></p>      ]]></body>
<body><![CDATA[<p>Para hacer el algoritmo m&aacute;s eficiente es necesario extraer el menor n&uacute;mero de bordes posible con m&iacute;nima p&eacute;rdida de informaci&oacute;n, por lo que se desarroll&oacute; el algoritmo de forma param&eacute;trica, de manera que se pudieran manipular ciertos par&aacute;metros propios del proceso de extracci&oacute;n de bordes, para ajustar el proceso a las caracter&iacute;sticas propias de cada uno de los objetos, como el tama&ntilde;o de las regiones o superficies y las texturas propias de las superficies. Esta manipulaci&oacute;n permite obtener resultados adecuados del proceso de extracci&oacute;n de bordes para diferentes objetos. Este proceso se ilustra en la <a href="#fig14">Figura 14</a>.</p>      <p>    <center><a name="fig14"><img src="img/revistas/inun/v13n2/v13n2a04f14.jpg"></center></p>      <p>Para observar un buen resultado en el proceso de interpolaci&oacute;n es necesario que se encuentren las correspondencias de los bordes relevantes, puesto que correspondencias err&oacute;neas producen distorsiones notorias en las im&aacute;genes interpoladas. En la <a href="#fig15">Figura 15</a> se ilustra c&oacute;mo al perderse algunas caracter&iacute;sticas relevantes del objeto durante el proceso de extracci&oacute;n de bordes el proceso de correspondencia es equivocado (parte a) y, por consiguiente, la imagen finalmente sintetizada no corresponde a una vista f&iacute;sicamente v&aacute;lida (parte b).</p>      <p>    <center><a name="fig15"><img src="img/revistas/inun/v13n2/v13n2a04f15.jpg"></center></p>      <p>Cuando se interpola con todas las correspondencias de los bordes relevantes, se obtienen resultados satisfactorios que simulan un movimiento de la c&aacute;mara virtual rectificada sobre la l&iacute;nea base, sin cambiar su orientaci&oacute;n. Las im&aacute;genes sintetizadas conservan las texturas en las superficies del objeto sin introducir distorsi&oacute;n aparente de forma. Un ejemplo de esta clase de resultados se ilustra para dos escenas simples en la <a href="#fig16">Figura 16</a>.</p>      <p>    <center><a name="fig16"><img src="img/revistas/inun/v13n2/v13n2a04f16.jpg"></center></p>      <p>Aunque se tenga la correspondencia total entre bordes relevantes de la escena, no es posible sintetizar las texturas de las vistas originales en las im&aacute;genes sintetizadas de cualquier objeto, dado que la correspondencia p&iacute;xel a p&iacute;xel encontrada por el algoritmo de interpolaci&oacute;n solamente es v&aacute;lida cuando la superficie o regi&oacute;n delimitada por los bordes correspondientes es plana, como se muestra en <a href="#fig17">Figura 17</a>.</p>      ]]></body>
<body><![CDATA[<p>    <center><a name="fig17"><img src="img/revistas/inun/v13n2/v13n2a04f17.jpg"></center></p>      <p>Sin embargo, cuando los brillos presentes en la imagen son parecidos y se puede establecer alg&uacute;n tipo de correspondencia entre ellos, aunque no est&eacute;n modelados dentro del algoritmo, estos ayudan a conservar las texturas de los objetos con superficies curvas en las im&aacute;genes sintetizadas, puesto que dividen las zonas del objeto en regiones planas de menor longitud. Aunque estos brillos mejoran la apariencia de las im&aacute;genes sintetizadas cuando hay objetos con superficies curvas, estas im&aacute;genes no pueden ser consideradas f&iacute;sicamente v&aacute;lidas, pues un par de brillos parecidos no necesariamente son producidos por la misma fuente de luz.</p>      <p>El efecto que se presenta cuando no se puede establecer correspondencia entre los brillos presentes en la imagen es la mezcla de las texturas de la superficie o regi&oacute;n, incluido el brillo, como se observa en la <a href="#fig18">Figura 18</a>.</p>      <p>    <center><a name="fig18"><img src="img/revistas/inun/v13n2/v13n2a04f18.jpg"></center></p>      <p><i>2.3 Derrectificaci&oacute;n</i></p>      <p>El m&eacute;todo utilizado para definir el plano al que se desea derrectificar la imagen permite sintetizar im&aacute;genes que simulan un movimiento natural de la c&aacute;mara virtual en l&iacute;nea recta, muy parecido al movimiento de la c&aacute;mara real, como se observa en la <a href="#fig19">Figura 19</a>. En cuanto a la evaluaci&oacute;n de manera cuantitativa de la validez f&iacute;sica de las im&aacute;genes sintetizadas, fue imposible comparar las im&aacute;genes sintetizadas con im&aacute;genes reales tomadas por la c&aacute;mara, porque el montaje f&iacute;sico impidi&oacute; reproducir con la exactitud requerida la trayectoria de la c&aacute;mara virtual en el mundo real.</p>      <p>    <center><a name="fig19"><img src="img/revistas/inun/v13n2/v13n2a04f19.jpg"></center></p>      ]]></body>
<body><![CDATA[<p><i>2.4 Evaluaci&oacute;n general del algoritmo en rostros</i></p>      <p>Un prop&oacute;sito planteado desde el principio de la investigaci&oacute;n era evaluar las posibilidades de usar este algoritmo para corregir los problemas de postura presentes en la s&iacute;ntesis de voz visual (Mu&ntilde;oz <i>et al</i>., 2003), por lo que el algoritmo se evalu&oacute; con rostros. Los resultados obtenidos fueron, en general, desfavorables, pues las im&aacute;genes sintetizadas se caracterizaban por distorsiones significativas, debido al gran n&uacute;mero de correspondencias inv&aacute;lidas, producto de un espacio de b&uacute;squeda que no cumple con las especificaciones del sistema, porque el camino &oacute;ptimo encontrado no tiene un significado f&iacute;sicamente v&aacute;lido y porque las oclusiones presentes en la im&aacute;genes son considerables.</p>      <p>Un ejemplo de este tipo de resultados se presenta en la <a href="#fig20">Figura 20</a>b, donde se muestran las distorsiones presentes en la imagen sintetizada en regiones como: las cejas, la patilla, la nariz, las orejas y la papada. Las regiones ocluidas que producen estas distorsiones se ilustran discriminadas por color en las <a href="#fig20">figuras 20</a>a y <a href="#fig20">20</a>b. De forma adicional se observa c&oacute;mo, cuando los rostros presentan oclusiones m&aacute;s dr&aacute;sticas, se observan distorsiones mucho m&aacute;s significativas.</p>      <p>    <center><a name="fig20"><img src="img/revistas/inun/v13n2/v13n2a04f20.jpg"></center></p>      <p>Para tratar de evaluar el algoritmo con im&aacute;genes de rostros que se acercaran m&aacute;s a las especificaciones del algoritmo, se trataron de disminuir las oclusiones presentes en las im&aacute;genes reales. Un ejemplo de este tipo de evaluaci&oacute;n se ilustra en la <a href="#fig21">Figura 21</a>, donde para el rostro "Paola" se utiliz&oacute; el cabello para ocultar las orejas, para disminuir el n&uacute;mero de oclusiones presentes en las im&aacute;genes reales, con lo que se obtuvieron resultados adecuados en la gran mayor&iacute;a de superficies; sin embargo, en algunas aparecieron deformidades como las ilustradas en la <a href="#fig21">Figura 21</a>d.</p>      <p>    <center><a name="fig21"><img src="img/revistas/inun/v13n2/v13n2a04f21.jpg"></center></p>      <p>El problema de distorsi&oacute;n de la nariz observado en la <a href="#fig21">Figura 21</a>d, que consiste en un ensanchamiento falso en la parte superior, no obedece a una oclusi&oacute;n, porque las superficies son visibles en ambas im&aacute;genes, sino que es producto de las falsas correspondencias encontradas por el algoritmo, producidas por la uniformidad de textura de la piel. Cuando las superficies tienen una textura uniforme, como las superficies de los costados de la nariz y las superficies de los p&oacute;mulos, el algoritmo de correspondencias pasa por alto los bordes que delimitan el cambio de una superficie a otra; en este caso el cambio de superficie entre la nariz y el p&oacute;mulo.</p>      <p><font size="3"><b>3. Conclusiones</b></font></p>      ]]></body>
<body><![CDATA[<p>La MPP encontrada por el proceso de calibraci&oacute;n modela la relaci&oacute;n existente entre el espacio tridimensional y el bidimensional, involucrada en la obtenci&oacute;n de im&aacute;genes, por lo que se puede manipular con resultados positivos la informaci&oacute;n codificada dentro de la matriz para las dem&aacute;s etapas del sistema. El algoritmo implementado obtiene vistas sin distorsi&oacute;n aparente, de una escena a partir de dos vistas de esta, bajo la condici&oacute;n de que las vistas base se rectifiquen antes de realizar la interpolaci&oacute;n y exista iluminaci&oacute;n controlada, escenas mon&oacute;tonas y con texturas planas; sin embargo, no es posible evaluar de manera cuantitativa la validez f&iacute;sica de las im&aacute;genes sintetizadas, debido a que la precisi&oacute;n de las medidas del montaje f&iacute;sico es insuficiente para reproducir con exactitud la trayectoria de la c&aacute;mara virtual en el mundo f&iacute;sico, lo que impide obtener im&aacute;genes v&aacute;lidas que puedan ser comparadas con las im&aacute;genes sintetizadas por el algoritmo a trav&eacute;s de un error con una m&eacute;trica asociada.</p>      <p>Adicionalmente, a medida que aumenta el &aacute;ngulo entre las vistas base, el algoritmo se ve afectado en mayor medida por oclusiones, brillos y superficies no planas, presentes en los objetos. Es necesario hacer mejoras significativas al algoritmo para ser aplicado en s&iacute;ntesis de im&aacute;genes complejas, como el problema de correcci&oacute;n de postura en rostros en voz visual.</p>      <p><font size="3"><b>4. Recomendaciones</b></font></p>      <p>Como la posici&oacute;n de la c&aacute;mara no debe variar del proceso de calibraci&oacute;n al proceso de obtenci&oacute;n de vistas, se podr&iacute;a calibrar la c&aacute;mara con la informaci&oacute;n presente en la escena, asegurando que las MPP modelen con exactitud el espacio capturado por las vistas adquiridas y, as&iacute;, den mayor flexibilidad al sistema. Para que el algoritmo permita sintetizar im&aacute;genes en un &aacute;ngulo de visi&oacute;n m&aacute;s amplio, que justifique su utilizaci&oacute;n en el an&aacute;lisis de escenas complejas, es necesario modelar dentro del algoritmo oclusiones, brillos y superficies curvas. Para modelar cualquier tipo de superficie, y as&iacute; conservar las texturas, se propone generar una correspondencia p&iacute;xel a p&iacute;xel. A fin de interpolar las im&aacute;genes cuando presentan oclusiones, es preciso contar con informaci&oacute;n adicional que permita modelar las superficies del objeto que est&eacute;n ocluidas. Una posible manera para obtener esta informaci&oacute;n, ser&iacute;a tomar una tercera vista base.</p>      <p><font size="3"><b>Agradecimientos</b></font></p>      <p>Al ingeniero Carlos Alberto Parra Rodr&iacute;guez, por las discusiones sostenidas durante el curso de esta investigaci&oacute;n, las cuales fueron de gran importancia en su desarrollo. Al Departamento de Ingenier&iacute;a Electr&oacute;nica de la Pontificia Universidad Javeriana, que otorg&oacute; los recursos necesarios para este proyecto de investigaci&oacute;n. A los ingenieros Diana Paola Garc&iacute;a y Andr&eacute;s C&oacute;rdoba, sin los cuales no hubiera sido posible realizar el proyecto de investigaci&oacute;n.</p>  <hr>      <p><font size="3"><b>Referencias</b></font></p>      <!-- ref --><p>BEIER, T. y NEELY, S. Feature-based image metamorphosis. <i>ACM SIGGRAPH'92 Computer Graphics</i>, 1992, vol. 26, n&uacute;m. 2, pp. 35-42.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000160&pid=S0123-2126200900020000400001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>CHEN, S. C. y WILLIAMS, L. <i>International Conference on Computer Graphics and Interactive Techniques: Proceedings of the 23rd annual conference on Computer graphics and interactive techniques</i>. New York: View Interpolation for Image Synthesis, 1993, pp. 279-288.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000161&pid=S0123-2126200900020000400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>C&Oacute;RDOBA, A.; FAJARDO A. y GARC&Iacute;A D. <i>S&iacute;ntesis de im&aacute;genes a partir de vistas de una escena</i>. Bogot&aacute;: Pontificia Universidad Javeriana, 2002.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000162&pid=S0123-2126200900020000400003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>FUSIELLO, A.; TRUCCO, E. y VERRI, A. A compact algorithm for rectification of stereo pairs. <i>Machine Vision and Applications</i>, 1999, vol. 12, n&uacute;m. 1, pp. 16-22.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000163&pid=S0123-2126200900020000400004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>GONZ&Aacute;LEZ, J. <i>Visi&oacute;n por computador</i>. Madrid: Paraninfo, 2000.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000164&pid=S0123-2126200900020000400005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>INAMOTO, N. y SAITO, H. Virtual viewpoint replay for a soccer match by view interpolation from multiple cameras. <i>IEEE Transactions on Multimedia</i>, 2007, vol. 9, n&uacute;m. 6, pp. 1155-1166.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000165&pid=S0123-2126200900020000400006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>KUBOTA, A.; KODAMA, K. y HATORI, Y. Deconvolution method for view interpolation using multiple images of circular camera array. <i>IEEE International Conference on Image Processing</i>, 2006, pp. 1049-1052.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000166&pid=S0123-2126200900020000400007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>MU&Ntilde;OZ, M.; SOTO, C. y VIZCAYA P. Avances en s&iacute;ntesis de voz visual y sus aplicaciones. <i>VIII Simposio de Tratamiento de Se&ntilde;ales, Im&aacute;genes y Visi&oacute;n Artificial</i>, Medell&iacute;n, Colombia, 2003.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000167&pid=S0123-2126200900020000400008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>NALWA, V. <i>A guided tour of computer vision</i>. New York: Addison-Wesley, 1993.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000168&pid=S0123-2126200900020000400009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>OTHA, Y. y KANADE, T. Stereo by intra and Inter-scanline search using dynamic programming. <i>IEEE Trans. on Pattern Analysis and Machine Intelligence</i>, 1985, vol. 7, n&uacute;m 2, pp. 139-154.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000169&pid=S0123-2126200900020000400010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>SEITZ, S. y DYER, C. Physically-valid view synthesis by image interpolation. En: <i>International Conference on Computer Graphics and Interactive Techniques: Proceedings of the 23rd annual conference on Computer graphics and interactive techniques</i>. New York, 1995, pp. 18-25.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000170&pid=S0123-2126200900020000400011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>&mdash;. View morphing: Synthetizing 3D metamorphoses using image transforms. <i>IEEE Transactions and Computer Graphics (SIGGRAPH'96)</i>, vol. 11, n&uacute;m. 1, 1996, pp. 21-30.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000171&pid=S0123-2126200900020000400012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>ZH ENG, X. y WU, E. Efficient 3D image warping for composing novel views. <i>Proceedings of Computer Graphics International</i>, 2001, pp. 123-130.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000172&pid=S0123-2126200900020000400013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[BEIER]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[NEELY]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Feature-based image metamorphosis]]></article-title>
<source><![CDATA[ACM SIGGRAPH'92 Computer Graphics]]></source>
<year>1992</year>
<volume>26</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>35-42</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CHEN]]></surname>
<given-names><![CDATA[S. C.]]></given-names>
</name>
<name>
<surname><![CDATA[WILLIAMS]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<source><![CDATA[International Conference on Computer Graphics and Interactive Techniques: Proceedings of the 23rd annual conference on Computer graphics and interactive techniques]]></source>
<year>1993</year>
<page-range>279-288</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[CÓRDOBA]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[FAJARDO]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[GARCÍA]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Síntesis de imágenes a partir de vistas de una escena]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Bogotá ]]></publisher-loc>
<publisher-name><![CDATA[Pontificia Universidad Javeriana]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[FUSIELLO]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[TRUCCO]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[VERRI]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A compact algorithm for rectification of stereo pairs]]></article-title>
<source><![CDATA[Machine Vision and Applications]]></source>
<year>1999</year>
<volume>12</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>16-22</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[GONZÁLEZ]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Visión por computador]]></source>
<year>2000</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Paraninfo]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[INAMOTO]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[SAITO]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Virtual viewpoint replay for a soccer match by view interpolation from multiple cameras]]></article-title>
<source><![CDATA[IEEE Transactions on Multimedia]]></source>
<year>2007</year>
<volume>9</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>1155-1166</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[KUBOTA]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[KODAMA]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[HATORI]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Deconvolution method for view interpolation using multiple images of circular camera array]]></article-title>
<source><![CDATA[IEEE International Conference on Image Processing]]></source>
<year>2006</year>
<page-range>1049-1052</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MUÑOZ]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[SOTO]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[VIZCAYA]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Avances en síntesis de voz visual y sus aplicaciones]]></source>
<year></year>
<conf-name><![CDATA[ VIII Simposio de Tratamiento de Señales, Imágenes y Visión Artificial]]></conf-name>
<conf-date>2003</conf-date>
<conf-loc>Medellín </conf-loc>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[NALWA]]></surname>
<given-names><![CDATA[V.]]></given-names>
</name>
</person-group>
<source><![CDATA[A guided tour of computer vision]]></source>
<year>1993</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Addison-Wesley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[OTHA]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[KANADE]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Stereo by intra and Inter-scanline search using dynamic programming]]></article-title>
<source><![CDATA[IEEE Trans. on Pattern Analysis and Machine Intelligence]]></source>
<year>1985</year>
<volume>7</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>139-154</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SEITZ]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[DYER]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Physically-valid view synthesis by image interpolation]]></article-title>
<source><![CDATA[International Conference on Computer Graphics and Interactive Techniques: Proceedings of the 23rd annual conference on Computer graphics and interactive techniques]]></source>
<year>1995</year>
<page-range>18-25</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[SEITZ]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[View morphing: Synthetizing 3D metamorphoses using image transforms]]></article-title>
<source><![CDATA[IEEE Transactions and Computer Graphics (SIGGRAPH'96)]]></source>
<year>1996</year>
<volume>11</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>21-30</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[ZH]]></surname>
<given-names><![CDATA[ENG, X.]]></given-names>
</name>
<name>
<surname><![CDATA[WU]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Efficient 3D image warping for composing novel views]]></article-title>
<source><![CDATA[Proceedings of Computer Graphics International]]></source>
<year>2001</year>
<page-range>123-130</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
