SciELO - Scientific Electronic Library Online

 
vol.59 issue1EVALUATION OF ALTERNATIVES FOR AIR CONDITIONING OF PONDS WITH SOLAR ENERGY FOR CULTIVATION OF RED TILAPIA (Oreochromis sp), LOCATED IN THE COLD AREA OF THE CAUCA VALLEY, COLOMBIAUREDINALES OF CULTIVATED FLOWERS IN COLOMBIA author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Facultad Nacional de Agronomía Medellín

Print version ISSN 0304-2847

Rev. Fac. Nac. Agron. Medellín vol.59 no.1 Medellín Jan./June 2006

 

SEGMENTACIÓN DE FRUTOS DE CAFÉ MEDIANTE MÉTODOS DE CRECIMIENTO DE REGIONES

SEGMENTATION OF COFFEE BEANS BY MEANS OF SEEDED REGION GROWING TECHNIQUES

 

Julián Andrés Betancur Acevedo1; Flavio Augusto Prieto Ortiz2 y Gustavo Adolfo Osorio Londoño3

 

1 Profesor Asociado. Universidad Nacional de Colombia, Sede Manizales. Facultad de Ingeniería y Arquitectura. A.A. 127. Manizales, Colombia. <julianbetancur@gmail.com>
2 Profesor Asociado. Universidad Nacional de Colombia, Sede Manizales. Facultad de Ingeniería y Arquitectura. A.A. 127. Manizales, Colombia. <faprietoo@unal.edu.co>
3 Profesor Asistente. Universidad Nacional de Colombia, Sede Manizales. Facultad de Ingeniería y Arquitectura. A.A. 127. Manizales, Colombia. <gaosoriol@unal.edu.co>

 

Recibido: Julio 18 de 2005; aceptado: Noviembre 2 de 2005.


RESUMEN

Se presentan tres diferentes sistemas de segmentación los cuales utilizan la técnica de crecimiento de regiones a partir de semillas SRG (Seeded Region Growing). El primero de ellos, llamado Sistema Euclídeo, hace uso de la distancia euclídea con el fin de encontrar la región de interés (grano de café). El Sistema ACB-PCB utiliza dos medidas de discontinuidad llamadas contraste promedio y contraste periférico, las cuales se derivan del promedio de las componentes de color de los pıxeles que conforman la región y aquellos que conforman dos de sus contornos. Luego de un proceso iterativo, se halla el contorno de contraste promedio ACB y el contorno de contraste periférico PCB, que se usan para segmentar el grano de café. Por último, el Sistema Híbrido utiliza la información de las principales componentes geométricas presentes en la escena (dadas por un Detector de Bordes de Color), y la medida de contraste promedio. Las herramientas de segmentación fueron aplicadas a imágenes de frutos de café, adquiridas bajo condiciones controladas. Los resultados obtenidos muestran un buen desempeño del detector de bordes de color implementado, así como de los sistemas de segmentación, en especial de los sistemas ACB-PCB e Híbrido.

Palabras claves: Procesamiento de imágenes, segmentación, crecimiento de regiones, Técnica SRG (Seeded Region Growing).


ABSTRACT

Three segmentation systems are presented which use the Seeded Region Growing Technique SRG. The first one, called the Euclidean System, uses a Euclidean distance measure in order to find the region of interest (coffee bean). The ACB-PCB System uses two discontinuity measures called average contrast and peripheral contrast, which are derived from the mean of the color components of the pixels that form the region and those that form two of its boundaries. Following an iterative process, the Average Contrast Boundary ACB and the Peripheral Contrast Boundary PCB are computed for use in performing the coffee bean segmentation. Finally, the Hybrid System uses both information from the principal geometrical components in the scene (provided by a Color Edge Detector) and the average contrast measure. These segmentation tools were applied to coffee images acquired under controlled conditions. Results showed a good performance of the Color Edge Detector, as well as the ACB-PCB and Hybrid systems.

Key words:  Image processing, image segmentation, Seeded Region Growing SRG.


ANTECEDENTES
RESULTADOS
CONCLUSIONES
BIBLIOGRAFÍA


 

La cosecha mecanizada de frutos de café es poco selectiva respecto del grado de maduración del fruto, por lo cual, en procesos de postcosechado tal como el beneficio, se tiene una gran cantidad de estos en diferentes etapas. Por esta razón se hace necesaria una etapa de clasificación, dado que la calidad del café producido está íntimamente relacionada con la etapa de maduración en que se encuentre el fruto. Para ello se utilizan técnicas de visión artificial, debido a que las características visuales tales como el color y la forma son discriminantes. En la clasificación de frutos de café mediante técnicas de visión artificial, la segmentación es parte fundamental y crítica (Maya 2001). Existen, esencialmente, cuatro métodos de segmentación automática: técnicas de Umbralización, técnicas basadas en Contornos, técnicas basadas en Regiones y técnicas Híbridas (Jianping et al. 2001). En este trabajo se presentan dos métodos diferentes basados en la técnica SRG (Seeded Region Growing: Crecimiento de Regiones a partir de Semillas). Cada uno de los sistemas implementados (Sección 3, Sección 4 y Sección 5), requiere de la posición de los pıxeles semilla. Para este caso, la ubicación de los pıxeles semilla en la imagen es dada por el usuario; por esta razón, los sistemas mostrados aquí son de segmentación asistida. Sin embargo, dicha posición puede ser hallada calculando los centroides de las regiones etiquetadas mediante la técnica SCT/Center (Umbaugh 1998, Montes 2001).

Todos los sistemas implementados utilizan el vecindario de segundo orden mostrado en Jianping et al. 2001, para determinar cualquier tipo de medición o análisis de conectividad. El primer sistema implementado, centra su criterio de adición de pixeles en la distancia euclídea (Palus y Bereska 1999). Esta distancia se mide en los espacios de color RGB, Y UV o Y IQ, por lo cual el criterio de segmentación se aplica para la escena cuya imagen digital ha sido transformada hacia alguno de dichos espacios de color (Palus y Bereska 1999).

El segundo sistema, el ACB-PCB (Hijjatoleslami y Kittler 1998), realiza un proceso iterativo de adición de pixeles. En cada iteración, se agrega un nuevo pixel a la región en crecimiento y se calculan dos medidas de discontinuidad: contraste promedio y contraste periférico. Luego de iterar lo suficiente, tal que la región al final del proceso iterativo contenga la región que se desea segmentar, se realiza un análisis de las medidas tomadas durante el proceso, y se procede a hallar la región final.

En el Sistema Híbrido, el último de ellos, se implementó un Detector de Bordes de Color (Jianping et al. 2001), el cual suministra información sobre las principales componentes geométricas presentes en la imagen. Al igual que en el sistema anterior, el proceso es iterativo, aunque solo se utiliza la medida de contraste promedio para llevar a cabo la segmentación.

 

ANTECEDENTES

Son diversas las áreas en las que se ha obtenido una aplicación satisfactoria de sistemas de Visión Artificial, entre las que se encuentran la medicina, industria, seguridad, robótica o la agricultura. El área agrícola debe ser de especial interés para Colombia, dada la amplia gama de productos que este país ofrece, a nivel nacional e internacional. La competitividad de estos productos en los mercados internacionales, dependería en gran medida de la innovación y aplicación de nuevos métodos en los diferentes procesos que conlleva su producción, que puedan incidir positivamente en su costo, calidad, selectividad, entre otros.

Visión Artificial y Agricultura. La creciente demanda de productos de alta calidad, ha promovido el uso de los computadores y la electrónica en los procesos agrícolas. Estos pueden ser aplicados para hacer tareas como inspección de calidad, clasificación y procesos automáticos. Los sistemas de Visión Artificial han sido ampliamente usados para llevar a cabo dichas tareas (Brosnan y Sun 2002). Este creciente uso de la visión computacional en la industria agrícola, es debida a ventajas como economía, consistencia, objetividad (Brosnan y Sun 2002), y la capacidad de proveer valores numéricos a atributos como tamaño, forma, color y textura (Chen, Chao y Kim 2002). Otro beneficio importante de la Visión Artificial es su naturaleza no destructiva. Sin embargo, a pesar de estas ventajas, surgen algunos problemas. Los resultados del sistema dependen de la calidad de las imágenes adquiridas. Adicionalmente, aunque se pregone la consistencia de los resultados, en muchas aplicaciones la capacidad humana continúa siendo mejor (Studman 2001).

Algunos investigadores, han hecho desarrollos en los campos de inspección de calidad y clasificación de manzanas, naranjas, fresas, nueces, tomates, duraznos, peras, papas, trigo, maíz, arroz y otros productos. Una revisión de estos trabajos se muestra en Brosnan y Sun 2002. En Yang 1994, se propone un algoritmo para detectar defectos en manzanas. En Nakano 1997, se discute un método para la clasificación de manzanas en categorías de calidad. En Leemans, Magein y Destain 1998, se desarrolló un algoritmo capaz de detectar un amplio rango de defectos en las manzanas de tipo “Golden Delicious”. Posteriormente, usaron un clasificador bayesiano para detectar los defectos en las manzanas “Jonagold” (Leemans, Magein y Destain 1999). En Aleixos et al. 2002, son clasificadas naranjas, mandarinas y limones, para medir su tamaño y detectar defectos. Un trabajo de clasificación de hongos fue desarrollado en Vízhányó y Felfóldi 2000. Por último, en Marchant, Oyango y Street 1990, se implementa un sistema de visión computacional para ponderar las papas en categorías de tamaño y forma.

La inspección y clasificación de productos agrícolas es de gran importancia. Colombia es bien conocida alrededor del mundo, por la calidad de su café, la cual depende en gran medida de la naturaleza selectiva del proceso de recolección manual. Una desventaja de este método de cosechado es su alto costo.

Segmentación de imágenes digitales. Diversos sistemas de segmentación automática o asistida de imágenes digitales, han sido presentados en la literatura. En general, cada sistema es propuesto para un tipo determinado de imagen, ya sean médicas, industriales, agrícolas, de exteriores, etc., dado que este responde a la solución específica de un problema. Dado que no hay una metodología que pueda ser aplicada a cualquier tipo de escena, los métodos propuestos en la literatura son muy variados. No obstante, estos pueden ser agrupados, a groso modo, en cuatro clases (Skarbek y Koschan 1994, González y Woods 1996, Jianping et al. 2001, Betancur 2002).

Técnicas de umbralización. Utilizan generalmente la información del histograma. Su resultado es satisfactorio si los objetos presentan un alto contraste respecto del fondo, y si no hay objetos juntos u oclusos.

Métodos basados en contornos. Utiliza la hipótesis que los valores de los pıxeles cambian rápidamente en el contorno entre dos regiones (Palmer, Dabis y Kittler 1996). En general, se soportan en la información de bordes y/o en el ajuste de formas para encontrar el objeto, tal como las técnicas que usan la Transformada de Hough o Contornos Activos (snakes).

Métodos basados en regiones. Se sustenta en la hipótesis que los pıxeles que pertenecen a una misma región, tienen características visuales similares (textura, color, forma, etc.). Se destacan la técnica de División y Unión, y la de Crecimiento de Regiones a partir de Semillas SRG. Un sistema SRG, es propuesto en Hijjatoleslami y Kittler 1998, para imágenes de resonancia magnética en escala de grises. El sistema ACB-PCB mostrado aquí, es una extensión de Hijjatoleslami y Kittler 1998, hacia imágenes a color, y se aplica al caso del café.

Métodos híbridos. Estos integran las características de los métodos anteriores, para solucionar el problema de la segmentación. Un sistema de esta naturaleza se presenta en Jianping et al. 2001. En el presente artículo, se propone un sistema híbrido, el cual integra la detección de bordes con el crecimiento de regiones.

De lo métodos anteriores, el híbrido se destaca para la solución de problemas de segmentación, dado que involucra las bondades de diversas técnicas, para la solución de un problema complejo. Cabe anotar que, según la estructura de visión artificial “clásica” que se muestra en Betancur 2002, la segmentación, como los demás bloques, utiliza el conocimiento a priori que se tiene del tipo de escena que se desea procesar. Es por esto que, la mayor cantidad de sistemas son diseñados para problemas específicos.

Los sistemas basados en contornos son apropiados allí donde la forma es un factor determinante para la segmentación de los objetos, dado que es fácil adaptar restricciones de forma tal que, el proceso de ajuste del contorno y/o la región segmentada al final, sean afines con el objeto. No obstante, la minimización de la función objetivo no necesariamente da como resultado la mejor región, dado que puede caer en un mínimo local (González y Woods 1996). Las técnicas de umbralización o de agrupamiento espectral, las cuales utilizan la información espectral para llevar a cabo la segmentación, son satisfactorias allí donde los objetos, que tengan las mismas características espectrales, aparezcan separados. Además, en todo caso, se debe proveer de un fondo de alto contrate con respecto a los objetos presentes. Los métodos de crecimiento de regiones, son altamente dependientes de la homogeneidad espectral de los objetos que estén presentes en la escena, pues el criterio de homogeneidad que controla el proceso de crecimiento, generalmente incorpora dicha información. En otras palabras, en el problema del café, podría suceder que un fruto pintón, el cual no es homogéneo espectralmente pues puede tener amarillos, rojos o verdes, no sea segmentado satisfactoriamente.

En el caso de la segmentación de imágenes de café, intuitivamente se observa que, la mayoría de los frutos que pertenecen a la misma etapa de maduración, presentan homogeneidad en el color, excepción hecha de los frutos pintones. Sin embargo, la información de bordes podría ser incorporada para obtener una segmentación satisfactoria en dichos casos. En este trabajo, se presenta un enfoque de crecimiento de regiones, partiendo del método clásico de crecimiento euclídeo, presentado a continuación un sistema iterativo que utiliza medidas globales de afinidad espectral, para la segmentación de los granos. Finalmente, se presenta también un método híbrido, que incorpora la información de los bordes en la imagen.

Sistema Euclídeo. En este sistema la integración de pıxeles a la región en crecimiento se hace mediante la distancia euclídea, medida en los espacios de color RGB, Y UV o Y IQ, entre el pıxel candidato y el promedio de color de los pıxeles que conforman la región a la cual se va a adherir (Palus y Bereska 1999). La distancia euclídea para el espacio de color RGB está definida por:

donde X es un punto en el espacio de color RGB, con componentes XR, XG y XB correspondientes a cada uno de sus valores rojo, verde y azul en dicho espacio; Y es otro punto en el espacio de color RGB y, d(X, Y )RGB es la distancia euclídea que existe entre los dos puntos.

El Sistema Euclídeo hace uso de la definición de distancia euclídea dada por la Ec.1, para crecer pıxel a pıxel la región, partiendo de un pıxel inicial llamado pıxel semilla (Jianping et al. 2001). Cada que se tenga un pıxel candidato a adherirse a la región, se debe cumplir el siguiente criterio:

Donde P es el punto en el espacio de color RGB del pıxel candidato; R es el punto en el espacio de color RGB correspondiente al promedio de los pıxeles que conforman la región en crecimiento, y dRGB es la distancia máxima (umbral) en el espacio de color RGB. En el momento en que la distancia desde la media de las componentes de color de la región RR, RG, RB, hacia las componentes PR, PG, PB de todos los pıxeles vecinos a ella, exceden el umbral dRGB, el proceso de crecimiento se detiene. La región crecida hasta ese momento es la región final. En los espacios de color Y UV e Y IQ se pueden involucrar las tres componentes de color: la de iluminación (Y ) y las de crominancia (U, V ) o (I, Q). En este caso los criterios de adición de pıxeles son:

El segundo criterio, involucra únicamente las componentes de crominancia U, V , y se define así:

Los pixeles semilla, junto con el espacio de color y el umbral correspondiente, de acuerdo con las Ec.2 a la Ec.4, son dados antes de que el proceso de segmentación inicie. Cada pıxel semilla es etiquetado, y esta etiqueta se correspondería a la de la región crecida a partir de él. Existen por lo tanto tantas regiones como semillas hallan sido ofrecidas al programa. En el caso de n pıxeles semilla, se tiene:

con Ri la i-ésima región crecida a partir de su correspondiente semilla. La ecuación anterior establece que las regiones crecidas a partir de las semillas son disyuntas, aunque no necesariamente corresponden a una partición de la imagen : imagen) (González y Woods 1996). Esto último es consecuencia del hecho que se tiene una semilla por fruto, pero la escena no necesariamente está compuesta completamente por ellos, pues pueden encontrarse otros objetos tales como tallo, hojas, fondo, entre otros.

Actualización de la media. Dado que en cada uno de los criterios de adición de pıxeles (Ec. 2 a Ec. 5) es necesaria la media de las componentes de la región en crecimiento, se utiliza un método iterativo de actualización de la media (Palus y Bereska 1999) cada que se adhiere un nuevo pıxel a la región:

donde Mn es la media actualizada, Mn−1 la media antes de adherir el pıxel con componente P, y n es el número actual de pıxeles de la región.

Dirección de crecimiento. La Figura 1 muestra una región compuesta por 20 pıxeles, donde se pueden apreciar los contornos actual e interno de la misma. El contorno actual está compuesto por los pıxeles que no pertenecen a la región, pero que son vecinos a ésta, según el vecindario de segundo orden mostrado en (Jianping et al. 2001).


Figura 1
Esquema que muestra el Contorno Actual (CB), el cual contiene el pıxel candidato a ser adherido, el Contorno Interno (IB) conformado por los pixeles más externos de la región, y la región misma. La región consiste de 20 pixeles.

Para el caso del crecimiento euclídeo, los pıxeles candidatos a adherirse a la región conforman el contorno actual (CB) de la misma (Figura 1). A lo largo del crecimiento, muchos de estos pıxeles cumplen el criterio euclídeo de segmentación (Ec.2 a Ec.4), por lo cual debe definirse una dirección de crecimiento que permita obtener al final del proceso, la región más homogénea posible. Con este fin, la dirección de crecimiento tomada es aquella de mínima distancia euclídea, es decir que, de los pıxeles candidatos, se toma aquel que tenga la menor distancia euclídea hacia la región en crecimiento.

La Figura 2 muestra el resultado obtenido al aplicar el método euclídeo sobre imágenes de laboratorio. A partir de los pıxeles semilla colocados sobre diferentes frutos de café en la imagen original (Figura 2 (a)), se obtienen las imágenes resultado para los diferentes espacios de color mostradas en las Figuras 2(b), 2(c) y 2(d).


Figura 2
Resultados sobre imágenes de laboratorio del sistema euclídeo: (a) Imagen original y pixeles semilla, (b) Crecimiento en el espacio RGB, (c) Crecimiento en el espacio Y UV, (d) Crecimiento en el espacio Y IQ.

Sistema ACB-PCB. Este sistema hace uso de dos medidas de discontinuidad llamadas contraste promedio y contraste periférico (Hijjatoleslami y Kittler 1998). Con el fin de encontrar la región final, se realiza un proceso iterativo mediante el cual se crece una región lo suficientemente grande tal que, al final, la región contenga el grano de café que se desea segmentar. Utilizando las medidas tomadas durante el proceso, se procede a hallar el contorno de contraste promedio (ACB: Average Contrast Boundary), y el contorno de contraste periférico (PCB: Peripheral Contrast. Boundary), los cuales son utilizados para realizar la segmentación.

El número de iteraciones es un parámetro que debe ser ajustado basándose en un conocimiento a priori del tipo de escena; en este caso depende del tamaño máximo que puede tener el objeto que se desea segmentar (p.e. 1,5 veces dicho valor). Para las imágenes de café, el número de iteraciones tomadas fue de 10,000, porque, en la base de datos de prueba, dicho valor corresponde a uno mayor al máximo tamaño de un grano de café. Para imágenes tomadas en condiciones controladas (fundamentalmente con distancia al objetivo y zoom constante), este parámetro no cambia.

Contraste promedio y contraste periférico. Las medidas de contraste promedio y contraste periférico para imágenes en escala de grises, se definen en Palus y Bereska 1999; sin embargo, para imágenes a color no están definidas. Por lo tanto, se toma la distancia euclídea en el espacio RGB (parte izq. de la Ec. 2), como base para calcularlas. Se define la medida de contraste promedio, como la distancia euclídea que existe entre el promedio de las componentes de color de los pixeles que conforman el CB, y los que conforman la región en crecimiento R:

donde  

son las componentes promedio de los pixeles que conforman el CBi;

 son las componentes promedio de los pixeles que conforman la región en crecimiento Ri, y c(i) es la medida de contraste promedio en la i-ésima iteración (0 ≤ i < 10,000). De forma similar, se define la medida de contraste periférico p(i), la cual es la distancia euclídea entre el promedio de las componentes de los pixeles del IB, y el promedio de aquellos del CB:

donde  son las componentes promedio de los pixeles que conforman el IBi.

La medida de contraste promedio, suministra información sobre el contraste que existe entre la región en crecimiento y su entorno, mientras que, el contraste periférico, muestra la fuerza o gradiente entre el contorno periférico de la región y su contorno actual (Figura.1). Esta última es menos sensible al ruido, dado que no utiliza la medida del gradiente entre dos pixeles vecinos, sino entre dos contornos vecinos (Hijjatoleslami y Kittler 1998).

Actualización de la media. Igual que en el Sistema Euclídeo, se implementó un método iterativo para la actualización de la media por adición de pixeles (Ec.7). No obstante, es necesario obtener un método similar para el caso en que se retiran pixeles de los contornos CB e IB, lo cual es posible mediante la siguiente ecuación:

con n el número de pixeles luego de extraerse aquel con componente P, Mn−1 la media anterior y, Mn la media actualizada.

Segmentación ACB-PCB. Igual que para el sistema anterior, la dirección de crecimiento utilizada es la de mínima distancia euclídea (Sección 3.2). El método ACB-PCB, adhiere en cada iteración un nuevo pixel a la región, tomándolo del contorno actual (Figura 1). Por lo tanto, entre iteraciones, es necesario actualizar el contorno actual

y periférico de la nueva región. Dado que las medidas necesarias para obtener la segmentación son la media de color de la región, y las medias de color de cada contorno, se utilizan las ecuaciones de actualización de la media, con el fin de hacer más rápido el proceso. Así pues, cuando se retira un pixel del CB para adherirlo a la región, se utiliza la Ec.10 para actualizar su media, y cuando se adhiere el pixel a la región, se utiliza la Ec.7, para actualizar la media de esta. Estas ecuaciones, son usadas también para computar dicha medida en el proceso de actualización de los contornos.

Con el fin de segmentar el grano de café, luego del proceso de iteración se procede a hallar el ACB y el PCB. El PCB contiene la región segmentada final. Para burbujas gausianas (Figura 3), el valor del contraste promedio crecerá a medida que el proceso de crecimiento continúe incorporando pixeles de alta intensidad de la burbuja. Una vez que se comienza a crecer dentro del fondo, el cambio de la intensidad decrece, y por lo tanto el contraste promedio comienza a decrecer. Así la iteración que produce la máxima medida de contraste promedio, corresponde al punto donde la región comienza a crecer en el fondo. Dicha iteración corresponde a la región contenida por el contorno de contraste promedio ACB (Hijjatoleslami y Kittler 1998).


Figura 3.
(a) Burbuja gausiana con σ = 25 pix, (b) Contorno de contraste promedio ACB, (c) Contorno de contrate periférico PCB y (d) Evolución de las medidas de contraste promedio y periférico.

Para regiones relativamente homogéneas, el contraste periférico tiene un máximo global. Sin embargo, para regiones ruidosas o con texturas, como en los frutos de café, la medida de contraste periférico muestra diferentes picos, cada uno de los cuales podría utilizarse para hallar el PCB y por lo tanto la región final. El criterio usado con este fin es utilizar el máximo contraste periférico anterior al máximo global de la medida de contraste promedio. El punto donde se tiene el máximo, corresponde a la región contenida por el PCB, la cual es la región segmentada final. Básicamente, la segmentación ACB-PCB consiste en hallar la región crecida a partir de una semilla, que presente el mayor gradiente entre su CB e IB, contenida dentro de la región con mayor contraste hacia su entorno (Hijjatoleslami y Kittler 1998).

El proceso utilizado arriba para una burbuja gausiana puede ser aplicado en imágenes de café, donde se observará un comportamiento de la medida de contraste promedio similar (es decir con un máximo global), aunque la evolución del contraste periférico puede presentar diferentes máximos locales. Utilizando el criterio mencionado en el párrafo anterior, se obtienen los resultados mostrados en la Figura 4.


Figura 4.
(a), (b) Frutos segmentados mediante el sistema ACB-PCB, (c) Evolución de las medidas de contraste promedio y periférico para (b).

Sistema híbrido.  Este sistema se clasifica como Híbrido, ya que integra la detección de bordes con el crecimiento de regiones.

Extracción de bordes de color. El sistema detector de bordes de color implementado se muestra en la Figura 5. Se puede dividir la extracción de Bordes de la escena en 5 etapas, cada una de las cuales se muestra en la figura. En la ETAPA 1, se obtienen los planos de color IY, IU e IV de la imagen . En la ETAPA 2, se utilizan las máscaras de Sobel (Tabla 1) (Umbaugh 1998), con el fin de hallar el gradiente existente entre cada pixel y sus vecinos, de acuerdo al vecindario de segundo orden N(x, y) (Jianping et al. 2001), en cada plano de color IY, IU e IV. En la ETAPA 3, se clasifican los pixeles de un solo mapa de bordes E, que contiene la información de los bordes presentes en la imagen, obtenidos a partir de aquellos que se encontraron en cada uno de los planos de color. Finalmente, la ETAPA 5, realiza un postprocesamiento al mapa de bordes E, con el fin de eliminar aquellos bordes no conexos que, en general, no ofrecen información sobre las principales componentes geométricas presentes en la escena. Las ETAPAS 1, 2, 3 y 4 son propuestas en (Jianping et al. 2001), mientras que la ETAPA 5 se propone y adiciona en este trabajo, para obtener un mejor desempeño.

Tabla 1 Coeficientes para calcular HOE(x, y), V OE(x, y), NOE(x, y) y SOE(x, y), respectivamente. Estas son las máscaras de Sobel para computar el gradiente en las cuatro direcciones: H, V, NE, SE.


Figura 5.
Sistema detector de bordes de color.

La ETAPA 5 tiene como entrada E, la cual es una matriz Booleana en donde cada posición tiene un valor Verdadero o Falso, dependiendo si el pıxel ha sido clasificado como pixel de borde o como pixel de no borde, respectivamente. Los pixeles pertenecientes a la clase pixel de borde en E, forman el grupo de pixeles denotado como E(1). Dicho grupo está conformado por z subgrupos de pixeles de borde conexos así:

Para un grupo de bordes conexos, cumple que:

donde Bi es el i-esimo subgrupo de pixeles de borde conexos y, N(x, y) es el vecindario de segundo orden para el pixel en la posición (x, y) (Jianping et al. 2001). El postproceso consiste en eliminar aquellos grupos de pixeles de borde conexos menores a 20 pixeles (Bi 20 pix.), ya que estos generalmente corresponden a bordes que no dan ninguna información sobre las principales estructuras geométricas presentes en la escena. La imagen de bordes luego del postproceso se denota como .

La Figura 6 muestra algunos resultados del Detector de Bordes de Color sobre imágenes de café: la Figura 6(a) muestra la imagen original IRGB, la Figura 6(b) muestra el mapa de bordes E obtenido, y la Figura 6(c), muestra la imagen resultante al aplicar el postproceso . Nótese la mejora con respecto a la imagen precedente, principalmente en aquellos bordes dispersos que en la imagen final han desaparecido. Sin embargo, aquellos bordes que dan información sobre las componentes geométricas presentes en la imagen original, pero que no conforman un grupo conexo de al menos 20 pix, desaparecen también (ver grano del centro).


Figura 6.
Resultado sobre una imagen de laboratorio del detector de bordes de color: (a) Imagen de laboratorio, (b) Mapa de bordes, y (c) Imagen de bordes obtenida al final del postproceso.

Segmentación híbrida. Luego de obtener la imagen de bordes con el sistema mostrado en la Figura 5, se procede a realizar la segmentación. Esta debe vincular la información que suministra la imagen de bordes con la de la medida de contraste promedio. Igual que en el sistema anterior, se itera hasta 10,000 para que la región al final contenga el grano que se desea segmentar (ver sección 4). Sin embargo, el sistema híbrido segmenta la región final de acuerdo al ACB y no al PCB.

Para involucrar la información de bordes, se define una nueva dirección de crecimiento.

Dirección de crecimiento. La dirección de crecimiento para el sistema híbrido es similar que en los sistemas anteriores, lo que se modifica es el conjunto de pixeles candidatos a adherirse a la región. Para el caso de los sistemas anteriores, los pixeles candidatos son aquellos que conforman el contorno actual (CB) de la región en crecimiento (Figura.1). En el sistema híbrido, los pixeles candidatos también se encuentran en este contorno, pero no se tienen en cuenta aquellos que sean pixeles de borde en la imagen de bordes luego del postproceso . La siguiente función aclara esto:

donde (1) es el conjunto de pixeles pertenecientes a la clase pixel de borde en , N(x, y) es el vecindario de segundo orden (Jianping et al. 2001), y Ki es el conjunto de pixeles candidatos para la región en crecimiento Ri. Así, la medida de contraste promedio no llevará la cuenta de aquellos pixeles que pertenezcan a la imagen de bordes. Esto permite crecer la región por donde no se tiene información sobre las componentes geométricas, lo que se traduce en hallar la región con mayor contraste entre ella y su entorno, que se encuentre dentro de los límites dados por los pixeles de borde, y que, donde no existan, los ajuste de acuerdo al ACB encontrado.

Debido al nuevo conjunto de pixeles candidatos tomado (Ec.13), pueden suceder dos casos:

Caso 1: La imagen es segmentada con el ACB. Corresponde a la situación en que el sistema puede iterar hasta 10,000, para luego segmentar usando el ACB.

Caso 2: No existen pixeles candidatos. Dada la Ec.13, puede suceder que todos los pixeles en el CBi sean pixeles de borde, situación en la cual no existirían pixeles candidatos Ki. En tal caso, la región segmentada final es la que lleve el proceso iterativo en ese momento.

La Figura 7, muestra el resultado obtenido luego de aplicar el Sistema Híbrido sobre una imagen de laboratorio. En ella puede observarse el resultado de la segmentación para los dos casos posibles: las Figuras 7(c) y 7(d) son las imágenes resultantes para el caso 1. Debido a que en este caso se segmenta con el ACB y no con el PCB, la región segmentada final corresponde, por lo tanto, a aquella crecida a partir de un pixel semilla, que presenta el mayor contraste de color con respecto a su entorno; por consiguiente, la segmentación podrá tomar mayor parte del grano por allí donde los bordes lo permitan. Sin embargo, puede suceder que existan pixeles de borde dentro del grano de café, por lo cual la segmentación resultaría imprecisa dado que estos pixeles no pueden adherirse a la región en crecimiento (Ec.13). No obstante, esta situación puede ser positiva. En el caso del ombligo p.e., generalmente este presenta un mayor contraste con respecto al grano, y está definido en gran parte por sus bordes de color. Así, el ombligo puede ser rodeado por la región final, lo que permite tomar características de él (Figura 7(c)). La Figura 7(b) muestra el resultado para el caso 2; aquí la región segmentada es óptima dado que el grano está totalmente rodeado por pixeles de borde.


Figura 7.
Resultado sobre una imagen de café del Sistema Híbrido: (a) Imagen de Bordes luego del Postproceso(), (b) Resultado Caso 2, (c) y (d) Resultados con ACB (Caso 1).

 

RESULTADOS

Esta sección muestra los índices de desempeño para los diferentes sistemas implementados, y para el detector de bordes. Los índices de desempeño utilizados son: Verdadera Aceptación, Verdadero Rechazo, Falsa Aceptación y Falso Rechazo. Todos los indicadores son calculados tomando como referente, la cantidad de pixeles que conforman la región que se desea segmentar.

La Verdadera Aceptación (V.A.) indica que porcentaje de la región fue segmentada por el método (Valor ideal: 100%). El Verdadero Rechazo (V.R.) indica qué porcentaje de los pixeles que no pertenecen al grano de café, fueron rechazados por el sistema (Valor ideal: 100 %). La Falsa Aceptación (F.A.) indica que porcentaje de los pixeles que no pertenecen al grano fueron clasificados como tal (Valor ideal: 0 %). Este valor puede ser mayor al 100%. Por ejemplo, para un F.R. = 200 %, la cantidad de pixeles que fueron falsamente segmentados como pertenecientes a la región, suman el doble de pixeles que conforman la región misma. Por último, el Falso Rechazo (F.R.) indica qué porcentaje de los pixeles que pertenecen al grano fueron rechazados por el sistema (Valor ideal: 0 %).

Para todo caso, la Verdadera Aceptación y el Falso Rechazo suman 100 %, es decir: % V.A = 100 % % F.R. Esto porque la porción rechazada del grano, corresponde a aquella región que, aunque pertenece al grano, no pertenece a la región segmentada final, la cual debería abarcar al grano por completo (en cuyo caso, V.A. = 100 % FR = 0 %).

Sistema Euclídeo. La Tabla 2 muestra el resultado obtenido con el Sistema Euclídeo. En ella se muestran los mejores desempeños obtenidos en cada uno de los espacios de color. Se puede observar que el desempeño es levemente mejor, en cuanto al índice de V.A., en el espacio de color RGB. No obstante,  es finalmente en el espacio YIQ donde se presenta el mejor desempeño, dado que el índice V.A. es alto, a la vez que la F.A. es baja. Nótese también la dependencia del umbral al espacio de color en el cual se trabaje (debido a la transformación entre espacios de color (Palus y Bereska 1999)). Como se observa en las figuras precedentes, la región a la cual se llega utilizando el Sistema Euclídeo (Figura 2), abarca menor porción del grano que la región que se obtiene usando los sistemas ACB-PCB e Híbrido (Figuras (4) y 7).

Tabla 2 Resultados del Sistema Euclídeo para los umbrales que mostraron mejor desempeño. d indica la distancia euclídea utilizada, V.A, V.R, F.A, F.R son los índices de desempeño.

Sistema ACB-PCB. La Tabla 3 muestra los Índices de desempeño para el Sistema ACB-PCB. En este caso, el sistema requiere únicamente del punto semilla a partir del cual será crecida la región (el número de iteraciones se mantiene constante debido a que son imágenes tomadas en condiciones controladas). Su desempeño es similar al del Sistema Híbrido.

Tabla 3 Resultados del sistema de segmentación ACB−PCB.

Sistema Híbrido. La Tabla 4 muestra los índices de desempeño para el detector de Bordes de Color. A su vez la Tabla 5 para el Sistema Híbrido.

Tabla 4 Índices de desempeño para el detector de bordes de color, antes del postproceso (B.Color) y luego de éste (B. Post).

Tabla 5 Índices de desempeño para el Sistema Híbrido.

En la Tabla 4 el índice de F.A. es superior al 100%, lo cual se debe a la gran cantidad de bordes que son clasificados como tal, pero que, según aquellos tomados por un humano, realmente no lo son.

Análisis. El desempeño del Detector de Bordes de Color es mejor que aquellos utilizados en imágenes en escala de grises (Sobel, Kirsh) (Umbaugh 1998), dado que se tiene información de bordes debidos a diferencias en el espacio de color y no simplemente a diferencias en intensidad de gris. En cuanto al resultado arrojado al aplicar el Postproceso, se observa que éste mejora en un 16% el índice de Falsa Aceptación (lo cual es lo deseado) aunque afecta en menor grado los demás índices. La importancia de tener una buena imagen de bordes de color radica en que, para el caso de la aplicación de imágenes de café, el color tiene información discriminante que puede ser utilizada para diferenciar entre frutos en diversas etapas de maduración, o entre un grano y hojas o el tallo (en algunos casos). Esto se aprovecha tanto en la etapa de segmentación (discutida en este artículo) como en la etapa de clasificación del grano de café (Maya 2001).

Con respecto a la técnica de segmentación híbrida, debido a que se incorpora información sobre los bordes de color presentes en la imagen, la dirección de crecimiento se focaliza hacia aquellos pixeles que más probablemente pueden pertenecer al grano, y rechaza de plano aquellos que definitivamente presentan una fuerte diferencia de color con su entorno (bordes de color). El uso del ACB (Caso 1) como región segmentada final produce dos efectos: por un lado los índices de Verdadera Aceptación y Falso Rechazo mejoran (están correlacionados), aunque los índices de Verdadero Rechazo y Falsa Aceptación se alejan de su valor ideal pues se toma la región con mayor contraste con respecto a su entorno, y no aquella dentro de ésta, que tiene el mayor gradiente entre sus contornos actual y periférico (como en la segmentación ACB-PCB). Lo anterior significa que la región segmentada frecuentemente contiene parte de una región vecina (otro grano, hoja o tallo).

El Sistema Euclídeo depende de diferentes parámetros que deben ser dados por el usuario final, mientras que los sistemas ACB-PCB e Híbrido sólo requieren, en este caso, de la posición del punto semilla, por lo cual los resultados obtenidos utilizando éste sistema sólo pueden ser analizados entre aquellos obtenidos con diferentes variaciones de tales parámetros. Puede anotarse la dependencia del umbral con el espacio de color analizado, debido a la transformación entre espacios de color. La implementación del Sistema Euclídeo se realiza con el propósito de introducir la medida básica de distancia euclídea, la cual es ampliamente utilizada en los posteriores sistemas de segmentación.

 

CONCLUSIONES

Tres sistemas de segmentación de frutos de café se presentaron en este artículo utilizando la técnica SRG de crecimiento de regiones. El primero, utiliza la distancia euclídea tomada desde el pıxel candidato hasta la región, para una imagen en el espacio de color RGB, Y UV o Y IQ, y exhibe un comportamiento óptimo cuando existe un alto contraste entre la región que se desea segmentar (grano de café) y el entorno a esta. Sin embargo, su resultado es dependiente de la posición del pıxel semilla (es decir, la región segmentada luego de aplicar el sistema Euclídeo para un mismo grano de café, pero partiendo de diferentes pıxeles semilla, no es siempre la misma), y del valor del umbral, el cual es dejado a consideración del usuario del sistema.

El segundo sistema utiliza dos medidas de discontinuidad entre la región en crecimiento R, y sus contornos CB e IB (c(i), p(i)). Este requiere un proceso de iteración, luego del cual se procede a realizar la segmentación. El sistema requiere además del máximo tamaño de los frutos de café. Aquí, es importante anotar que, similarmente a los sistemas de segmentación basados en bordes, se aplica una medida de discontinuidad que suministra información sobre el gradiente: contraste periférico (en este caso entre dos contornos de la región). Esta medida es menos sensible al ruido presente en la imagen (Hijjatoleslami y Kittler 1998).

El tercer sistema utiliza la información disponible tanto de discontinuidad pıxel a pıxel (Bordes de Color), como entre la región y su contorno CB (c(i)). La característica de este algoritmo es que en cada iteración se adhiere un pıxel a la región en crecimiento, el cual no es un píxel de borde dentro de la imagen. Su desempeño es similar al Sistema ACB-PCB, aunque dado que utiliza el ACB para realizar la segmentación, el índice de Verdadera Aceptación es levemente mayor por lo que su índice de Falso Rechazo disminuye, aunque la Falsa Aceptación aumenta. Este sistema tiene buenos resultados allí donde la imagen de bordes sea discriminante, es decir donde sea posible obtener las principales componentes geométricas presentes en la imagen.

Finalmente, se concluye del análisis de las Tablas 2, 3, y 5, que el Sistema ACB-PCB es el mejor de los tres. Esto porque, aunque tiene un menor índice de V.A. que el Sistema Híbrido, su índice de V.R. es mayor, y el de F.A. es claramente superior. Esto significa, que aunque el sistema puede no tener la mayor parte del fruto segmentado, se asegura que la región segmentada probablemente es solamente parte del grano, mientras que el resultado que se obtendría con el Sistema Híbrido, podría contener mayor parte del fruto, pero también otras regiones no deseables como parte del fondo, de una hoja o de otro grano.

 

BIBLIOGRAFÍA

Aleixos, N., Blasco, J., Navarrón, F. and Moltó, E. 2002. Multispectral inspection of citrus in realtime using machine vision and digital signal pro-cessors. En: Computers and Electronics in Agriculture. Vol. 33, no. 2; p. 121–137.         [ Links ]

Betancur, Julián. 2002. Segmentación de granos de café mediante métodos de crecimiento de regiones. Manizales, 89 h. Tesis Ingeniería Electrónica. Universidad Nacional de Colombia. Facultad de Ingeniería y Arquitectura.        [ Links ]

Brosnan, T. D. and Sun, D. W. 2002. Inspection and grading of agricultural and food products by computer vision systems: a review. En: Computers and Electronics in Agriculture. Vol. 36; p. 193-213.        [ Links ]

Chen, Y. R., Chao, K., and Kim, M. S. 2002. Machine vision technology for agricultural applications. En: Computers and Electronics in Agriculture. Vol. 36; p. 173–191,         [ Links ]

González, R. y Woods, R. 1996. Tratamiento digital de imágenes. Wilniington, Delaware: Addison-Wesley. 518 p.        [ Links ]

Hijjatoleslami, S. A. and Kittler, J. 1998. Region growing: a new approach. En: IEEE Transactions on Image Processing. Vol. 7, no. 7; p. 1079–1084.         [ Links ]

Jianping, David, Yau, K., Elmagarmid, Ahmed and Aref, Walid. 2001. Automatic image segmentation by integrating color-edge extraction and seeded region growing. En: IEEE Transactions on Image Processing. Vol. 10, no. 10; p. 1454–1465.         [ Links ]

Leemans, V., Magein, H. and Destain, M. F. 1999. Defect segmentation on ‘Jonagold’ apples using colour vision and a bayesian classification method. En: Computers and Electronics in Agriculture. Vol. 23, no. 1; p. 43–53.         [ Links ]

Leemans, V., Magein, H. and Destain, M. F. 1998. Defects segmentation on ‘Golden delicious’ apples by using colour machine vision. En: Computers and Electronics in Agriculture. Vol. 20; p. 117-130.         [ Links ]

Marchant, J. A., Oyango, C. M. and Street, M. J. 1990. Computer vision for potato inspection without singulation. En: Computers and Electronics in Agriculture. Vol. 4, no. 3; p. 235–244.         [ Links ]

Maya, Carolina. 2001. Desarrollo de un algoritmo para la caracterización y clasificación de granos de café empleando técnicas de visión artificial. Manizales, 68 h. Tesis Ingeniería Electrónica. Universidad Nacional de Colombia. Facultad de Ingeniería y Arquitectura.        [ Links ]

Montes Castrillón, Nubia Liliana. 2001. Desarrollo de algoritmos de segmentación de frutos maduros y verdes de café en imágenes tomadas en condiciones controladas basados en las propiedades de color. Manizales, 44 h. Tesis Ingeniería Electrónica. Universidad Nacional de Colombia. Facultad de Ingeniería y Arquitectura.        [ Links ]

Ñakano, K. ­1997. Application of neural networks to the color grading of apples. En: Computers and Electronics in Agriculture. Vol.18; p.105–116.         [ Links ]

Palmer, P. L., Dabis, and Kittler, H. J. 1996. Performance measure for boundary detection algorithms. En: Computer Vision and Image Understanding. Vol. 63; p. 476-494.         [ Links ]

Palus, Henryk and Bereska, Damian. 1999. Region-based colour image segmentation. Gliwice, Poland : Silesian University of Technology, Department of Automatic Control. 101 p.        [ Links ]

Skarbek, W. and Koschan, A. 1994. Colour image segmentation: a survey. Technical University of Berlin,  Institute for Technical Informatics . p. 2-81.        [ Links ]

Studman, C. J. 2001. Computers and electronics in postharvest technology: a review. En: Co mputers and Electronics in Agriculture. Vol. 30; p. 109-124.         [ Links ]

Umbaugh, Scott. 1998. Computer vision and image processing. New Jersey: Prentice Hall. 85 p.        [ Links ]

Vízhányó,T. and Felföldi, J. 2000. Enhancing colour differences in images of diseased mushrooms. En: Computers and Electronics in Agriculture. Vol. 26; p. 187–198.         [ Links ]

Yang, Q. 1994. An approach to apple surface feature detection by machine vision. En: Computers and Electronics in Agriculture. Vol. 11; p. 249–264.        [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License