SciELO - Scientific Electronic Library Online

 
vol.60 número2ILLUMINATION CORRECTION FOR AERIAL AGRICULTURE IMAGES TAKEN AT LOW ALTITUDEMODELLING OF THE COLOMBIAN COFFEE PRICE IN THE NEW YORK STOCK EXCHANGE USING ARTIFICIAL NEURAL NETWORKS índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Revista Facultad Nacional de Agronomía, Medellín

versão impressa ISSN 0304-2847

Rev.Fac.Nal.Agr.Medellín v.60 n.2 Medellín jul./dez. 2007

 

CARACTERIZACIÓN DE CAFÉ CEREZA EMPLEANDO TÉCNICAS DE VISIÓN ARTIFICIAL

AN ARTIFICIAL VISION SYSTEM FOR CLASSIFICATION OF COFFEE BEANS

 

Zulma Liliana Sandoval Niño1 y Flavio Augusto Prieto Ortiz2

 

1 Profesora Asociada. Universidad Pedagógica y Tecnológica de Colombia. Facultad de Ingeniería.  Cra. 18 N° 22-00. Duitama, Colombia. <zsandoval@duitama.uptc.edu.co>
2 Profesor Asociado. Universidad Nacional de Colombia, Sede Manizales. Facultad de Ingeniería y Arquitectura. Carrera 27, No. 64-60, Manizales, Colombia. <faprietoo@unal.edu.co>

 

Recibido: Junio 8 de 2007; aceptado: septiembre 25 de 2007.


RESUMEN

Se desarrolló un sistema de visión artificial para la clasificación de frutos de café en once categorías dependiendo de su estado de madurez. Para la descripción de la forma, el color y la textura de cada fruto de café se extrajeron 208 características. La reducción del conjunto de características de 208 a 9 se hizo con base en los resultados de dos métodos de selección de características, uno univariado y otro multivariado. Las características seleccionadas corresponden a 4 características de textura, 3 de color y 2 de forma. Este conjunto final de características se evaluó en dos técnicas de clasificación: Bayesiano y redes neuronales. Con el clasificador Bayesiano se obtuvo un error de clasificación del 5,43% y requirió un tiempo de clasificación de 5,5 ms, mientras que usando redes neuronales el error de clasificación fue de 7,46%, pero disminuyó el tiempo de clasificación a 0,8 ms.

Palabras claves: Reconocimiento de patrones, café, clasificación de patrones, procesamiento digital de imágenes.


ABSTRACT

An artificial vision system for classification of coffee beans, in eleven categories, according to its state of maturity was developed. The description of the coffee beans was done by using 208 characteristics (form, color and texture characteristics). The reduction of the set of characteristics from 208 to 9 was done by using two methods of characteristic selection. The final set of characteristics is composed by 4 texture characteristics, 3 color characteristics and 2 shape characteristics. This final set was evaluated in two classifiers: The Bayesian and a neuronal networks classifier. The classification error obtained by the Bayesian classifier was 5,43%, it required 5,5 ms for the classification process, while the error obtained by neuronal networks classifier was 7,46% and the classification time decreased to 0,8 ms.

Key words: Pattern recognition, coffee, pattern classification, digital image processing.


ANTECEDENTES
ADQUISICIÓN DE LAS IMÁGENES
CARACTERIZACIÓN
CLASIFICACIÓN
RESULTADOS
CONCLUSIONES
AGRADECIMIENTOS
BIBLIOGRAFÍA


 

La calidad del café colombiano es reconocida mundialmente y ha sido apreciada por los países consumidores como una de las mejores dentro de los cafés arábicos. La alta calidad del café colombiano es el resultado de las variedades que se cultivan, de la oferta ambiental y de suelos, y principalmente de la recolección. La recolección se hace de forma manual y selectiva desprendiendo los frutos maduros, esta es una ardua labor ya que en una misma rama es posible encontrar frutos en diferentes estados de madurez e incluso flores. Los costos de recolección son altos y muchas veces no se generan los resultados esperados porque no sólo se reúnen frutos maduros sino que también algunos verdes y sobremaduros. La presencia de estos frutos verdes y sobremaduros afectan la calidad del café variando el sabor y el aroma. Por lo tanto, la adición de una etapa de clasificación del café recogido, permitiría mejorar la calidad del café que actualmente se produce y además la generación de nuevos productos, al procesar café de cada una de las otras etapas de madurez. Por otro lado, en un proceso de recolección automático, la necesidad de esta etapa de clasificación es evidente, ya que en este tipo de recolección se desprenden frutos en diferentes estados de madurez.

La implementación de un sencillo sistema de clasificación usando visión artificial es una alternativa conveniente ya que permitiría la extracción de características de los granos de café, tales como la forma, el color y la textura del fruto, que son los parámetros principales con los cuales un experto hace la clasificación manual. Las ventajas con respecto a sistemas de clasificación manual, mecánica y óptica se centran en la objetividad, poco contacto físico entre el sistema de clasificación y el producto, y la posibilidad de hacer una clasificación más específica.

Por lo anterior, el objetivo de este trabajó es desarrollar un estudio para la selección de las características más discriminantes en el proceso de clasificación de frutos de café según su estado de madurez. Las características que se utilizan están relacionadas con la textura, la forma y el color de los frutos de café. Los métodos de selección de características empleados son el índice de Fisher y el método de análisis multivariado. El conjunto de características seleccionado se evalúa con dos clasificadores: el bayesiano y uno basado en Redes Neuronales Artificiales.

Los sistemas de visión artificial se han convertido en una solución eficaz para los problemas cotidianos de control presentes en la agricultura. Los excelentes resultados obtenidos han incrementado el interés por el desarrollo de proyectos aplicados a diferentes procesos agrícolas, especialmente en las etapas de cosecha de cultivos y en el control de calidad, (Brosnan y Sun, 2004 y Brosnan y Sun, 2002). Ejemplos de estas aplicaciones son: la recolección de tomates, Hayashi, Sakaue y Kanuma, 1997; manzanas Bulanon et al., 2001; Paulus, Busscher y Schrevens, 1997, naranjas, Recce et al., 1998; tomates-cereza, Kondo et al., 1996; así como la clasificación de papas, Guizard Gravoueille y Crochon, 1998; olivas, Molto et al., 1998; brócoli, Qiu y Shearer, 1993 y nueces de pistacho, Ghazanfari et al., 1997. Por esta razón en este trabajo se emplean técnicas de inteligencia artificial para la clasificación de los granos de café después de la recolección, para clasificarlos en las diferentes etapas de maduración.

Para realizar una clasificación correcta, se hizo el seguimiento de todo el proceso de maduración de los frutos, a lo largo de 8 semanas, iniciando cuando los frutos estaban verdes hasta cuando se encontraban sobremaduros y secos. Se caracterizaron once etapas diferentes, con base en la descripción del color, la forma y la textura de los frutos, a partir de sus imágenes. Los métodos de extracción de características aplicados permitieron generar un espacio de características de dimensión 208. En problemas de clasificación es conveniente reducir la dimensión del espacio de características, en este trabajo se logró disminuir la dimensión de 208 a 9 empleando dos métodos de selección, el índice de Fisher y el método de análisis multivariado. Para la clasificación se usaron dos algoritmos clásicos de reconocimiento de patrones, como son: el clasificador Bayesiano y las redes neuronales.

El artículo está organizado de la siguiente manera. La Sección 2 presenta los antecedentes orientados a la cosecha mecanizada. La Sección 3 describe el proceso de adquisición de las imágenes y el preproceso digital aplicado a ellas. En la Sección 4 se presentan las características empleadas para la clasificación, esta última se detallada en la Sección 5. Los resultados se muestran en la Sección 6, y finalmente, en la Sección 7 se concluye el trabajo.

 

ANTECEDENTES

El propósito de la cosecha mecanizada es la sustitución de la mano de obra, en operaciones elementales, por medio de máquinas diseñadas específicamente. Dichas máquinas están dotadas de ciertos captadores que, al obrar como órganos sensoriales del hombre, recogen información permitiéndoles ejecutar determinadas acciones de control o pasar de una operación a otra. Los trabajos de investigación que se han realizado a nivel mundial, relacionados con la utilización de visión artificial en procesos agrícolas se han enfocado en las etapas de recolección robotizada de cosechas, y en la clasificación de los productos.

Recolección robotizada. Los principales componentes de un robot recolector son: el sistema de visión (ej. cámaras de vídeo), la unidad de control (ej. microprocesador), el manipulador (ej. brazo robótico), el actuador (ej. tubo de succión y herramienta de corte) y el dispositivo de desplazamiento a través del cultivo, (Slaughter y Harrell, 1989). Un robot recolector de frutas para campo abierto es una máquina capaz de: identificar la ubicación de la fruta en la planta así como su forma, tamaño y color, desprender la fruta con precisión excluyendo objetos como hojas y ramas, adaptarse a movimientos de la fruta debidos al viento o a los desplazamientos del mismo actuador, así como mantener la estabilidad de toda la estructura.

La identificación visual automática en imágenes de campo es una operación compleja por las variaciones de iluminación, donde efectos de la luz del sol y la sombra de las ramas, pueden combinarse en una sola imagen, así como fondos oscuros y claros, (Recce et al., 1998). Por esta razón, muchos diseños se trabajan en ambientes bajo techo, por ejemplo en invernaderos (Kondo et al., 1996). Para las aplicaciones en las cuales el color de la fruta es diferente al de las hojas y ramas se utilizan cámaras a color, pero cuando la fruta es verde como el pepino o cuando son frutos no maduros se han utilizado cámaras infrarrojas. La ubicación de la fruta en el espacio tridimensional se hace con visión estéreo o con el método de tamaño de objeto diferencial el cual está basado en el principio de triangulación.

La recolección robotizada ha sido estudiada y probada en los años recientes y los resultados de estos estudios mostraron que a pesar del éxito obtenido se debía mejorar la etapa de detección y ubicación, así como el desprendimiento del fruto.

Clasificación de productos agrícolas. La clasificación manual es una tarea altamente subjetiva, sujeta al error humano y no siempre es consistente. Se ha probado que difícilmente coincide una estimación de calidad hecha por un humano al repetir una prueba, (Paulus, Busscher y Schrevens,  1997). Los costos de clasificación manual pueden ser altos, ya que se requiere un gran número de trabajadores para separar los productos que cumplen determinadas características. Los aparatos electromecánicos no son muy precisos y por su contacto directo con los productos pueden causar daño mecánico (Ghazanfari et al., 1997). En la clasificación electroóptica el número de categorías para la clasificación es reducido. Por ejemplo, un dispositivo electroóptico utilizado para clasificar nueces de pistacho puede separar con precisión en dos categorías: aceptado ó rechazado, sin embargo, en muchos procesos se necesita que el producto se pueda separar en más de dos clases, (Ghazanfari et al., 1997).

La clasificación que emplea técnicas de visión artificial se hace con base en el análisis de una imagen digital del producto, de cada una de estas imágenes se pueden extraer propiedades del producto tales como: la forma, el tamaño, el color, etc., (Granitto et al., 2002). La clasificación de productos por medio de visión artificial comprende los siguientes pasos: adquisición de las imágenes, segmentación de los objetos presentes en la imagen, extracción de las características de los objetos, interpretación de estas características y la subsiguiente asignación de los objetos a una clase.

En muchos procesos es preferible optar por un proceso de clasificación sencillo y eficiente, en lugar de realizar una recolección selectiva, ya que los costos de producción son menores y la tasa de cosecha es más alta. Como se indicó, los sistemas automáticos usando visión artificial han sido implementados con éxito en diferentes procesos productivos, algunos de los trabajos publicados que muestran resultados satisfactorios son: Kondo et al. (2000); Li, Wang y Gu (2002); Pydipati Burks y Lee (2006) y Kilic et al. (2007). También se han mencionado trabajos empleando diferentes técnicas de clasificación, y en algunos casos comparándolas entre ellas, en general los clasificadores basados en Redes Neuronales Artificiales han mostrado tener un buen desempeño, como se constata en Moshou et al. (2001); Steenhoek et al. (2001); Diaz et al. (2004) y Du y Sun (2006).

 

ADQUISICIÓN DE LAS IMÁGENES

Proceso de recolección de los frutos de caféLos frutos de café utilizados en la adquisición de las imágenes se obtuvieron en el marco del proyecto de investigación desarrollado por Cenicafé y la Universidad de Caldas, el cual buscaba la extracción de características físicas y químicas de los frutos de café en diferentes etapas de desarrollo (Marín et al., 2003).

La definición de la población objetivo de estudio se tomó con base en los siguientes criterios:

  • Altura de los cultivos: el estudio se llevó a cabo en las subestaciones de Cenicafé en Chinchiná, localizadas a tres alturas diferentes: zona alta (mayor de 1800 msnm), media (entre 1200 − 1600 msnm) y baja (menor de 1100 msnm).
  • Representatividad del cultivo: el cultivo en las tres zonas debe ser homogéneo en cuanto a variedad y condiciones de manejo. Además debe tener características propias de los cultivos tecnificados de la región.
  • Densidad: se deben tener altas densidades de siembra, como mínimo 5000 plantas y preferiblemente cercanas a las 10000 plantas por hectárea.
  • Variedad: café variedad Colombia - Cereza roja.
  • Edad: plantaciones que estén entre la segunda y la cuarta cosecha.
  • Sistema de cultivo: cafetales a libre exposición.
  • Manejo: plantaciones en buen estado, sin deficiencias nutricionales, que hayan recibido adecuado manejo fitosanitario y de arvenses.

Se seleccionó un lote compuesto por aproximadamente 7500 plantas establecidas a una distancia de 1 m por 1 m. A éstas plantas se les hizo un proceso conocido como raleo, debido a la característica de fructificación no uniforme. El raleo consiste en desprender todos los frutos de la planta dejando sólo las flores, de esta forma, se logra una floración homogénea garantizando que todos los frutos de la planta pertenecen al mismo estado de madurez. Cada semana, a partir de la semana 26 después de la floración y hasta la semana 33 (momento en el que se recolectaron frutos secos), se escogieron aleatoriamente 100 plantas. Es decir de las 7.500 plantas que componían el lote, se seleccionaron, aleatoriamente del lote, 800 plantas para el estudio a lo largo de las 8 semanas. De las 100 plantas seleccionadas cada semana se recogieron 200 frutos, 100 de los cuales fueron utilizados para este estudio, y por lo tanto se obtuvo de ellos una imagen digital.

Las imágenes se adquirieron el mismo día que se recogieron los frutos, para evitar cambios físicos en ellos. Como se mencionó anteriormente, este proceso se repitió semanalmente, durante 8 semanas, y cada semana se contó con 100 frutos por muestra. Con cada muestra se tomaron 300 imágenes. Debido a la forma como se desarrolla el café, las condiciones del terreno y atmosféricas, se presentaron cambios significativos en los frutos de café, en muy corto tiempo, por lo que en algunas semanas se cosecharon dos muestras, en la Tabla 1 se explica la relación entre las muestras y las semanas.

Tabla 1. Relación entre: las muestras, los estados de maduración, las semanas en frutos de café, variedad Colombia, cereza roja.

En la Figura 1 se presenta una imagen con el color para cada una de las once muestras o clases.


Figura 1.
Color de las once muestras o clases de frutos de café, variedad Colombia, cereza roja.

Sistema de adquisición de las imágenes. El sistema de adquisición implementado consta de una cámara de video a color (3 CCD), una tarjeta digitalizadora, un computador y dos lámparas de luz blanca. Las imágenes almacenadas son la vista superior de los frutos dispuestos individualmente sobre un fondo e iluminados con luz blanca difusa. Cada semana se utilizaron tres sistemas de adquisición diferentes, con cada uno se tomaron 100 imágenes, una imagen por fruto. Los sistemas de adquisición contienen los mismos elementos pero se modificó la iluminación cambiando la posición de las lámparas y el fondo. Para la iluminación, la luz de las lámparas no se orientó directamente sobre el fruto sino que se difuminó usando una sombrilla blanca en cada lámpara. A pesar de la sombrilla, el haz de luz incidía fuertemente sobre el fruto creando dos brillos polarizados. Se utilizó un filtro de papel pergamino entre la lámpara y la cámara para obtener imágenes con frutos sin mucho brillo, y con luz moderada y homogénea. Los tres fondos eran cartulinas de color blanco y azul en dos tonalidades, estos colores se escogieron para producir alto contraste entre el fruto y el fondo, y facilitar la segmentación. El número total de imágenes adquiridas para el estudio fue de 3 fotografías (3 cámaras) por 100 muestras por 11 clases para un total de 3300 imágenes. Las imágenes fueron almacenadas en formato BMP, con una resolución de 160 x 160 píxeles y 24 bits por píxel.

Etapa de adecuación de las imágenes. Las características externas, como son textura y color, se extrajeron con base en los datos de la imagen que corresponden al exterior del fruto. Ya que los frutos están centrados en la imagen, se tomó una matriz de 50 x 50 píxeles, a partir del centro de la imagen, de ésta forma se obtiene una porción del centro del fruto.

Las características de forma que son externas, se obtuvieron del contorno de cada fruto. Para esto se segmentó toda la región del fruto y se extrajo el contorno. En la segmentación se aplicó un filtro suavizante tipo mediana con una máscara de 7 x 7, luego se convirtieron las imágenes RGB a escala de grises. La conversión RGB a escala de grises se hizo eliminando la información de tono y saturación y tomando sólo el valor de luminancia.

En la imagen a escala de grises es más evidente el alto contraste entre el fondo y el fruto, por lo que se utilizó un algoritmo de umbralización para separarlos. El umbral es el valor promedio de las intensidades de los píxeles del fondo que se encuentran en la matriz de 10 x 10 de la esquina superior izquierda de la imagen en escala de grises. El algoritmo de umbralización presentó buen resultado, aunque en algunas imágenes los brillos en el fruto quedaron como píxeles del fondo. Para la obtención del contorno se utilizó el filtro Sobel.

Este trabajo se centró en  la clasificación de los frutos, por lo que el proceso de adquisición de las imágenes fue controlado, y sólo se fotografió un fruto por imagen. Sin embargo, para realizar la clasificación de los frutos a partir de imágenes con muchos granos y condiciones de iluminación menos controladas, se deben utilizar algoritmos de segmentación de los frutos como el presentado en Betancur, Prieto y Sorio (2006).

 

CARACTERIZACIÓN

Características. Para caracterizar los frutos de café se tomaron medidas de color, forma y textura. Las mismas se obtuvieron al aplicar cada uno de los métodos de extracción de características en las 3300 imágenes de frutos de café.

Características de color. El color es la principal característica para identificar la madurez en la variedad de café que se utilizó en este trabajo, como es la variedad Colombia cereza roja. La especificación cereza roja significa que cuando el fruto está maduro presenta un color rojo intenso homogéneo en toda la epidermis, existen otras variedades donde el color del fruto maduro no es rojo sino que puede ser amarillo o naranja. Para la variedad Colombia cereza roja utilizada en este trabajo, el color de la epidermis varía en la gama de los verdes para las primeras etapas, le siguen tonos naranjas y rosados hasta tomar el color rojo de la madurez, y cuando están sobremaduros el color llega a ser violeta oscuro.

Para la caracterización del color se usaron seis espacios de representación del color: RGB, HSI, YIQ, YCbCr, Colores oponentes, y Ohta. Cada uno de estos espacios describe el color usando tres componentes. Por lo tanto, para cada imagen de fruto de café se obtuvo un vector de tamaño 18, donde cada posición muestra la media estadística de cada componente para los diferentes espacios. En la Figura 2 se presenta una imagen con el color promedio en el espacio RGB para cada una de las once clases.


Figura 2.
Color promedio RGB de las once muestras o clases de frutos de café, variedad Colombia, cereza roja.

Características de textura. Usando características de textura se espera obtener descripciones de la suavidad, rugosidad y regularidad de una región. Un método de extracción de características de textura es el análisis estadístico usando la matriz de coocurrencia. La matriz de coocurrencia tiene información de la distribución de las intensidades de los píxeles dentro de la imagen y sus relaciones con el vecindario. En el proceso de maduración del café se tienen etapas donde un color se presenta de manera homogénea sobre toda la epidermis, mientras que en otras etapas hay una variación suave o brusca de diferentes colores. Las características de textura aplicadas a imágenes de café se enfocan en el análisis de la suavidad en la distribución de la intensidad de los colores para todas las etapas, así como el análisis de la rugosidad para las etapas finales cuando los frutos están demasiado maduros o secos.

La construcción de la matriz de coocurrencia se basa en la ubicación espacial de los píxeles, las relaciones con su vecindario y el valor de su intensidad, dependiendo de la condición, la dirección y la distancia. Condición: Es la regla que debe cumplir un determinado píxel para poder ser cuantificado, usualmente esta condición es tomada como la ubicación del píxel de determinada intensidad que se encuentra en la dirección del vecino. Dirección: Es la orientación espacial en la cual se evalúa la condición, como casos típicos se utilizan direcciones como 0 grados, 45 grados, 90 grados y 135 grados (González y Woods, 1996). Distancia: Es el número de píxeles que hay entre el par de píxeles evaluados, usualmente se utilizan 1, 3 y 5 píxeles de distancia. Se obtuvo una matriz de coocurrencia para cada una de las direcciones 0, 45, 90 y 135 grados, todos a una distancia fija de 1 píxel. La matriz final es la suma de las cuatro matrices de diferentes direcciones divida en cuatro. Con base en la matriz de coocurrencia se obtienen los descriptores de textura. Se extrajeron 11 descriptores: Entropía, Uniformidad, Contraste, Correlación, Momento de diferencia de orden k, Momento inverso de diferencia de orden k, Máxima probabilidad, Homogeneidad local, Varianza, Directividad y Tendencia de Cluster. Estas características se evaluaron en cada una de las componentes R, G y B, obteniéndose así 33 características.

Características de forma. La forma de los frutos de café variedad Colombia es elipsoidal-esférica, independiente de su estado de madurez. La forma elipsoidal se define con un centro y tres ejes de simetría, además todas las secciones planas de un elipsoide son elipses o círculos. En las primeras etapas la forma va variando de elipsoidal alargada, donde un eje de simetría es mucho mayor que los otros dos, a circular, donde los tres ejes son similares. En plena madurez, la forma es esférica es decir que los ejes de simetría son iguales. A medida que el fruto se sobremadura, la pulpa se va secando y la forma tiende otra vez a ser elipsoidal alargada. En una imagen de un fruto de café sólo se tiene información de una de las tres secciones de la elipsoide, con base en esta vista se obtienen dos de los tres ejes de simetría. En la Tabla 2, se presenta la lista de las 157 características de forma obtenidas. La descripción de estas características es explicada por González y Woods (1996).

Tabla 2. Características de forma en los frutos de café, variedad Colombia, cereza roja.

Normalización de las características. Los valores de las características extraídas manejan diferentes rangos dinámicos, si se realiza un proceso de clasificación utilizando las características en esta condición, las que tienen valores más grandes tendrán mayor influencia en la clasificación que aquellas con valores pequeños. Por lo anterior, se hace necesario realizar un proceso de normalización del rango de las características, para que los valores se mantengan dentro de un rango similar.

Existen dos técnicas para realizar esta normalización, una lineal y otra no lineal. La técnica lineal está basada en la estimación de la media y la varianza. Las características normalizadas con este método tienen media cero y varianza uno. Esta técnica es utilizada cuando los datos están distribuidos uniformemente alrededor de la media. En este caso la condición anterior no se cumple, por lo que se debe usar una técnica no lineal. La normalización no lineal se puede realizar utilizando la Ecuación  1,  donde   corresponde  a  la media de los valores de la  k-ésima  caracte rística y  es la respectiva varianza. El i-ésimo  valor normalizado , se relaciona de forma no lineal con la constante r, que para este caso se toma como 1. En la Ecuación 1. y es una variable auxiliar, utilizada para hallar el valor normalizado , en la segunda parte de la ecuación.

Selección de características. El número de características extraídas usualmente es muy grande, en este estudió fue de 208 para cada fruto. Uno de los problemas más comunes en el reconocimiento de patrones es la reducción de la dimensión del espacio característico. Hay varias razones para reducir el número de características. Primero, un gran número de características aumenta la complejidad computacional tanto en la etapa de caracterización como en la clasificación. En segundo lugar, muchas veces dos características pueden portar información adecuada para la clasificación cuando se utilizan por separado, pero si son altamente correlacionadas la ganancia es poca al utilizarlas en un mismo vector característico. Finalmente, la capacidad de generalización del clasificador se puede medir con la relación que existe entre el número de muestras y los parámetros del clasificador. El número de características es proporcional al número de parámetros del clasificador por ejemplo, los pesos sinápticos de una red neuronal o los pesos en un clasificador lineal.

La selección o reducción de características es el proceso mediante el cual se escogen las mejores características de un conjunto dado, de tal forma que se reduzca el número de características pero al mismo tiempo se conserve la información discriminante. Si se logra obtener un conjunto de características adecuado se simplifica el diseño del clasificador. Las mejores características deben proporcionar una gran distancia entre clases y una pequeña distancia intraclase en el espacio vectorial característico.

Relación discriminante de Fisher. El índice de Fisher cuantifica la capacidad de separabilidad de las características individuales. Para el caso de múltiples clases el índice de Fisher se expresa mediante la siguiente ecuación.

Aquí, µ y σ se refieren a la media y varianza correspondiente a la característica bajo investigación para las clases ωi y ωj, respectivamente. Las características con más alto índice de Fisher son más discriminantes que las que tienen menor índice.

Método multivariado. La selección usando el método multivariado se hace con base en la evaluación en conjunto de las características. Esta técnica comprende los siguientes pasos: MANOVA (Multivariate Analysis of Variables) y Decisión por Flujo de Conjunto Flotante; PCA (Principal Component Analysis); ANOVA (Analysis of Variables) y Análisis de Correlación, (Daza y Sánchez, 2004).

MANOVA. Es una técnica de análisis de varianza multivariado que selecciona las características discriminantes en conjunto y no en forma independiente. La idea es evitar la utilización de conjuntos de características que analizadas de forma univariada discriminen y en conjunto no lo hagan. El conjunto se empieza a conformar con la característica que separe mejor dos clases. Se va incrementando el tamaño del conjunto, adicionando la característica que mejore el desempeño. El conjunto sigue creciendo hasta que la adición de una característica no mejore o dañe el desempeño del conjunto. Para obtener el desempeño cada uno de los subconjuntos de características se evalúa usando el test de Wilks (MANOVA), se obtiene el F-stats y se estima la probabilidad acumulada de la distribución de Fisher. Se selecciona el subconjunto que ofrezca la mayor probabilidad acumulada y que exceda la probabilidad acumulada medida cuando no se había adicionado la última característica.

PCA. Al grupo seleccionado en el paso anterior se le aplica análisis de componentes principales enfocado a la minimización de la correlación entre componentes, pero no se realiza reducción del conjunto.

ANOVA. Se hace análisis univariado sobre las proyecciones PCA para reducir el espacio, pero la reducción se hace sobre un hiperespacio diferente al original.

Análisis de correlación. Como la reducción ANOVA se realizó en un espacio diferente al original, se analiza la correlación que existe entre las componentes principales seleccionadas con ANOVA y las características originales para escoger las características originales que están más correlacionadas con las proyecciones PCA seleccionadas por ANOVA. Las características originales escogidas se pasan por un clasificador lineal incrementando en uno el conjunto. Finalmente se toman las características que minimicen el error de clasificación.

Selección de características.  Se obtuvieron 18 características de color, 33 de textura y 157 de forma, es decir 208 características. Se inicia la selección con la eliminación de aquellas que son linealmente dependientes. Estas características son una combinación lineal de otra u otras y por tanto no ofrecen información adicional. Con este primer proceso de eliminación, el conjunto queda reducido a 171 características. Se utilizaron dos métodos de selección de características, el índice de Fisher y el método de análisis multivariado. El índice de Fisher mide la capacidad de discriminación de cada característica para todas las 11 clases. El análisis multivariado, entrega las características más discriminantes para dos clases. Es decir que el análisis se hace clase a clase, una clase con cada una de las clases restantes. En este caso que son 11 clases se obtienen 55 conjuntos de características uno para cada clase con cada una de las 10 clases restantes. Fisher hace análisis univariado, mide la discriminación de la característica independientemente, y el otro método es un análisis multivariado, donde se observan las características en conjunto. Es más confiable hacer el análisis multivariado, pero como son 11 clases se necesitarían 55 clasificadores biclase. Lo que aumentaría la complejidad del clasificador y el tiempo de ejecución. Por lo anterior se decidió utilizar el resultado de los dos métodos para escoger las características del clasificador final.

Comparación de los métodos de selección de características. Para evaluar la reducción de las características se toma el error de clasificación variando la dimensión del conjunto de características resultado de cada uno de los métodos. Se utiliza el mismo clasificador Bayesiano en las diferentes pruebas para comparar los resultados.

Fisher. En la Figura 3, se muestran los valores de los índices de Fisher para las 171 características. Es evidente que  unas  tienen alta información discriminante mientras que la mayoría no. Se organizaron las características de mayor a menor según el índice de Fisher, se observó que menos de la mitad tienen un índice representativo.


Figura 3.
Indice de Fisher para las características en frutos de café, variedad Colombia, cereza roja.

En la Figura 4(a) se presenta el error de clasificación al variar la dimensión del conjunto de características. Se incrementó la dimensión del conjunto de características en orden según el índice de Fisher, desde la más discriminante hasta evaluar el clasificador con todas las características. Con una característica el error está cerca al 55%, con nueve características  alcanza el 10%, entre 10 y 16 características se obtiene el menor error entre el 7 y el 10%. En la Figura 4(b) se muestra el tiempo requerido para la clasificación aumentando la dimensión del conjunto de características. Como es de esperarse, el tiempo requerido para la clasificación aumenta lentamente en forma exponencial a medida que se aumenta el tamaño del conjunto de características. Cuando se evalúa con todas las características se necesitan 3 segundos para la clasificación. En la Tabla 3 se enumeran las 20 mejores características según el índice de Fisher.


Figura 4.
Evaluación de las características en frutos de café variedad Colombia, cereza roja, según el índice de Fisher.

Tabla 3. Las mejores 20 características en frutos de café variedad Colombia, cereza roja, con base en el índice de Fisher.

Análisis multivariado. El método de análisis multivariado selecciona un conjunto de características adecuado para separar dos clases. Como son 11 clases, con el método multivariado se obtienen 55 grupos de características de diferentes tamaños, uno para cada clase con respecto a cada una de las otras 10 clases. En muchos casos una característica separa bien varias clases, es decir, aparece en varios grupos. Se ordenaron las características de tal forma que las primeras son las mejores de cada grupo y luego se van ubicando las otras sucesivamente hasta ordenar todas las características de todos lo grupos. El conjunto total de la selección usando el método multivariado comprende 54 características de las 171. En la Tabla 4 se listan las 20 mejores características  obtenidas con el método multivariado.

Tabla 4. Mejores 20 características en frutos de café variedad Colombia, cereza roja, según el análisis multivariado.

En la Figura 5(a) se muestra el error de clasificación obtenido al aumentar la dimensión del conjunto de características ordenadas. Con una característica se obtiene un error del 50%, con seis características se alcanza un error del 10%, con 11 características se logra el menor error de 7%. El tiempo de clasificación se presenta en la Figura 5(b). El tiempo presenta un crecimiento exponencial suave a medida que se incrementa la dimensión del espacio de características.


Figura 5.
Evaluación de las características en frutos de café, variedad Colombia, cereza roja, según el análisis multivariado.

Como se utilizaron dos métodos para la selección de características, uno univariado y otro multivariado, se tomó de cada método el conjunto de características  con el que se obtuvo el menor error de clasificación. Es decir, las primeras 16 características según el índice de Fisher y las 11 características del método multivariado. Luego, se compararon y se escogieron las características que aparecen en los dos conjuntos. El resultado de esta selección mostró que ocho características  aparecen tanto en la selección con Fisher como usando el método multivariado, estas características se presentan el la Tabla 5. Se adicionó la característica 171: Media componente I3 de OHTA, ya que esta característica, por su alto valor discriminante, mejora la clasificación. Por lo tanto, el espacio de características después del proceso de selección, es de dimensión 9.

Tabla 5. Características en frutos de café, variedad Colombia, cereza roja, seleccionadas con base en los dos métodos utilizados.

 

CLASIFICACIÓN

Para evaluar el poder discriminativo de las características seleccionadas en la etapa anterior, en el momento de asignar un fruto de café a un estado de madurez (clase), se implementó un clasificador bayesiano y un clasificador con redes neuronales artificiales.

Clasificador bayesiano. Este clasificador se fundamenta en la regla de Bayes del mínimo error, (Duda, Hart, y Stork, 1998). Un objeto, con unas características determinadas, pertenece a una clase si la probabilidad de pertenecer a ésta clase es mayor que la probabilidad de pertenecer a cualquier otra clase, como se muestra en la Ecuación (3).

donde W es el espacio de características, que está dividido en regiones Wi, i = 1, 2, ..., N donde N es el número de clases. P(wi) es la probabilidad a priori por la cual un objeto con características X, pertenece a la clase wi y p(m/wi) es la función de probabilidad condicional de la clase wi para X. En la práctica, las funciones de probabilidad no se conocen y por lo tanto se deben estimar. Para estimarlas, primero se asume la forma de la función de probabilidad, y luego se hallan sus parámetros a partir del conjunto de entrenamiento. Se supone que las funciones de probabilidad de las clases están descritas por distribuciones normales o gausianas como se muestra en la Ecuación (4).

donde d es la dimensión del vector de características, μi es el vector d-dimensional que contiene la media de las características en una clase wi y Ci es la matriz de covarianza. Para obtener p(X/wi), sólo se necesita reemplazar los parámetros μi, Ci. Estos parámetros y la probabilidad  a priori P(wi), se estiman a partir del  conjunto de muestras. En la Ecuación 4, T  indica que el vector es transpuesto.

Redes Neuronales como clasificadores de patronesEl clasificador que se implementó está conformado por once redes neuronales que clasifican las imágenes en cada uno de los grupos. Es decir, la salida es uno cuando la muestra corresponde a la clase y cero para las demás. Las once redes tienen igual estructura. Cada una de éstas es una red neuronal multicapa conformada de la siguiente manera: una capa de entrada con 4 neuronas, dos capas ocultas con 15 y 7 neuronas respectivamente, una capa de salida con una neurona. La entrada es el vector característico de cada imagen. Las funciones de transferencia son funciones sigmoidales. Se entrenó durante 300 iteraciones y se tomó como umbral del error 1 × 10−10. Se utilizó el algoritmo Backpropagation Levenberg y Marquardt para entrenar la red (Díaz y Figueredo, 2002). Este algoritmo utiliza técnicas numéricas para la optimización, minimiza la suma de los cuadrados del error, y actualiza los pesos de acuerdo a la Ecuación (5).

donde, J es la matriz Jacobiana que contiene las derivadas primeras de los errores de la red con respecto a los pesos y μ es un escalar que determina la velocidad de entrenamiento. Los demás parámetros se definen de igual manera que en las ecuaciones precedentes.

Evaluación. Para estimar el error de clasificación se utilizaron dos técnicas, el método Holdout y el método de validación cruzada (10-fold) (Moore 2001; Theodoridis y Koutroumbas, 1999). Para la estimación del error se usa el conjunto de muestras disponible, el cual se divide en el conjunto de entrenamiento y el de prueba. El clasificador se diseña usando las muestras de entrenamiento y luego se evalúa obteniendo el error de clasificación para las muestras de prueba. Con base en el error obtenido se puede predecir el desempeño del clasificador ante nuevas muestras. Para obtener una medida confiable del desempeño el conjunto de muestras debe ser lo suficientemente grande y, los conjuntos de entrenamiento y de prueba deben ser independientes.

Análisis de los resultados. La información de la prueba se dispone en una matriz de confusión. La matriz de confusión es una herramienta utilizada para la presentación y el análisis del resultado de una clasificación. Es una matriz cuadrada cuyo orden es el número de clases. En las columnas se presentan las clases reales mientras que en las filas, se presentan las clases asignadas por el clasificador. La suma vertical muestra la distribución real de las clases, mientras que la suma horizontal muestra la distribución de las clases producida por el clasificador. El análisis de los clasificadores se hace con base en la matriz de confusión de dónde se obtienen algunos indicadores de desempeño, como se describe a continuación.

  • Proporción de verdaderos positivos: PVP = VP/(VP+FN). (Efectividad).
  • Proporción de falsos negativos: PFN = FN/(VP+FN). (Error positivo).
  • Proporción de verdaderos negativos: PVN = VN/(VN+FP). (Especificidad).
  • Proporción de falsos positivos: PFP = FP/(VN+FP). (Error negativo).
  • Valor predictivo positivo: VPP = VP/(VP+FP). (Precisión).
  • Valor predictivo negativo: VPN = VN/(VN+FN) .

Curvas ROC. El espacio ROC (Receiver Operating Characteristic), define un sistema de coordenadas usadas para visualizar el desempeño del clasificador. Las curvas ROC presentan el compromiso entre efectividad y especificidad del clasificador, un aumento en la sensibilidad está acompañado por un decremento en la especificidad. Es decir, las curvas ROC muestran la relación entre las muestras clasificadas adecuadamente (PVP, Proporción de Verdaderos Positivos) y las muestras que no pertenecen a la clase pero se clasificaron como si lo fueran (PFP Proporción de Falsos Positivos). En el espacio ROC la PFP se dibuja como variable independiente y la PVP como variable dependiente. Cada clasificador es representado por el punto (PFP, PVP).

Para dibujar la curva ROC se construye la línea convexa formada por los puntos (PFP, PVP) de los clasificadores que se estén evaluando (PFP=1-PVN), junto con los puntos de los clasificadores triviales (0,0) y (1,1). La curva más cercana a los bordes izquierdo y superior en el espacio ROC, es la prueba más acertada porque significa que hay mayor acierto. La curva que más se acerque a la diagonal de 45 grados en el espacio ROC, es la prueba menos acertada. El mejor sistema de entrenamiento es el que produce un conjunto de clasificadores que maximice el área bajo la curva.

 

RESULTADOS

El conjunto total de muestras con el que se dispone está conformado por 300 muestras de cada una de las 11 clases, es decir 3300 muestras.

Resultados con el clasificador bayesiano. En la Tabla 6 se muestra la matriz de confusión para el mejor clasificador bayesiano al evaluar 100 imágenes. Como se puede ver, se obtiene una buena clasificación en las primeras etapas pero no tanto para las demás. En particular se tiene un alto error, casi del 10% en las etapas intermedias. Observando la Tabla 7, donde se muestran los parámetros de desempeño obtenidos con base en la matriz de confusión, se puede concluir que el clasificador bayesiano tiene efectividad por encima del 90% en todas las clases excepto en las clases 6 y 8. Pero tiene mejores resultados en cuanto a la especificidad ya que los valores superan el 98% en todas las clases. En cuanto al error, tiene menor error negativo que positivo. La precisión en la mayoría de las clases es del 100%, excepto en las clases 5, 6, 7 y 8 donde la precisión es cercana al 90%.

Tabla 6. Matriz de confusión. Clasificador bayesiano para frutos de café variedad Colombia, cereza roja.

Tabla 7. Indicadores de desempeño. Clasificador bayesiano para frutos de café variedad Colombia, cereza roja.

Resultados con el clasificador basado en redes neuronales. En la Tabla 8 se muestra la matriz de confusión para el mejor clasificador usando redes neuronales al evaluar 100 imágenes. Como se puede ver, se obtiene una buena clasificación en las primeras etapas pero no tanto para las demás. En particular se presenta un alto error en las etapas finales. Observando la Tabla 9, donde se muestran los parámetros de desempeño obtenidos con base en la matriz de confusión, se puede concluir que el clasificador usando redes neuronales tiene efectividad por encima del 90% en todas las clases excepto en las clases 7, 8 y 10, donde la efectividad es mucho menor, cercana al 80%. En cuanto a la especificidad tiene muy buen desempeño ya que los valores superan el 98% en todas las clases. Así como en el error bayesiano, tiene menor error negativo que positivo. En general el clasificador con redes tiene menor precisión que el clasificador bayesiano, ya que sus valores están cercanos al 90% en la mayoría de las etapas excepto en la etapa 7 y 8.

Tabla 8.  Matriz de confusión. Clasificador usando redes neuronales para frutos de café variedad Colombia, cereza roja.

Tabla 9: Indicadores de desempeño. Clasificador usando redes neuronales para frutos de café variedad Colombia, cereza roja.

Curvas ROC.  En la Figura 6, se graficaron las curvas ROC para las dos técnicas de clasificación empleadas. Como se explicó anteriormente, la mejor técnica de clasificación según el análisis con curvas ROC es la que tenga mayor área bajo la curva. Por lo tanto, el mejor clasificador es el Bayesiano, con un área de 0,9740, seguido muy de cerca por el clasificador usando redes neuronales, con un área de 0,9615.


Figura 6.
Curva ROC para los clasificadores empleados en frutos de café variedad Colombia, cereza roja.

El clasificador bayesiano tiene mejor desempeño según las dos técnicas utilizadas para la comparación de los clasificadores como son: índices de desempeño usando la matriz de confusión y las curvas ROC. Con base en los índices de desempeño obtenidos con la matriz de confusión el clasificador bayesiano presenta mayor efectividad, especificidad y precisión, además de menor error. Analizando los clasificadores con las curvas ROC, el clasificador bayesiano exhibe mayor compromiso entre efectividad y especificidad.

 

CONCLUSIONES

En este trabajo se presentó un estudio para la selección de las características más discriminantes en el proceso de clasificación de frutos de café según su estado de madurez. El conjunto de características se redujo de 208 a 9, con las cuales se obtuvo un alto desempeño de clasificación, cuando se emplearon dos técnicas de clasificación. Las características seleccionadas corresponden a 4 características de textura, 3 de color y 2 de forma.

Características como la textura y la forma de un fruto de café aportan poca información en la clasificación manual pero proporcionan medidas discriminantes en aplicaciones computacionales donde se pueden obtener valores exactos. Según la selección, las características de textura aportan mayor información discriminante que las de color, demostrando que para la separación lo mejor no es sólo el valor del color sino también su distribución en la superficie del fruto. Las características de forma seleccionadas contienen la información de baja frecuencia con la cual se reconoce el cambio en la redondez. La mejor característica de color corresponde a una componente del modelo de colores oponentes mostrando una mejor representación del color en otros modelos diferentes a los comúnmente utilizados RGB y HSI

Se obtuvo el menor error con el clasificador bayesiano, aproximadamente del 5%, pero requirió el mayor tiempo de clasificación, cerca de 5,5 ms. Con el clasificador usando redes neuronales aumentó el error de clasificación, aproximadamente al 7%, pero disminuyó el tiempo de clasificación a 0,8 ms.

En un sistema de visión artificial, la adquisición determina la sencillez o complejidad de las siguientes etapas, y por tanto define el logro de los objetivos. Si el sistema de visión artificial se basa en la extracción de las características externas del objeto, como son forma y tamaño, entonces durante la adquisición se deben evitar en la imagen dos defectos: las sombras y los brillos. Las sombras aparecen cuando hay una ubicación errónea de las fuentes de iluminación, o también resultan de una iluminación parcial producida por la escasez de fuentes de luz. Los brillos se presentan cuando la luz incidente sobre el objeto es muy directiva. Los dos defectos se evitan con la ubicación de mínimo cuatro fuentes de luz (una por cada punto cardinal), puestas a una distancia considerable y cuya luz emitida sea difuminada ya sea reflejándola sobre una superficie adecuada o retractándola al pasarla por un filtro. Si el interés del objeto de estudio está en sus características internas, como son color y textura, entonces se debe procurar mantener constantes la intensidad y el color de la iluminación, ya que el color que se percibe de un objeto es la parte de la luz incidente que el objeto no absorbe.

 

AGRADECIMIENTOS

Los autores agradecen a la Universidad Nacional de Colombia, quien a través de la Dirección de Investigaciones de Manizales, financió parcialmente este trabajo en el marco del proyecto titulado: “Desarrollo de algoritmos para la clasificación de café cereza en el proceso de beneficio empleando técnicas de visión artificial”.

 

BIBLIOGRAFÍA

Betancur, J., F. Prieto, y G. Sorio. 2006. Segmentación de frutos de café mediante métodos de crecimiento de regiones. Rev. Fac. Nal. Agr., Medellín. 59(1):3311-3333.         [ Links ]

Brosnan, T. and D.W. Sun. 2002. Inspection and grading of agricultural and food products by computer vision systems: a review. Comput. Electron. Agric. 36(2):193-213.        [ Links ]

Brosnan, T. and D.W. Sun. 2004. Improving quality inspection of food products by computer vision: a review. J. Food Eng. 61(1):3-16.         [ Links ]

Bulanon, D., T. Kataoka, Y. Ota, and T. Hiroma. 2001. A machine vision system for the apple harvesting robot. Agric Eng.Intl.: the CIGR J. Sci. Res. Dev. v.3.  11 p. (Manuscript PM 01 006).        [ Links ]

Daza, G. y L. Sanchez. 2004. PCA, KPCA y MANOVA sobre señales de voz en imágenes de posturas labiales y audio. Trabajo de grado, Facultad de Ingeniería y Arquitectura, Universidad Nacional de Colombia, Manizales. 78 p.        [ Links ]

Díaz C., R. and J. Figueredo B. 2002. Optimización del problema inverso en geofísica usando el algoritmo de entrenamiento de Levenberg - Marquardt. p. 4. En: Memorias  I  Simposio Colombiano de Sismología: avances de la sismología colombiana en los últimos 20 años. Universidad Nacional de Colombia. Departamento de Geociencias – Observatorio Sismológico de Quindío - INGEOMINAS, Bogotá.        [ Links ]

Diaz, R., L. Gil, C. Serrano, M. Blasco, E. Moltó and J. Blasco. 2004. Comparison of three algorithms in the classification of table olives by means of computer vision. J. Food Eng.  61(1):101–107.         [ Links ]

Du, C.J. and D.W. Sun. 2006. Learning techniques used in computer vision for food quality evaluation: a review. J. Food Eng. 72(1):39–55.         [ Links ]

Duda, R., P. Hart and D. Stork. 1998. Pattern classification. Wiley, New York.   654 p.        [ Links ]

Ghazanfari, A., J. Irudayaraj, A. Kusalik and M. Romaniuk. 1997. Machine vision grading of pistachio nuts using Fourier descriptors. J. Agric. Eng. Res. 68(3):247-252.         [ Links ]

Gonzalez, R. y R. Woods. 2002. Tratamiento digital de imágenes. Prentice-Hall, Upper Saddle River, EUA. 793 p.        [ Links ]

Granitto, P.M., H.D. Navone, P.F. Verdes and H.A. Ceccatto. 2002. Weed seeds identification by machine vision. Comput. Electron. Agric. 33:91-103.        [ Links ]

Guizard, C., J. Gravoueille and M. Crochon. 1998. Automating potato sorting system using color machine vision. p. 24-27. En: Memoires Sensoral 98 Colloque International sur les capteurs de la qualité des produits agroalimentaires. ENSAM-Cemagref-INRA, Montpellier, France.        [ Links ]

Hayashi, S., O. Sakaueand and T. Kanuma. 1997. Study on tomato harvesting robot. p. 351-364. En: Proceedings V International Symposium on Fruit, Nut and Vegetable Production Engineering. Department of Biological and Agricultural Engineering. University of California,Davis, California, USA.        [ Links ]

Kilic, K., I. Hakki, H. Koöksel and I. Küsmenoglu. 2007. A classification system for beans using computer vision system and artificial neural networks. J. Food Eng. 78(3):897-904.         [ Links ]

Kondo, N., Y. Nishitsuji, P. Ling and K. Ting. 1996. Visual feedback guided robotic cherry tomato harvesting. Trans. ASAE. 39(6): 2331-2338.         [ Links ]

Kondo, N., U. Ahmad, M. Monta and H. Murase. 2000. Machine vision based quality evaluation of Iyokan orange fruit using neural networks. Comp. Electron. Agric. 29(1):135-147.         [ Links ]

Li, Q., M. Wang and W. Gu. 2002. Computer vision based system for apple surface defect detection. Comp. Electron. Agric. 36(2):215-223.         [ Links ]

Marin, S., J. Arcila, E. Montoya y C. Oliveros. 2003. Cambios físicos y químicos durante la maduración del fruto de café (Coffea arabica L. var. Colombia). Rev. Cenicafé. 54(3):208-225.         [ Links ]

Molto, E., J. Blasco, V. Escuderos, J. García, R. Díaz, and M. Blasco. 1998. Automatic inspection of olives using computer vision. p. 221-229. En: Memoires Sensoral 98 Colloque international sur les capteurs de qualité des produits agroalimentaires. ENSAM – Cemagref - INRA, Montpellier, France        [ Links ]

Moore, A. 2001. Cross-validation for detecting and preventing overfitting. School of Computer Science Carneigie Mellon University. Web Tutorial. [Online]. En: http://www.cs.cmu.edu/.awm/tutorials/overfit09.pdf. Consulted: June 2007.        [ Links ]

Moshou, D., E. Vrindts, B. De Ketelaere, J. De Baerdemaeker and H. Ramon. 2001. A neural network based plant classifier. Comp. Electron. Agric. 31(1):5-16.         [ Links ]

Paulus, I., R. Busscher and E. Schrevens. 1997. Use of image analysis to human quality classification of aples. J. Agric. Eng. Res. 68(4):341-353.         [ Links ]

Pydipati, R., T.F. Burks and W.S. Lee. 2006. Identification of citrus disease using color texture features and discriminant analysis. Comp. Electron. Agric. 52(1-2):49-59.         [ Links ]

Qiu, W. and S. Shearer. 1993. Maturity assessment of broccoli using the discrete fourier transform. Tran. ASAE. 35(6):2057-2062.         [ Links ]

Recce, M., J. Taylor, A. Plebe and G. Tropiano. 1996. Vision and neural control for an orange harvesting robot.  p. 467-484. En: Proceedings International Workshop on Neural Networks for Identification, Control, Robotics, and Signal/Image. IEEE Computer Society Press, NICROSP'96, Venice, Italy.        [ Links ]

Slaughter, D. and R. Harrell. 1989. Discriminating fruit for robotic harvest using color in natural outdoor scenes. Trans. ASAE. 32(2):757–763.        [ Links ]

Steenhoek, L.W., M.K. Misra, C.R. Hurburgh Jr. and C.J. Bern. 2001. Implementing a computer vision system for corn kernel damage evaluation. Appl. Eng. Agric. Am. Soc. Agric. Eng.  17(2):235–240.         [ Links ]

Theodoridis, S. and K. Koutroumbas. 1999. Pattern recognition. Academic Press, New York. 690 p.        [ Links ]