SciELO - Scientific Electronic Library Online

 
vol.24 issue2Micropropagation protocol for Furcraea macrophylla BakerDetection of possible duplicates in Colombian Central Collection of potato Solanum tuberosum subspecies andigena using morphological characters author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Agronomía Colombiana

Print version ISSN 0120-9965

Agron. colomb. vol.24 no.2 Bogotá July/Dec. 2006

 

Confrontación entre un agrupamiento a priori de germoplasma de papa Solanum tuberosum subespecie andigena y un agrupamiento no jerárquico

 

Confrontation between an a priori clustering of potato germplasm Solanum tuberosum subspecies andigena vs. a non-hierarchic clustering

 

Ángela María Bernal1, Jorge Enrique Arias2, José Dilmer Moreno3, Iván Valbuena4 y Luis Ernesto Rodríguez5

1 Ingeniera agrónoma, Facultad de Agronomía, Universidad Nacional de Colombia, Bogotá.
e-mail: ambernalva@unal.edu.co

2 Ingeniero agrónomo, Facultad de Agronomía, Universidad Nacional de Colombia, Bogotá.
e-mail: jeariasr@unal.edu.co

3 Investigador, Corporación Colombiana de Investigación Agropecuaria (Corpoica), Centro de Investigación Tibaitatá, Mosquera (Colombia).
e-mail: jdmoreno@corpoica.org.co

4 Investigador, Corporación Colombiana de Investigación Agropecuaria (Corpoica), Centro de Investigación Tibaitatá, Mosquera (Colombia).
e-mail: ri.valbuena@yahoo.com

5 Profesor asociado, Facultad de Agronomía, Universidad Nacional de Colombia, Bogotá.
e-mail: lerodriguezmo@unal.edu.co

 


Resumen:

Con el fin de establecer patrones de similitud entre las accesiones para facilitar la identificación de cruzamientos potenciales, se realizó el agrupamiento a priori de la Colección Central Colombiana de papa subespecie andigena por características de color de piel y carne del tubérculo. La necesidad de incluir otras variables de tubérculo y realizar una clasificación basada en métodos estadísticos aumentó con el tiempo y con la evolución de las técnicas multivariadas de datos. En este trabajo se realizó el agrupamiento no jerárquico de la Colección, mediante un análisis de partición que utiliza el algoritmo de k-medias, luego de la caracterización morfológica de 435 accesiones sólo por características del tubérculo. Al comparar ambos agrupamientos se encontró la no correspondencia entre uno y otro, así como la necesidad de mejorar la objetividad en la caracterización de recursos genéticos. Las caracterizaciones tuvieron lugar en el Centro de Investigación Tibaitatá de la Corporación Colombiana de Investigación Agropecuaria (Corpoica), en Mosquera (Cundinamarca), donde se conserva la Colección Central Colombiana de papa.

Palabras claves adicionales: variabilidad genética, caracterización morfológica, método de partición.

 


Abstract:

In order to establish similarity patterns among accessions to facilitate the identification of potential crosses, it was made an a priori clustering of the potato Colombian Central Collection in subspecies andigena, by features of tuber skin color and primary meat color of tuber. The necessity of including other tuber variables and doing another classification based on statistic methods grew through time and with the progress of multivariate data techniques. In this work, a non-hierarchical clustering of the Collection was carried out by means of a Partition Analysis which uses the k-mean algorithm before the morphologic characterization of 435 accessions only by tuber features. When comparing both clusterings, it was found that there was no coincidence between them; it was necessary to improve the objectivity in genetic resource characterization. The characterizations were carried out in the Corpoica CI Tibaitatá (Mosquera, Cundinamarca), where is conserved the Colombian Central Collection of potato.

Additional key words: genetic variability, morphologic characterization, partition method.

 


Introducción

LA COLECCIÓN CENTRAL COLOMBIANA DE PAPA hace parte del Sistema nacional de bancos de germoplasma, a cargo de Corpoica; concentra gran parte de la variabilidad genética de la especie existente, no sólo en la región, sino a lo largo y ancho de una importante franja geográfica que abarca Centro y Sur América, desde México hasta Argentina. Fue establecida entre 1940 y 1948, a raíz de las expediciones pioneras del profesor Gregory Hawkes, quien logró la reunión de un acervo significativo de accesiones y de variedades locales y planteó la necesidad de conservar de forma apropiada este recurso tan importante e inexplorado (Corpoica, 2004).

Actualmente la colección se conserva bajo tres subsistemas (FAO/IPGRI, 1994): 1) en cavas de 4º y -20º C para semilla sexual y en las que reposan las colecciones activa y base, respectivamente; 2) en campo, con la siembra y manejo de ciclos repetidos de tubérculos-semilla, que son almacenados en bodegas de luz difusa a nivel de páramo (3.100 msnm) y 3) in vitro, como duplicado de seguridad o respaldo a la colección de campo, mediante el establecimiento de explantes en medios enriquecidos. De esta manera se ha consolidado todo un sistema de conservación de este recurso ex situ, con el que se pretende: resguardar la identidad genética del material, aislándolo de las fuerzas evolutivas; mantener la representatividad de su variabilidad, rescatándolo de la extinción de los hábitat y de su manejo inadecuado, y ponerlo a disposición de los programas regionales de mejoramiento genético de la especie (FAO, 1998; Rao y Riley, 1994).

Entre los objetivos principales de la caracterización de una colección, independientemente de su tamaño, están: (i) investigar la estructura genética, o sea, la composición de la colección, estudiada en términos de las relaciones o combinaciones que permiten agruparla en poblaciones identificables y (ii) identificar genes especiales o que se pueden expresar en caracteres visibles (morfológicos o de evaluación) en diferentes estados o combinaciones de estados. A estos genes generalmente se les denomina ‘stocks genéticos’ y son utilizados para investigaciones de aplicación práctica inmediata, como es el caso de resistencia a factores bióticos (Hidalgo, 2003).

Ochoa y Valbuena (1989) realizaron un agrupamiento a priori de la subespecie andigena con base en las características de color de piel y carne del tubérculo, para facilitar la identificación de cruzamientos potenciales y con el fin de establecer patrones de similitud entre las accesiones. Como resultado, las accesiones se discriminaron en 92 grupos. Sin embargo, la necesidad de verificar tal distribución a priori con una clasificación que integre todas las características del tubérculo se fue haciendo más importante a medida que las técnicas estadísticas multivariadas se refinaron y se hicieron más accesibles.

Los análisis de conglomerados ofrecen dos métodos de clasificación: uno jerárquico, cuyo objetivo es la identificación de un pequeño número de grupos, de talmanera que los elementos dentro de cada grupo sean similares (cercanos) respecto a sus variables y muy diferentes respecto de los que están en otro grupo (Díaz, 2002), y una clasificación no-jerárquica que, en lugar de construir un árbol de distancias, asigna los objetos en conglomerados o clases una vez el número de éstos ha sido especificado (Hair et al., 1998).

El objetivo de este trabajo fue confrontar el agrupamiento que resulta del análisis de partición, teniendo en cuenta todos los caracteres morfológicos del tubérculo, con el agrupamiento a priori de los materiales realizado por Ochoa y Valbuena en 1987.

Materiales y métodos

La caracterización morfológica se realizó durante 2004 en el Centro de Investigación Tibaitatá de Corpoica, en Mosquera (Cundinamarca), y se basó en los descriptores de papa propuestos por el Centro Internacional de la Papa (CIP, 1994). Se evaluaron los 10 caracteres cualitativos categóricos correspondientes a características del tubérculo (tabla 1), por ser los que menor influencia ambiental tienen (Vallejo y Estrada, 2002).

Se utilizaron 464 accesiones de la especie Solanum tuberosum ssp. andigena de la CCC conservadas ex situ. Por cada accesión se sembraron 10 plantas en surcos sencillos de 4,5 m de longitud. La información se tomó de 20 tubérculos por accesión y se registró la moda del carácter para cada variable.

La confrontación de ambos agrupamientos (a priori vs. estadístico) partió de la construcción de una matriz básica de datos para 435 accesiones –con información completa–, distribuidas en 81 de los grupos a priori. Con esta matriz, primero se realizó un análisis factorial de correspondencias múltiples (ACM) con el objeto de obtener las coordenadas métricas de cada accesión para un posterior análisis de conglomerados (AC). Una vez visualizado el dendograma, se procedió a dividir las accesiones en tantas clases como grupos formados a priori se tenían, es decir 81. El paquete estadístico utilizado fue SPAD versión 4.51, que utiliza el algoritmo de k-medias para el análisis de partición (AP) (Bécue y Valls, sf).

Los métodos de partición o no jerárquicos empiezan con una partición del conjunto de objetos en algún número específico de grupos; a cada uno de estos grupos se le calcula el centroide6; se ubica cada caso u objeto en el conglomerado cuyo centroide esté mas cercano a éste; se calcula el nuevo centroide de los conglomerados y se repite este procedimiento hasta que los casos resulten irremovibles (Díaz, 2002).

Cada clase obtenida del AP es definida en términos de frecuencia de ocurrencia (como porcentaje) de una modalidad dentro de la misma clase y frecuencia de ocurrencia (como porcentaje) de la modalidad en toda la muestra; así, se compararon las clases que presentaron todas las veces (100%) una misma modalidad para color primario de piel (CPPT) y color primario de carne del tubérculo (CPCT), dentro de cada clase, con los grupos a priori definidos por Ochoa y Valbuena (1989) según estas dos características (CPPT y CPCT), con el objeto de verificar su coincidencia.

Resultados y discusión

En la tabla 2 se encuentra la descripción en términos de frecuencia (%) de cada grupo a priori resultante del agrupamiento de la ssp. andigena realizado por Ochoa y Valbuena (1989), según características de color de piel y color primario de carne de tubérculo. En la tabla 3 se presentan las accesiones (Acc, cuatro dígitos) componentes de cada grupo a priori (Gr, dos dígitos) y la clase asignada (Clase, dos dígitos) en la nueva clasificación no jerárquica (k-medias). De esta forma, fue posible visualizar cómo se segregan los grupos a priori en diferentes clases (k-medias), dentro de cada grupo.

Tabla 2

La conformación de cada clase se presenta en el anexo 1 y la caracterización de cada clase en términos de la modalidad más frecuente dentro de la clase y la frecuencia de la modalidad en toda la muestra, en el anexo 2. Las tablas sólo registran las modalidades con las frecuencias más altas, y las modalidades que aparecen con frecuencia cero (0,00) nunca aparecieron en esa clase.

Anexo 1

Al seleccionar únicamente las clases que quedaron definidas en 100% por color primario de piel (CPPT) y color primario de carne de tubérculo (CPCT), se observa mejor el grado de coincidencia o de divergencia entre los dos agrupamientos. Resulta más objetivo comparar clases cuyo porcentaje de ocurrencia de una modalidad de CPPT o CPCT o ambos fue de 100% con grupos a priori formados por presentar, supuestamente, el mismo color de piel o color primario de carne de tubérculo. De esta manera se identificaron 33 clases, agrupadas según la modalidad de CPPT y/o CPCT que predominaba en cada una de ellas (tabla 4).

Cada conjunto de clases que presentó la misma modalidad en el 100% se cotejó con la información contenida en la tabla 2 para los grupos a priori correspondientes a las accesiones componentes de las clases dadas, observables en el anexo 1. Así, el grupo CPPT amarillo de la tabla 4 está conformado por las clases 1 y 9, para las que en el anexo 1 se observa que las accesiones que las integran se dispersan en varios de los grupos a priori, a saber: grupos 1, 3, 4, 13A, 31, 52A, 52B, 57, 65 y 80, que son examinados finalmente en la tabla 2, y se observa que tales accesiones, agrupadas por tener un CPPT amarillo, fueron calificadas en el agrupamiento a priori como tubérculos de color rosado, rosado crema, crema, rojo crema, púrpura crema, rojo y púrpura.

Al confrontar el agrupamiento hecho a priori (tabla 2) con el que ha resultado de la partición (k-medias) (anexo 1), es evidente la no concordancia entre uno y otro (tabla 3). Esto se puede explicar por el uso de descriptores diferentes en cada uno de los dos casos de caracterización, por el grado de subjetividad en la percepción de los caracteres y por el criterio seguido para el agrupamiento, que en el primer caso se basó en principios puramente empíricos, mientras que en este trabajo se basó en principios operacionales propios de los métodos estadísticos de partición.

Tabla 3

Sin embargo, esta diferenciación no insinúa la exclusión mutua de estos dos tipos de criterio, puesto que el conocimiento integral del material biológico muchas veces se complementa con los patrones definidos por las herramientas estadísticas. A diferencia de las técnicas jerárquicas, en las de partición no es definitiva la ubicación de un objeto en un grupo (Díaz, 2002). En efecto, Franco et al. (1997b) explican que entre las limitantes de los métodos no jerárquicos se encuentra la especificación, obligatoria, del número y la composición de los grupos previa al análisis y que, a partir de grupos a priori diferentes, se pueden originar diferentes soluciones.

Cualquiera que sea la clasificación conseguida, independientemente del método, no debe olvidarse que se trata de un ejercicio exploratorio de los datos, de manera que se debe tener precaución con la perpetuación o estatización en el tiempo, en el espacio o en la población de los grupos o clases conformados con una determinada metodología y sobre unos datos particulares (Díaz, 2002).

Como tales, los métodos de partición no se proponen reducir la cantidad de variables mediante combinaciones lineales, sino únicamente repartir los individuos en grupos que resultan bien definidos por las modalidades más frecuentes al interior de ellos; de esta manera, lo que el análisis arroja es una relación entre las modalidades y los grupos que definen, lejos de pretender inferencias con respecto a las variables. En este trabajo, cada clase quedó debidamente caracterizada con el porcentaje de aparición de las modalidades, tanto dentro de clases como en toda la muestra (anexo 2).

Anexo 2

Conclusiones

Entre el agrupamiento hecho a priori y el obtenido mediante la aplicación de la metodología de partición no jerárquica de las k-medias, no existió coincidencia alguna, en términos de comparación dentro de los grupos formados en cada caso, así como tampoco se evidenció ninguna correspondencia entre las características del tubérculo y algunas características de la parte aérea de la planta.

Con el presente trabajo se logró un agrupamiento sistemático de la colección y un avance significativo en el conocimiento de las relaciones genéticas de este acervo que, al integrarse con lo obtenido en trabajos anteriores, se constituye en una base importante en el proceso de mejoramiento de la especie en el país.

Adicionalmente, se presenta una propuesta metodológica estadística novedosa, de fácil utilización y completa, para la organización de colecciones núcleos de germoplasma.

Literatura citada

Bécue, M. y J. Valls. s.f. Manual de introducción a los métodos factoriales y clasificación con SPAD.         [ Links ] En: Universitat Autònoma de Barcelona, Servei d’Estadística. http://einstein.uab.es/_c_serv_estadistica/Manuals/manualSPAD.pdf; consulta: noviembre 2006.

Centro Internacional de la Papa [CIP]. 1994. Descriptores de la papa para caracterización básica de colecciones nacionales. Centro Internacional de la Papa (CIP), Lima, Perú.

Corporación Colombiana de Investigación Agropecuaria [Corpoica]. 2004. Informe anual 2003. Documento inédito. Programa de recursos genéticos y biotecnología vegetal, Corporación Colombiana de Investigación Agropecuaria (Corpoica).

Díaz, L.G. 2002. Estadística multivariada: inferencia y métodos. Facultad de Ciencias, Universidad Nacional de Colombia. 529 p.        [ Links ]

Franco, J., J. Crossa, J. Díaz, S. Taba, J. Villaseñor y S.A. Eberhart. 1997b. A sequential clustering strategy for classifying gene bank accessions. Crop Sci. 37, 1656-1662.        [ Links ]

Hair, J.F., R.E. Anderson, R.L. Tatham y W.C. Black. 1998. Multivariate data analysis. 5th edition. Prentice Hall, New Jersey. 730 p.        [ Links ]

Hidalgo, R. 2003. Variabilidad genética y caracterización de especies vegetales. pp. 2-26. En: Franco, T. y R. Hidalgo (eds.). Análisis estadístico de datos de caracterización morfológica de recursos fitogenéticos. Boletín técnico IPGRI No 8. International Plant Genetics Resources Institute (IPGRI). Cali, Colombia. 89 p.        [ Links ]

Ochoa, C. y Valbuena, I. 1989. Agrupamiento de la CCC ssp. andigena según características color de piel y color primario de carne de tubérculo. Documento inédito.

Organización de las Naciones Unidas para la Agricultura y la Alimentación [FAO]. 1998. Conservación ex situ. Organización de las Naciones Unidas para la Agricultura y la Alimentación (FAO), Roma. 16 p.

Organización de las Naciones Unidas para la Agricultura y la Alimentación [FAO] e International Plant Genetics Resources Institute [IPGRI]. 1994. Normas para bancos de genes. Dirección de producción y protección vegetal, Organización de las Naciones Unidas para la Agricultura y la Alimentación (FAO) e International Plant Genetics Resources Institute (IPGRI), Roma. 15 p.

Rao, R. y K.W. Riley. 1994. The use of biotechnology for conservation and utilization of plant genetic resources. Plant Genet. Resources Newsl. 97, 3-20.        [ Links ]

Vallejo, F.A. y E.I. Estrada. 2002. Mejoramiento genético de plantas. Universidad Nacional de Colombia, Palmira. 67 p.        [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License