<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0120-2812</journal-id>
<journal-title><![CDATA[Acta Agronómica]]></journal-title>
<abbrev-journal-title><![CDATA[Acta Agron.]]></abbrev-journal-title>
<issn>0120-2812</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0120-28122010000300002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Evidencias empíricas de regularidades estadísticas y leyes de potencia en los genomas de Arabidopsis thaliana, Oriza sativa y Mus musculus]]></article-title>
<article-title xml:lang="en"><![CDATA[Empirical evidences of statistical regularities and power laws in the genomes of Arabidopsis thaliana, Oriza sativa and Mus musculus]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Almanza P.]]></surname>
<given-names><![CDATA[Martha I]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[López-López]]></surname>
<given-names><![CDATA[Karina]]></given-names>
</name>
<xref ref-type="aff" rid="A04"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Moreno]]></surname>
<given-names><![CDATA[Pedro A]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Téllez T.]]></surname>
<given-names><![CDATA[Carlos E]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional de Colombia, sede Palmira  ]]></institution>
<addr-line><![CDATA[ Valle del Cauca]]></addr-line>
</aff>
<aff id="A04">
<institution><![CDATA[,Universidad Nacional de Colombia, sede Palmira  ]]></institution>
<addr-line><![CDATA[ Valle del Cauca]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad del Valle  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad del Cauca  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>07</month>
<year>2010</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>07</month>
<year>2010</year>
</pub-date>
<volume>59</volume>
<numero>3</numero>
<fpage>257</fpage>
<lpage>272</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0120-28122010000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0120-28122010000300002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0120-28122010000300002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La masiva cantidad de datos biológicos provenientes de las disciplinas "ómicas" y su aprovechamiento en el mejoramiento genético vegetal requiere de nuevos abordajes teóricos y estadísticos que describan de forma satisfactoria principios generales en los genomas. El total de secuencias de los genes de los genomas vegetales de Arabidopsis thaliana y Oriza sativa y del genoma animal Mus musculus fueron extraídas y depuradas de la base de datos pública del Genebank mediante el diseño de algoritmos en lenguaje de programación Python. Se analizaron las distribuciones de las variables frecuencia de uso y tamaño de los genes, exones e intrones por cromosoma y entre genomas. Los resultados señalaron que las variables presentan patrones de comportamiento no lineales en forma de ley de potencia que difieren estadísticamente entre los genomas pero no entre los cromosomas de un mismo genoma. Además, el análisis aportó evidencias respecto al tamaño promedio constante de las secuencias de exones y de los genes simples por cromosoma y entre genomas. Los hallazgos sugieren: primero, que el genoma se auto-organiza de la misma manera en los cromosomas independientemente del tamaño o número de genes que estos contengan, y, segundo, que tanto los cromosomas como sus elementos constituyentes: genes, exones e intrones han evolucionado conjuntamente. El estudio señala que las leyes de potencia cumplen un papel amortiguador en las leyes de variación biológica y proporcionan medidas cuantitativas de la organización de las secuencias de ADN que definen la identidad de un genoma. La regularidad estadística de estas medidas genéticas tiene potenciales aplicaciones en el incremento del valor predictivo de los actuales modelos de mejoramiento genético vegetal.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The huge quantity of biological data arising from the omics disciplines and their benefit in plant breeding require of new theoretical and statistical approaches in order to get a satisfactory description of the genomes general principles. The total number of sequences in the genes of A. thaliana and O. sativa plant genomes and in M. musculus animal genome was obtained from the public data base of the Genebank through algoritms designed in Python programming language. The variables distribution use frequency and gene size, exons and intrones per chromosome and among genomes were analyzed. The results indicated that variable distribution show non lineal patterns of behavior in a power law form, which are statistically different among genomes but no among the chromosomes of the same genome. In the same manner the analysis gave evidences about the constant mean size of the exons sequences and the single genes per chromosome and among genomes. These findings suggest that, first, the genome is self-organized in the same way in the chromosomes independently of the size or the number of genes being contained; second, so the chromosomes as their constituent elements: genes, exones and intrones, have evolved all together. The study points out that the power laws have a buffer roll in the biological variation laws and provide DNA sequences organization quantitative measurements which are defining the identity of the genome. The statistical regularity of these genetic measurements has potential applications in the predicted value increase of the actual models of genetic plant breeding.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Genómica]]></kwd>
<kwd lng="es"><![CDATA[leyes de potencia]]></kwd>
<kwd lng="es"><![CDATA[Arabidopsis thaliana]]></kwd>
<kwd lng="es"><![CDATA[Oriza sativa]]></kwd>
<kwd lng="es"><![CDATA[Mus musculus]]></kwd>
<kwd lng="en"><![CDATA[Genomics]]></kwd>
<kwd lng="en"><![CDATA[Power law]]></kwd>
<kwd lng="en"><![CDATA[Arabidopsis thaliana]]></kwd>
<kwd lng="en"><![CDATA[Oriza sativa]]></kwd>
<kwd lng="en"><![CDATA[Mus musculus]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">     <p><b>    <center><font face="verdana" size="4">Evidencias emp&iacute;ricas de regularidades estad&iacute;sticas y leyes de potencia en los genomas de <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i> y <i>Mus musculus</i></font></center></b></p>     <p><b>    <center><font face="verdana" size="3">Empirical evidences of statistical regularities and power laws in the genomes of <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i> and <i>Mus musculus</i></font></center></b></p>     <p><i>    <center>Martha I. Almanza P.<sup>1</sup>, Karina L&oacute;pez-L&oacute;pez<sup>2</sup>, Pedro A. Moreno<sup>3</sup>, Carlos E. T&eacute;llez T.<sup>4</sup></center></i></p>     <p><sup>1</sup>1Bi&oacute;loga, M.Sc., Candidata a Ph.D. en Ciencias Agropecuarias, Universidad Nacional de Colombia, sede Palmira. A.A. 237. Valle del Cauca. Docente Universidad del Cauca.<a href="mailto:mialmanzap@palmira.unal.edu.co">mialmanzap@palmira.unal.edu.co</a>.  <sup>2</sup> Ingeniera Bioqu&iacute;mica. Ph.D. en Biotecnolog&iacute;a de Plantas. Docente Universidad Nacional de Colombia, sede Palmira. A.A. 237. Valle del Cauca. Autor para correspondencia.<a href="mailto:klopezl@palmira.unal.edu.co">klopezl@palmira.unal.edu.co</a>. <sup>3</sup> Bi&oacute;logo. Ph.D. en Biolog&iacute;a. Docente Universidad del Valle. <a href="mailto:pedro.moreno@univalle.edu.co">pedro.moreno@univalle.edu.co</a> <sup>4</sup>Ingeniero de Sistemas. Universidad del Cauca. <a href="mailto:ctellez@unicauca.edu.co">ctellez@unicauca.edu.co</a></p>     <p>    <center>Recibido.: 23-01-2010 Aceptado.: 02-06-2010</center></p> <hr size="1">     ]]></body>
<body><![CDATA[<p><b>    <center>Resumen</center></b></p>     <p>La masiva cantidad de datos biol&oacute;gicos provenientes de las disciplinas “&oacute;micas” y su aprovechamiento en el mejoramiento gen&eacute;tico vegetal requiere de nuevos abordajes te&oacute;ricos y estad&iacute;sticos que describan de forma satisfactoria principios generales en los genomas. El total de secuencias de los genes de los genomas vegetales de <i>Arabidopsis thaliana</i> y <i>Oriza sativa</i> y del genoma animal <i>Mus musculus</i> fueron extra&iacute;das y depuradas de la base de datos p&uacute;blica del Genebank mediante el dise&ntilde;o de algoritmos en lenguaje de programaci&oacute;n Python. Se analizaron las distribuciones de las variables frecuencia de uso y tama&ntilde;o de los genes, exones e intrones por cromosoma y entre genomas. Los resultados se&ntilde;alaron que las variables presentan patrones de comportamiento no lineales en forma de ley de potencia que difieren estad&iacute;sticamente entre los genomas pero no entre los cromosomas de un mismo genoma. Adem&aacute;s, el an&aacute;lisis aport&oacute; evidencias respecto al tama&ntilde;o promedio constante de las secuencias de exones y de los genes simples por cromosoma y entre genomas. Los hallazgos sugieren: primero, que el genoma se auto-organiza de la misma manera en los cromosomas independientemente del tama&ntilde;o o n&uacute;mero de genes que estos contengan, y, segundo, que tanto los cromosomas como sus elementos constituyentes: genes, exones e intrones han evolucionado conjuntamente. El estudio se&ntilde;ala que las leyes de potencia cumplen un papel amortiguador en las leyes de variaci&oacute;n biol&oacute;gica y proporcionan medidas cuantitativas de la organizaci&oacute;n de las secuencias de ADN que definen la identidad de un genoma. La regularidad estad&iacute;stica de estas medidas gen&eacute;ticas tiene potenciales aplicaciones en el incremento del valor predictivo de los actuales modelos de mejoramiento gen&eacute;tico vegetal.</p>     <p><b>Palabra clave:</b> Gen&oacute;mica, leyes de potencia, <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i>, <i>Mus musculus</i>.</p> <hr size="1">     <p>    <center><b>Abstract</b></center></p>     <p>The huge quantity of biological data arising from the omics disciplines and their benefit in plant breeding require of new theoretical and statistical approaches in order to get a satisfactory description of the genomes general principles. The total number of sequences in the genes of <i>A. thaliana</i> and <i>O. sativa</i> plant genomes and in <i>M. musculus</i> animal genome was obtained from the public data base of the Genebank through algoritms designed in Python programming language. The variables distribution use frequency and gene size, exons and intrones per chromosome and among genomes were analyzed. The results indicated that variable distribution show non lineal patterns of behavior in a power law form, which are statistically different among genomes but no among the chromosomes of the same genome. In the same manner the analysis gave evidences about the constant mean size of the exons sequences and the single genes per chromosome and among genomes. These findings suggest that, first, the genome is self-organized in the same way in the chromosomes independently of the size or the number of genes being contained; second, so the chromosomes as their constituent elements: genes, exones and intrones, have evolved all together. The study points out that the power laws have a buffer roll in the biological variation laws and provide DNA sequences organization quantitative measurements which are defining the identity of the genome. The statistical regularity of these genetic measurements has potential applications in the predicted value increase of the actual models of genetic plant breeding. </p>     <p><b>Key words:</b> Genomics, Power law, <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i>, <i>Mus musculus</i></p> <hr size="1">     <p><b>    <center><font face="verdana" size="3">Introducci&oacute;n</font></center></b></p>     ]]></body>
<body><![CDATA[<p>Los mayores avances en el mejoramiento gen&eacute;tico vegetal del siglo XXI se dar&aacute;n cuando se comprenda c&oacute;mo extraer informaci&oacute;n de la ingente cantidad de datos biol&oacute;gicos postgen&oacute;micos provenientes de la aplicaci&oacute;n de las nuevas tecnolog&iacute;as –masivas, automatizables y cada vez menos costosas– de la biolog&iacute;a molecular. Mientras las secuencias de genes y genomas disponibles en las bases de datos crecen exponencialmente, la comprensi&oacute;n de la funci&oacute;n de los genes lo hace linealmente. El reto principal del an&aacute;lisis de datos es encontrar regularidades estad&iacute;sticas o patrones estructurales de organizaci&oacute;n y de funci&oacute;n en los genomas, independientemente de que estos sean de vegetales o animales, procariotas o eucariotas o provengan de poblaciones, ecosistemas o metagenomas.</p>     <p>La detecci&oacute;n de patrones forma parte del paradigma de las nuevas disciplinas denominadas ‘&oacute;micas’ y de la teor&iacute;a de sistemas esbozada a mediados del siglo XX que en la &eacute;poca actual se presenta en los art&iacute;culos cient&iacute;ficos como <i>System Biology</i> o <i>Network Biology</i>, t&eacute;rminos en ingl&eacute;s que a&uacute;n no tienen un consenso de c&oacute;mo deben ser traducidos al espa&ntilde;ol. La idea fundamental es que a trav&eacute;s del descubrimiento de regularidades y principios en el dise&ntilde;o de los componentes de los sistemas biol&oacute;gicos, y de la comprensi&oacute;n cuantitativa de su funcionamiento por medio del modelamiento y la simulaci&oacute;n, es posible elucidar funciones biol&oacute;gicas y predecir c&oacute;mo cambian frente a perturbaciones end&oacute;genas y ex&oacute;genas para, finalmente, desarrollar experimentos precisos y efectivos para el mejoramiento de caracter&iacute;sticas de inter&eacute;s en los seres vivos (Barreto, 2008).</p>     <p>Los estudios de los genomas eucariotas secuenciados hasta el momento se&ntilde;alan dos aspectos importantes: el primero, la existencia de una intricada irregularidad topol&oacute;gica en la distribuci&oacute;n de las secuencias codificantes y no-codificantes a lo largo de los cromosomas y en el contenido informacional de estas cuyo significado biol&oacute;gico a&uacute;n dista de ser entendido por completo; y el segundo, la necesidad de cambiar de mentalidad y de herramientas inform&aacute;ticas para el tratamiento de datos biol&oacute;gicos a escala gen&oacute;mica. Estos aspectos son a&uacute;n m&aacute;s cr&iacute;ticos en genomas vegetales, en donde se aplican enfoques, recursos e infraestructura desarrollados para el genoma humano y para otros genomas eucariotas y procariotas, y no se consideran las caracter&iacute;sticas particulares de &eacute;stos, tales como alta plasticidad gen&eacute;tica, metabolismo secundario complejo y su papel como cultivos.</p>     <p>Por otra parte, seg&uacute;n Barreto (2008) en Colombia existen grupos con buen dominio en biolog&iacute;a molecular pero muy pocos en gen&oacute;mica. Siendo esta &uacute;ltima fundamental para tamizar e identificar genes y encontrar soluciones pr&aacute;cticas para el mejoramiento gen&eacute;tico de cultivos comerciales y el desarrollo de servicios de diagn&oacute;stico de enfermedades y control de calidad de los cultivos vegetales y crianza de animales.</p>     <p>Los estudios comparativos y exhaustivos de los genomas de organismos modelo son la base te&oacute;rica de las herramientas de an&aacute;lisis de la gen&oacute;mica, disciplina centrada en el estudio de la secuencia, la estructura y funci&oacute;n del genoma. La idea subyacente de la gen&oacute;mica comparativa es que lo que es cierto para una especie es cierto para todas o al menos para muchas otras. Adem&aacute;s, cuanta m&aacute;s informaci&oacute;n se tiene de un organismo m&aacute;s f&aacute;cil es estudiarlo a otros niveles. La importancia del estudio de estos organismos radica en entender no s&oacute;lo c&oacute;mo funcionan en particular, sino en extrapolar los resultados obtenidos a un modelo general.</p>     <p>Las regularidades estad&iacute;sticas o patrones se reconocen s&oacute;lo cuando los sucesos se estudian en diversos organismos, los cuales operan de forma diferente pero mostrando caracter&iacute;sticas comunes. El estudio comparativo de organismos modelo alejados filogen&eacute;ticamente permite identificar caracter&iacute;sticas esenciales evolutivamente conservadas a trav&eacute;s de las especies, mientras que el estudio de organismos cercanos permite la comparaci&oacute;n y descripci&oacute;n detallada de caracter&iacute;sticas espec&iacute;ficas o variables de la especie (Simpson, 2002). <i>Arabidopsis thaliana</i> y <i>O. sativa</i> son las dos &uacute;nicas plantas modelo actualmente secuenciadas y con anotaciones disponibles en las bases de datos p&uacute;blicas, mientras que el genoma del rat&oacute;n <i>M. musculus</i> es el organismo modelo de los animales incluyendo el genoma humano, particularmente porque junto con <i>Drosophila melanogaster</i> son los organismos de los cuales se dispone de gran cantidad de informaci&oacute;n con verificaci&oacute;n experimental en diferentes niveles de an&aacute;lisis.</p>     <p>El objetivo general del estudio es proponer nuevos abordajes te&oacute;ricos estad&iacute;sticos que describan de forma satisfactoria caracter&iacute;sticas estad&iacute;sticas generales en los genomas. El objetivo espec&iacute;fico del estudio es discernir estad&iacute;stica y biol&oacute;gicamente las variables frecuencia de uso y longitud de los genes y sus componentes (exones e intrones) en cromosomas y genomas. La estrategia consisti&oacute; en resumir los datos en t&eacute;rminos de las medidas de tendencia central (posici&oacute;n y dispersi&oacute;n) y analizar si se ajustaban a una funci&oacute;n de distribuci&oacute;n de probabilidad conocida.</p>     <p><b>    <center><font face="verdana" size="3">Materiales y m&eacute;todos</font></center></b></p>     <p><b>Los datos</b>. Las secuencias completas de los genes con sus respectivas secuencias de exones e intrones por cromosoma de los genomas vegetales de <i>Arabidopsis thaliana</i> y <i>Oryza sativa</i> (arroz) y el genoma animal de <i>Mus musculus</i> (rat&oacute;n) fueron obtenidas directamente de los archivos en formato gbk disponibles v&iacute;a ftp en la base de datos p&uacute;blica Genebank perteneciente al Centro Nacional de Informaci&oacute;n Biotecnol&oacute;gica NCBI (<a href="http://ftp.ncbi.nih.gov/genomes/" target="_blank"> http://ftp.ncbi.nih.gov/genomes/</a>) en marzo del 2009.</p>      ]]></body>
<body><![CDATA[<p>Con el lenguaje de programaci&oacute;n Python se desarrollaron algoritmos para extraer y depurar las secuencias de ADN del formato gbk a un formato Fasta. Todo el estudio se realiz&oacute; en un ambiente Linux. La informaci&oacute;n se organiz&oacute; en tres archivos Fasta por cromosoma (secuencias de genes, exones e intrones) para facilitar el manejo de la informaci&oacute;n de las secuencias y alcanzar mayor rapidez de procesamiento. Los genes que conten&iacute;an nucle&oacute;tidos desconocidos (representados por la letra N) en sus secuencias o con longitudes menores de 20 nucle&oacute;tidos fueron excluidos del estudio. El estudio consider&oacute; todos los genes de los cromosomas de los genomas vegetales (<i>A. thaliana</i>: 2n = 10; <i>O. sativa</i>: 2n = 24) y solamente los 19 cromosomas autos&oacute;micos de <i>M. musculus</i>: 2n = 42.</p>     <p>El genoma de <i>M. musculus</i> fue el genoma de referencia para validar la estrategia de an&aacute;lisis estad&iacute;stico debido a que la informaci&oacute;n biol&oacute;gica de una buena cantidad de sus secuencias ha sido obtenida experimentalmente (Mouse Genome Sequencing Consortium, 2002; 2009). Los cromosomas sexuales fueron excluidos porque presentan caracter&iacute;sticas estructurales, gen&eacute;ticas y anat&oacute;micas particulares que podr&iacute;an ocasionar sesgos estad&iacute;sticos (Gu et al., 2000). Los genes extra&iacute;dos por genoma del total registrado en la base de datos p&uacute;blica fue de 81.59%, 94.81% y 95.53% para <i>M. musculus</i>, <i>A. thaliana</i> y <i>O. sativa</i>, respectivamente.</p>     <p><b>Las variables</b> analizadas fueron cantidad de secuencias (genes, exones e intrones) y tama&ntilde;o o longitud (total de nucle&oacute;tidos) de estas, por cromosoma y por genoma. El an&aacute;lisis estad&iacute;stico se realiz&oacute; en dos etapas: la primera, consisti&oacute; en analizar las variables en t&eacute;rminos de totales, promedios y porcentajes, y la segunda etapa, en analizar la estructura de distribuci&oacute;n de las variables por conjunto de secuencias, por cromosoma y por genoma mediante la construcci&oacute;n de histogramas de frecuencias. En todos los casos, las transformaciones de las distribuciones fueron hechas con logaritmo com&uacute;n, las ecuaciones de regresi&oacute;n se obtuvieron por el m&eacute;todo de m&iacute;nimos cuadrados, la medida de ajuste de las rectas de regresi&oacute;n se determin&oacute; mediante el coeficiente de determinaci&oacute;n (R<sup>2</sup>) y la significancia estad&iacute;stica de las pruebas fue p &lt; 0.05.</p>     <p>Los conteos por gen fueron: longitud del gen, longitud de cada ex&oacute;n e intr&oacute;n, n&uacute;mero de exones e intrones y longitud total de los exones e intrones, mientras que los conteos por cromosoma y por genoma, fueron: longitud total de los genes, exones e intrones y cantidad de genes, exones e intrones. </p>     <p><b>    <center><font face="verdana" size="3">Resultados y discusi&oacute;n</font></center></b></p>     <p>Este estudio muestra que aunque la longitud total de los genes en cada genoma vegetal es aproximadamente 90% m&aacute;s peque&ntilde;a que la del genoma animal de <i>M. musculus</i>, los tres genomas presentan regularidades estad&iacute;sticas entre los cromosomas de un mismo genoma y entre genomas. Regularidades estad&iacute;sticas que en su mayor&iacute;a no hab&iacute;an sido detectadas en genomas vegetales. El Cuadro 1 indica que la longitud total de los genes de <i>A. thaliana</i> y <i>O. sativa</i> equivale al 8.3% (67.953.362 nucle&oacute;tidos) y 11.1% (90.892.843 nucle&oacute;tidos), respectivamente, de la longitud total de los genes (819.954.023 nucle&oacute;tidos) de <i>M. musculus</i>, y adem&aacute;s, los tres genomas contienen relativamente el mismo n&uacute;mero de genes. Las evidencias moleculares soportan la explicaci&oacute;n que el incremento de tama&ntilde;o de los genomas de las especies superiores est&aacute; asociado a procesos de poliploid&iacute;a pleiotrop&iacute;a y epig&eacute;nesis. Estos procesos constituyen fuerzas evolutivas cruciales en la regulaci&oacute;n g&eacute;nica, ya que una vez que los genomas poseen mayor tama&ntilde;o, la aparici&oacute;n de nuevos fenotipos resultar&iacute;a de la alteraci&oacute;n de los mecanismos de control de la maquinaria gen&eacute;tica preexistente y no de la formaci&oacute;n <i>de novo</i> de nuevos genes (Otto y Whitton, 2000; Rakyan et al., 2001; Osborn et al., 2003; Rodin y Rigs, 2003). Las investigaciones en evoluci&oacute;n g&eacute;nica se&ntilde;alan que el 70% de las angiospermas han tenido al menos una ronda de duplicaci&oacute;n total del genoma mientras que en los vertebrados se han propuesto por lo menos dos rondas de duplicaci&oacute;n gen&oacute;mica para explicar la redundancia g&eacute;nica existente en los mam&iacute;feros (Mable, 2003; Gallardo et al., 2003; Furlong y Holland, 2004; Comai, 2005).</p>     <p>La proporci&oacute;n de nucle&oacute;tidos pertenecientes a secuencias de exones e intrones difiere notablemente entre los genomas. El genoma de <i>A. thaliana</i> es el que contiene la mayor proporci&oacute;n de nucle&oacute;tidos asociados a secuencias de exones. Obs&eacute;rvese en el <a href="img/revistas/acag/v59n3/v59n3a02t1.jpg" target="_blank">Cuadro 1</a> que en el genoma de <i>A. thaliana</i>, el 72.2% de nucle&oacute;tidos (49.086.976 nucle&oacute;tidos) pertenecen a secuencias de exones, mientras que el 27.8% (18.866.386 nucle&oacute;tidos) pertenecen a secuencias de intrones. En contraste, estos porcentajes en <i>O. sativa</i> fueron cercanos al 50% (48.4% y 51.6% de nucle&oacute;tidos relacionados con secuencias de exones y de intrones, respectivamente) y en <i>M. musculus</i>, menos del 7% de nucle&oacute;tidos de la regi&oacute;n g&eacute;nica estaban asociados a secuencias de exones (6.9% y 93.1% de nucle&oacute;tidos relacionados con secuencias de exones y de intrones, respectivamente). Los porcentajes mencionados para el genoma de <i>M. musculus</i> concuerdan con las afirmaciones de Rogic et al. (2008), Taft y Mattick (2003) y Mattick (2004) respecto al predominio del ADN nocodificante en las especies m&aacute;s evolucionadas. Estos investigadores argumentan que la gran cantidad de nucle&oacute;tidos asociados a secuencias de intrones en genomas superiores es debida al rol que tienen los intrones como mecanismo paralelo de control de la expresi&oacute;n gen&eacute;tica. La existencia de intrones en el genoma pareciera facilitar la fusi&oacute;n, duplicaci&oacute;n y reordenamiento de segmentos de genes. Seg&uacute;n Gilbert (1978; 1987) los intrones presentan puntos de propensi&oacute;n que incrementan el barajamiento “splicing” de exones y por lo tanto, la eficiencia del contenido gen&eacute;tico informacional de los genes y la formaci&oacute;n de nuevos genes. Por otro lado, Angeline (1996) y Andr&eacute; y Teller (1996) han determinado te&oacute;rica y experimentalmente que los intrones pareciera que protegieran a los exones de los efectos destructores del cruzamiento en programaci&oacute;n gen&eacute;tica.</p>     <p>Lo interesante del an&aacute;lisis y primer hallazgo de este estudio es que las proporciones de nucle&oacute;tidos pertenecientes a secuencias de exones e intrones encontradas por genoma no fueron estad&iacute;sticamente diferentes entre los cromosomas de un mismo genoma. Esta afirmaci&oacute;n se puede verificar en el <a href="img/revistas/acag/v59n3/v58n3a02t2.jpg" target="_blank">Cuadro 2</a> que muestra el tama&ntilde;o total de las secuencias de exones e intrones por cromosoma del genoma de <i>A. thaliana</i>; por ejemplo, la proporci&oacute;n de nucle&oacute;tidos perteneciente a secuencias de exones para cada cromosoma del genoma de <i>A. thaliana</i> fue la siguiente: 71.2, 73.6, 73.3, 72.2 y 71.6%, cromosomas 1 al 5, respectivamente. Estos datos sugieren reglas estructurales evolutivas comunes entre los cromosomas de un mismo genoma.</p>     <p>Otro hallazgo importante revel&oacute; que aunque la proporci&oacute;n de nucle&oacute;tidos pertenecientes a secuencias de exones es significativamente diferente entre genomas, la longitud promedio de los exones no difiere estad&iacute;sticamente entre todos los cromosomas ni entre los genomas estudiados. Los datos en el Cuadro 1 indican que el tama&ntilde;o promedio de las secuencias de exones en el genoma de <i>A. thaliana</i> es de 338.6 mientras que en <i>O. sativa</i> y en <i>M. musculus</i> es de 328.6 y 299.3, respectivamente. Estos valores no difieren significativamente de los obtenidos por cromosoma a trav&eacute;s de los genomas. En el genoma de <i>A. thaliana</i>, la longitud promedio de los exones por cromosoma var&iacute;a de 320.1 nucle&oacute;tidos (cromosoma 1) a 359.2 nucle&oacute;tidos (cromosoma 2) (Cuadro 2). Promedios similares de longitud de los exones se observan entre los cromosomas de los genomas de <i>O. sativa</i> y de <i>M. musculus</i> (datos no mostrados).</p>     ]]></body>
<body><![CDATA[<p>En contraste, la longitud promedio de los genes y de los intrones es espec&iacute;fica para cada genoma pero se mantiene estad&iacute;sticamente constante a trav&eacute;s de los cromosomas del genoma respectivo. La longitud promedio de los genes e intrones de <i>A. thaliana</i> fue de 2.119.2 y 165.8 nucle&oacute;tidos, respectivamente (Cuadro 1) y esas longitudes no var&iacute;an estad&iacute;sticamente a trav&eacute;s de los cromosomas (Cuadro 2). El tama&ntilde;o promedio de los intrones de <i>O. sativa</i> es aproximadamente tres veces m&aacute;s grande que el de <i>A. thaliana</i> y aproximadamente diez veces m&aacute;s peque&ntilde;o que el de <i>M. musculus</i> (Cuadro 1). Comparaciones de tama&ntilde;o de secuencias de exones e intrones entre especies de aves y mam&iacute;feros se&ntilde;alan que los exones no han sufrido cambios significativos en su longitud, mientras que los intrones presentan diferencias significativas entre especies, siendo los de las aves m&aacute;s cortos que los de los mam&iacute;feros (Hughes, 1999; Hughes y Hughes, 1995; Waltari y Edwards, 2002). Adem&aacute;s, la longitud promedio de los exones obtenida en este estudio fue consistente con la revelada por Deutsch y Long (1999) al comparar muestras de secuencias de diez organismos modelo eucariotas (promedio 338.7 nucle&oacute;tidos). Estos mismos investigadores indican que el tama&ntilde;o del intr&oacute;n disminuye a medida que las especies descienden en la escala filogen&eacute;tica y est&aacute; directamente relacionado con el tama&ntilde;o del genoma.</p>     <p>Cabe destacar que la longitud promedio de las secuencias de los genes, los exones y los intrones obtenidas para cada genoma fueron consistentes con las reportadas oficialmente por el Genebank (2009).</p>     <p><b>Genes simples <i>versus</i> genes interrumpidos</b></p>     <p>Un examen detallado de los genomas indica que est&aacute;n constituidos por dos categor&iacute;as de genes: genes simples GS (genes constituidos solamente por un ex&oacute;n = genes sin intrones) y genes interrumpidos o fragmentados GI (genes constituidos por dos o m&aacute;s exones = genes constituidos por uno o m&aacute;s intrones). Los genomas vegetales contienen mayor cantidad de genes simples, en comparaci&oacute;n con el genoma animal y los nucle&oacute;tidos de estos genes ocupan proporciones importantes de la longitud total de las secuencias de genes de los genomas vegetales respectivos. El genoma de <i>A. thaliana</i> contiene 33.8% (10.836 genes) de genes simples mientras que el genoma de <i>O. sativa</i> y de <i>M. musculus</i> contienen el 26 y 18.8% de genes simples, respectivamente (<a href="img/revistas/acag/v59n3/v59n3a02t3.jpg" target="_blank">Cuadro 3</a>). Estos resultados indican que por cada GS hay 2 GI en <i>A. thaliana</i>, 3 GI en <i>O. sativa</i> y 4.3 GI en <i>M. musculus</i>.</p>     <p>Los genes simples de <i>A. thaliana</i> ocupan el 22.6% (15.324.888 nucle&oacute;tidos) del total de nucle&oacute;tidos de las secuencias de genes (67.953.362 nucle&oacute;tidos) mientras que los genes simples de <i>O. sativa</i> ocupan el 8.3% y los de <i>M. musculus</i>, &uacute;nicamente el 0.7% (Cuadro 3). Estos resultados indican que por cada nucle&oacute;tido de un GS hay 3.4 nucle&oacute;tidos en un GI del genoma de <i>A. thaliana</i>, 11 nucle&oacute;tidos en un GI de <i>O. sativa</i> y 141 nucle&oacute;tidos en GI de <i>M. musculus</i>.</p>     <p>El an&aacute;lisis de los genes simples revela dos hallazgos importantes (Cuadro 3): primero, la proporci&oacute;n de genes simples y longitud ocupada por estos no presentan diferencias significativas a trav&eacute;s de los cromosomas de un mismo genoma; por ejemplo, del total de genes de los cromosomas de <i>A. thaliana</i>, 8095, 5291, 6474, 4933 y 7273 genes, cromosomas 1 al 5 respectivamente, el 31.3, 38.4, 34.8, 34.3 y 32%, respectivamente son genes simples. Segundo, el tama&ntilde;o promedio de un gen simple no difiere estad&iacute;sticamente a trav&eacute;s de todos los cromosomas de los genomas estudiados (por ejemplo, el tama&ntilde;o promedio de los genes simples en <i>A. thaliana</i> var&iacute;a de 1306,4 nucle&oacute;tidos –cromosoma 1- a 1476,9 nucle&oacute;tidos –cromosoma 2) siendo el tama&ntilde;o promedio de un GS en <i>A. thaliana</i> de 1414.3 nucle&oacute;tidos, mientras que <i>O. sativa</i> es de 1029.1 nucle&oacute;tidos y en <i>M. musculus</i> es de 1253 nucle&oacute;tidos.</p>     <p>En contraste, el tama&ntilde;o promedio de los genes interrumpidos es espec&iacute;fico para cada genoma pero al igual que en los genes simples, este promedio no difiere estad&iacute;sticamente entre los cromosomas del genoma respectivo. El tama&ntilde;o promedio de un GI es significativamente m&aacute;s bajo en el genoma vegetal que en el genoma animal (Cuadro 3).</p>     <p>Este estudio demuestra que aunque la cantidad de genes interrumpidos es aproximadamente la misma en los tres genomas (21230, 20819 y 19931 genes interrumpidos, <i>A. thaliana</i>, <i>O. sativa</i> y <i>M. musculus</i>, respectivamente) (Cuadro 3), las diferencias subyacen en la distribuci&oacute;n de las frecuencias de uso de exones y en la longitud promedio de uso de las secuencias de los genes interrumpidos en cada genoma. Este resultado aporta evidencias a lo sugerido por Levine y Tijan (2003) respecto a que la complejidad gen&eacute;tica no se basa en la aparici&oacute;n de nuevos genes, sino en la progresiva y m&aacute;s elaborada regulaci&oacute;n de la expresi&oacute;n de los existentes; pareciera que las especies eucariotas hubieran optado por la reutilizaci&oacute;n de genes para cumplir sus tareas, pues ser&iacute;a m&aacute;s econ&oacute;mico modificar y aumentar el n&uacute;mero de peque&ntilde;as secuencias control, que duplicar y mutar secuencias de genes (Mattick et al., 2001).</p>     <p><b>Distribuciones de Ley de Potencia en genes interrumpidos</b></p>     <p>Al ordenar los genes interrumpidos de acuerdo con la frecuencia creciente de uso de exones se origina una distribuci&oacute;n que se ajusta a una ley cuantitativa de escalamiento o Ley de Potencia que result&oacute; ser espec&iacute;fica para cada genoma. Esta distribuci&oacute;n proporciona una descripci&oacute;n sencilla de la organizaci&oacute;n jer&aacute;rquica de los genes en el genoma, cuyos par&aacute;metros expresados en la ecuaci&oacute;n se pueden utilizar como descriptores espec&iacute;ficos de la estructura de cada genoma. Este resultado permite concluir que la composici&oacute;n de exones de los genes interrumpidos en un genoma contiene informaci&oacute;n relevante sobre la identidad de una especie.</p>     ]]></body>
<body><![CDATA[<p>La <a href="img/revistas/acag/v59n3/v59n3a02f1.jpg" target="_blank">Figura 1</a> ilustra la distribuci&oacute;n de la variable frecuencia de uso de exones de los genes interrumpidos en los genomas de <i>A. thaliana</i>, <i>O. sativa</i> y <i>M. musculus</i>. N&oacute;tese, en primera instancia, la regularidad estad&iacute;stica expresada en l&iacute;neas rectas decrecientes de la distribuci&oacute;n de los genes interrumpidos en los genomas y que esta distribuci&oacute;n en una gr&aacute;fica bilogar&iacute;tmica obedece a una ley de potencia (recuadro en la Figura 1). Los coeficientes de determinaci&oacute;n (R<sup>2</sup>) altos indican que las variables est&aacute;n altamente correlacionadas y confirman la presencia de la Ley de Potencia. En segunda instancia, la distribuci&oacute;n de genes interrumpidos de cada genoma ocupa un lugar distinto en el espacio de coordenadas, definido por ecuaciones estad&iacute;sticamente diferentes, lo que indica una firma gen&oacute;mica para cada especie.</p>     <p>La interpretaci&oacute;n de la Figura 1 es inmediata: muchos GI utilizan pocos exones, mientras que muy pocos GI utilizan muchos exones y la proporci&oacute;n de unos y otros est&aacute; relacionada por una ley de escalamiento con exponentes espec&iacute;ficos (la pendiente) para cada genoma; por lo tanto, la frecuencia de GI seg&uacute;n el n&uacute;mero de exones que contiene un genoma no es al azar, obedece a una ley cuantitativa espec&iacute;fica expresada por la ecuaci&oacute;n que aparece en la Figura 1. Seg&uacute;n Lus-Combe et al. (2002), las leyes de potencia proveen una descripci&oacute;n matem&aacute;tica concisa de una importante propiedad biol&oacute;gica: el dominio completo de los genes con pocos exones sobre todo el genoma. Adem&aacute;s, la Figura 1 se&ntilde;ala que los genes interrumpidos del genoma animal son m&aacute;s fragmentados que los del genoma vegetal. Esto debido probablemente a una mayor eficiencia en t&eacute;rminos del barajamiento o “splicing” de genes y por ende del contenido gen&eacute;tico informacional.</p>     <p>Otra evidencia que corrobora la afirmaci&oacute;n de que los genes interrumpidos no se distribuyen al azar en el genoma, se encontr&oacute; al analizar la cantidad y longitud de las secuencias de genes, exones e intrones que constituyen los genes interrumpidos. Ambas variables decrecen “paralelamente” en forma de ley de potencia a medida que se incrementa el n&uacute;mero de exones por gen interrumpido. Muchos genes interrumpidos utilizan pocos exones y presentan promedios de longitud bajos pero ocupan gran parte de la longitud total de las secuencias de genes interrumpidos y pocos genes interrumpidos que utilizan muchos exones y presentan altos promedios de longitud ocupan una m&iacute;nima parte de la longitud total de los genes interrumpidos. Las transformaciones de las variables y especificidad de las ecuaciones que se presentan en las <a href="img/revistas/acag/v59n3/v59n3a02f2.jpg" target="_blank">Figura 2</a>, <a href="img/revistas/acag/v59n3/v59n3a02f3.jpg" target="_blank">Figura 3</a> y <a href="img/revistas/acag/v59n3/v59n3a02f4.jpg" target="_blank">Figura 4</a> de los genomas de <i>A. thaliana</i>, <i>O. sativa</i> y <i>M. musculus</i>, respectivamente, ilustran de manera irrefutable las anteriores afirmaciones.</p>     <p>En conclusi&oacute;n, en la distribuci&oacute;n en forma de leyes de potencia de los genes interrumpidos est&aacute;n contenidas otras leyes de potencia (de mayor magnitud) como son las distribuciones de cantidad y longitud de las secuencias que constituyen los exones e intrones. Cuanto m&aacute;s podamos distinguir la distribuci&oacute;n en forma de leyes de potencia de variables que caractericen las secuencias de ADN de los genomas, m&aacute;s informaci&oacute;n tendremos sobre las regularidades estad&iacute;sticas comunes entre y dentro de genomas. Probablemente, en un futuro, con la sumatoria de leyes de potencia de distintas variables analizadas en un conjunto de genes interrumpidos ser&aacute; posible obtener un perfil gen&eacute;tico preciso del genoma al cual pertenece.</p>     <p>Finalmente, el hallazgo m&aacute;s importante del an&aacute;lisis de las variables frecuencia de uso de exones y longitud total de las secuencias de los genes interrumpidos mostr&oacute; que el comportamiento de estas variables no present&oacute; diferencias significativas a trav&eacute;s de los cromosomas de un mismo genoma. A manera de demostraci&oacute;n, en las <a href="img/revistas/acag/v59n3/v59n3a02f5.jpg" target="_blank">Figura 5a</a> y <a href="img/revistas/acag/v59n3/v59n3a02f5.jpg" target="_blank">Figura 5b</a> se observa que la forma de la distribuci&oacute;n de ley potencia de las variables es similar en los cinco cromosomas del genoma de <i>A. thaliana</i>. Esta simetr&iacute;a fue a&uacute;n m&aacute;s evidente en los recuadros de la Figura 5 que presenta las transformaciones de las distribuciones y, lo que es a&uacute;n m&aacute;s importante, las ecuaciones por cromosoma no mostraron diferencias estad&iacute;sticamente significativas de la ecuaci&oacute;n obtenida para el genoma y que se present&oacute; en la Figura 1.</p>     <p><b>Significado matem&aacute;tico de la distribuci&oacute;n de uso y tama&ntilde;o de los genes interrumpidos</b></p>     <p>Los comportamientos de Ley de Potencia de las distribuciones de las frecuencias de uso de exones y tama&ntilde;o de los GI y de sus componentes generaron un sistema de ecuaciones matem&aacute;ticamente simple que expresa relaciones &uacute;nicas, precisas e invariantes entre los cromosomas y el respectivo genoma. Estas ecuaciones se&ntilde;alan que existen constantes estad&iacute;sticas que relacionan de manera espec&iacute;fica estas variables en cada genoma. Las constantes revelan que dichas secuencias no son independientes sino el resultado de sus relaciones que se expresan en formas de ley de potencia. Es decir, evidencian la existencia de un sistema que articula las secuencias de genes e indican que hay coherencia y regularidad en la aparici&oacute;n de estas secuencias en cada genoma.</p>     <p>De las ecuaciones se obtienen dos par&aacute;metros, el primero, la constante que depende del tipo de secuencia y del genoma y el segundo, el coeficiente de regresi&oacute;n o pendiente de la ecuaci&oacute;n que corresponde al exponente en la gr&aacute;fica bilogar&iacute;tmica. La pendiente negativa denota el sentido inverso de la relaci&oacute;n entre la cantidad de secuencias y la frecuencia de uso o longitud de estas secuencias, tanto en cromosomas como en genomas; por ejemplo, los genes m&aacute;s utilizados son los que contienen menor n&uacute;mero de exones y en promedio son m&aacute;s peque&ntilde;os pero ocupan la mayor parte de la longitud total de los genes. As&iacute; mismo, la pendiente muestra que el cambio por t&eacute;rmino medio de uso y longitud de las secuencias es menor en el genoma animal que en los genomas vegetales.</p>     <p>Las diferencias estad&iacute;sticamente no significativas de las pendientes de las ecuaciones que definen cada variable a trav&eacute;s de los cromosomas y el genoma respectivo son la evidencia emp&iacute;rica que mejor refleja la caracter&iacute;stica de invarianza de escala en el sentido estad&iacute;stico: independiente de la escala de observaci&oacute;n se conserva la forma de la funci&oacute;n. Intuitivamente, la invarianza implica patrones de comportamiento similares en la distribuci&oacute;n de las variables a trav&eacute;s de los cromosomas y del genoma. Los cromosomas son autosimilares estad&iacute;sticamente o invariantes al cambio de escala. Esto significa que el genoma se autoorganiza de la misma manera en los cromosomas, independientemente del tama&ntilde;o o del n&uacute;mero de genes, exones o intrones que estos contengan. Cada cromosoma manifiesta las propiedades estad&iacute;sticas globales del genoma al cual pertenece. La pendiente denota el grado de irregularidad que permanece constante a diferentes escalas.</p>     <p>La principal conclusi&oacute;n de este sistema de ecuaciones es que existe una regularidad estad&iacute;stica no lineal entre la cantidad y el tama&ntilde;o de las secuencias de los genes y sus componentes (los exones e intrones) que var&iacute;a con el tipo de genoma y que se repite estad&iacute;sticamente de manera similar a trav&eacute;s de los cromosomas del respectivo genoma.</p>     ]]></body>
<body><![CDATA[<p>La interpretaci&oacute;n matem&aacute;tica de estas leyes es irrefutable: lo que es v&aacute;lido para el genoma es v&aacute;lido para los cromosomas o viceversa. Cada cromosoma manifiesta las propiedades estad&iacute;sticas globales del genoma al cual pertenece.</p>     <p><b>Significado biol&oacute;gico de la frecuencia de uso y tama&ntilde;o de los genes interrumpidos</b></p>     <p>Biol&oacute;gicamente, las leyes de potencia indican que ni los genes ni sus componentes se distribuyen aleatoriamente en los cromosomas o en los genomas. Tanto las secuencias de genes como las de exones de cada genoma tienen asociada una cantidad escalar que representa su aptitud de adaptaci&oacute;n o capacidad para soportar determinada cantidad de variaci&oacute;n sin perder su identidad. Esta afirmaci&oacute;n valida lo sugerido por Kosak y Groudine (2004) respecto a que la organizaci&oacute;n lineal de los genes en los cromosomas no es aleatoria y por Duboule y Morata (1994) en cuanto a que la organizaci&oacute;n f&iacute;sica de los genes en los cromosomas es importante para su correcta activaci&oacute;n y el desarrollo normal de sus funciones.</p>     <p>Las leyes de potencia act&uacute;an como fuerzas que pueden fusionar grupos de genes con el &uacute;nico fin de mantener la integridad y especificidad de cada genoma. Estudios recientes con ‘microarrays’ muestran agrupaciones contiguas de genes coexpresados en <i>A. thaliana</i> (Williams y Bowles, 2004), en <i>Drosophila</i> (Boutanaev et al., 2002; Spellman y Rubin, 2002) y en nematodos y mam&iacute;feros (Lercher et al., 2002). Se han detectado agrupaciones de genes con funciones metab&oacute;licas o ‘housekeeping’ (Halligan et al., 2004; Lercher et al., 2002), genes vecinos o pr&oacute;ximos con patrones de expresi&oacute;n similares (Spellman y Rubin, 2002) o complejos g&eacute;nicos en tejidos espec&iacute;ficos (Boutanaev et al., 2002). Los genes home&oacute;ticos se presentan agrupados en m&oacute;dulos en los cromosomas y se expresan casi en el mismo orden en todos los organismos estudiados (Veraksa et al., 2000).</p>     <p>Los estudios mencionados se&ntilde;alan que estas agrupaciones de genes contienen regiones codificantes y no-codificantes extraordinariamente conservadas tanto en su composici&oacute;n de nucle&oacute;tidos como en su posici&oacute;n y orientaci&oacute;n entre las especies. La coexpresi&oacute;n parece ser ventajosa y una raz&oacute;n para el mantenimiento de la sintenia. Sintenia que se manifiesta en la regularidad estad&iacute;stica de n&uacute;mero, tama&ntilde;o y frecuencia de uso de los genes y sus componentes manteniendo la forma de la distribuci&oacute;n a trav&eacute;s de sus cromosomas, pero diferenci&aacute;ndose cuantitativamente de manera precisa entre genomas.</p>     <p>La similaridad de la forma mas no de la ecuaci&oacute;n de las distribuciones de frecuencia de uso y tama&ntilde;o a trav&eacute;s de genomas cercanos filogen&eacute;ticamente como los genomas vegetales o lejanos filogen&eacute;ticamente como <i>M. musculus</i>, avalan la hip&oacute;tesis de algunos an&aacute;lisis gen&oacute;micos comparativos que sostienen que las dr&aacute;sticas diferencias en el desarrollo de los diversos phyla son debidas al uso diferencial de productos g&eacute;nicos conservados estructural y funcionalmente m&aacute;s que a la invenci&oacute;n de prote&iacute;nas <i>de novo</i> (Carroll, 1995; 2000; Gellon y McGinnis, 1998).</p>     <p>La interpretaci&oacute;n m&aacute;s simple de las regularidades estad&iacute;sticas encontradas ser&iacute;a que la estructura de los cromosomas y por ende del genoma de una especie, se mantiene a expensas de una distribuci&oacute;n espec&iacute;fica de las variables de frecuencia de uso y tama&ntilde;o de los genes y sus componentes seg&uacute;n una Ley de Potencia. Las distribuciones en forma de esta Ley estudiadas en otros fen&oacute;menos biol&oacute;gicos, econ&oacute;micos o sociales se interpretan como mecanismos amortiguadores que en cierto grado ordenan y moldean los cambios gen&eacute;ticos en los genomas.</p>     <p><b>    <center><font face="verdana" size="3">Conclusiones</font></center></b></p> <ul>     <li>A modo de s&iacute;ntesis, en la primera aproximaci&oacute;n estad&iacute;stica general del estudio se presentan evidencias de una estructura estad&iacute;stica lineal del genoma que se refleja en sus cromosomas y se relaciona con el n&uacute;mero y tama&ntilde;o de sus genes y los componentes de estos &uacute;ltimos, los exones e intrones. En la segunda aproximaci&oacute;n, que es un an&aacute;lisis detallado de la frecuencia de uso y tama&ntilde;o de las secuencias, la estructura de estas dos simples variables se torna compleja y solamente puede ser analizada en t&eacute;rminos de Leyes de Potencia, la interpretaci&oacute;n biol&oacute;gica de estas leyes es contundente, lo que es v&aacute;lido para el genoma es v&aacute;lido para los cromosomas y que ambos an&aacute;lisis, el lineal y el no lineal, son necesarios para interpretar la estructura y organizaci&oacute;n de los genomas.</li>     ]]></body>
<body><![CDATA[<li>Los resultados muestran que es posible modelar el comportamiento aparentemente aleatorio de los nucle&oacute;tidos en las secuencias y de las secuencias en los cromosomas mediante el an&aacute;lisis de la distribuci&oacute;n de frecuencias de las variables frecuencia de uso de exones y longitud de las secuencias de los genes interrumpidos.</li>     <li>El abordaje te&oacute;rico, la deducci&oacute;n de las ecuaciones y las interpretaciones biol&oacute;gicas y matem&aacute;ticas, as&iacute; como las comparaciones entre los genomas seleccionados son contribuciones de este estudio al desarrollo estad&iacute;stico de las disciplinas &oacute;micas en general, y en particular, sirven para paliar la escasez de estos an&aacute;lisis en los programas de mejoramiento gen&eacute;tico vegetal de inmenso potencial biotecnol&oacute;gico.</li>     <li>De este trabajo queda pendiente por definir c&oacute;mo las regularidades estad&iacute;sticas analizadas est&aacute;n asociadas a determinadas funciones matem&aacute;ticas y biol&oacute;gicas, tal y como se observa en otros sistemas sociales o econ&oacute;micos e inclusive biol&oacute;gicos. Inicialmente, comparando grupos g&eacute;nicos de especies ubicadas a diferentes distancias filogen&eacute;ticas, lo que permitir&iacute;a detectar regiones funcionales importantes para distintos grupos de especies (Boffelli et al., 2003; 2004; Clark, 2001).</li>     </ul>     <p><b>    <center><font face="verdana" size="3">Agradecimientos</font></center></b></p>     <p>Los autores expresan sus agradecimientos al grupo de investigaci&oacute;n en Biolog&iacute;a Molecular y C&aacute;ncer, BIMAC de la Universidad del Cauca. As&iacute; mismo a la profesora de matem&aacute;ticas Lorena Silva, de la Universidad del Cauca y al profesor M.Sc. Germ&aacute;n &aacute;lvarez por sus valiosas discusiones y comentarios en el desarrollo de esta investigaci&oacute;n.</p>     <p><b>    <center><font face="verdana" size="3">Referencias </font></center></b></p>     <!-- ref --><p>Andr&eacute;, D.; Teller, A. 1996. A study in program response and the negative effects of introns in genetic programming. En: Genetic Programming: proceedings of the first annual conference. 12-20, MIT, Press.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000082&pid=S0120-2812201000030000200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Angeline, P. 1996. Two self-adaptative crossover operators for genetic programming. En: Advances in genetic programming 2: 89-110, MIT, Press.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000083&pid=S0120-2812201000030000200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Barreto, E. 2008. Bioinform&aacute;tica: una oportunidad y un desaf&iacute;o. Rev. Colomb. Biotecnol. 10(1):132 - 138.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000084&pid=S0120-2812201000030000200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Boffelli, D.; McAuliffe, J.; Ovcharenko, D.; Lewis, K. D.; Ovcharenko, I.; Pachter, L.; Rubin, E.M. 2003. Phylogenetic shadowing of primate sequences to find functional regions of the human genome. Science 299: 1391 - 1394.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000085&pid=S0120-2812201000030000200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Boffelli, D.; Nobrega, M. A.; Rubin, E.M. 2004. Comparative genomics at the vertebrate extremes. Nat Rev. Genet 5: 456 - 465.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000086&pid=S0120-2812201000030000200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Boutanaev, A. M.; Kalmykova, A. I.; Shevelyov, Y. Y.; Nurminsky, D. I. 2002. Large clusters of co-expressed genes in the Drosophila genome. Nature 420:666 - 669.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000087&pid=S0120-2812201000030000200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Carroll, R. L. 1995. Homeotic genes and the evolution of arthropods and chordates. Nature 376:479 - 485.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000088&pid=S0120-2812201000030000200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Carroll, R. L. 2000. Towards a new evolutionary synthesis. Trends in Ecology and Evolution. 15:27 - 32.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000089&pid=S0120-2812201000030000200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Clark, A. 2001. The search for meaning in noncoding DNA. Genome Res. 11:1319 - 1320.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000090&pid=S0120-2812201000030000200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Comai, L. 2005. The advantages and disadvantages of being polyploidy. Nat. Rev. Gen. 6: 836-846.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000091&pid=S0120-2812201000030000200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Deutsch, M.; Long, M. 1999. Intron-exon structures of eukaryotic model organisms. Nucleic Acids Researc. 27 (15): 3219- 3228.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000092&pid=S0120-2812201000030000200011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Duboule, D.; Morata, G. 1994. Colinearity and functional hierarchy among genes of the homeotic complexes. Tends Genet. 10: 358-364.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000093&pid=S0120-2812201000030000200012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Furlong, R.F.; Holland, P.W.H. 2004. Polyploidy in vertebrate ancestry: Ohno and Beyond. Biological Journal of the Linnean Society. 82: 425-430.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000094&pid=S0120-2812201000030000200013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gallardo, M.H.; Bickham, J.W.; Kohler, N.; Honeycutt, R.L. 2003. Gradual and quantum genome size in the hystricognath rodents. Journal of evolutionary Biology. 16: 163-169.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000095&pid=S0120-2812201000030000200014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gellon, G.; McGinnis, W. 1998. Shaping body plans in development and evolution by modulation of hox expression patterns. Bioessays. 20:116 - 125.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000096&pid=S0120-2812201000030000200015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gilbert, W. 1978. Why genes in pieces?. Nature. Vol, 271 (9): 501.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000097&pid=S0120-2812201000030000200016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gilbert, W. 1987. The exon theory of genes. Cold Spring Harbor Symposia on Quantitative Biology. Volumen LII: evolution of catalytic function: 907-913.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000098&pid=S0120-2812201000030000200017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gu, Z.; Wang, H.; Nekulenko, A.; Li, W.L. 2000. Densities, length proportions, and other distributional features of repetitive sequences in the human genome estimated from 430 Mb of genomic sequence. Gene. 259: 81-88.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000099&pid=S0120-2812201000030000200018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Kosak, S.T.; Groudine, M. 2004. Form follows function: the Genomic organization of cellular differentiation. Genes Dev. 18:1371 - 1384.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000100&pid=S0120-2812201000030000200019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Halligan, D. L.; Eyre-Walker, A.; Andolfatto, P.; y Keightley, P. D. 2004. Patterns of evolutionary constrains in intr&oacute;nica and intergenic DNA of <i>Drosophila</i>. Genome Res 14:273 – 279.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000101&pid=S0120-2812201000030000200020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hughes, A.L. (1999). Adaptative evolution of genes and genomes. Oxford University Press, Oxford, Reino Unido. 288 p.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000102&pid=S0120-2812201000030000200021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hughes, A. L.; Hughes M. K. 1995. Small genomes for better flyers. Nature 377:391.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000103&pid=S0120-2812201000030000200022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Kosak, S. T.; Groudine, M. 2004. Form follows function: The genomic organization of cellular differentiation. Genes Dev. 18:1371 - 1384.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000104&pid=S0120-2812201000030000200023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Lercher, M. J.; Urrutia, A. O.; Hurst, L. D. 2002. Clustering of housekeeping genes provides a unified of gene order in the human genome. Nat. Genet. 31:180 - 183.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000105&pid=S0120-2812201000030000200024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Levine M.; Tijan R. 2003. Transcriptional regulation and animal diversity, Nature. Vol 424, 10.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000106&pid=S0120-2812201000030000200025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Lus-Combe, N.M. et al., 2002. The dominance of the population by selected few: powerlaw behavior applies to a wide variety of genomics properties. Disponible en: <a href="http://genomebiology.com/2002/3/8/research/0040.1" target="_blank">http://genomebiology.com/2002/3/8/research/0040.1</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000107&pid=S0120-2812201000030000200026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mable, B.K. 2003. Breaking down taxonomic barriers in polyploidy research. Trends in plant Science. 8: 582-590.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000108&pid=S0120-2812201000030000200027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mattick, J.S. 2004. RNA Regulation: a new genetics? Nature Reviews Genetics, 5.316- 323.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000109&pid=S0120-2812201000030000200028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mattick, S.; John, Y.; Gagen, M. J. 2001. The evolution of a controlled multitasked gene Network: The role of introns and other Noncoding RNA in the development of complex organism. Molecular Biology Evolution 18(9): 1611-1630.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000110&pid=S0120-2812201000030000200029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mouse Genome Sequencing Consortium. 2002. Initial sequencing and comparative analysis of the mouse genome. Nature. 420: 520-562.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000111&pid=S0120-2812201000030000200030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Osborn, T.C.; Pires, J.C.; Birchler, J.A.; Auger, D.L.; Chen, Z.J.; Lee, H.; Comai, L.; Madlung, A.; Doerge, R.W., Colot, V.; Martiesen, R.A. 2003. Understanding mechanisms of novel gene expression in polyploids. Trends in Genetics. 19: 141- 147.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000112&pid=S0120-2812201000030000200031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Otto, S.P.; Whitton, J. 2000. Poliploid incidence and evolution. Annu. Rev. Genet. 34, 401-437.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000113&pid=S0120-2812201000030000200032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Rakyan, V.K., Preis, J., Morgan, H.D., Whitelaw, E. 2001. The marks, mechanisms and memory of epigenetic states in mammals. Biochem. J. 356, 1-10.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000114&pid=S0120-2812201000030000200033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Rodin, S.; Riggs, A. 2003. Epigenetic silencing maya id evolution by gene duplication. Journ. Mol. Evol. 56, 718-729.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000115&pid=S0120-2812201000030000200034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Rogic, S.; Mackworth, A.K.; Qullette, B.F. 2008. Evaluation of gene finding programs on mammalian sequences. Genome Res. 11, 817-832.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000116&pid=S0120-2812201000030000200035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Simpson, P. 2002. Evolution of development in closely related species of flies and worms. Nat. Rev. Genet. 3:907 - 917.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000117&pid=S0120-2812201000030000200036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Spellman, P. T. y Rubin, G. M. 2002. Evidence for large domains of similarly expressed genes in the <i>Drosophila</i> genome. J. Biol 1:5.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000118&pid=S0120-2812201000030000200037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Taft, R. J. y Mattick, J. S. 2003. Increasing biological complexity is positively correlated with the relative genome-wide expression of non-protein-coding DNA sequences. Disponible en: <a href="http://www.arxiv.org/aba/q-bio.GN/0401020" target="_blank">http://www.arxiv.org/aba/q-bio.GN/0401020</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000119&pid=S0120-2812201000030000200038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Veraksa, A.; Del Campo, M.; y McGinnins, W. 2000. Developmental patterning genes and their conserved Functions: from model organisms to humans. Mol. Genet .Metab. 69:85 - 100.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000120&pid=S0120-2812201000030000200039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Waltari, <i>E</i>. y Edwards, S. V. 2002. Evolutionary dynamics of intron size, genome size, and physiological correlates in archosaurs. The American Naturalist 160:539 - 552.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000121&pid=S0120-2812201000030000200040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Williams, E. J. y Bowles, D. J. 2004. Coexpression of neighboring genes in the genome of <i>Arabidopsis thaliana</i>. Genome Res. 14:1060 - 1067.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000122&pid=S0120-2812201000030000200041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[André]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Teller]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[A study in program response and the negative effects of introns in genetic programming]]></source>
<year>1996</year>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Angeline]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Two self-adaptative crossover operators for genetic programming]]></source>
<year>1996</year>
<volume>2</volume>
<page-range>89-110</page-range><publisher-name><![CDATA[MIT, Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barreto]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Bioinformática: una oportunidad y un desafío]]></article-title>
<source><![CDATA[Rev. Colomb. Biotecnol.]]></source>
<year>2008</year>
<volume>10</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>132 - 138</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Boffelli]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[McAuliffe]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Ovcharenko]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Lewis]]></surname>
<given-names><![CDATA[K. D]]></given-names>
</name>
<name>
<surname><![CDATA[Ovcharenko]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Pachter]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Rubin]]></surname>
<given-names><![CDATA[E.M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Phylogenetic shadowing of primate sequences to find functional regions of the human genome.]]></article-title>
<source><![CDATA[Science]]></source>
<year>2003</year>
<volume>299</volume>
<page-range>1391 - 1394</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Boffelli]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Nobrega]]></surname>
<given-names><![CDATA[M. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Rubin]]></surname>
<given-names><![CDATA[E.M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparative genomics at the vertebrate extremes]]></article-title>
<source><![CDATA[Nat Rev. Genet]]></source>
<year>2004</year>
<volume>5</volume>
<page-range>456 - 465</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Boutanaev]]></surname>
<given-names><![CDATA[A. M]]></given-names>
</name>
<name>
<surname><![CDATA[Kalmykova]]></surname>
<given-names><![CDATA[A. I]]></given-names>
</name>
<name>
<surname><![CDATA[Shevelyov]]></surname>
<given-names><![CDATA[Y. Y]]></given-names>
</name>
<name>
<surname><![CDATA[Nurminsky]]></surname>
<given-names><![CDATA[D. I]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Large clusters of co-expressed genes in the Drosophila genome]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2002</year>
<volume>420</volume>
<page-range>666 - 669</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carroll]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Homeotic genes and the evolution of arthropods and chordates]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1995</year>
<volume>376</volume>
<page-range>479 - 485</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carroll]]></surname>
<given-names><![CDATA[R. L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Towards a new evolutionary synthesis]]></article-title>
<source><![CDATA[Trends in Ecology and Evolution]]></source>
<year>2000</year>
<volume>15</volume>
<page-range>27 - 32</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Clark]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The search for meaning in noncoding DNA]]></article-title>
<source><![CDATA[Genome Res.]]></source>
<year>2001</year>
<volume>11</volume>
<page-range>1319 - 1320</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Comai]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The advantages and disadvantages of being polyploidy]]></article-title>
<source><![CDATA[Nat. Rev. Gen.]]></source>
<year>2005</year>
<volume>6</volume>
<page-range>836-846</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Deutsch,]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Long]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Intron-exon structures of eukaryotic model organisms]]></article-title>
<source><![CDATA[Nucleic Acids Researc]]></source>
<year>1999</year>
<volume>27</volume>
<numero>15</numero>
<issue>15</issue>
<page-range>3219- 3228</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Duboule]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Morata]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Colinearity and functional hierarchy among genes of the homeotic complexes]]></article-title>
<source><![CDATA[Tends Genet.]]></source>
<year>1994</year>
<volume>10</volume>
<page-range>358-364</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Furlong]]></surname>
<given-names><![CDATA[R.F]]></given-names>
</name>
<name>
<surname><![CDATA[Holland]]></surname>
<given-names><![CDATA[P.W.H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Polyploidy in vertebrate ancestry: Ohno and Beyond]]></article-title>
<source><![CDATA[Biological Journal of the Linnean Society]]></source>
<year>2004</year>
<volume>82</volume>
<page-range>425-430</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gallardo]]></surname>
<given-names><![CDATA[M.H]]></given-names>
</name>
<name>
<surname><![CDATA[Bickham]]></surname>
<given-names><![CDATA[J.W]]></given-names>
</name>
<name>
<surname><![CDATA[Kohler]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Honeycutt]]></surname>
<given-names><![CDATA[R.L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Gradual and quantum genome size in the hystricognath rodents]]></article-title>
<source><![CDATA[Journal of evolutionary Biology]]></source>
<year>2003</year>
<volume>16</volume>
<page-range>163-169</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gellon]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[McGinnis]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Shaping body plans in development and evolution by modulation of hox expression patterns]]></article-title>
<source><![CDATA[Bioessays]]></source>
<year>1998</year>
<volume>20</volume>
<page-range>116 - 125</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gilbert]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Why genes in pieces?]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1978</year>
<volume>Vol, 271</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>501</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gilbert]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<source><![CDATA[The exon theory of genes]]></source>
<year>1987</year>
<volume>Volumen LII</volume>
<conf-name><![CDATA[ Cold Spring Harbor Symposia on Quantitative Biology]]></conf-name>
<conf-loc> </conf-loc>
<page-range>907-913</page-range></nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gu]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Nekulenko]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[W.L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Densities, length proportions, and other distributional features of repetitive sequences in the human genome estimated from 430 Mb of genomic sequence]]></article-title>
<source><![CDATA[Gene]]></source>
<year>2000</year>
<volume>259</volume>
<page-range>81-88</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kosak]]></surname>
<given-names><![CDATA[S.T.]]></given-names>
</name>
<name>
<surname><![CDATA[Groudine]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Form follows function: the Genomic organization of cellular differentiation]]></article-title>
<source><![CDATA[Genes Dev.]]></source>
<year>2004</year>
<volume>18</volume>
<page-range>1371 - 1384</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Halligan]]></surname>
<given-names><![CDATA[D. L]]></given-names>
</name>
<name>
<surname><![CDATA[Eyre-Walker]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Andolfatto]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Keightley]]></surname>
<given-names><![CDATA[P. D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Patterns of evolutionary constrains in intrónica and intergenic DNA of Drosophila]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2004</year>
<volume>14</volume>
<numero>273 - 279</numero>
<issue>273 - 279</issue>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hughes]]></surname>
<given-names><![CDATA[A.L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Adaptative evolution of genes and genomes]]></source>
<year>1999</year>
<page-range>288 p</page-range><publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hughes]]></surname>
<given-names><![CDATA[A. L]]></given-names>
</name>
<name>
<surname><![CDATA[Hughes]]></surname>
<given-names><![CDATA[M. K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Small genomes for better flyers]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1995</year>
<volume>377</volume>
<page-range>391</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kosak]]></surname>
<given-names><![CDATA[S. T.]]></given-names>
</name>
<name>
<surname><![CDATA[Groudine]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Form follows function: The genomic organization of cellular differentiation]]></article-title>
<source><![CDATA[Genes Dev.]]></source>
<year>2004</year>
<volume>18</volume>
<page-range>1371 - 1384</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lercher]]></surname>
<given-names><![CDATA[M. J]]></given-names>
</name>
<name>
<surname><![CDATA[Urrutia]]></surname>
<given-names><![CDATA[A. O]]></given-names>
</name>
<name>
<surname><![CDATA[Hurst]]></surname>
<given-names><![CDATA[L. D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Clustering of housekeeping genes provides a unified of gene order in the human genome]]></article-title>
<source><![CDATA[Nat. Genet]]></source>
<year>2002</year>
<volume>31</volume>
<page-range>180 - 183</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Levine]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Tijan]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transcriptional regulation and animal diversity]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2003</year>
<volume>Vol 424</volume>
<numero>10</numero>
<issue>10</issue>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lus-Combe]]></surname>
<given-names><![CDATA[N.M]]></given-names>
</name>
</person-group>
<source><![CDATA[The dominance of the population by selected few: powerlaw behavior applies to a wide variety of genomics properties]]></source>
<year>2002</year>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mable]]></surname>
<given-names><![CDATA[B.K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Breaking down taxonomic barriers in polyploidy research]]></article-title>
<source><![CDATA[Trends in plant Science]]></source>
<year>2003</year>
<volume>8</volume>
<page-range>582-590</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mattick,]]></surname>
<given-names><![CDATA[J.S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA Regulation: a new genetics?]]></article-title>
<source><![CDATA[Nature Reviews Genetics]]></source>
<year>2004</year>
<volume>5</volume>
<page-range>316- 323</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mattick]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[John]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Gagen]]></surname>
<given-names><![CDATA[M. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The evolution of a controlled multitasked gene Network: The role of introns and other Noncoding RNA in the development of complex organism]]></article-title>
<source><![CDATA[Molecular Biology Evolution]]></source>
<year>2001</year>
<volume>18</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>1611-1630</page-range></nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<collab>Mouse Genome Sequencing Consortium</collab>
<article-title xml:lang="en"><![CDATA[Initial sequencing and comparative analysis of the mouse genome]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2002</year>
<volume>420</volume>
<page-range>520-562</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Osborn]]></surname>
<given-names><![CDATA[T.C]]></given-names>
</name>
<name>
<surname><![CDATA[Pires]]></surname>
<given-names><![CDATA[J.C]]></given-names>
</name>
<name>
<surname><![CDATA[Birchler]]></surname>
<given-names><![CDATA[J.A]]></given-names>
</name>
<name>
<surname><![CDATA[Auger]]></surname>
<given-names><![CDATA[D.L]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[Z.J]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Comai]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Madlung]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Doerge]]></surname>
<given-names><![CDATA[R.W]]></given-names>
</name>
<name>
<surname><![CDATA[Colot]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Martiesen]]></surname>
<given-names><![CDATA[R.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Understanding mechanisms of novel gene expression in polyploids]]></article-title>
<source><![CDATA[Trends in Genetics]]></source>
<year>2003</year>
<volume>19</volume>
<page-range>141- 147</page-range></nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Otto]]></surname>
<given-names><![CDATA[S.P]]></given-names>
</name>
<name>
<surname><![CDATA[Whitton]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Poliploid incidence and evolution]]></article-title>
<source><![CDATA[Annu. Rev. Genet.]]></source>
<year>2000</year>
<volume>34</volume>
<page-range>401-437</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rakyan]]></surname>
<given-names><![CDATA[V.K]]></given-names>
</name>
<name>
<surname><![CDATA[Preis]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Morgan]]></surname>
<given-names><![CDATA[H.D]]></given-names>
</name>
<name>
<surname><![CDATA[Whitelaw]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The marks: mechanisms and memory of epigenetic states in mammals]]></article-title>
<source><![CDATA[Biochem. J]]></source>
<year>2001</year>
<volume>356</volume>
<page-range>1-10</page-range></nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rodin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Riggs]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Epigenetic silencing maya id evolution by gene duplication]]></article-title>
<source><![CDATA[Journ. Mol. Evol]]></source>
<year>2003</year>
<volume>56</volume>
<page-range>718-729</page-range></nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rogic]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mackworth]]></surname>
<given-names><![CDATA[A.K]]></given-names>
</name>
<name>
<surname><![CDATA[Qullette]]></surname>
<given-names><![CDATA[B.F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluation of gene finding programs on mammalian sequences]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2008</year>
<volume>11</volume>
<page-range>817-832</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Simpson]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evolution of development in closely related species of flies and worms]]></article-title>
<source><![CDATA[Nat. Rev. Genet]]></source>
<year>2002</year>
<volume>3</volume>
<page-range>907 - 917</page-range></nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Spellman]]></surname>
<given-names><![CDATA[P. T]]></given-names>
</name>
<name>
<surname><![CDATA[Rubin]]></surname>
<given-names><![CDATA[G. M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evidence for large domains of similarly expressed genes in the Drosophila genome]]></article-title>
<source><![CDATA[J. Biol]]></source>
<year>2002</year>
<volume>1</volume>
<page-range>5</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Taft]]></surname>
<given-names><![CDATA[R. J]]></given-names>
</name>
<name>
<surname><![CDATA[Mattick]]></surname>
<given-names><![CDATA[J. S]]></given-names>
</name>
</person-group>
<source><![CDATA[Increasing biological complexity is positively correlated with the relative genome-wide expression of non-protein-coding DNA sequences]]></source>
<year>2003</year>
</nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Veraksa]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Del Campo]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[McGinnins]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Developmental patterning genes and their conserved Functions: from model organisms to humans]]></article-title>
<source><![CDATA[Mol. Genet .Metab]]></source>
<year>2000</year>
<volume>69</volume>
<page-range>85 - 100</page-range></nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Waltari]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Edwards]]></surname>
<given-names><![CDATA[S. V]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evolutionary dynamics of intron size, genome size, and physiological correlates in archosaurs]]></article-title>
<source><![CDATA[The American Naturalist]]></source>
<year>2002</year>
<volume>160</volume>
<page-range>539 - 552</page-range></nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[E. J]]></given-names>
</name>
<name>
<surname><![CDATA[Bowles]]></surname>
<given-names><![CDATA[D. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Coexpression of neighboring genes in the genome of Arabidopsis thaliana]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2004</year>
<volume>14</volume>
<page-range>1060 - 1067</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
