<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0120-2812</journal-id>
<journal-title><![CDATA[Acta Agronómica]]></journal-title>
<abbrev-journal-title><![CDATA[Acta Agron.]]></abbrev-journal-title>
<issn>0120-2812</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0120-28122010000400012</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Aplicación del análisis de rango reescalado R/S para la predicción de genes en el genoma vegetal]]></article-title>
<article-title xml:lang="en"><![CDATA[Rescaled range R/S analysis application for genes prediction in the plant genome]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Almanza Pinzón]]></surname>
<given-names><![CDATA[Martha Isabel]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[López López]]></surname>
<given-names><![CDATA[Karina]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Téllez Villa]]></surname>
<given-names><![CDATA[Carlos Eduardo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad del Cauca  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Nacional de Colombia  ]]></institution>
<addr-line><![CDATA[Palmira ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>10</month>
<year>2010</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>10</month>
<year>2010</year>
</pub-date>
<volume>59</volume>
<numero>4</numero>
<fpage>473</fpage>
<lpage>487</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0120-28122010000400012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0120-28122010000400012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0120-28122010000400012&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La predicción de genes es en la actualidad uno de los principales desafíos de la genómica. La predicción permite realizar experimentos con alta probabilidad de encontrar genes de interés y comparar regiones de ADN de importancia agronómica entre genomas; además, ayuda a restringir los espacios de búsqueda en las bases de datos. Un procedimiento estadístico con base en el análisis R/S y el coeficiente de Hurst fue desarrollado para caracterizar y predecir genes y los componentes estructurales de estos (exones e intrones) en los genomas eucariotas completos de Arabidopsis thaliana, Oriza sativa y Mus musculus. Algoritmos en lenguaje de programación Python fueron desarrollados para extraer, filtrar y modelar más del 80% de las secuencias de genes registradas para estos genomas en la base de datos del GeneBank del NCBI. El análisis R/S permitió demostrar que existe un orden estructural en la distribución de los nucleótidos que constituyen las secuencias en las que predominan los fenómenos de memoria o dependencia de largo alcance. La estructura de memoria varía según el tipo de secuencias y el genoma de la especie. Las secuencias de los genes y exones de los genomas vegetales analizados presentaron comportamiento persistente mientras que las de los intrones tuvieron un comportamiento antipersistente, en comparación, al genoma animal en el cual los tres tipos de secuencias presentaron comportamiento persistente. De acuerdo con los parámetros provenientes del análisis R/S, el patrón de distribución de las secuencias del genoma se repitió de manera estadísticamente similar en cada uno de los cromosomas que pertenecen a una especie, constituyéndose en evidencias fundamentales de invarianza por cambio de escala; es decir, cada cromosoma por sí solo es una réplica estadística a menor escala del genoma completo. Los parámetros constituyeron criterios compactos para derivar predictores (clasificadores) de secuencias que alcanzaron promedios de sensibilidad y especificidad mayor del 81% y 70%, respectivamente. Este procedimiento podría ser probado en otros genomas y utilizado como criterio para incrementar la eficiencia de la selección en los programas de mejoramiento genético vegetal.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Currently gene's prediction problem is one of the main genomic challenges. Prediction allows performing experiments with high probability of interesting genes to be found and compare DNA regions of agronomic importance among genomes; besides, it helps to restrict the searching spaces into the data bases. A statistical procedure based on the R/S analysis and the Hurst coefficient was developed in order to characterize and predict genes and their structural components (exones and intrones) in the whole eukaryotic genomes of Arabidopsis thaliana, Oriza sativa and Mus musculus. Python programming language algorithms were developed with the purpose of extract, screen and modeling more than 80% of the registered gene sequences for these genomes in the NCBI Gene Bank data base. The R/S analysis allows to demonstrate that a structural order do exist in the distribution of the nucleotides which are constituting sequences with the memory or long range dependence phenomena predominance. The memory structure varies according to the sequences type and the species genome. The genes and exones sequences from the analyzed plant genomes showed a persistent behavior whereas those from the intrones had an anti-persistent behavior, in comparison with animal genome in which the three type of sequences showed persistent behavior. According to R/S analysis out coming parameters the genome sequences distribution pattern was replicated in a statistically similar manner in each chromosome belonging to one species, constituting fundamental evidences of invariance by scale change; it means each chromosome by itself is a statistical replication to a minor scale of the whole genome. The parameters constituted compact criteria in order to derivate sequences predictors (classifiers) which reached sensibility and specificity averages higher than 81% and 70% respectively. This procedure could be tried in other genomes and be used as a criterion in order to increasing selection efficiency in plant genetic breeding programs.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Genómica comparativa]]></kwd>
<kwd lng="es"><![CDATA[predicción de genes]]></kwd>
<kwd lng="es"><![CDATA[análisis R/S]]></kwd>
<kwd lng="es"><![CDATA[coeficiente de Hurst]]></kwd>
<kwd lng="es"><![CDATA[Arabidopsis thaliana]]></kwd>
<kwd lng="es"><![CDATA[Oryza sativa]]></kwd>
<kwd lng="es"><![CDATA[Mus musculus.]]></kwd>
<kwd lng="en"><![CDATA[Comparative genomics]]></kwd>
<kwd lng="en"><![CDATA[gene's prediction]]></kwd>
<kwd lng="en"><![CDATA[R/S analysis]]></kwd>
<kwd lng="en"><![CDATA[Hurst coefficient]]></kwd>
<kwd lng="en"><![CDATA[Arabidopsis thaliana]]></kwd>
<kwd lng="en"><![CDATA[Oryza sativa]]></kwd>
<kwd lng="en"><![CDATA[Mus musculus.]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">     <p><b>    <center><font face="verdana" size="4">Aplicaci&oacute;n del an&aacute;lisis de rango reescalado R/S para la predicci&oacute;n de genes en el genoma vegetal</font></center></b></p>     <p><b>    <center><font face="verdana" size="3">Rescaled range R/S analysis application for genes prediction in the plant genome</font></center></b></p>     <p><i>    <center>Martha Isabel Almanza Pinz&oacute;n<sup>1</sup>, Karina L&oacute;pez L&oacute;pez <sup>2</sup>, Carlos Eduardo T&eacute;llez Villa <sup>3</sup></center></i></p>     <p><sup>1</sup>Bi&oacute;loga, M.Sc., Candidata a Ph.D. en Ciencias Agropecuarias, Universidad Nacional de Colombia, sede Palmira. A.A. 237. Docente Universidad del Cauca. <sup>2</sup> Ingeniera Bioqu&iacute;mica. Ph.D. en Biotecnolog&iacute;a de Plantas. Docente Universidad Nacional de Colombia, sede Palmira. <sup>3</sup> Ingeniero de Sistemas. Universidad del Cauca. Autores para correspondencia:  <a href="mailto:klopezl@palmira.unal.edu.co">klopezl@palmira.unal.edu.co</a>, <a href="mailto:mialmanzap@palmira.unal.edu.co">mialmanzap@palmira.unal.edu.co</a>, <a href="mailto:ctellez@unicauca.edu.co">ctellez@unicauca.edu.co</a></p>     <p>    <center>Recibido: 22-10-2008 Aceptado: 2-11-2010</center></p> <hr size="1">     ]]></body>
<body><![CDATA[<p><b>    <center>Resumen</center></b></p>     <p>La predicci&oacute;n de genes es en la actualidad uno de los principales desaf&iacute;os de la gen&oacute;mica. La predicci&oacute;n permite realizar experimentos con alta probabilidad de encontrar genes de inter&eacute;s y comparar regiones de ADN de importancia agron&oacute;mica entre genomas; adem&aacute;s, ayuda a restringir los espacios de b&uacute;squeda en las bases de datos. Un procedimiento estad&iacute;stico con base en el an&aacute;lisis R/S y el coeficiente de Hurst fue desarrollado para caracterizar y predecir genes y los componentes estructurales de estos (exones e intrones) en los genomas eucariotas completos de <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i> y <i>Mus musculus</i>. Algoritmos en lenguaje de programaci&oacute;n Python fueron desarrollados para extraer, filtrar y modelar m&aacute;s del 80% de las secuencias de genes registradas para estos genomas en la base de datos del GeneBank del NCBI. El an&aacute;lisis R/S permiti&oacute; demostrar que existe un orden estructural en la distribuci&oacute;n de los nucle&oacute;tidos que constituyen las secuencias en las que predominan los fen&oacute;menos de memoria o dependencia de largo alcance. La estructura de memoria var&iacute;a seg&uacute;n el tipo de secuencias y el genoma de la especie. Las secuencias de los genes y exones de los genomas vegetales analizados presentaron comportamiento persistente mientras que las de los intrones tuvieron un comportamiento antipersistente, en comparaci&oacute;n, al genoma animal en el cual los tres tipos de secuencias presentaron comportamiento persistente. De acuerdo con los par&aacute;metros provenientes del an&aacute;lisis R/S, el patr&oacute;n de distribuci&oacute;n de las secuencias del genoma se repiti&oacute; de manera estad&iacute;sticamente similar en cada uno de los cromosomas que pertenecen a una especie, constituy&eacute;ndose en evidencias fundamentales de invarianza por cambio de escala; es decir, cada cromosoma por s&iacute; solo es una r&eacute;plica estad&iacute;stica a menor escala del genoma completo. Los par&aacute;metros constituyeron criterios compactos para derivar predictores (clasificadores) de secuencias que alcanzaron promedios de sensibilidad y especificidad mayor del 81% y 70%, respectivamente. Este procedimiento podr&iacute;a ser probado en otros genomas y utilizado como criterio para incrementar la eficiencia de la selecci&oacute;n en los programas de mejoramiento gen&eacute;tico vegetal.</p>     <p><b>Palabra clave:</b> Gen&oacute;mica comparativa, predicci&oacute;n de genes, an&aacute;lisis R/S, coeficiente de Hurst, <i>Arabidopsis thaliana</i>, <i>Oryza sativa</i>, <i>Mus musculus</i>.</p> <hr size="1">     <p>    <center><b>Abstract</b></center></p>     <p>Currently gene's prediction problem is one of the main genomic challenges. Prediction allows performing experiments with high probability of interesting genes to be found and compare DNA regions of agronomic importance among genomes; besides, it helps to restrict the searching spaces into the data bases. A statistical procedure based on the R/S analysis and the Hurst coefficient was developed in order to characterize and predict genes and their structural components (exones and intrones) in the whole eukaryotic genomes of <i>Arabidopsis thaliana</i>, <i>Oriza sativa</i> and <i>Mus musculus</i>. Python programming language algorithms were developed with the purpose of extract, screen and modeling more than 80% of the registered gene sequences for these genomes in the NCBI Gene Bank data base. The R/S analysis allows to demonstrate that a structural order do exist in the distribution of the nucleotides which are constituting sequences with the memory or long range dependence phenomena predominance. The memory structure varies according to the sequences type and the species genome. The genes and exones sequences from the analyzed plant genomes showed a persistent behavior whereas those from the intrones had an anti-persistent behavior, in comparison with animal genome in which the three type of sequences showed persistent behavior. According to R/S analysis out coming parameters the genome sequences distribution pattern was replicated in a statistically similar manner in each chromosome belonging to one species, constituting fundamental evidences of invariance by scale change; it means each chromosome by itself is a statistical replication to a minor scale of the whole genome. The parameters constituted compact criteria in order to derivate sequences predictors (classifiers) which reached sensibility and specificity averages higher than 81% and 70% respectively. This procedure could be tried in other genomes and be used as a criterion in order to increasing selection efficiency in plant genetic breeding programs.</p>     <p><b>Key words:</b> Comparative genomics, gene's prediction, R/S analysis, Hurst coefficient, <i>Arabidopsis thaliana</i>, <i>Oryza sativa</i>, <i>Mus musculus</i>.</p> <hr size="1">     <p><b>    <center><font face="verdana" size="3">Introducci&oacute;n</font></center></b></p>     ]]></body>
<body><![CDATA[<p>Analizar genomas completos es de fundamental importancia para entender procesos biol&oacute;gicos como la herencia, la evoluci&oacute;n y el mejoramiento gen&eacute;tico. La predicci&oacute;n de genes consiste en identificar regiones codificantes (exones) en una secuencia de ADN an&oacute;nima. La identificaci&oacute;n no es de ning&uacute;n modo una tarea trivial debido a la complejidad estructural y funcional de los genomas eucariotas como de las bases de datos, depositarias de la informaci&oacute;n biol&oacute;gica. La predicci&oacute;n permite realizar experimentos con alta probabilidad de encontrar genes de inter&eacute;s o alguno de sus componentes; comparar regiones de ADN entre genomas de importancia agron&oacute;mica, patol&oacute;gica o taxon&oacute;mica; adem&aacute;s de ayudar a restringir los espacios de b&uacute;squeda en las bases de datos. El gran reto de la predicci&oacute;n es lograr establecer procedimientos matem&aacute;ticos para descubrir patrones, propiedades o reglas generales que determinan la informaci&oacute;n, estructura y organizaci&oacute;n de los genomas o para romper el texto cifrado en el ADN.</p>     <p>Desde la d&eacute;cada de los sesenta en el siglo XX se han realizado diversos an&aacute;lisis estad&iacute;sticos en secuencias de ADN mediante m&eacute;todos de la lingü&iacute;stica, la teor&iacute;a de la informaci&oacute;n y m&eacute;todos de escalamiento, como la complejidad y el an&aacute;lisis fractal. La primera compilaci&oacute;n de estos an&aacute;lisis fue publicada por Hawkins en 1988, la cual indica que las secuencias de exones e intrones presentan comportamientos estad&iacute;sticos diferentes y enfatiza la existencia de dos propiedades b&aacute;sicas de dependencia o correlaci&oacute;n de los nucle&oacute;tidos en las secuencias: correlaciones de corto y largo alcance. Seg&uacute;n Li y Kaneko (1992), Peng <i>et al</i>. (1992), Karlin y Brendel (1993), Karlin y Cardon (1994), Buldyrev <i>et al</i>. (1995) estas propiedades son indicadoras del nivel de complejidad y estructura jer&aacute;rquica del ADN. Sin embargo, existe desacuerdo en relacionar las propiedades de correlaci&oacute;n con el tipo de secuencia. El debate contin&uacute;a abierto y aspectos interesantes de &eacute;ste se encuentran en Yu <i>et al</i> (2001). El argumento principal de la discusi&oacute;n se basa en la propuesta de la existencia de m&aacute;s de un nivel de informaci&oacute;n en el lenguaje biol&oacute;gico del ADN.</p>     <p>Hao (2000) argumenta que aunque los an&aacute;lisis estad&iacute;sticos han sido herramientas &uacute;tiles en el estudio del ADN, las evidencias se&ntilde;alan que los m&eacute;todos no son lo suficientemente buenos para detectar diferencias entre y dentro de grupos de secuencias de ADN; y, afirma que existe la necesidad urgente de desarrollar nuevas aproximaciones conceptuales y experimentales a nivel biol&oacute;gico, matem&aacute;tico y computacional para el an&aacute;lisis e interpretaci&oacute;n de patrones en los genomas.</p>     <p>El an&aacute;lisis del recorrido estandarizado, tambi&eacute;n llamado an&aacute;lisis de rango reescalado, o an&aacute;lisis R/S, es una prueba estad&iacute;stica utilizada para cuantificar la din&aacute;mica de una serie temporal y determinar la existencia de caracter&iacute;sticas fractales en un sistema (Hoop <i>et al</i>., 1993). El valor de esta prueba es su sensibilidad para distinguir correlaciones o dependencias estad&iacute;sticas de corto o largo alcance, en procesos aleatorios; correlaciones que se presentan como consecuencia de la tendencia que presentan las observaciones a desviarse del valor medio durante un tiempo m&aacute;s o menos prolongado. As&iacute;, el estad&iacute;stico R/S mide el rango de las desviaciones de las sumas parciales de una serie temporal respecto de su media, reescalado por la desviaci&oacute;n est&aacute;ndar de la serie.</p>     <p>El an&aacute;lisis R/S fue desarrollado por Harold Hurst (1951; 1956); sin embargo, no fue sino hasta 1968, cuando Mandelbrot y Van Ness (1968); Mandelbrot y Wallis, 1969a,b,c) lo introdujeron como herramienta de an&aacute;lisis estad&iacute;stico para registros fractales. El fundamento matem&aacute;tico de la prueba se presenta en Mandelbrot (1982). Una consecuencia importante del an&aacute;lisis R/S es obtener el coeficiente de escalamiento, tambi&eacute;n denominado, de Hurst, o exponente R/S, que puede tomar cualquier valor entre 0 y 1 (Mandelbrot, 1982).</p>     <p>Xiao <i>et al</i> (1995) encontraron que las secuencias de nucle&oacute;tidos en animales, plantas y humanos presentan propiedades fractales y demostraron que las secuencias de exones e intrones difieren en sus propiedades fractales. Yu y Chen (2000), Yu <i>et al</i> (2001) y Yu y Wang (2001) propusieron modelos de series de tiempo basados en las longitudes de las secuencias de ADN de genomas completos; calculando correlaciones, an&aacute;lisis R/S y coeficientes de Hurst encontrando que estas medidas podr&iacute;an dar una se&ntilde;al del orden de los genes en el cromosoma.</p>     <p><b>    <center><font face="verdana" size="3">Materiales y m&eacute;todos</font></center></b></p>     <p>Las secuencias completas y anotaciones de los genes con sus respectivas secuencias de exones e intrones por cromosoma de los genomas: <i>A. thaliana</i>, <i>O. sativa</i> y <i>M. musculus</i>, fueron obtenidas directamente de los archivos en formato gbk disponibles v&iacute;a ftp en la base de datos p&uacute;blica GeneBank perteneciente al Centro Nacional de Informaci&oacute;n Biotecnol&oacute;gica NCBI (<a href=http://ftp.ncbi.nih.gov/genomes/ target="blank">http://ftp.ncbi.nih.gov/genomes/</a>) en marzo del 2009.</p>     <p>Algoritmos en lenguaje de programaci&oacute;n Python fueron desarrollados, tanto para extraer las secuencias de ADN del formato gbk a un formato Fasta para depurar, caracterizar, clasificar y evaluar, biol&oacute;gica y estad&iacute;sticamente los datos, por conjunto de secuencias (genes, exones e intrones), por cromosoma y por genoma.</p>     ]]></body>
<body><![CDATA[<p>La informaci&oacute;n extra&iacute;da de la base de datos se organiz&oacute; en tres archivos Fasta por cromosoma (secuencias completas de genes, exones e intrones) para facilitar el manejo de la informaci&oacute;n de las secuencias por genoma y mayor rapidez de procesamiento. Dos restricciones fueron hechas: las secuencias de genes que conten&iacute;an nucle&oacute;tidos desconocidos (representados por la letra N) o longitudes menores de 20 nucle&oacute;tidos en sus secuencias fueron excluidas del estudio. La primera restricci&oacute;n, se hizo porque existen criterios biol&oacute;gicos para asignarles valores a los cuatro nucle&oacute;tidos que constituyen una secuencia, y as&iacute;, transforma la secuencia de nucle&oacute;tidos en una secuencia num&eacute;rica (Stanley <i>et al</i>., 1994; Yu y Chen, 2000) pero, no se encontr&oacute;, un criterio biol&oacute;gico o estad&iacute;stico confiable para asignarle valor a una posici&oacute;n N en una secuencia. En la segunda restricci&oacute;n, se tuvo en cuenta dos hallazgos: el de Deutsch y Long (1999) indicando que las se&ntilde;ales de corte y empalme (<i>splicing</i>) de genes codifican adecuadamente cuando la longitud de los intrones es mayor de 20 nucle&oacute;tidos; y el de Peters (1991), quien encontr&oacute; mediante simulaciones de Montecarlo desviaciones sistem&aacute;ticas en el valor esperado del Log(R/S) para n(observaciones)&lt;20.</p>     <p><i>M. musculus</i> fue el genoma de referencia para validar las dos estrategias propuestas debido: primero, a que la informaci&oacute;n biol&oacute;gica de una buena cantidad de sus secuencias ha sido obtenida experimentalmente (Mouse Genome Sequencing Consortium, 2002); y segundo, porque todos sus cromosomas autos&oacute;micos son morfol&oacute;gicamente similares (Craig y Bickmore, 1993). Adem&aacute;s, Kolbe <i>et al</i>., (2004) se&ntilde;alan que la adici&oacute;n de una tercera especie mejora notablemente los an&aacute;lisis comparativos globales y locales de secuencias gen&oacute;micas.</p>     <p>El estudio consider&oacute; todos los cromosomas de los &uacute;nicos genomas vegetales eucariotas secuenciados disponibles en la base de datos (<i>A. thaliana</i>: 2n=10; <i>O. sativa</i>: 2n=24) y &uacute;nicamente los 19 cromosomas autos&oacute;micos del genoma del rat&oacute;n (<i>M. musculus</i>: 2n=42). Los cromosomas sexuales (X y Y) fueron excluidos porque presentan caracter&iacute;sticas estructurales, gen&eacute;ticas, anat&oacute;micas y fisiol&oacute;gicas particulares que podr&iacute;an ocasionar sesgos estad&iacute;sticos (Gu <i>et al</i>., 2000).</p>     <p>El procedimiento del an&aacute;lisis R/S aplicado a cada secuencia completa de ADN (gen, ex&oacute;n e intr&oacute;n) para la estimaci&oacute;n del respectivo coeficiente de Hurst (H), se desarroll&oacute; en cuatro etapas: la primera, la sucesi&oacute;n de nucle&oacute;tidos individuales de cada secuencia se traduce a una sucesi&oacute;n num&eacute;rica; la segunda, procedimiento matem&aacute;tico del an&aacute;lisis R/S; tercera, estimaci&oacute;n del coeficiente de Hurst (H); y cuarta, prueba de significancia del coeficiente de Hurst (H). A continuaci&oacute;n se presentan los criterios biol&oacute;gicos, propiedades matem&aacute;ticas y notaci&oacute;n del an&aacute;lisis R/S aplicado a secuencias de ADN:</p>     <p>Las cuatro letras (A, C, G y T) que representan las cuatro clases de nucle&oacute;tidos presentes en una secuencia de ADN fueron sustituidas por cuatro valores: -2, -1, 1 y 2, obteni&eacute;ndose una secuencia num&eacute;rica unidimensional. Esta representaci&oacute;n num&eacute;rica de los nucle&oacute;tidos fue utilizada posteriormente por Yu y Chen (2000). El criterio para asignar estos valores consiste en discriminar las purinas (A y G) de las pirimidinas (C y T) porque proporciona resultados robustos debidos probablemente a la complementariedad fisicoqu&iacute;mica de las purinas y pirimidinas (Stanley <i>et al</i>., 1994).</p>     <p>El procedimiento matem&aacute;tico del an&aacute;lisis R/S consta de los siguientes pasos:</p>     <p><img src="img/revistas/acag/v59n4/v59n4a12e1.jpg"></p>     <p><img src="img/revistas/acag/v59n4/v59n4a12e2.jpg"></p>     <p><img src="img/revistas/acag/v59n4/v59n4a12e3.jpg"></p>     <p><img src="img/revistas/acag/v59n4/v59n4a12e4.jpg"></p>     ]]></body>
<body><![CDATA[<p><img src="img/revistas/acag/v59n4/v59n4a12e5.jpg"></p>     <p>En la generalizaci&oacute;n: c, es una constante; n, es el n&uacute;mero de nucle&oacute;tidos que constituyen la secuencia; y H: es el coeficiente de escalamiento o de Hurst (H); R/S es el estad&iacute;stico que depende del tama&ntilde;o de la serie y que se define como el rango de variaci&oacute;n de la serie expresada en t&eacute;rminos de su desviaci&oacute;n est&aacute;ndar. El coeficiente H corresponde a la pendiente obtenida por el modelo cl&aacute;sico de regresi&oacute;n lineal ajustado por un estimador de m&iacute;nimos cuadrados ordinarios (Log(R<sub>(n)</sub>/S<sub>(n)</sub>) <i>vs</i> Log(n)) con base en la transformaci&oacute;n logar&iacute;tmica de la ecuaci&oacute;n de generalizaci&oacute;n, de la siguiente manera: Log(R<sub>(n)</sub>/S<sub>(n)</sub>)=log c+HLog(n).</p>     <p>Este art&iacute;culo propone un procedimiento estad&iacute;stico basado en el an&aacute;lisis de rango reescalado R/S y el coeficiente de escalamiento por intervalos. La idea subyacente del estudio es que toda la informaci&oacute;n necesaria para una prote&iacute;na est&aacute; en la propia estructura y contenido de nucle&oacute;tidos de las secuencias que componen los genes de un genoma.</p>     <p>El coeficiente de Hurst (H) es empleado usualmente como medida de complejidad de un sistema (Mandelbrot, 1982). H mide la aleatoriedad aparente de los nucle&oacute;tidos en secuencias altamente ordenadas como los exones e intrones a nivel de cromosomas y genomas. Un exponente de Hurst bajo (0&lt;H&lt;0.5) indica presencia de una complejidad alta y "comportamiento antipersistente"; la fuerza de la antipersistencia aumenta a medida que H tiende a cero. Un exponente de Hurst alto (0.5&lt;H&lt;1) indica complejidad baja y "comportamiento persistente"; cuanto mayor sea el valor de H, m&aacute;s fuerte es la tendencia de persistencia. H=0.5, corresponde a series de datos completamente aleatorias, en donde la correlaci&oacute;n de un periodo actual tiene una correlaci&oacute;n nula con un periodo anterior o futuro. H=1: indica un comportamiento determin&iacute;stico. En general, series de datos con un H<font face="symbol" size="2">&#185;</font>0.5 sugieren que aunque las observaciones est&eacute;n suficientemente distantes unas de otras en el espacio no son estad&iacute;sticamente independientes, caracter&iacute;stica importante de los sistemas biol&oacute;gicos.</p>     <p>El an&aacute;lisis de rango reescalado R/S se aplic&oacute; a cada una de las secuencias completas de genes, exones e intrones de los tres genomas de estudio, obteni&eacute;ndose para cada secuencia su m&aacute;ximo, m&iacute;nimo, rango y coeficiente de Hurst (H) y se adicion&oacute; la informaci&oacute;n de longitud de la secuencia. Estas medidas constituyen los par&aacute;metros o descriptores propios que definen cada secuencia de ADN y a partir de los cuales se clasifica o predice la secuencia. La decisi&oacute;n de incluir longitud como par&aacute;metro de definici&oacute;n de la secuencia de ADN, se bas&oacute; en la afirmaci&oacute;n de Mandelbrot y Wallis (1969b) respecto a que el an&aacute;lisis R/S de una serie de datos est&aacute; asint&oacute;ticamente relacionado con su longitud, por lo que formalmente plantearon la generalizaci&oacute;n, como: R/S=cn<sup>H</sup>.</p>     <p>El coeficiente de Hurst se dividi&oacute; en diez intervalos semiabiertos de igual amplitud, de tal manera que una secuencia pertenece a un intervalo, seg&uacute;n el coeficiente obtenido. El <a href="img/revistas/acag/v59n4/v59n4a12t1.jpg" target="blank">Cuadro 1</a> presenta los resultados del procedimiento del an&aacute;lisis R/S por intervalos del coeficiente de Hurst, para las secuencias de exones e intrones del cromosoma 3 de <i>M. musculus</i>.</p>     <p>La calidad del modelo de predicci&oacute;n basado en el intervalo del coeficiente de Hurst, los par&aacute;metros del an&aacute;lisis R/S y la longitud de la secuencia, se calcul&oacute; con base en su sensibilidad (probabilidad de clasificar correctamente un ex&oacute;n) y especificidad (probabilidad de clasificar correctamente un intr&oacute;n) (Burset y Guig&oacute;, 1996):</p>     <p>Sensibilidad: = VP/(VP+FN) = FVP (fracci&oacute;n de verdaderos positivos)</p>     <p>Especificidad: = VN/(VN+FP) = FVN (fracci&oacute;n de verdaderos negativos)</p>     <p>En donde, VP: verdaderos positivos; FN: falsos negativos; VN: verdaderos negativos; FP: falsos positivos.</p>     ]]></body>
<body><![CDATA[<p><b>    <center><font face="verdana" size="3">Resultados y discusi&oacute;n</font></center></b></p>     <p>Entre 0&lt;H&lt;1, cada grupo de secuencias de los genomas presenta una historia de complejidad diferente. Los coeficientes de Hurst (H) de las secuencias de genes, exones e intrones de los tres genomas fueron significativamente diferentes de H=0.5 con niveles altos de ajuste (R<sup>2</sup>) de los modelos de regresi&oacute;n, denotando que el an&aacute;lisis R/S permite discriminar secuencias de ADN (<a href="img/revistas/acag/v59n4/v59n4a12t2.jpg" target="blank">Cuadro 2</a>).</p>     <p>El coeficiente de Hurst (H) cuantifica y describe las relaciones entre los nucle&oacute;tidos de las secuencias gen&oacute;micas. Los tres conjuntos de secuencias del genoma animal presentaron comportamiento persistente (H&gt;0.5), mientras que en los genomas vegetales, los genes y exones presentaron comportamiento persistente y los intrones comportamiento antipersistente (H&lt;0.5). Estos comportamientos indican que existe un orden estructural espec&iacute;fico en la composici&oacute;n de nucle&oacute;tidos que constituyen cada conjunto de secuencias en cada genoma. Los valores de Hurst fueron consistentes con los reportados por Yu y Chen (2000) al obtener H&gt;0.5 para muestras de secuencias de exones e intrones de los genomas de <i>M. musculus</i> y del humano.</p>     <p>Las mismas caracter&iacute;sticas estad&iacute;sticas generales del coeficiente de Hurst (H) observadas para los conjuntos de secuencias por genoma fueron encontradas por cromosoma (H<font face="symbol" size="2">&#185;</font>0.5, p&lt;0.05; R<sup>2</sup><u>&gt;</u>87%), lo que indica que tambi&eacute;n existe una estructura en las secuencias de los cromosomas de cada genoma. Sin embargo, el hallazgo m&aacute;s significativo fue que el valor del coeficiente de Hurst de cada conjunto de secuencias por genoma no era significativamente diferente del observado para cada cromosoma del genoma respectivo (datos no mostrados).</p>     <p>Estos primeros resultados revelan tres aspectos significativos: primero, seg&uacute;n el valor de Hurst obtenido para cada conjunto de secuencias, las de genes y las de exones son las que presentan mayor tendencia a la persistencia en los tres genomas, este resultado es consistente con la funci&oacute;n que realizan estas secuencias en el genoma. Segundo, pareciera que el efecto de persistencia se incrementa conforme las especies se tornan m&aacute;s complejas (n&oacute;tese que los valores de Hurst de los tres conjuntos de secuencias son m&aacute;s altos en el genoma animal, Cuadro 2). Tercero, valores de Hurst estad&iacute;sticamente similares entre cromosomas y el genoma respectivo son evidencias de invarianza de escala.</p>     <p><b>Significado matem&aacute;tico de los coeficientes de Hurst (H)</b></p>     <p>El comportamiento estad&iacute;stico persistente (0.5&lt;H&lt;1) o memoria de largo alcance indica propagaci&oacute;n de la informaci&oacute;n en el espacio gen&eacute;tico que se manifiesta a trav&eacute;s de la dependencia o correlaci&oacute;n positiva entre los nucle&oacute;tidos que contienen las secuencias y, entre las secuencias que contienen los cromosomas y los genomas. La informaci&oacute;n que llevan los nucle&oacute;tidos sigue una caminata aleatoria sesgada, la fuerza del sesgo depende de qu&eacute; tan lejos de 0.5 se encuentre el valor de H.</p>     <p>La intensidad del comportamiento persistente se incrementa cuando H se aproxima al valor de uno, es decir, mayor es el grado de correlaci&oacute;n entre nucle&oacute;tidos lejanos y las diferencias entre nucle&oacute;tidos cercanos tienden al valor de cero; y es este efecto de memoria de largo alcance el que causa la aparici&oacute;n de tendencias y ciclos. La intensidad de la memoria se disipa a medida que H se acerca al valor de 0.5, es decir, mayor es el grado de correlaci&oacute;n entre nucle&oacute;tidos cercanos, caracterizando un proceso de corto alcance. Un valor de H&gt;0.5 indica la presencia de un sistema no lineal.</p>     <p>En contraste, la intensidad del comportamiento antipersistente (0&lt;H&lt;0.5) se incrementa cuando H se aproxima a cero, mayor es el ruido entre nucle&oacute;tidos y mayor apariencia de aleatoriedad "err&aacute;tica" tienen los nucle&oacute;tidos en las secuencias.</p>     ]]></body>
<body><![CDATA[<p>Entonces, una secuencia de ADN con un valor de H<font face="symbol" size="2">&#185;</font>0.5 es el resultado de la interconexi&oacute;n entre los nucle&oacute;tidos. Cada nucle&oacute;tido acarrea memoria de los nucle&oacute;tidos que le precedieron, existe un efecto de sesgo, tendencia o de memoria. Sin embargo, esta no es la memoria de corto alcance, com&uacute;nmente llamada Markoviana. Esta memoria es distinta, es de largo alcance. Nucle&oacute;tidos contiguos tienen mayor impacto que los m&aacute;s distantes, pero estos &uacute;ltimos siguen teniendo un efecto residual que influye en la secuencia.</p>     <p>Conocida la interpretaci&oacute;n matem&aacute;tica de los valores de Hurst desde la perspectiva del ADN se puede tomar el coeficiente de Hurst como una medida de la complejidad de la estructura de las secuencias de ADN en cada genoma. El valor de H indica el valor m&aacute;ximo que alcanzan las secuencias en alg&uacute;n punto entre el orden de lo completamente regular y el desorden de lo completamente aleatorio, siendo ambos extremos sistemas de complejidad nula (o extremadamente baja). En esta l&oacute;gica, un coeficiente de Hurst alto indica que la estructura de la secuencia presenta una complejidad baja y viceversa, un coeficiente bajo revela que la estructura de la secuencia presenta una complejidad alta.</p>     <p>Dos conclusiones significativas surgen del an&aacute;lisis expuesto: la primera, el coeficiente de Hurst (H) es una medida de la informaci&oacute;n que los nucle&oacute;tidos conservan a trav&eacute;s del espacio gen&eacute;tico; y, la segunda, los valores de H obtenidos indican que cada conjunto de secuencias de un genoma tiene su propia estructura organizada de memoria y, que adem&aacute;s, esta estructura se repite estad&iacute;sticamente en los cromosomas del genoma correspondiente.</p>     <p>Computacionalmente, la persistencia (correlaci&oacute;n positiva entre nucle&oacute;tidos) permite modelar fen&oacute;menos que tienden a agruparse primero a un lado de la media y luego al otro lado, mientras que la antipersistencia (correlaci&oacute;n negativa entre nucle&oacute;tidos) permite modelar fen&oacute;menos que fluct&uacute;an fuertemente alrededor de la media (Mandelbrot y Hudson, 2004).</p>     <p><b>Significado biol&oacute;gico de los coeficientes de Hurst (H)</b></p>     <p>Los comportamientos de persistencia o antipersistencia, indican que existen tendencias o ciclos de longitud variable en la composici&oacute;n de nucle&oacute;tidos de las secuencias, las cuales se mantienen a lo largo de la secuencia y que realmente hay una estructura en la secuencia. La persistencia indica tendencias en la secuencia que se refuerzan continuamente, esto es, s&iacute; la tendencia de la secuencia ha sido positiva en el &uacute;ltimo trayecto observado, es probable que siga siendo positiva y no negativa en el siguiente trayecto. La persistencia indica estructuras estables con una alta probabilidad de cumplir funciones espec&iacute;ficas, pero tambi&eacute;n revela que son insensibles a muchas alteraciones menores.</p>     <p>En contraste, el comportamiento antipersistente muestra tendencias que se revierten continuamente (los valores que toma la secuencia tienden a compensarse uno al otro) y se manifiestan como correlaciones negativas entre los nucle&oacute;tidos que componen las secuencias. La antipersistencia indica estructuras inestables y sin funci&oacute;n espec&iacute;fica (Balb&iacute;n y Andrade, 2004); sin embargo, Mattick <i>et al</i>., (2001), se&ntilde;alan que la antipersistencia en secuencias de ADN podr&iacute;a estar se&ntilde;alando plasticidad gen&eacute;tica para acomodarse a la uni&oacute;n de ligados (prote&iacute;nas, ADN, iones met&aacute;licos, etc.) que intervienen en la regulaci&oacute;n g&eacute;nica.</p>     <p>Biol&oacute;gicamente, el predominio de valores altos de Hurst en las secuencias de los genomas superiores, como el del genoma animal, indica que la probabilidad de mutaciones es m&aacute;s baja que en las especies poco adaptadas con valores bajos H, donde la probabilidad de que las secuencias cambien continuamente es alta.</p>     <p>Las tendencias persistentes en secuencias de ADN pueden tener dos posibles or&iacute;genes: primero, son el resultado de las restricciones f&iacute;sico-qu&iacute;micas que se establecen entre los nucle&oacute;tidos de una secuencia y que dan lugar a un determinado orden con un rango de posibles variaciones en la secuencia. El orden estar&iacute;a determinado, no s&oacute;lo por el posible aumento o cambio de nucle&oacute;tidos en la secuencia, sino tambi&eacute;n por la fijaci&oacute;n o conservaci&oacute;n de estos en posiciones determinadas de la secuencia (Carothers <i>et al</i>., 2004). Adem&aacute;s, Zhang y Zhang (1991) afirman que el potencial codificante de una secuencia de ADN es debido a la estructura r&iacute;gida y regular de los nucle&oacute;tidos en el cod&oacute;n generada por las caracter&iacute;sticas f&iacute;sico-qu&iacute;micas de estos.</p>     <p>Las afirmaciones anteriores apuntan en el mismo sentido de las sugeridas por Denton <i>et al</i>. (2003) para las secuencias proteicas, en donde leyes f&iacute;sico-qu&iacute;micas y no &uacute;nicamente la tr&iacute;ada: variaci&oacute;n, herencia y presi&oacute;n de selecci&oacute;n (natural o artificial) son los factores que m&aacute;s aportan al complejo orden biol&oacute;gico. Schultes <i>et al</i>. (1999) se&ntilde;alan que aunque la selecci&oacute;n modifique las secuencias de ADN para adaptarse a funciones espec&iacute;ficas, la mayor parte del orden estructural de un genoma es intr&iacute;nseco. Bernardi (1995), se&ntilde;ala que la composici&oacute;n de nucle&oacute;tidos de las secuencias est&aacute; sometida a reglas precisas que son decisivas en la organizaci&oacute;n, fisiolog&iacute;a y evoluci&oacute;n de un genoma.</p>     ]]></body>
<body><![CDATA[<p>El otro posible origen, est&aacute; relacionado con el incremento de tama&ntilde;o del genoma debido a procesos de poliploid&iacute;a y transferencia horizontal que generan gran cantidad y variedad de estructuras de ADN repetitivas y de genes duplicados (Li y Kaneko (1992). Ordov <i>et al</i>. (2006) argumentan que la persistencia en secuencias de ADN puede estar relacionada con sesgos estad&iacute;sticamente significativos originados por la presencia de estructuras repetitivas en la composici&oacute;n de nucle&oacute;tidos de las secuencias, tales como: repeticiones dispersas, en t&aacute;ndem o altamente repetitivas, o una combinaci&oacute;n de todas o algunas de estas estructuras. Seg&uacute;n estos investigadores, los sesgos ocasionan que las variaciones de los valores de H en una secuencia persistente sean mon&oacute;tonas, correlacionen positivamente y sigan una caminata aleatoria sesgada.</p>     <p>La transferencia horizontal tambi&eacute;n duplica estructuras repetitivas, genes y produce redundancia g&eacute;nica funcional. Entendida &eacute;sta como la capacidad que tienen algunos genes de realizar la misma funci&oacute;n, es una actividad que facilita el cambio evolutivo, puesto que se reduce la probabilidad de efectos letales por mutaciones en uno de los genes redundantes. La p&eacute;rdida de funcionalidad de uno de los genes puede ser cubierta, al menos parcialmente, por otro que evite la aparici&oacute;n de alteraciones fenot&iacute;picas.</p>     <p>Las estructuras de ADN repetitivas y genes duplicados producidas por estos dos procesos biol&oacute;gicos (poliploid&iacute;a y transferencia g&eacute;nica) son consideradas cruciales para explicar la complejidad y adquisici&oacute;n de nuevas funciones en las especies superiores; adem&aacute;s de ayudar a explicar la propiedad de autosimilaridad estad&iacute;stica en genomas (Doolittle, 1981).</p>     <p>Mandelbrot y Hudson (2004) argumentan que los comportamientos de persistencia o antipersistencia en los sistemas naturales tienen un importante significado funcional, ya que est&aacute;n estrechamente relacionados con procesos de retroalimentaci&oacute;n positiva o negativa, respectivamente. La retroalimentaci&oacute;n positiva est&aacute; orientada hacia la producci&oacute;n y cambio acumulativo de un estado dado. En secuencias de ADN se refiere al hecho de que los nucle&oacute;tidos que componen una secuencia se influencian uno al otro, a los contiguos y aun a los m&aacute;s lejanos y, de esta manera, las secuencias logran mantener largos segmentos de la secuencia conservados. En contraste, la retroalimentaci&oacute;n negativa consiste en alcanzar y/o mantener la funcionalidad o continuidad de un estado. El coeficiente de Hurst indica la medida de dicha retroalimentaci&oacute;n. El genoma, entendido como un sistema natural complejo, tendr&iacute;a ambos procesos de retroalimentaci&oacute;n para desarrollar sus funciones.</p>     <p>Adicionalmente, algunos grupos de investigaci&oacute;n se&ntilde;alan que las condiciones de persistencia le confieren al genoma importantes ventajas relacionadas con procesos de adaptaci&oacute;n a condiciones ambientales; tambi&eacute;n, que la informaci&oacute;n biol&oacute;gica proveniente del an&aacute;lisis de las correlaciones de largo alcance puede estar relacionada con los mecanismos de las funciones saludables o patol&oacute;gicas de un organismo (Goldberger <i>et al</i>., 2000).</p>     <p>Finalmente, dos posibles explicaciones biol&oacute;gicas tendr&iacute;a la invarianza de escala que se expresa entre cromosomas y el genoma respectivo, la primera: disminuir la cantidad de informaci&oacute;n gen&eacute;tica que se necesita para modelar una especie al reutilizar sus propios principios estructurales o biol&oacute;gicos fundamentales. Las regularidades estad&iacute;sticas de persistencia o antipersistencia en una secuencia representan ahorro en la capacidad de almacenar informaci&oacute;n y llevan impl&iacute;cito cierto equilibrio de las fuerzas resultantes de la interacci&oacute;n genotipo-ambiente en una especie. Cada cromosoma contiene en s&iacute; mismo la estructura de toda la informaci&oacute;n gen&eacute;tica del genoma al cual pertenece.</p>     <p>La segunda explicaci&oacute;n es la homogeneizaci&oacute;n del genoma que da lugar a mayor diversidad entre que dentro de especies. Brown <i>et al</i>. (1972) encontraron que dentro de una especie de anfibios, las diferencias entre las secuencias repetitivas presentes en los intrones de una familia de genes de ARNr fueron m&iacute;nimas; mientras que entre especies, estas secuencias en intrones presentaron diferentes mutaciones y evolucionan libremente. Existe una evoluci&oacute;n concertada que resulta en que estas secuencias repetitivas (independientemente del n&uacute;mero de copias, funci&oacute;n o distribuci&oacute;n) conserven su identidad dentro de una especie, frente a la variaci&oacute;n entre especies Dover (1982).</p>     <p><b>Representaci&oacute;n gr&aacute;fica del Coeficiente de Hurst (H)</b></p>     <p>La <a href="img/revistas/acag/v59n4/v59n4a12f1.jpg" target="blank">Figura 1</a> es la representaci&oacute;n gr&aacute;fica del an&aacute;lisis R/S (denominada <i>pox plot</i>) para obtener el valor del coeficiente de Hurst (H) para una secuencia de ADN o un genoma. En la figura tambi&eacute;n se puede visualizar, para una mejor comprensi&oacute;n intuitiva, los comportamientos de persistencia y antipersistencia en cualquier secuencia de ADN. El eje de las abscisas representa el logaritmo del valor num&eacute;rico asignado a cada nucle&oacute;tido (<i>n</i>) de una secuencia, y el eje de las ordenadas el logaritmo del valor R/S alcanzado por la secuencia, a medida que la caminata avanza nucle&oacute;tido por nucle&oacute;tido. El coeficiente de Hurst corresponde a la pendiente del ajuste lineal de los puntos en el diagrama. Las secuencias persistentes presentan menor cantidad de escalones largos que se caracterizan por peque&ntilde;as pero constantes variaciones de los valores m&aacute;ximo y m&iacute;nimo de los nucle&oacute;tidos a lo largo de la secuencia. El desplazamiento vertical m&aacute;s que horizontal de las secuencias se refleja en una pendiente menos inclinada y por lo tanto, en un valor del coeficiente de Hurst m&aacute;s alto. N&oacute;tense diferentes pendientes en diversos lugares de las curvas, lo que implica la existencia de m&aacute;s de un coeficiente por secuencia.</p>     <p><b>Selecci&oacute;n de par&aacute;metros</b></p>     ]]></body>
<body><![CDATA[<p>El coeficiente de Hurst es un par&aacute;metro necesario pero no suficiente para clasificar secuencias de ADN. Dos secuencias pueden tener el mismo coeficiente de escalamiento o de Hurst pero diferentes patrones de autosimilaridad. Por lo tanto, se analizaron estad&iacute;sticamente las medias obtenidas durante el procedimiento matem&aacute;tico del an&aacute;lisis R/S para la estimaci&oacute;n del Coeficiente de Hurst.</p>     <p>Estos par&aacute;metros R/S describen regularidades biol&oacute;gicas, denotan la complejidad de un conjunto de secuencias en t&eacute;rminos de las tendencias generales o locales de las fluctuaciones de los nucle&oacute;tidos que las constituyen y no de la posici&oacute;n de estos en las secuencias o de se&ntilde;ales en las secuencias, cuantifican el comportamiento espacial de las secuencias y presentan caracter&iacute;sticas estad&iacute;sticas robustas para derivar algoritmos de clasificaci&oacute;n de secuencias entre y dentro de genomas, conceptualmente simples y computacionalmente eficientes.</p>     <p><b>Significado biol&oacute;gico de los par&aacute;metros R/S</b></p>     <p>Los par&aacute;metros M&aacute;ximo (M&aacute;x.) y M&iacute;nimo (M&iacute;n.) representan medidas de la m&aacute;xima y m&iacute;nima variabilidad de nucle&oacute;tidos alcanzada por un conjunto de secuencias en un genoma. El par&aacute;metro rango representa la diferencia entre la m&aacute;xima y la m&iacute;nima variabilidad estructural que puede soportar un conjunto de secuencias en un cromosoma o en un genoma. N&oacute;tese que el conjunto de genes y el de intrones del genoma de <i>M. musculus</i> presentan los rangos m&aacute;s altos de variabilidad 1.052,9 y 232,7 nucle&oacute;tidos, respectivamente) y aparentemente estos rangos se reducen a medida que las especies descienden en la escala evolutiva, como as&iacute; lo indican los valores bajos del par&aacute;metro rango obtenidos por los genomas vegetales para estas mismas secuencias (Cuadro 2). En contraste, el rango de variabilidad de los exones permanece constante a trav&eacute;s de los genomas (el valor del par&aacute;metro rango para el conjunto de exones del genoma de <i>A. thaliana</i> fue de 38.6 mientras que para los genomas de <i>O. sativa</i> y <i>M. musculus</i> fue de 34.8 y 35.6, respectivamente.</p>     <p>N&oacute;tese que los valores de los par&aacute;metros M&aacute;ximo y M&iacute;nimo son de igual longitud dentro de los conjuntos de secuencias de un mismo genoma (por ejemplo, en el conjunto de intrones del genoma de <i>O. sativa</i>, el M&aacute;ximo &oacute;ptimo es 22.6 y el M&iacute;nimo &oacute;ptimo es -22.9 nucle&oacute;tidos (Cuadro 2). Tres interpretaciones surgen al respecto: la primera, las variaciones de nucle&oacute;tidos en las secuencias se autorregulan a trav&eacute;s de alg&uacute;n patr&oacute;n b&aacute;sico intr&iacute;nseco de retroalimentaci&oacute;n o proceso recursivo que incorpora autocorrecci&oacute;n e indica cu&aacute;nta variaci&oacute;n soportan las secuencias de un determinado genoma. La segunda, las variaciones de determinadas posiciones de los nucle&oacute;tidos en las secuencias est&aacute;n estrechamente correlacionadas o parecen influir en la aceptaci&oacute;n de cambios en otras posiciones que podr&iacute;an estar lejos en la secuencia, pero que cabe esperar est&eacute;n pr&oacute;ximas en la estructura tridimensional o de empaquetamiento del ADN (Gobel <i>et al</i>, 1994); y, la tercera, un aumento en la informaci&oacute;n gen&eacute;tica de una secuencia siempre debe compensarse con una p&eacute;rdida equivalente de informaci&oacute;n.</p>     <p>Los tres par&aacute;metros (M&aacute;ximo, M&iacute;nimo y Rango) caracterizan la autoorganizaci&oacute;n o complejidad de las secuencias de un genoma, mientras que el par&aacute;metro intercepto b representa la constante caracter&iacute;stica de cada conjunto de secuencias en un genoma. La inclusi&oacute;n de la longitud de la secuencia como par&aacute;metro se interpreta como que el sistema posee algo o existe algo que es capaz de actuar a larga distancia. En general, valores altos de estos par&aacute;metros en secuencias de genes e intrones en el genoma animal contrastaron con valores bajos de estas secuencias en los genomas vegetales.</p>     <p>El hecho de que los par&aacute;metros R/S tengan una interpretaci&oacute;n biol&oacute;gica puede consider&aacute;rseles como variables biol&oacute;gicas dado que estos var&iacute;an de manera espec&iacute;fica entre conjuntos de secuencias y entre genomas. Por lo tanto, a partir de estos, podr&iacute;an construirse criterios de mejoramiento vegetal para la selecci&oacute;n de genes, parentales o poblaciones.</p>     <p>Finalmente, la evidencia presentada de que secuencias no codificantes como los intrones puedan ser descritas matem&aacute;ticamente y analizadas biol&oacute;gicamente mediante los par&aacute;metros R/S indica que el procedimiento del an&aacute;lisis R/S potencialmente puede ser aplicado a las otras secuencias de ADN que constituyen la estructura de un gen, tales como regiones promotoras, reguladoras y terminadoras, lo que permite completar generalizaciones respecto a la din&aacute;mica y funcionamiento de los genes en los genomas.</p>     <p><b>Caracterizaci&oacute;n de las secuencias</b></p>     <p>Una vez seleccionados los par&aacute;metros R/S, examinado su comportamiento global estad&iacute;stico y explicado su significado biol&oacute;gico por conjunto de secuencias, por cromosoma y por genoma, se realizaron an&aacute;lisis locales de los par&aacute;metros por frecuencias de ocurrencia de las secuencias en los intervalos de clase de Hurst. Este an&aacute;lisis se hizo para perfeccionar la caracterizaci&oacute;n de los conjuntos de secuencias y optimizar las posibilidades de discriminaci&oacute;n de los par&aacute;metros R/S.</p>     ]]></body>
<body><![CDATA[<p>El an&aacute;lisis mostr&oacute; que los promedios de los par&aacute;metros que definen las secuencias contenidas en un determinado intervalo de clase de Hurst fueron estad&iacute;sticamente diferentes de los promedios de los par&aacute;metros de los intervalos previos o contiguos dentro de un mismo genoma; por ejemplo, el promedio del par&aacute;metro rango de las 552 secuencias de genes del genoma de <i>A. thaliana</i> con valores del coeficiente de Hurst en el intervalo [0.2-0.3] es de 96.6&plusmn;D.S difiere estad&iacute;sticamente del promedio del par&aacute;metro rango del siguiente intervalo [0.3-0.4] que es de 105&plusmn;D.S. con 3.558 secuencias de genes (<a href="img/revistas/acag/v59n4/v59n4a12t3.jpg" target="blank">Cuadro 3</a>). A la misma conclusi&oacute;n se llega con los otros par&aacute;metros del conjunto de secuencias de genes, con las secuencias de exones e intrones del genoma de <i>A. thaliana</i> (Cuadro 3) y con los par&aacute;metros de los conjuntos de secuencias de los genomas de <i>O. sativa</i> y <i>M. musculus</i> (datos no mostrados).</p>     <p>La <a href="img/revistas/acag/v59n4/v59n4a12f2.jpg" target="blank">Figura 2</a> ilustra con contundencia en el plano cartesiano, la trayectoria espec&iacute;fica y el espacio claramente diferenciado tomado por los par&aacute;metros seg&uacute;n el intervalo de clase de Hurst y el conjunto de secuencias del genoma de <i>M. musculus</i>. De estos pocos par&aacute;metros se derivaron los algoritmos de clasificaci&oacute;n de secuencias entre y dentro de genomas que alcanzaron altos promedios de sensibilidad y especificidad.</p>     <p>Cabe anotar que &eacute;ste es el primer estudio que no se limita a asignarle un valor puntual de escalamiento o coeficiente de Hurst a las secuencias gen&oacute;micas, muy por el contrario, explora con detalle el potencial del procedimiento matem&aacute;tico del an&aacute;lisis R/S e interpreta su significado biol&oacute;gico para obtener la metodolog&iacute;a que se ha expuesto de los par&aacute;metros R/S acotados por los intervalos de clase de Hurst. En esencia, el an&aacute;lisis R/S en secuencias gen&oacute;micas se hizo de manera similar a como lo plante&oacute; originalmente Hurst, quien no solamente lo desarroll&oacute; para demostrar que hay dependencia entre los eventos de un sistema sino que lo utiliz&oacute; para encontrar el dise&ntilde;o &oacute;ptimo de una represa para un sistema tan complejo como el del rio Nilo (Mandelbrot, 1997).</p>     <p><b>Predicci&oacute;n de secuencias</b></p>     <p>Los an&aacute;lisis de predicci&oacute;n permiten verificar si los par&aacute;metros seleccionados corresponden a caracter&iacute;sticas estad&iacute;sticas generales y robustas de las secuencias, los cromosomas y los genomas. A partir de los Cuadros 1 y 3 que indican valores promedio de los par&aacute;metros R/S&plusmn;D.S. acotados por intervalos de clase del coeficiente de Hurst, por cromosoma y por genoma, respectivamente, seg&uacute;n los conjuntos de secuencias, se elaboraron los algoritmos para la clasificaci&oacute;n de secuencias entre y dentro de genomas.</p>     <p>En cada Cuadro se explota la posibilidad de predecir c&oacute;mo una determinada secuencia puede encajar en uno de los intervalos del coeficiente de Hurst definido por los par&aacute;metros R/S, sin necesidad de que la secuencia tenga que tener ninguna homolog&iacute;a o se&ntilde;al biol&oacute;gica con las secuencias incluidas en este intervalo, bas&aacute;ndose exclusivamente en el comportamiento estad&iacute;stico de los par&aacute;metros de dicha secuencia. Cada secuencia a clasificar debe contener la informaci&oacute;n de los par&aacute;metros: valor de H, m&aacute;ximo, m&iacute;nimo, rango, intercepto b y longitud de la secuencia.</p>     <p>El algoritmo para la clasificaci&oacute;n de genes, exones e intrones en genomas comprende dos grandes etapas: primera, estimar el valor del coeficiente de Hurst y de los par&aacute;metros derivados del an&aacute;lisis R/S (m&aacute;ximo, m&iacute;nimo, rango, longitud de la secuencia y el intercepto de la ecuaci&oacute;n) para cada secuencia de estudio; y segunda, construir los cuadros de clasificaci&oacute;n mencionados por conjuntos de secuencias y por genoma.</p>     <p>El resultado general de sensibilidad de los predictores para clasificar secuencias de genes, exones e intrones dentro del mismo genoma fue del 81%, mientras que para clasificar secuencias de otros genomas fue mayor del 70% porque var&iacute;a significativamente seg&uacute;n el predictor y el genoma.</p>     <p>Resultados publicados en la literatura cient&iacute;fica reportan porcentajes de sensibilidad similar o inferior a los de esta investigaci&oacute;n pero, definitivamente, las medidas de especificidad son m&aacute;s bajas o no aparecen en las publicaciones. En conclusi&oacute;n, las medidas de desempe&ntilde;o de los predictores desarrollados en nuestro estudio son altas y robustas, como puede deducirse de los an&aacute;lisis de los art&iacute;culos de Majoros <i>et al</i>. (2003) y Rojic <i>et al</i>. (2008). Majoros y colaboradores (2003) compararon el rendimiento de diferentes algoritmos para la predicci&oacute;n de genes y encontraron que el porcentaje de genes exactamente detectados no superaba el 50% y las medidas de desempe&ntilde;o para detectar exones ten&iacute;an menos del 75%, tanto en especificidad como en sensibilidad. Los resultados de estos investigadores fueron confirmados por Rojic <i>et al</i> (2008) que demuestran, al analizar los mejores programas actuales de predicci&oacute;n de genes en mam&iacute;feros, que aunque se ha incrementado la exactitud en la predicci&oacute;n de la composici&oacute;n de nucle&oacute;tidos en las secuencias (la especificidad y sensibilidad alcanzan 95% y 93%, respectivamente), realmente, las medidas de desempe&ntilde;o de estos programas para predecir secuencias exones no llega al 70%.</p>     <p>Finalmente, cuando se estableci&oacute; un predictor &uacute;nico de exones a partir de todas las secuencias de exones de los tres genomas (datos no mostrados), el desempe&ntilde;o del predictor alcanz&oacute; una sensibilidad del 91% y de especificidad del 75% y 91% para intrones y genes, respectivamente.</p>     ]]></body>
<body><![CDATA[<p><b>    <center><font face="verdana" size="3">Conclusiones</font></center></b></p>     <p>A pesar de las grandes diferencias en tama&ntilde;o y en el n&uacute;mero de cromosomas y secuencias por genoma, existen regularidades estad&iacute;sticas b&aacute;sicas en la distribuci&oacute;n de las secuencias gen&oacute;micas que se manifiestan a trav&eacute;s de los cromosomas de un mismo genoma y entre genomas, lo que corrobora que la complejidad estructural de un genoma no est&aacute; relacionada con estas caracter&iacute;sticas.</p>     <p>El an&aacute;lisis R/S permiti&oacute; demostrar que ambas distribuciones, la de los nucle&oacute;tidos que constituyen las secuencias de los genes, exones e intrones y la de estas secuencias en los genomas est&aacute;n caracterizadas por el fen&oacute;meno de memoria o dependencia de largo alcance. La estructura de memoria var&iacute;a seg&uacute;n el tipo de secuencia y el genoma.</p>     <p>Las estructuras de memoria de las secuencias de los genes e intrones fueron espec&iacute;ficas para el genoma de cada especie, mientras que la estructura de las secuencias de los exones fue estad&iacute;sticamente similar en los tres genomas. La estructura de memoria de los tres tipos de secuencias del genoma animal presentaron comportamiento persistente, mientras que las de los genes y de los exones de los genomas vegetales tuvieron comportamientos persistentes y la de los intrones, comportamiento antipersistente. Estos resultados fueron consistentes con la complejidad de las especies y con la funci&oacute;n que realizan estas secuencias en el genoma. La persistencia est&aacute; asociada a estructuras estables con alta probabilidad de cumplir funciones espec&iacute;ficas, mientras que la antipersistencia se relaciona con estructuras inestables que buscan funcionalidad.</p>     <p>Los par&aacute;metros R/S permiten definir biol&oacute;gica y matem&aacute;ticamente conjuntos de secuencias entre y dentro de genomas, lo que indica que el procedimiento del an&aacute;lisis R/S potencialmente podr&iacute;a utilizarse como una herramienta fen&eacute;tica de inferencia filogen&eacute;tica molecular, que complemente los m&eacute;todos cl&aacute;sicos de comparaci&oacute;n de secuencias o especies; o podr&iacute;a implementarse en los algoritmos de uso com&uacute;n de las herramientas bioinform&aacute;ticas para mejorar la capacidad de predicci&oacute;n; o podr&iacute;a utilizarse para influir sustancialmente en las estad&iacute;sticas de las puntuaciones del alineamiento de secuencias, o complementar los an&aacute;lisis de comparaci&oacute;n de secuencias que sean dif&iacute;ciles de alinear.</p>     <p><b>    <center><font face="verdana" size="3">Referencias</font></center></b></p>     <!-- ref --><p>Balb&iacute;n, A.; Andrade E. 2004. Protein Folding and Evolution are driven by the Maxwell Demon activity of Proteins. <i>Acta Bio theor</i>. 52 (3): 173-200.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000111&pid=S0120-2812201000040001200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Bernardi, G. 1995.The human genome: organization and evolutionary history. <i>Annu Rev. Genetics</i>. 29: 445-476.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000112&pid=S0120-2812201000040001200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Brown, D.D.; Wensink, P.C.; Jordan, E.A. 1972. A comparison of the ribosomal DNA´s of <i>Xenopus laevi</i> and <i>Xenopus mulleri</i>, the evolution of tandem genes. <i>J. Mol. Biol</i>. 63: 57-73.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000113&pid=S0120-2812201000040001200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Buldyrev, S.V., Golberger A.L., Havlin S., Mantegna R.N., Matsa M.E., Peng C.K., Simons M., y Stanley H.E. 1995. <i>Phys. Rev. E</i>. 51, 5084-5091.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000114&pid=S0120-2812201000040001200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Burset, M.,; Guigo. R. 1996. Evaluation of Gene Structure Prediction Programs. Genomics 34, 353–367.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000115&pid=S0120-2812201000040001200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Carothers, J.M.; Oestreich, S.C.; David, J.H.; Szostak, J.W. 2004. Informational complexity and functional activity of RNA structures. <i>J. Am. Chem</i>. Soc. 126: 5130-5137.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000116&pid=S0120-2812201000040001200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Craig, J.M.; Bickmore, W.A. 1993. Chromosome bands: flavors to savor. <i>BioEssays</i>. 15: 349-354.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000117&pid=S0120-2812201000040001200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Denton, M.J.; Dearden, P.K.; Sowerby, S.J. 2003. Physical law not natural selection as the major determinant of biological complexity in the subcellular realm: new support for the pre-Darwinian conception of evolution by natural law. <i>BioSystems</i> 71: 297-303&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000118&pid=S0120-2812201000040001200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Deutsch, M.; Long, M. 1999. Intron–exon structures of eukaryotic model organisms. Nucleic Acids Research. Vol. 27(15): 3219-3228.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000119&pid=S0120-2812201000040001200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Doolittle, R.F. 1981. Similar amino acid sequences: chance or common ancestry? <i>Science</i>. 214: 149-159.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000120&pid=S0120-2812201000040001200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gobel, U. <i>et al</i>. 1994. Correlated mutations and residue contacts in proteins. <i>Proteins: Struct. Funct. Genet</i>. 18: 309-317.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000121&pid=S0120-2812201000040001200011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Goldberger, A et al. 2000. PhysioBank, physioToolkit, and physioNet: components of a new research resource for complex physiologic signals. <i>Circulation</i>. 101(23): e215-220.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000122&pid=S0120-2812201000040001200012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Gu, Z.; Wang, H.; Nekulenko, A.; Li, W.L. 2000. Densities, length proportions, and other distributional features of repetitive sequences in the human genome estimated from 430 Mb of genomic sequence. <i>Gene</i>. 259: 81-88.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000123&pid=S0120-2812201000040001200013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hao, B.L. 2000. fractals from genomes –exact solutions of a biology– inspired problem. <i>Physica</i> A 282, 225-246.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000124&pid=S0120-2812201000040001200014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hawkins, J.D. 1988. A survey on intron and exon lengths. <i>Nucleic Acids Res</i>. 16, 9893-9906.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000125&pid=S0120-2812201000040001200015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hoop, B., Kazemi, H., Leibovitch, L. 1993. Rescaled range analysis of resting respiration. Chaos, 3(1), 27-29.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000126&pid=S0120-2812201000040001200016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hurst, H.E. 1956. Methods of using long-term storage in reservoirs. Part 1.Proc. Inst. Civ. Eng. Part I. 519 p.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000127&pid=S0120-2812201000040001200017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Hurst, H.E. 1951. Long-term storage capacity of reservoirs. <i>Trans. Am. Soc. Civil Engineers</i>. 116: 770-808.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000128&pid=S0120-2812201000040001200018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Karlin, S. and V. Brendel. 1993. Patchiness and correlations in DNA sequences. <i>Science</i>. 259: 677-680.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000129&pid=S0120-2812201000040001200019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Karlin, S. and LR. Cardon. Computational DNA sequence analysis. <i>Annu Rev Microbiol</i> 1994. 48: 619-54.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000130&pid=S0120-2812201000040001200020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Kolbe et al. 2004. Genetic variation increases during biological invasion by Cuban lizard. <i>Nature</i>. 431. 177-181.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000131&pid=S0120-2812201000040001200021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Li, W., K. Kaneko. 1992. Long-range correlation and partial 1/f spectrum in a non-coding DNA sequence. <i>Europhysics. Lett</i>. 17(7), 655-660.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000132&pid=S0120-2812201000040001200022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Majoros, W.H.; Pertea, M.; Antonescu, C; Salzberg, S.; Glimmer, M. 2003. Exonomy and Unveil: three <i>ab initio</i> eukariotic genefinders. <i>Nucleic Acids Res</i>. 31: 3601-3604.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000133&pid=S0120-2812201000040001200023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B. y Hudson, R.L. 2004. The (miss) behavoir of markets. A fractal view of risk, ruin and reward. Tusquets editors, S.A. 322p.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000134&pid=S0120-2812201000040001200024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B., Van Ness, J.W. 1968. Fractional Brownian motions, fractional noises and applications, SIAM Review 10, 422-437.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000135&pid=S0120-2812201000040001200025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B., Wallis J.R. 1969a. Some long-run properties of geophysical records. Water Resources Res. 5: 321-340.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000136&pid=S0120-2812201000040001200026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B., Wallis J.R. 1969b. Robustness of the rescaled range R/S in the measurement of non-cyclic long-run statistical dependence. Water Resources Research, 5: 967-988.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000137&pid=S0120-2812201000040001200027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B., Wallis J.R. 1969c. Computer experiments with fractional Gaussian noises. Water Resources Research, 5: 228-267.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000138&pid=S0120-2812201000040001200028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mandelbrot, B. 1982. Cambios de escala y leyes potenciales sin geometr&iacute;a. En: The Fractal Geometry of Nature. San Francisco: V.H. Freeman. P. 477-487.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000139&pid=S0120-2812201000040001200029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mattick, S.; John, Y.; Gagen, M. J. 2001. The evolution of a controlled multitasked gene Network: The role of introns and other Noncoding RNA in the development of complex organism. <i>Molecular Biology Evolution</i> 18(9): 1611-1630.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000140&pid=S0120-2812201000040001200030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Mouse Genome Sequencing Consortium. 2002. Initial sequencing and comparative analysis of the mouse genome. <i>Nature</i>, 420: 520-562.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000141&pid=S0120-2812201000040001200031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Ordov, YL; Boekhorst, R.; Abnizova II. 2006. Statistical measures of the structure of genomic sequences: entropy, complexity, and position information. <i>J Bioinform Comput Biol</i>. 4(2):523-36.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000142&pid=S0120-2812201000040001200032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Peng, C.K., Buldyrev S., Golberg A.L., Havlin S., Sciortino, F., Simons, M., y Stanley H.E. 1992. Long-Range Correlations in Nucleotide Sequences. <i>Nature</i> 356, 168.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000143&pid=S0120-2812201000040001200033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Peters, E. 1991. Chaos and order in the Fractal Market Analysis (Applying chaos theory to investment an economic). New York: John Wiley and Sons.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000144&pid=S0120-2812201000040001200034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Rojic, S.; Mackworth, A.K.; Qullette, B.F. 2008. Evaluation of gene finding programs on mammalian sequences. Genome Res. 11: 817-832.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000145&pid=S0120-2812201000040001200035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Schultes, E.; Hraber, P.; Labean, T. 1999. Estimating the contributions of selection and self-Organitation in ARN Secondary Structure. <i>J. Mol. Evol</i>. 49: 76-83.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000146&pid=S0120-2812201000040001200036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Stanley, H.E.; Buldyrev, S.V.; Goldberger, A.L.; Goldberger, Z.D.; Havlin, S.; Mantegna, R.N.; Ossadnik, S.M.; Peng, C.K.; Simons, M. 1994. Statistical mechanics in biology: how ubiquitous are long-range correlations? <i>Physic</i>. A205: 214-253.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000147&pid=S0120-2812201000040001200037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Xiao, Yi., Chen, R. Jian S. Jun X. 1995. Fractal dimension of Exon and Intron Sequences. <i>J. Theor. Biol</i>. 175, 23-26.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000148&pid=S0120-2812201000040001200038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Yu, Z.G., Chen G.Y. 2000. Rescaled range and transition matrix analysis of DNA sequences. <i>Comm. Theor. Phys</i>. 33(4), 673-678.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000149&pid=S0120-2812201000040001200039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Yu, Z.G., Anh V.V., Lau K.S. 2001. Multifractal characterisation of length sequences of coding and noncoding segments in a complete genome. <i>Physica</i> A. 301 (1-4), 351-361&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000150&pid=S0120-2812201000040001200040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Yu, Z.G., Wang B. 2001. Chaos, Solitons Fractals 12, 519.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000151&pid=S0120-2812201000040001200041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p>Zhang, C.T.; Zhang, R. 1991. Analysis of distribution of bases in the coding sequences by a diagrammatic technique. <i>Nucleic Acids Res</i>., 19: 6313-6317.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000152&pid=S0120-2812201000040001200042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Balbín]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Andrade]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Protein Folding and Evolution are driven by the Maxwell Demon activity of Proteins]]></article-title>
<source><![CDATA[Acta Bio theor]]></source>
<year>2004</year>
<volume>52</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>173-200</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bernardi]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The human genome: organization and evolutionary history]]></article-title>
<source><![CDATA[Annu Rev. Genetics]]></source>
<year>1995</year>
<volume>29</volume>
<page-range>445-476</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brown]]></surname>
<given-names><![CDATA[D.D.]]></given-names>
</name>
<name>
<surname><![CDATA[Wensink]]></surname>
<given-names><![CDATA[P.C.]]></given-names>
</name>
<name>
<surname><![CDATA[Jordan]]></surname>
<given-names><![CDATA[E.A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comparison of the ribosomal DNA´s of Xenopus laevi and Xenopus mulleri, the evolution of tandem genes]]></article-title>
<source><![CDATA[J. Mol. Biol.]]></source>
<year>1972</year>
<volume>63</volume>
<page-range>57-73</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Buldyrev]]></surname>
<given-names><![CDATA[S.V.]]></given-names>
</name>
<name>
<surname><![CDATA[Golberger]]></surname>
<given-names><![CDATA[A.L.]]></given-names>
</name>
<name>
<surname><![CDATA[Havlin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mantegna]]></surname>
<given-names><![CDATA[R.N.]]></given-names>
</name>
<name>
<surname><![CDATA[Matsa]]></surname>
<given-names><![CDATA[M.E.]]></given-names>
</name>
<name>
<surname><![CDATA[Peng]]></surname>
<given-names><![CDATA[C.K.]]></given-names>
</name>
<name>
<surname><![CDATA[Simons]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Stanley]]></surname>
<given-names><![CDATA[H.E.]]></given-names>
</name>
</person-group>
<source><![CDATA[Phys. Rev. E.]]></source>
<year>1995</year>
<volume>51</volume>
<page-range>5084-5091</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Burset]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Guigo]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluation of Gene Structure Prediction Programs]]></article-title>
<source><![CDATA[Genomics]]></source>
<year>1996</year>
<volume>34</volume>
<page-range>353-367</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carothers]]></surname>
<given-names><![CDATA[J.M.]]></given-names>
</name>
<name>
<surname><![CDATA[Oestreich]]></surname>
<given-names><![CDATA[S.C.]]></given-names>
</name>
<name>
<surname><![CDATA[David]]></surname>
<given-names><![CDATA[J.H.]]></given-names>
</name>
<name>
<surname><![CDATA[Szostak]]></surname>
<given-names><![CDATA[J.W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Informational complexity and functional activity of RNA structures.]]></article-title>
<source><![CDATA[J. Am. Chem. Soc.]]></source>
<year>2004</year>
<volume>126</volume>
<page-range>5130-5137</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Craig]]></surname>
<given-names><![CDATA[J.M.]]></given-names>
</name>
<name>
<surname><![CDATA[Bickmore]]></surname>
<given-names><![CDATA[W.A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Chromosome bands: flavors to savor]]></article-title>
<source><![CDATA[BioEssays]]></source>
<year>1993</year>
<volume>15</volume>
<page-range>349-354</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Denton]]></surname>
<given-names><![CDATA[M.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Dearden]]></surname>
<given-names><![CDATA[P.K.]]></given-names>
</name>
<name>
<surname><![CDATA[Sowerby]]></surname>
<given-names><![CDATA[S.J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Physical law not natural selection as the major determinant of biological complexity in the subcellular realm: new support for the pre-Darwinian conception of evolution by natural law]]></article-title>
<source><![CDATA[BioSystems]]></source>
<year>2003</year>
<volume>71</volume>
<page-range>297-303</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Deutsch]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Long]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Intron-exon structures of eukaryotic model organisms]]></article-title>
<source><![CDATA[Nucleic Acids Research]]></source>
<year>1999</year>
<volume>Vol. 27</volume>
<numero>15</numero>
<issue>15</issue>
<page-range>3219-3228</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Doolittle]]></surname>
<given-names><![CDATA[R.F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Similar amino acid sequences: chance or common ancestry?]]></article-title>
<source><![CDATA[Science]]></source>
<year>1981</year>
<volume>214</volume>
<page-range>149-159</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gobel]]></surname>
<given-names><![CDATA[U]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Correlated mutations and residue contacts in proteins]]></article-title>
<source><![CDATA[Proteins: Struct. Funct. Genet.]]></source>
<year>1994</year>
<volume>18</volume>
<page-range>309-317</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goldberger]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[PhysioBank, physioToolkit, and physioNet: components of a new research resource for complex physiologic signals]]></article-title>
<source><![CDATA[Circulation]]></source>
<year>2000</year>
<volume>101</volume>
<numero>23</numero>
<issue>23</issue>
<page-range>e215-220</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gu]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Nekulenko]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Li,]]></surname>
<given-names><![CDATA[W.L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Densities, length proportions, and other distributional features of repetitive sequences in the human genome estimated from 430 Mb of genomic sequence.]]></article-title>
<source><![CDATA[Gene]]></source>
<year>2000</year>
<volume>259</volume>
<page-range>81-88.</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hao]]></surname>
<given-names><![CDATA[B.L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[fractals from genomes -exact solutions of a biology- inspired problem]]></article-title>
<source><![CDATA[Physica A]]></source>
<year>2000</year>
<volume>282</volume>
<page-range>225-246</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hawkins]]></surname>
<given-names><![CDATA[J.D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A survey on intron and exon lengths]]></article-title>
<source><![CDATA[Nucleic Acids Res.]]></source>
<year>1988</year>
<volume>16</volume>
<page-range>9893-9906</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hoop]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Kazemi]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Leibovitch]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Rescaled range analysis of resting respiration]]></article-title>
<source><![CDATA[Chaos]]></source>
<year>1993</year>
<volume>3</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>27-29</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hurst,]]></surname>
<given-names><![CDATA[H.E]]></given-names>
</name>
</person-group>
<source><![CDATA[Methods of using long-term storage in reservoirs]]></source>
<year>1956</year>
<volume>Part I</volume>
<page-range>519 p.</page-range><publisher-name><![CDATA[Proc. Inst. Civ. Eng]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hurst]]></surname>
<given-names><![CDATA[H.E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Long-term storage capacity of reservoirs]]></article-title>
<source><![CDATA[Trans. Am. Soc. Civil Engineers.]]></source>
<year>1951</year>
<volume>116</volume>
<page-range>770-808</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Karlin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Brendel]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Patchiness and correlations in DNA sequences]]></article-title>
<source><![CDATA[Science]]></source>
<year>1993</year>
<volume>259</volume>
<page-range>677-680</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Karlin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Cardon]]></surname>
<given-names><![CDATA[LR]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computational DNA sequence analysis]]></article-title>
<source><![CDATA[Annu Rev Microbiol]]></source>
<year>1994</year>
<volume>48</volume>
<page-range>619-54</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kolbe]]></surname>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genetic variation increases during biological invasion by Cuban lizard]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2004</year>
<volume>431</volume>
<page-range>177-181.</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[W]]></given-names>
</name>
<name>
<surname><![CDATA[Kaneko]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Long-range correlation and partial 1/f spectrum in a non-coding DNA sequence]]></article-title>
<source><![CDATA[Europhysics. Lett.]]></source>
<year>1992</year>
<volume>17</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>655-660</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Majoros]]></surname>
<given-names><![CDATA[W.H]]></given-names>
</name>
<name>
<surname><![CDATA[Pertea]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Antonescu]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Glimmer]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Exonomy and Unveil: three ab initio eukariotic genefinders]]></article-title>
<source><![CDATA[Nucleic Acids Res.]]></source>
<year>2003</year>
<volume>31</volume>
<page-range>3601-3604</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Hudson]]></surname>
<given-names><![CDATA[R.L]]></given-names>
</name>
</person-group>
<source><![CDATA[The (miss) behavoir of markets: A fractal view of risk, ruin and reward]]></source>
<year>2004</year>
<page-range>322p.</page-range><publisher-name><![CDATA[Tusquets editors, S.A]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Van Ness]]></surname>
<given-names><![CDATA[J.W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fractional Brownian motions, fractional noises and applications]]></article-title>
<source><![CDATA[SIAM Review]]></source>
<year>1968</year>
<volume>10</volume>
<page-range>422-437</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Wallis]]></surname>
<given-names><![CDATA[J.R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Some long-run properties of geophysical records]]></article-title>
<source><![CDATA[Water Resources Res]]></source>
<year>1969</year>
<volume>5</volume>
<page-range>321-340</page-range></nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Wallis]]></surname>
<given-names><![CDATA[J.R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Robustness of the rescaled range R/S in the measurement of non-cyclic long-run statistical dependence]]></article-title>
<source><![CDATA[Water Resources Research]]></source>
<year>1969</year>
<volume>5</volume>
<page-range>967-988</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Wallis]]></surname>
<given-names><![CDATA[J.R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computer experiments with fractional Gaussian noises]]></article-title>
<source><![CDATA[Water Resources Research]]></source>
<year>1969</year>
<volume>5</volume>
<page-range>228-267</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mandelbrot]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Cambios de escala y leyes potenciales sin geometría]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Freeman]]></surname>
<given-names><![CDATA[V.H.]]></given-names>
</name>
</person-group>
<source><![CDATA[The Fractal Geometry of Nature]]></source>
<year>1982</year>
<page-range>P. 477-487</page-range><publisher-loc><![CDATA[San Francisco ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mattick]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[John]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Gagen]]></surname>
<given-names><![CDATA[M. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The evolution of a controlled multitasked gene Network: The role of introns and other Noncoding RNA in the development of complex organism]]></article-title>
<source><![CDATA[Molecular Biology Evolution]]></source>
<year>2001</year>
<month>.</month>
<volume>18</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>1611-1630</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<collab>Mouse Genome Sequencing Consortium</collab>
<article-title xml:lang="en"><![CDATA[Initial sequencing and comparative analysis of the mouse genome]]></article-title>
<source><![CDATA[Nature]]></source>
<year>2002</year>
<volume>420</volume>
<page-range>520-562</page-range></nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ordov]]></surname>
<given-names><![CDATA[YL]]></given-names>
</name>
<name>
<surname><![CDATA[Boekhorst]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Abnizova]]></surname>
<given-names><![CDATA[II]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical measures of the structure of genomic sequences: entropy, complexity, and position information]]></article-title>
<source><![CDATA[J Bioinform Comput Biol]]></source>
<year>2006</year>
<volume>4</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>523-36</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Peng]]></surname>
<given-names><![CDATA[C.K]]></given-names>
</name>
<name>
<surname><![CDATA[Buldyrev]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Golberg]]></surname>
<given-names><![CDATA[A.L.]]></given-names>
</name>
<name>
<surname><![CDATA[Havlin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Sciortino]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Simons]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Stanley]]></surname>
<given-names><![CDATA[H.E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Long-Range Correlations in Nucleotide Sequences]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1992</year>
<volume>356</volume>
<page-range>168</page-range></nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Peters]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Chaos and order in the Fractal Market Analysis (Applying chaos theory to investment an economic)]]></source>
<year>1991</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley and Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojic]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mackworth]]></surname>
<given-names><![CDATA[A.K.]]></given-names>
</name>
<name>
<surname><![CDATA[Qullette]]></surname>
<given-names><![CDATA[B.F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluation of gene finding programs on mammalian sequences]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2008</year>
<volume>11</volume>
<page-range>817-832</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schultes]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Hraber]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Labean]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Estimating the contributions of selection and self-Organitation in ARN Secondary Structure]]></article-title>
<source><![CDATA[J. Mol. Evol.]]></source>
<year>1999</year>
<volume>49</volume>
<page-range>76-83</page-range></nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stanley]]></surname>
<given-names><![CDATA[H.E]]></given-names>
</name>
<name>
<surname><![CDATA[Buldyrev]]></surname>
<given-names><![CDATA[S.V]]></given-names>
</name>
<name>
<surname><![CDATA[Goldberger]]></surname>
<given-names><![CDATA[A.L.]]></given-names>
</name>
<name>
<surname><![CDATA[Goldberger]]></surname>
<given-names><![CDATA[Z.D]]></given-names>
</name>
<name>
<surname><![CDATA[Havlin]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Mantegna]]></surname>
<given-names><![CDATA[R.N]]></given-names>
</name>
<name>
<surname><![CDATA[Ossadnik]]></surname>
<given-names><![CDATA[S.M]]></given-names>
</name>
<name>
<surname><![CDATA[Peng]]></surname>
<given-names><![CDATA[C.K]]></given-names>
</name>
<name>
<surname><![CDATA[Simons,]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical mechanics in biology: how ubiquitous are long-range correlations?]]></article-title>
<source><![CDATA[Physic. A]]></source>
<year>1994</year>
<volume>205</volume>
<page-range>214-253</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xiao]]></surname>
<given-names><![CDATA[Yi]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Jian]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Jun]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fractal dimension of Exon and Intron Sequences]]></article-title>
<source><![CDATA[J. Theor. Biol.]]></source>
<year>1995</year>
<volume>175</volume>
<page-range>23-26</page-range></nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yu]]></surname>
<given-names><![CDATA[Z.G.]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[G.Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Rescaled range and transition matrix analysis of DNA sequences]]></article-title>
<source><![CDATA[Comm. Theor. Phys.]]></source>
<year>2000</year>
<volume>33</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>673-678</page-range></nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yu]]></surname>
<given-names><![CDATA[Z.G]]></given-names>
</name>
<name>
<surname><![CDATA[Anh]]></surname>
<given-names><![CDATA[V.V]]></given-names>
</name>
<name>
<surname><![CDATA[Lau]]></surname>
<given-names><![CDATA[K.S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multifractal characterisation of length sequences of coding and noncoding segments in a complete genome]]></article-title>
<source><![CDATA[Physica A.]]></source>
<year>2001</year>
<volume>301</volume>
<numero>1-4</numero>
<issue>1-4</issue>
<page-range>351-361</page-range></nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yu]]></surname>
<given-names><![CDATA[Z.G]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[Chaos, Solitons Fractals]]></source>
<year>2001</year>
<page-range>519</page-range></nlm-citation>
</ref>
<ref id="B42">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[C.T]]></given-names>
</name>
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Analysis of distribution of bases in the coding sequences by a diagrammatic technique]]></article-title>
<source><![CDATA[Nucleic Acids Res]]></source>
<year>1991</year>
<volume>19</volume>
<page-range>6313-6317</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
