<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0120-548X</journal-id>
<journal-title><![CDATA[Acta Biológica Colombiana]]></journal-title>
<abbrev-journal-title><![CDATA[Acta biol.Colomb.]]></abbrev-journal-title>
<issn>0120-548X</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Biología]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0120-548X2014000200001</article-id>
<article-id pub-id-type="doi">10.15446/abc.v19n2.41010</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[ANALIZANDO DATOS DE RNA-Seq EN PROCARIOTAS: UNA REVISIÓN PARA NO EXPERTOS: A Review for Non-experts]]></article-title>
<article-title xml:lang="en"><![CDATA[RNA-Seq Data Analysis in Prokaryotes]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[RODRÍGUEZ CUBILLOS]]></surname>
<given-names><![CDATA[ANDRÉS EDUARDO]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[PERLAZA JIMÉNEZ]]></surname>
<given-names><![CDATA[LAURA]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[BERNAL GIRALDO]]></surname>
<given-names><![CDATA[ADRIANA JIMENA]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad de los Andes Departamento de Ciencias Biológicas ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>05</month>
<year>2014</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>05</month>
<year>2014</year>
</pub-date>
<volume>19</volume>
<numero>2</numero>
<fpage>131</fpage>
<lpage>142</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0120-548X2014000200001&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0120-548X2014000200001&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0120-548X2014000200001&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La secuenciación de transcritos con RNA-Seq es hoy en día una de las técnicas más populares en los estudios transcriptómicos. Relativamente reciente, esta técnica ha permitido la secuenciación de transcritos de RNA en una escala y profundidad no alcanzada por otras técnicas anteriores. Sin embargo, el alcance de las conclusiones que se pueden sacar depende estrictamente de un proceso adecuado, desde el diseño experimental hasta el análisis bioinformático de los datos. Dadas las diferencias en el proceso transcripcional de las células eucariotas y procariotas, el análisis de RNA-Seq deberá tener ciertas consideraciones dependiendo del tipo de organismo estudiado. En esta revisión se exponen los principales factores a tener en cuenta para lograr un análisis de RNA-Seq consistente, replicable y concluyente, enfocándose específicamente en organismos procariotas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[RNA-Seq is nowadays the method of choice for the sequencing of transcripts and transcriptomes in the field of molecular biology and gene expression assays. Until recently, this technique has allowed for the sequencing of RNA transcripts in an unprecedented scale and depth never reached in previous years; nevertheless, the reach and validity of the conclusions generated will depend strictly on an adequate experimental design and a robust analysis of the data. Given the inherent differences between prokaryotes and eukaryotes, the RNA-Seq analysis should take into account the type of organism studied. In this review we present the main factors to take into consideration when designing a consistent analysis for this type of data in prokaryotes, from the experimental design to the in silico analysis of the generated data.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[análisis bioinformático]]></kwd>
<kwd lng="es"><![CDATA[diseño experimental]]></kwd>
<kwd lng="es"><![CDATA[procariotas]]></kwd>
<kwd lng="es"><![CDATA[RNA-Seq]]></kwd>
<kwd lng="en"><![CDATA[analysis]]></kwd>
<kwd lng="en"><![CDATA[experimental design]]></kwd>
<kwd lng="en"><![CDATA[prokaryotes]]></kwd>
<kwd lng="en"><![CDATA[RNA-Seq]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="verdana" size="2">     <p><a href="http://dx.doi.org/10.15446/abc.v19n2.41010" target="_blank">http://dx.doi.org/10.15446/abc.v19n2.41010</a></p>     <p align="center"><font size="4"><b>ANALIZANDO DATOS DE RNA-Seq EN PROCARIOTAS: UNA REVISI&Oacute;N PARA NO EXPERTOS</b></font></p>     <p align="center"><font size="4"><b>RNA-Seq Data Analysis in Prokaryotes: A Review for Non-experts</b></font></p>     <p><b>ANDR&Eacute;S EDUARDO RODR&Iacute;GUEZ CUBILLOS</b>1, Bi&oacute;logo; <b>LAURA PERLAZA JIM&Eacute;NEZ</b>1, M. Sc.; <b>ADRIANA JIMENA BERNAL GIRALDO</b>1, Ph. D.</p>     <p>1 Grupo de Micolog&iacute;a y Fitopatolog&iacute;a, Departamento de Ciencias Biol&oacute;gicas, Universidad de los Andes. Carrera 1 # 18A - 12. Laboratorio J-204. Bogot&aacute;, Colombia.</p>     <p>Autor de correspondencia: Adriana Bernal, <a href="mailto:abernal@uniandes.edu.co">abernal@uniandes.edu.co</a></p>     <p>Presentado el 28 de noviembre de 2013, aceptado el 31 de enero de 2014, fecha de reenv&iacute;o el 12 de febrero de 2014.</p>     <p>Citation / Citar este art&iacute;culo como: RODR&Iacute;GUEZ CUBILLOS AE, PERLAZA JIM&Eacute;NEZ L, BERNAL GIRALDO AJ. Analizando datos de RNA-Seq en procariotas: una revisi&oacute;n para no expertos. Acta biol. Colomb. 2014;19(2):131-142.</p> <hr>     <p><b>RESUMEN</b></p>     ]]></body>
<body><![CDATA[<p>La secuenciaci&oacute;n de transcritos con RNA-Seq es hoy en d&iacute;a una de las t&eacute;cnicas m&aacute;s populares en los estudios transcript&oacute;micos. Relativamente reciente, esta t&eacute;cnica ha permitido la secuenciaci&oacute;n de transcritos de RNA en una escala y profundidad no alcanzada por otras t&eacute;cnicas anteriores. Sin embargo, el alcance de las conclusiones que se pueden sacar depende estrictamente de un proceso adecuado, desde el dise&ntilde;o experimental hasta el an&aacute;lisis bioinform&aacute;tico de los datos. Dadas las diferencias en el proceso transcripcional de las c&eacute;lulas eucariotas y procariotas, el an&aacute;lisis de RNA-Seq deber&aacute; tener ciertas consideraciones dependiendo del tipo de organismo estudiado. En esta revisi&oacute;n se exponen los principales factores a tener en cuenta para lograr un an&aacute;lisis de RNA-Seq consistente, replicable y concluyente, enfoc&aacute;ndose espec&iacute;ficamente en organismos procariotas.</p>     <p><b>Palabras clave:</b> an&aacute;lisis bioinform&aacute;tico, dise&ntilde;o experimental, procariotas, RNA-Seq.</p> <hr>     <p><b>ABSTRACT</b></p>     <p>RNA-Seq is nowadays the method of choice for the sequencing of transcripts and transcriptomes in the field of molecular biology and gene expression assays. Until recently, this technique has allowed for the sequencing of RNA transcripts in an unprecedented scale and depth never reached in previous years; nevertheless, the reach and validity of the conclusions generated will depend strictly on an adequate experimental design and a robust analysis of the data. Given the inherent differences between prokaryotes and eukaryotes, the RNA-Seq analysis should take into account the type of organism studied. In this review we present the main factors to take into consideration when designing a consistent analysis for this type of data in prokaryotes, from the experimental design to the in silico analysis of the generated data.</p>     <p><b>Keywords:</b> analysis, experimental design, prokaryotes, RNA-Seq.</p> <hr>     <p><b>INTRODUCCI&Oacute;N</b></p>     <p>El estudio del transcript&oacute;ma de un organismo en una condici&oacute;n dada puede realizarse con diferentes t&eacute;cnicas; estas pueden ser basadas en hibridaci&oacute;n o secuenciaci&oacute;n. Las t&eacute;cnicas basadas en hibridaci&oacute;n, como los microarreglos, requieren el conocimiento previo de los transcritos de inter&eacute;s para generar las sondas. Adem&aacute;s de esto, introducen ruido por posibles hibridaciones cruzadas, inherente al proceso de dise&ntilde;o de sondas, y limita el rango de detecci&oacute;n a genes previamente descritos (Wang <i>et al</i>., 2009; McClure <i>et al</i>., 2013). Por su lado, las t&eacute;cnicas basadas en secuenciaci&oacute;n tienen mayor alcance; t&eacute;cnicas como SAGE (<i>Serial Analysis of Gene Expression</i>), CAGE (<i>Cap Analysis of Gene Expression</i>) y MPSS (<i>Massively Parallel Signature Sequencing</i>) se basan en la secuenciaci&oacute;n de cDNA, o librer&iacute;as de ESTs con Sanger. Sin embargo, debido a que estas t&eacute;cnicas son de bajo rendimiento, se requiere dirigir la secuenciaci&oacute;n de forma espec&iacute;fica para producir resultados precisos, elevando los costos significativamente (Wang <i>et al</i>., 2009; Ozsolak y Milos, 2011; McClure <i>et al</i>., 2013).</p>     <p>La aparici&oacute;n de las plataformas de secuenciaci&oacute;n masiva paralelizadas, o t&eacute;cnicas de secuenciaci&oacute;n de nueva generaci&oacute;n (NGS, <i>Next-generation sequencing</i>), han generado la producci&oacute;n de datos a gran escala. Debido a esto, los costos de secuenciaci&oacute;n se han reducido dr&aacute;sticamente de entre dos a tres &oacute;rdenes de magnitud en los &uacute;ltimos diez a&ntilde;os (Shendure y Ji, 2008; Tucker <i>et al</i>., 2009). La reducci&oacute;n en los costos de NGS ha aumentado las posibilidades de estudiar cambios en el campo transcript&oacute;mico de forma m&aacute;s flexible y global que lo permitido por t&eacute;cnicas anteriores. El nuevo enfoque de inter&eacute;s en el tema de la transcript&oacute;mica es la secuenciaci&oacute;n masiva y profunda de RNAs, cuya t&eacute;cnica se denomina RNASeq. El principal objetivo de RNA-Seq es catalogar todos y cada uno de los transcritos (RNA) expresados por una c&eacute;lula en una condici&oacute;n especifica; una t&eacute;cnica altamente cuantitativa y de alto rendimiento que ha encontrado diversas aplicaciones en la actualidad (Hoen <i>et al</i>., 2008; Wang <i>et al</i>., 2009; Chen <i>et al</i>., 2011; Ozsolak y Milos, 2011; McClure <i>et al</i>., 2013; Van Verk <i>et al</i>., 2013). Estas t&eacute;cnicas basadas en secuenciaci&oacute;n masiva eliminan el ruido introducido por la correcta hibridaci&oacute;n de sondas dependiente del dise&ntilde;o empleado, ofrecen un mayor rango din&aacute;mico de detecci&oacute;n al evitar la saturaci&oacute;n por se&ntilde;ales de fluorescencia y permiten obtener un panorama m&aacute;s global de los genes activados y/o reprimidos sin restringirse a genes previamente caracterizados (Hoen <i>et al</i>., 2008; Bradford <i>et al</i>., 2010; Nookaew <i>et al</i>., 2012; Soneson y Delorenzi, 2013; Van Verk <i>et al</i>., 2013).</p>     <p>Aunque el alcance del RNA-Seq es mucho mayor a t&eacute;cnicas anteriormente usadas su poder informativo se ve limitado por cuatro factores importantes: 1) el dise&ntilde;o del experimento del cual se obtienen los datos a secuenciar, 2) la informaci&oacute;n requerida sobre los datos secuenciados, 3) la calidad de la secuenciaci&oacute;n y 4) el an&aacute;lisis bioinform&aacute;tico de los datos (Agarwal <i>et al</i>., 2010; Bradford <i>et al</i>., 2010; Oshlack <i>et al</i>., 2010; Soneson y Delorenzi, 2013). Dada la cantidad de informaci&oacute;n recopilada en una corrida de RNA-Seq, este &uacute;ltimo punto puede llegar a ser abrumador si se desconoce una metodolog&iacute;a adecuada. En esta revisi&oacute;n se sigue un flujo de trabajo para el an&aacute;lisis de organismos procariotas debido a que se excluyen los pasos necesarios para analizar datos de RNA-seq que contienen informaci&oacute;n sobre RNA producto de splicing alternativo, exclusivo de c&eacute;lulas eucariotas. Tambi&eacute;n se entiende que el principal objetivo del an&aacute;lisis de RNA-Seq es detectar genes diferencialmente expresados (DEGs); sin embargo se incluyen recomendaciones para cumplir otros objetivos, como la detecci&oacute;n de RNAs no codificantes y anotaci&oacute;n de genes novedosos.</p>     <p><b>Dise&ntilde;o experimental</b></p>     ]]></body>
<body><![CDATA[<p> El dise&ntilde;o experimental para el an&aacute;lisis de RNA-Seq es un   paso de gran relevancia, porque luego de secuenciadas las   muestras cualquier error en el dise&ntilde;o experimental solo podr&aacute;   corregirse reemplazando las muestras con una nueva   secuenciaci&oacute;n, lo cual implica altos costos y extiende el tiempo   de la investigaci&oacute;n. El dise&ntilde;o experimental de un an&aacute;lisis   transcript&oacute;mico no est&aacute; muy alejado del dise&ntilde;o de otros   experimentos en investigaci&oacute;n comparativa; sin embargo   cobra gran importancia debido al origen de la variaci&oacute;n   encontrada en los resultados. En los datos de RNA-Seq se   encuentran dos or&iacute;genes de variaci&oacute;n: el biol&oacute;gico, y el t&eacute;cnico.   Si el dise&ntilde;o experimental no se realiza adecuadamente   se podr&iacute;an confundir las variaciones t&eacute;cnicas con las biol&oacute;gicas   y llegar a conclusiones erradas que ning&uacute;n an&aacute;lisis   estad&iacute;stico elaborado podr&iacute;a evitar (Auer y Doerge, 2010).   Una manera frecuente de controlar la variaci&oacute;n t&eacute;cnica es   utilizar <i>Barcoding</i>. Los <i>Barcodes</i> son peque&ntilde;os fragmentos de   secuencias espec&iacute;ficas agregados a la secuencia original   del transcrito que sirven como etiqueta para cada muestra   de RNA, permitiendo diferenciar cada tratamiento del experimento;   estas muestras luego son procesadas en la misma   reacci&oacute;n de secuenciaci&oacute;n para reducir al m&iacute;nimo la variabilidad   t&eacute;cnica, maximizar los recursos utilizados y, a la vez,   permitir el dise&ntilde;o experimental en bloques (Auer y Doerge,   2010; Strickler <i>et al</i>., 2012).</p>     <p>Capturar la variabilidad biol&oacute;gica entre tratamientos se logra realizando el n&uacute;mero de r&eacute;plicas adecuadas. Sin embargo, cuando no se conoce la variabilidad del organismo, definir qu&eacute; numero de r&eacute;plicas biol&oacute;gicas es el adecuado resulta dif&iacute;cil; el m&eacute;todo estad&iacute;stico empleado tambi&eacute;n definir&aacute; un m&iacute;nimo de r&eacute;plicas a utilizar. Lo que se recomienda, en general, es tener tres r&eacute;plicas biol&oacute;gicas por tratamiento, es decir tres tratamientos id&eacute;nticos por separado (Anders y Huber, 2010; Soneson y Delorenzi, 2013; Tarazona <i>et al</i>., 2013). Esto permite evaluar la variabilidad biol&oacute;gica dentro de cada tratamiento y entre tratamientos. No obstante, aunque los trabajos de RNA-Seq sin r&eacute;plicas biol&oacute;gicas son comunes en la literatura, a medida que crecen los estudios con esta t&eacute;cnica la estad&iacute;stica aplicada es mas estricta y los resultados sin r&eacute;plicas biol&oacute;gicas pueden resultar obsoletos, sobretodo por la incapacidad de poder extrapolar los resultados a una poblaci&oacute;n biol&oacute;gica (Anders y Huber, 2010; Auer y Doerge, 2010; Soneson y Delorenzi, 2013; Tarazona <i>et al</i>., 2013).</p>     <p>Adem&aacute;s de tomar en cuenta la variabilidad t&eacute;cnica y biol&oacute;gica, es importante entender que la precisi&oacute;n en la estimaci&oacute;n de transcritos diferencialmnete expresados est&aacute; relacionada, tambi&eacute;n, con la profundidad de secuenciaci&oacute;n; es decir, a mayor n&uacute;mero de datos menos varianza existir&aacute; entre ellos. En este caso particular, los transcritos m&aacute;s afectados por una baja profundidad de secuenciaci&oacute;n ser&aacute;n aquellos con bajos niveles de expresi&oacute;n y longitudes reducidas. Actualmente se ha propuesto que para un genoma de mam&iacute;fero se requieren 700 millones de lecturas para obtener una cuantificaci&oacute;n confiable de > 95 % de los transcritos expresados (Bradford <i>et al</i>., 2010; Tarazona <i>et al</i>., 2011; Cai <i>et al</i>., 2012). Seg&uacute;n el consorcio de investigaci&oacute;n ENCODE, lanzado por el Instituto Nacional de Investigaci&oacute;n del Genoma Humano (NHGRI), la profundidad de secuenciaci&oacute;n adecuada var&iacute;a dependiendo del objetivo del proyecto. Para experimentos cuyo prop&oacute;sito es evaluar la similitud entre dos perfiles transcript&oacute;micos, se recomienda tener treinta millones de lecturas pareadas de una longitud mayor a treinta nucle&oacute;tidos. Si el experimento busca descubrir nuevos transcritos, o cuantificarlos de forma robusta, un m&iacute;nimo de 100-200 millones de lecturas mayores a setenta pares de bases es recomendado.</p>     <p><b>Informaci&oacute;n requerida: tipos de librer&iacute;as</b></p>     <p>Los datos obtenidos en el experimento ser&aacute;n representados   por secuencias, denominadas lecturas, y la agrupaci&oacute;n de   estas generan librer&iacute;as de secuenciaci&oacute;n. Adem&aacute;s de contener   lecturas, las librer&iacute;as incluyen informaci&oacute;n particular de estas.   Por esta raz&oacute;n, resulta crucial definir el tipo de librer&iacute;a deseada   previo a la secuenciaci&oacute;n. Dependiendo del tipo de librer&iacute;a   se puede obtener informaci&oacute;n adicional a la expresi&oacute;n diferencial   de genes, como la anotaci&oacute;n de genes novedosos o   la identificaci&oacute;n de RNAs no codificantes. Adicionalmente, la   escogencia adecuada de la librer&iacute;a tendr&aacute; un impacto sobre   la precisi&oacute;n de los resultados finales. Para generar an&aacute;lisis de   transcriptomas completos en una condici&oacute;n dada es recomendable   la construcci&oacute;n de librer&iacute;as paired-end tags, conocidas   por sus siglas en ingl&eacute;s como librer&iacute;as tipo PET (<a href="#tab1">Tabla   1</a>). Estas librer&iacute;as secuencian dos regiones por cada fragmento   de RNA, un fragmento a partir de cada extremo, produciendo   lecturas pareadas (Ruan y Ruan, 2012). Esto es   importante a la hora de realizar el ensamblaje de transcritos;   es decir, la uni&oacute;n de lecturas para formar transcritos hipot&eacute;ticos.   Dicho proceso se logra, normalmente, mediante la   identificaci&oacute;n de lecturas contiguas alineadas a un genoma   de referencia. Al contar con dos lecturas por fragmento, este   tipo de librer&iacute;a disminuye las posibilidades de encontrar alineamientos   en un genoma de referencia por azar, aumentando   la precisi&oacute;n a la hora de identificar transcritos hipot&eacute;ticos.   Por otro lado, al obtener dos lecturas por fragmento   se aumenta el &aacute;rea de cobertura en el genoma de referencia   estudiado; por esta raz&oacute;n, se suele considerar que la cobertura   de este tipo de librer&iacute;a es superior (Fullwood <i>et al</i>.,   2009). Por su lado, las librer&iacute;as single-end se recomiendan   para el an&aacute;lisis y predicci&oacute;n de RNAs no codificantes (<a href="#tab1">Tabla   1</a>), los cuales son mol&eacute;culas de menor longitud. En estos   casos, las librer&iacute;as tipo paired-end resultan en la sobreestimaci&oacute;n   de transcritos y complejizan el ensamblaje de los   mismos debido al riesgo inherente de secuenciar por duplicado   cada transcrito.</p>     <p>Tambi&eacute;n existe la posibilidad de generar librer&iacute;as hebra-espec&iacute;fica (<i>strand-specific</i>) con informaci&oacute;n sobre la direcci&oacute;n de transcripci&oacute;n. Este tipo de informaci&oacute;n resulta muy &uacute;til a la hora de descubrir RNAs no codificantes, los cuales pueden ser transcritos en sentido contrario de su blanco, anotar de forma correcta genes novedosos (previamente no predichos por herramientas bioinform&aacute;ticas) y, asimismo, obtener niveles de expresi&oacute;n m&aacute;s precisos debido a la capacidad de discernir mejor a qu&eacute; transcrito pertenece una secuencia en regiones con genes superpuestos (Kapranov <i>et al</i>., 2007; He <i>et al</i>., 2008; Parkhomchuk <i>et al</i>., 2009). Aunque existen varios m&eacute;todos para la construcci&oacute;n de una librer&iacute;a hebra-espec&iacute;fica, se ha reportado que el m&eacute;todo dUTP, donde toda la secuenciaci&oacute;n se hace a partir de la primera hebra de cDNA, genera los resultados m&aacute;s confiables (Levin <i>et al</i>., 2010).</p>     <p>El tama&ntilde;o de las librer&iacute;as tambi&eacute;n resulta crucial porque determina la profundidad de secuenciaci&oacute;n del ensayo. En casos donde las muestras de RNA no puedan ser obtenidas de forma pura (aislamiento a partir de tejidos hospederos), la cantidad limitante de RNA puede ser un obst&aacute;culo para aclanzar una profundidad de secuenciaci&oacute;n efectiva. En estos casos, se suelen amplificar las librer&iacute;as mediante PCR antes de la secuenciaci&oacute;n. No obstante, este paso previo suele introducir ruido adicional debido a la posible generaci&oacute;n de d&iacute;meros de primer's y/o la amplificaci&oacute;n de productos inespec&iacute;ficos (Tang <i>et al</i>., 2011). Como alternativa, se puede emplear una ampificaci&oacute;n lineal, utilizada en la metodolog&iacute;a CEL-seq (Hashimshony <i>et al</i>., 2012). Dicha aproximaci&oacute;n emplea una transcripci&oacute;n in vitro (IVT) a partir de cDNAs de doble cadena con un promotor muy espec&iacute;fico de la RNA polimerasa T7. Esta reacci&oacute;n isot&eacute;rmica evita los productos inespec&iacute;ficos y d&iacute;meros de primer's de la amplificaci&oacute;n exponencial pero requiere de una mayor cantidad de muestra inicial; por esta raz&oacute;n, previo a la IVT, las muestras se juntan con c&oacute;digos de barras (<i>Barcodes</i>) espec&iacute;ficos para sumar las cantidades de RNA y poder, a su vez, discernir las muestras originales. A&uacute;n as&iacute;, esta metodolog&iacute;a muestra un fuerte sesgo hacia la detecci&oacute;n de transcritos con altos niveles de expresi&oacute;n y no parece ofrecer una buena cobertura del transcriptoma, por lo que la mejor manera de obtener suficiente RNA a partir de muestras limitantes contin&uacute;a siendo debatible (Bhargava <i>et al</i>., 2014).</p>      <p align="center"><a name="tab1" id="tab1"><img src="img/revistas/abc/v19n2/v19n2a1t1.jpg"></a></p>      <p><b>Secuenciaci&oacute;n</b></p>     <p>Teniendo en cuenta la informaci&oacute;n anterior, las muestras   deben ser procesadas y enviadas a secuenciar, especificando   qu&eacute; tipo de librer&iacute;a se requiere. La secuenciaci&oacute;n RNA-Seq   de las muestras puede realizarse mediante cuatro tipos diferentes   de plataforma: Illumina, SOLiD, 454 y Ion Torrent   (Ozsolak y Milos, 2011; McClure <i>et al</i>., 2013). Sin embargo,   para t&eacute;rminos pr&aacute;cticos de este documento se asume que los   datos fueron obtenidos a trav&eacute;s de la plataforma de secuenciaci&oacute;n   Illumina, considerada como una de las tecnolog&iacute;as   m&aacute;s dominantes en el mercado (Metzker, 2010). Para garantizar   una buena calidad de secuenciaci&oacute;n, es de vital importancia   obtener buenas muestras del RNA a secuenciar. Para   esto se debe lograr extraer RNA de buena calidad en las   condiciones requeridas. La calidad del RNA suele medirse   mediante dos par&aacute;metros: pureza e integridad. La pureza se   puede analizar en un espectrofot&oacute;metro, como el NanoDrop;   se espera que las medidas de absorbancia est&eacute;n dentro del   rango 1,8 y 2 para asegurar unas muestras sin contaminaci&oacute;n   de prote&iacute;nas o compuestos fen&oacute;licos, normalmente   introducidos durante el proceso de extracci&oacute;n. El bioanalizador   realiza una electroforesis capilar que permite determinar   la integridad del RNA mediante dos tipos de lecturas:   el n&uacute;mero de integridad del RNA (RIN) y las proporciones de   RNA ribosomal (rRNA) presentes (23S/16S). La primera se   calcula a trav&eacute;s de un software que analiza todo el patr&oacute;n   electrofor&eacute;tico de corrida y el segundo m&eacute;todo calcula las   proporciones de las intensidades de banda correspondientes   al rRNA (las m&aacute;s visibles en una electroforesis de RNA total).</p>     ]]></body>
<body><![CDATA[<p>RINs de buena calidad se sit&uacute;an por encima de seis, en un rango de uno a diez, y buenas proporciones de rRNA son iguales o superiores a uno. Luego de asegurarse que la extracci&oacute;n se realice de la manera adecuada, las muestras se env&iacute;an a secuenciar. Desde este punto la calidad de la secuenciaci&oacute;n queda en manos de la compa&ntilde;&iacute;a secuenciadora.</p>     <p><b>An&aacute;lisis bioinform&aacute;tico</b></p>     <p> Despu&eacute;s del proceso de secuenciaci&oacute;n se obtienen los datos   en forma de lecturas contenidos en archivos inform&aacute;ticos.   Estos archivos pueden llegar a ser muy pesados; entre m&aacute;s   grande sea el genoma del organismo estudiado mayor ser&aacute;   el tama&ntilde;o de los archivos, por lo cual se recomienda tener   un cl&uacute;ster o un servidor para poder analizarlos de forma   eficiente. Se recomienda tener, preferiblemente, un servidor   con 16Gb de RAM o m&aacute;s; si no es posible, al menos 4Gb de   RAM y una capacidad de almacenamiento superior al tama&ntilde;o   de las librer&iacute;as debido a que los archivos resultantes   del an&aacute;lisis bioinform&aacute;tico tambi&eacute;n suelen ser pesados (Van   Verk <i>et al</i>., 2013). A lo largo de esta revisi&oacute;n se explicar&aacute;n los   pasos para analizar los datos utilizando un sistema operativo   basado en Unix (sea GNU/Linux o Mac OS X). Los datos suelen   estar en formato .<i>fastq</i>. Este formato contiene las secuencias   de las lecturas y sus correspondientes valores de calidad   de secuenciaci&oacute;n. Los pasos b&aacute;sicos en el an&aacute;lisis bioinform&aacute;tico   son: (1) la preparaci&oacute;n de las lecturas, (2) el mapeo   y ensamblaje, y (3) la identificaci&oacute;n de genes diferencialmente   expresados. Adicionalmente, se pueden identificar   RNAs no codificantes aunque esta revisi&oacute;n se enfocar&aacute; en la   identificaci&oacute;n de transcritos codificantes.</p>     <p><b>Preparando las lecturas para el an&aacute;lisis</b></p>     <p>Antes de centrarnos en identificar los transcritos diferencialmente   expresados, se debe realizar una limpieza y ensamblaje   de dichos transcritos. Para ello es necesario primero responder   dos preguntas: 1)Cu&aacute;l es el estado de la secuenciaci&oacute;n   de nuestras lecturas? 2) &iquest;Qu&eacute; informaci&oacute;n dentro de   las librer&iacute;as es pertinente incluir en el an&aacute;lisis?</p>     <p>Para responder la primera pregunta se pueden visualizar las lecturas utilizando la herramienta bioinform&aacute;tica <i>fastq</i>C, disponible en <a href="http://www.bioinformatics.babraham.ac.uk/projects/fastqc/" target="_blank">http://www.bioinformatics.babraham.ac.uk/projects/fastqc/</a> (Van Verk <i>et al</i>., 2013). Esta herramienta (<a href="#fig1">Fig. 1</a>) permite observar la calidad de las lecturas, la distribuci&oacute;n por nucle&oacute;tido, el contenido GC, las secuencias sobrerrepresentadas, la frecuencia de k-meros y el nivel de duplicaci&oacute;n, entre otros. Con esta informaci&oacute;n se identifica el estado de las lecturas y se toman medidas para optimizar las mismas; a esto se le denomina limpieza de las lecturas.</p>     <p>Existen varios criterios para identificar qu&eacute; limpieza se debe realizar a las lecturas. Por ejemplo, la calidad de las lecturas debe estar por encima de 28 (quality score) y se deben eliminar las porciones de secuencias que incrementen la desviaci&oacute;n est&aacute;ndar de la muestra. Se deben tener en cuenta la distribuci&oacute;n y frecuencia de los nucle&oacute;tidos; una inconstancia en estas caracter&iacute;sticas usualmente implica la presencia de fragmentos de los adaptadores ligados durante el proceso de secuenciaci&oacute;n. Muchas veces dentro del servicio de secuenciaci&oacute;n, las compa&ntilde;&iacute;as incluyen el servicio de limpieza de adaptadores. Sin embargo, siempre es &uacute;til realizar este an&aacute;lisis debido a que no siempre la limpieza es realizada con los mismos est&aacute;ndares. Se puede decir que estos son los principales criterios a observar, sin embargo si est&aacute; interesado en conocer otros criterios sugerimos visitar la p&aacute;gina de los desarrolladores: <a href="http://www.bioinformatics.babraham.ac.uk/projects/fastqc/" target="_blank">http://www.bioinformatics.babraham.ac.uk/projects/fastqc/</a>.</p>     <p align="center"><a name="fig1"><a href="img/revistas/abc/v19n2/v19n2a1f1.jpg" target="_blank">Figura 1</a></a></p>     <p>Para realizar dicha limpieza de lecturas se puede emplear el programa FastX Toolkit disponible gratis en la web del Laboratorio Hannon (<a href="http://hannonlab.cshl.edu/fastx_toolkit/" target="_blank">http://hannonlab.cshl.edu/fastxtoolkit/</a>). Para filtrar las secuencias por una calidad m&iacute;nima de secuenciaci&oacute;n se debe emplear el paquete Quality Filter de FastX Toolkit. Para eliminar regiones extremas con un contenido de bases anormal se puede utilizar Trimmer (paquete de FastX Toolkit). Despu&eacute;s de filtrar por calidad y remover regiones extremas con proporciones anormales de bases es recomendable mirar los archivos nuevamente mediante <i>fastq</i>C para verificar se haya mejorado la calidad y se hayan eliminado las regiones correspondientes a los adaptadores. Adem&aacute;s de FastX Toolkit, existen otras herramientas bioinform&aacute;ticas disponibles para eliminar adaptadores, filtrar secuencias por calidad y recortar una longitud de secuencia especificada por el usuario (<a href="#tab2">Tabla 2</a>).</p>     <p align="center"><a name="tab2" id="tab2"><img src="img/revistas/abc/v19n2/v19n2a1t2.jpg"></a></p>      ]]></body>
<body><![CDATA[<p>Para responder qu&eacute; informaci&oacute;n dentro de las librer&iacute;as es pertinente incluir en el an&aacute;lisis se debe tener en cuenta que los kit de limpieza de RNA ribosomal (rRNA) utilizados durante la extracci&oacute;n no son 100 % eficientes (Giannoukos <i>et al</i>., 2012). Uno de los grandes retos del analisis de RNA-Seq, sobretodo en procariotas, consiste en la eliminaci&oacute;n adecuada de este tipo de RNA que no suministra informaci&oacute;n relevante sobre genes de inter&eacute;s diferencialmente expresados y suele ser muy abundante. Por ende, es recomendable realizar una filtraci&oacute;n del rRNA in silico (m&eacute;todos bioinform&aacute;ticos). Para eliminar las secuencias correspondientes al rRNA es recomendable utilizar un alineador eficiente como Bowtie2 (Langmead y Salzberg, 2012). Bowtie2 ahorra memoria porque comprime los datos utilizando una transformaci&oacute;n de Burrows- Wheeler, brindando una mayor eficiencia al lado de otros alineadores como SOAP y Maq; Bowtie es 351 veces m&aacute;s r&aacute;pido que SOAP y 107 veces m&aacute;s r&aacute;pido que Maq. La clave de la transformaci&oacute;n Burrows-Wheeler radica en su flexibilidad; adem&aacute;s de reducir el tama&ntilde;o, en este caso, de un genoma, evita la p&eacute;rdida de informaci&oacute;n asociada normalmente con la compresi&oacute;n de archivos (Langmead <i>et al</i>., 2009). Para eliminar el rRNA se deben indexar las secuencias de rRNA correspondientes al organismo de estudio con el fin de suministr&aacute;rselo a Bowtie2 como un genoma de referencia. El siguiente paso ser&aacute; mapear las lecturas contra este "genoma de referencia" y eliminar todo aquello que alinee para conservar &uacute;nicamente las lecturas que no corresponden a rRNA. Si se tienen lecturas pareadas (PETs) es importante realizar la limpieza por cada pareja de archivos en conjunto para evitar eliminar lecturas de una sola pareja &uacute;nicamente (ver anexos para recomendaciones t&eacute;cnicas). Para obtener todos los detalles sobre las opciones y comandos de Bowtie2 se recomienda leer el manual del programa disponible en <a href="http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml" target="_blank">http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml</a></p>     <p><b>Mapeo y ensamblaje de transcritos</b></p>     <p>Para analizar las lecturas de forma apropiada y poder descubrir   genes diferencialmente expresados en un tratamiento   espec&iacute;fico se deben seguir tres pasos (Fig. 2): 1) mapeo de   lecturas a un genoma de referencia, 2) ensamble y estimaci&oacute;n   de las abundancias de los transcritos y 3) identificaci&oacute;n de   transcritos diferencialmente expresados. Para realizar el mapeo   de las lecturas a un genoma de referencia se puede utilizar   TopHat; esta herramienta utiliza Bowtie2 para alinear   lecturas a un genoma de referencia y ofrece las ventajas adicionales   de permitir ensayos <i>strand-specific</i> (hebra-espec&iacute;fico)   e identificar genes novedosos por splicing alternativo, &uacute;til en   organismos eucariotas (Trapnell <i>et al</i>. 2009). Para el mapeo   es importante tener en cuenta que aproximadamente el 90 %   del genoma procariota es codificante (Kuo y Ochman, 2009),   por lo que el transcript&oacute;ma deber&iacute;a tener una alta cobertura   del genoma.</p>     <p>Para ensamblar transcritos a partir de lecturas y estimar sus abundancias se recomienda el uso de Cufflinks y Cuffmerge (Trapnell <i>et al</i>., 2010) o, en caso de querer utilizar DESeq, HTSeq-count (<a href="#tab3">Tabla 3</a>); este &uacute;ltimo puede ser descargado desde la p&aacute;gina de los desarrolladores <a href="http://www-huber.embl.de/users/anders/HTSeq/doc/count.html" target="_blank">http://www.huber.embl.de/users/anders/HTSeq/doc/count.html</a>. Es importante resaltar que para utilizar HTSeq-count se debe tener un archivo SAM de entrada y TopHat normalmente arroja resultados en formato binario BAM para ahorrar espacio (ver anexo para mayor informaci&oacute;n sobre compatibilidad de archivos y sugerencias t&eacute;cnicas). Otros programas como BWA, CLC o IDB-UD son alternativas adicionales para alinear lecturas y ensamblar transcritos (Li y Durbin, 2009; Peng <i>et al</i>., 2012).</p>     <p>Adicionalmente al genoma de referencia, es importante saber si se cuenta con un genoma anotado en formato .gtf o .gff. En caso de tener este tipo de archivo, es aconsejable suministrarlo en el proceso de alineamiento y ensamble para guiar dichos procesos y obtener los nombres anotados de los transcritos identificados (de lo contrario Cufflinks establece un c&oacute;digo como nombre a cada transcrito especificando el rango de coordenadas que cubre dentro del genoma). Adem&aacute;s de obtener genes previamente anotados, tambi&eacute;n se pueden identificar transcritos novedosos siempre y cuando se le permita a Cufflinks ensamblar transcritos diferentes a los ya anotados (ver anexo para recomendaciones t&eacute;cnicas).</p>     <p align="center"><a name="fig2"><a href="img/revistas/abc/v19n2/v19n2a1f2.jpg" target="_blank">Figura 2</a></a></p>      <p align="center"><a name="tab3" id="tab3"><img src="img/revistas/abc/v19n2/v19n2a1t3.jpg"></a></p>      <p><b>Identificaci&oacute;n de Genes Diferencialmente</b></p>     <p> Expresados   (DEGs)   Existen diversidad de programas capaces de identificar genes   diferencialmente expresados (DEGs, por sus siglas en ingl&eacute;s).   La selecci&oacute;n del programa depender&aacute;, en gran medida, del   n&uacute;mero de r&eacute;plicas biol&oacute;gicas disponibles en el ensayo. En   esta revisi&oacute;n nos enfocaremos principalmente en las ventajas   y desventajas de los programas m&aacute;s com&uacute;nmente utilizados   y entraremos a detallar mejor las aproximaciones param&eacute;tricas   y no param&eacute;tricas empleadas por DESeq (Anders y Huber,   2010), NOISeq (Tarazona <i>et al</i>., 2011; Tarazona <i>et al</i>., 2012)   y NPEBseq (Bi y Davuluri, 2013).</p>     <p>Antes de poder identificar DEGs se deben "normalizar" los datos de las abundancias de los transcritos hipot&eacute;ticos. El t&eacute;rmino "normalizaci&oacute;n" suele emplearse de forma errada en los an&aacute;lisis de RNA-Seq para referirse al m&eacute;todo por el cual se busca minimizar el ruido t&eacute;cnico introducido en los datos durante el proceso de secuenciaci&oacute;n con el fin de volverlos comparables entre s&iacute;; no busca transformar los datos para que sigan una distribuci&oacute;n normal. Existen numerosos m&eacute;todos de normalizaci&oacute;n dentro de los cuales los m&aacute;s ampliamente utilizados son la normalizaci&oacute;n por tama&ntilde;o de librer&iacute;a y por longitud del fragmento o transcrito hipot&eacute;tico. Normalizar por el tama&ntilde;o de librer&iacute;a implica llevar a una misma escala todas las librer&iacute;as correspondientes a cada tratamiento para evitar falsos positivos (una librer&iacute;a con mayor profundidad de secuenciaci&oacute;n tiene m&aacute;s probabilidad de tener genes diferencialmente sobreexpresados respecto a otra librer&iacute;a sin ser consecuencia del tratamiento). De la misma forma, un transcrito largo tendr&aacute; mayor probabilidad de ser secuenciado y de tener un n&uacute;mero mayor de lecturas alineadas que uno corto, implicando una mayor probabilidad de ser detectado como un DEG (Oshlack y Wakefield, 2009; Dillies <i>et al</i>., 2013). El m&eacute;todo de normalizaci&oacute;n que emplea ambas correcciones mencionadas se conoce como FPKM por sus siglas en ingl&eacute;s (<i>Fragments Per Kilobase Of Transcript Per Million Mapped Reads</i>), parecido al RPKM (<i>Reads Per Kilobase Of Transcript Per Million Mapped Reads</i>). La &uacute;nica diferencia entre ambas es que una utiliza fragmentos y la otra lecturas; una librer&iacute;a tipo PET tiene dos lecturas por fragmento, raz&oacute;n por la cu&aacute;l se emplea la terminolog&iacute;a FPKM al trabajar con este tipo de librer&iacute;as (Mortazavi <i>et al</i>., 2008).</p>     ]]></body>
<body><![CDATA[<p>Tambi&eacute;n resulta &uacute;til tomar en cuenta las variaciones biol&oacute;gicas naturales entre tratamientos no atribuibles a los tratamientos en s&iacute;. Por esta raz&oacute;n, Robinson <i>et al</i>. (2010) crearon una correcci&oacute;n para eliminar el ruido introducido por la variaci&oacute;n biol&oacute;gica entre muestras. Este tipo de normalizaci&oacute;n busca llevar a una misma escala los valores de expresi&oacute;n promedio entre las diferentes muestras bajo el supuesto que "la mayor&iacute;a de genes no se encuentran diferencialmente expresados". Este tipo de normalizaci&oacute;n se conoce como TMM, por sus siglas en ingl&eacute;s <i>Trimmed mean of M values</i>, y podr&iacute;a ser &uacute;til si se encuentran demasiados genes diferencialmente expresados al final de un an&aacute;lisis. Vale la pena resaltar, sin embargo, las asunciones en las que se basa esta normalizaci&oacute;n: solo una minor&iacute;a de genes se encuentran diferencialmente expresados y el n&uacute;mero de genes sobreregulados ser&aacute; similar al n&uacute;mero de genes reprimidos (Robinson y Oshlack, 2010; Dillies <i>et al</i>., 2013; Soneson y Delorenzi, 2013).</p>     <p>Al emplear Cufflinks para ensamblar transcritos a partir de lecturas alineadas se obtendr&aacute;n abundancias normalizadas por FPKMs para cada transcrito hipot&eacute;tico. HTSeq-count, por otro lado, arroja abundancias crudas sin ning&uacute;n tipo de normalizaci&oacute;n por lo que no se recomienda utilizar estas abundancias para detectar DEGs sin antes haberlas normalizado (los programas para la detecci&oacute;n de genes diferencialmente expresados suelen tener pasos previos de normalizaci&oacute;n).</p>     <p>Debido al gran n&uacute;mero de genes presentes en cada ensayo de RNA-Seq se requiere una correcci&oacute;n para las m&uacute;ltiples comparaciones (una por cada gen entre dos tratamientos) con el fin de evitar falsos positivos; a medida que aumentan las comparaciones aumenta la probabilidad de encontrar diferencias por azar. Inicialmente, el concepto de tasa de falsos descubrimientos (FDR por sus siglas en ingl&eacute;s), desarrollado por (Benjamini y Hochberg, 1995), fue ampliamente utilizado para controlar este tipo de error. No obstante, la mayor&iacute;a de los c&aacute;lculos estad&iacute;sticos iniciales para determinar DEGs se basaban en un comportamiento normal de los datos, idea que normalmente no se cumple. Adem&aacute;s, es importante resaltar que la matriz de datos obtenida despu&eacute;s de una corrida de RNA-Seq se compone de n&uacute;meros con valores positivos (no son n&uacute;meros reales), por lo que una aproximaci&oacute;n basada en un comportamiento gaussiano no ser&iacute;a apropiada (Li <i>et al</i>., 2012). Paralelamente, la estimaci&oacute;n correcta de una FDR requiere de valores p precisos y estos valores de significancia se basan en una distribuci&oacute;n te&oacute;rica de los datos. Por ende, si dicha distribuci&oacute;n te&oacute;rica no se cumple, ser&aacute; dif&iacute;cil rechazar falsos positivos de forma acertada. Debido a esto, se desarrollaron m&eacute;todos que, en vez de asumir una distribuci&oacute;n normal, asumen una distribuci&oacute;n de Poisson (Marioni <i>et al</i>., 2008) o una binomial negativa (Anders y Huber, 2010) para controlar mejor la sobredispersi&oacute;n observada entre r&eacute;plicas t&eacute;cnicas y biol&oacute;gicas, respectivamente. A&uacute;n as&iacute;, estas presunciones empleadas por programas param&eacute;tricos como EdgeR (Robinson <i>et al</i>., 2010) y DESeq (Anders y Huber, 2010) siguen asumiendo una distribuci&oacute;n te&oacute;rica de los datos y basan sus c&aacute;lculos en una estimaci&oacute;n de la relaci&oacute;n existente entre media y varianza; par&aacute;metros dif&iacute;ciles de estimar por separado con pocas r&eacute;plicas biol&oacute;gicas. Por ende, estas t&eacute;cnicas pueden ser sensibles a la variabilidad presente entre r&eacute;plicas biol&oacute;gicas si no se cuenta con el n&uacute;mero adecuado (Bullard <i>et al</i>., 2010).</p>     <p>Aunque EdgeR y DESeq funcionan bajo los mismos supuestos, DESeq emplea una regresi&oacute;n local de las dispersiones presentes en los datos que le brinda mayor flexibilidad ante varianzas inestables; esto ha sido demostrado experimentalmente por (Robles <i>et al</i>., 2012). Sin embargo, si un gen tiene una dispersi&oacute;n muy elevada en el tratamiento problema y una dispersi&oacute;n baja en el tratamiento de referencia, la regresi&oacute;n trazada de dispersi&oacute;n ser&aacute; m&aacute;s elevada en el tratamiento problema con respecto al tratamiento de referencia. De la misma forma, el promedio de expresi&oacute;n de un gen en un tratamiento ser&aacute; influenciado en gran medida por un valor extremo en alguna r&eacute;plica y un gen podr&iacute;a ser elegido como un DEG a pesar de no tener un nivel de expresi&oacute;n similar entre las r&eacute;plicas biol&oacute;gicas utilizadas. Por ende, la confiabilidad de DESeq y otros programas param&eacute;tricos se reduce con pocas r&eacute;plicas biol&oacute;gicas debido a la imprecisi&oacute;n que existe a la hora de estimar los par&aacute;metros de media y varianza; utilizar estos programas es recomendable &uacute;nicamente cuando se tienen tres o, preferiblemente, m&aacute;s de tres r&eacute;plicas biol&oacute;gicas por tratamiento (Soneson y Delorenzi, 2013).</p>     <p>Para evitar supuestos en la distribuci&oacute;n de los datos y disminuir la tasa de falsos positivos se pueden transformar los datos o emplear programas no param&eacute;tricos que no asumen una distribuci&oacute;n establecida para los datos. Anders <i>et al</i>. (2010) desarrollaron un m&eacute;todo donde los datos son transformados para estabilizar las varianzas y generar homocedasticidad. Tambi&eacute;n existe una transformaci&oacute;n utilizada originalmente para datos de microarreglos que ha sido empleada en algunos experimentos de RNA-Seq (Smyth, 2004; Soneson y Delorenzi, 2013). No obstante, los programas no param&eacute;tricos han tenido gran acogida en los &uacute;ltimos a&ntilde;os y existen dos muy conocidos que han demostrado tener una baja tasa de falsos positivos: SAMseq (Li y Tibshirani, 2011) y NOISeq (Tarazona <i>et al</i>., 2011; Tarazona <i>et al</i>., 2012).</p>     <p>Recientemente, NOISeq ha tenido varias mejoras que incluyen la versi&oacute;n NOISeqBIO dise&ntilde;ada para trabajar con r&eacute;plicas biol&oacute;gicas. NOISeq genera una distribuci&oacute;n de ruido basada en los factores de cambio existentes entre r&eacute;plicas de un mismo tratamiento. Posteriormente, los factores de cambio calculados entre tratamientos son contrastados contra la distribuci&oacute;n de ruido para discernir entre cambios atribuibles a los tratamientos o al ruido existente entre r&eacute;plicas (Tarazona <i>et al</i>., 2011; Tarazona <i>et al</i>., 2012).</p>     <p>NOISeqBIO genera una distribuci&oacute;n nula mediante aleatorizaci&oacute;n de los datos de expresi&oacute;n. Esta distribuci&oacute;n corresponde a la hip&oacute;tesis nula de genes invariantes entre tratamientos (al aleatorizar los datos se rompe cualquier tipo de relaci&oacute;n). Posteriormente, los factores de cambio calculados entre tratamientos son contrastados contra los calculados entre r&eacute;plicas (ruido) y contra los calculados para la distribuci&oacute;n nula con el fin de determinar si los cambios de expresi&oacute;n son significativos o no.</p>     <p>Sin embargo, el n&uacute;mero de combinaciones posibles (permutaciones) para la construcci&oacute;n de la distribuci&oacute;n nula depender&aacute; del n&uacute;mero de datos por gen (r&eacute;plicas biol&oacute;gicas). Por ende, la distribuci&oacute;n nula puede quedar "deficiente" con pocas r&eacute;plicas biol&oacute;gicas. En caso de tener pocas r&eacute;plicas biol&oacute;gicas (menos de cuatro), NOISeqBIO agrupa los genes con expresi&oacute;n similar (teniendo en cuenta todas las r&eacute;plicas biol&oacute;gicas disponibles) y genera cl&uacute;sters de genes (k) donde cada (k) se toma como una condici&oacute;n y se aleatoriza con base en el n&uacute;mero de genes contenidos para generar una distribuci&oacute;n nula m&aacute;s robusta que se utiliza para contrastar los factores de cambio calculados entre tratamientos sin aleatorizar (Tarazona <i>et al</i>., 2011; Tarazona <i>et al</i>., 2012). Esta aproximaci&oacute;n es m&aacute;s robusta que la estimaci&oacute;n de la media y la varianza empleada por programas param&eacute;tricos si se tienen menos de cuatro o tres r&eacute;plicas biol&oacute;gicas (Tarazona <i>et al</i>., 2011; Soneson y Delorenzi, 2013). Sin embargo, en caso de no tener r&eacute;plicas, NOISeq tambi&eacute;n tiene una versi&oacute;n capaz de simular un n&uacute;mero de r&eacute;plicas biol&oacute;gicas establecida por el usuario (NOISeqSim), aunque las conclusiones de dicho an&aacute;lisis no podr&aacute;n ser extrapoladas a nivel poblacional (Tarazona <i>et al</i>., 2013).</p>     <p>SAMseq tambi&eacute;n ha demostrado tener una tasa muy baja de falsos positivos. No obstante, estudios previos han recalcado que su capacidad para detectar DEGs se ve limitada al uso de al menos cuatro r&eacute;plicas biol&oacute;gicas por tratamiento (Soneson y Delorenzi, 2013). La estad&iacute;stica no param&eacute;trica tambi&eacute;n ha sido combinada con la estad&iacute;stica bayesiana en el pasado, aunque solo recientemente se ha implementado para la identificaci&oacute;n de genes diferencialmente expresados en microarreglos (Smyth, 2004). No obstante, estos m&eacute;todos no pueden ser aplicados directamente a datos de RNA-Seq debido a las diferencias en la naturaleza de los datos (Auer <i>et al</i>., 2012). El programa m&aacute;s reciente en emplear este tipo de estad&iacute;stica es NPEBseq desarrollado por Yingtao Bi <i>et al</i>., (2013). La estad&iacute;stica bayesiana infiere un par&aacute;metro (en este caso, la media de expresi&oacute;n g&eacute;nica) con base en una distribuci&oacute;n   <i><i>a priori</i></i> y la probabilidad que los datos se den bajo dicha hip&oacute;tesis/modelo (verosimilitud).</p>     <p>La estad&iacute;stica bayesiana param&eacute;trica asume distribuciones <i>a priori</i> param&eacute;tricas a diferencia de la estad&iacute;stica bayesiana no param&eacute;trica. Por otro lado, la estad&iacute;stica bayesiana emp&iacute;rica no asume una distribuci&oacute;n <i>a priori</i>; la construye con base en la media y la varianza observada de los datos para calcular una media estimada que se aproxime m&aacute;s a la media poblacional (desconocida). NPEBseq emplea estad&iacute;stica bayesiana emp&iacute;rica no param&eacute;trica para definir genes diferencialmente expresados y se puede descargar a trav&eacute;s de la p&aacute;gina web del Instituto Wistar (<a href="http://bioinformatics.wistar.upenn.edu/NPEBseq" target="_blank">http://bioinformatics.wistar.upenn.edu/NPEBseq</a>). Este programa prueba la hip&oacute;tesis que la diferencia en los niveles de expresi&oacute;n entre las condiciones A y B est&aacute;n por encima de un umbral de significancia biol&oacute;gico definido por el usuario (Bi y Davuluri, 2013).</p>     ]]></body>
<body><![CDATA[<p>Este umbral se suministra para disminuir la distancia que separa un resultado estad&iacute;sticamente significativo de uno biol&oacute;gicamente significativo; es m&aacute;s probable secuenciar y detectar genes con niveles de expresi&oacute;n elevados, dejando por fuera genes con bajos niveles de expresi&oacute;n que tambi&eacute;n pueden estar diferencialmente expresados entre tratamientos (McIntyre <i>et al</i>., 2011). Programas param&eacute;tricos basados en la distribuci&oacute;n normal dan predilecci&oacute;n a genes con altos niveles de expresi&oacute;n independiente de las diferencias significativas entre tratamientos (Wu <i>et al</i>., 2010). No obstante, no queda claro c&oacute;mo establecer este umbral de significancia biol&oacute;gica en NPEBseq para un set de datos espec&iacute;ficos. La ventaja que ofrece NPEBseq es que no tiene supuestos param&eacute;tricos y es robusto incluso cuando se tiene una r&eacute;plica biol&oacute;gica; ventajas que tambi&eacute;n ofrece NOISeqSim (Tarazona <i>et al</i>., 2011). Una ventaja adicional de NPEBseq, sin embargo, es que permite detectar el uso diferencial de exones, o isoformas, para cada gen (&uacute;til en organismos eucariotas) (Bi y Davuluri, 2013). Vale la pena resaltar, sin embargo, que el tiempo computacional requerido para correr NPEBseq es mucho mayor respecto a otros programas (entre estos DESeq y NOISeq). Asimismo, NPEBseq y DESeq est&aacute;n dise&ntilde;ados para trabajar con abundancias de lecturas crudas porque la robustez de su estad&iacute;stica depende, en gran medida, de sus m&eacute;todos de normalizaci&oacute;n; NOISeq, por otro lado, ofrece diferentes m&eacute;todos de normalizaci&oacute;n y no exige datos crudos para empezar (<a href="#tab3">Tabla 3</a>).</p>     <p><b>CONCLUSIONES</b></p>     <p> La secuenciaci&oacute;n de RNAs (RNA-Seq) brinda un panorama   global del transcriptoma de un organismo bajo una condici&oacute;n   espec&iacute;fica, generando datos transcript&oacute;micos cuantificables a escalas antes no logradas. Sin embargo, la rapidez   con la que se generan los datos hoy en d&iacute;a no va al mismo   ritmo que los m&eacute;todos disponibles para su an&aacute;lisis. Esta   desigualdad en el ritmo de evoluci&oacute;n entre las t&eacute;cnicas y sus   m&eacute;todos de an&aacute;lisis obligan al investigador a buscar siempre   una imagen general y amplia de todas las posibilidades dentro   de su investigaci&oacute;n. Las nuevas herramientas para el an&aacute;lisis,   como RNA-seq, surgen con sus propias limitaciones y   ventajas. Por esta raz&oacute;n, resulta necesario conocer todos los   factores que aseguran el &eacute;xito de la t&eacute;cnica, ya que de esto   depende el buen uso de la misma. Para el investigador, una   visi&oacute;n general como esta le permite sumergirse de una manera   guiada dentro de las posibilidades metodol&oacute;gicas para   tomar decisiones m&aacute;s acertadas.</p>     <p>En el an&aacute;lisis de datos de RNA-Seq en procariotas existen diversos m&eacute;todos para llegar a los resultados finales y la escogencia de cada paso influenciar&aacute; en gran medida el enfoque y la validez de los resultados obtenidos; desde el tipo de librer&iacute;a y el tratamiento de los datos crudos hasta los programas empleados para la identificaci&oacute;n de genes diferencialmente expresados. En esta revisi&oacute;n se recopil&oacute; informaci&oacute;n sobre diferentes herramientas disponibles para realizar an&aacute;lisis de datos de RNA-Seq teniendo como base un genoma de referencia, brindando informaci&oacute;n suficiente para lograr un correcto dise&ntilde;o y an&aacute;lisis experimental de los datos as&iacute; como alternativas y comparaciones entre aproximaciones estad&iacute;sticas actualmente utilizadas para la identificaci&oacute;n de DEGs.</p>     <p>Aunque este tipo de aplicaci&oacute;n es reciente en el campo de la transcript&oacute;mica, ofrece grandes ventajas respecto a los microarreglos (evita el ruido introducido por el dise&ntilde;o de sondas, ofrece un panorama global con un mayor rango din&aacute;mico de detecci&oacute;n y no se restringe a lo conocido). Debido a su eficiencia, resoluci&oacute;n y ventajas econ&oacute;micas conforme pasan los a&ntilde;os, RNA-Seq se ha convertido en la herramienta m&aacute;s poderosa y vers&aacute;til de la actualidad para ensayos de expresi&oacute;n g&eacute;nica y estimaci&oacute;n de abundancia de transcritos.</p>     <p><b>AGRADECIMIENTOS</b></p>     <p> A la Facultad de Ciencias de la Universidad de los Andes   y al Laboratorio de Micolog&iacute;a y Fitopatolog&iacute;a Uniandes   (LAMFU).</p>     <p><b>ANEXOS</b></p>     <p> <b>Anexo 1.</b> Sugerencias T&eacute;cnicas   Limpieza de lecturas tipo PET. Si se tienen PETs, es recomendable   limpiar el rRNA de cada pareja de forma conjunta para   evitar eliminar reads de una pareja &uacute;nicamente. De esta   forma tambi&eacute;n se aprovecha la mayor precisi&oacute;n que ofrecen   dos secuencias por lectura y se evitan falsos positivos. Para   eliminar todas las lecturas pareadas que alineen contra   rRNAs indexados utilizando Bowtie2 se debe especificar el   archivo de la primera pareja con -1 &lt;ruta del archivo&gt;, el de   la segunda pareja con -2 &lt;ruta del archivo&gt; y guardando   todas las lecturas pareadas que no alineen en un solo archivo   con --un-conc &lt;ruta destino&gt;. El comando final ser&iacute;a:</p>     <p>bowtie2 -t -x &lt;ruta rRNA indexado&gt; -1 &lt;ruta reads pareja1&gt; -2 &lt;ruta reads pareja2&gt; --un-conc &lt;ruta archivo salida&gt;</p>     ]]></body>
<body><![CDATA[<p>Formatos de salida en los alineamientos. Al alinear lecturas contra un genoma de referencia se genera un archivo en formato SAM (Sequence Alignment Map). Este archivo suele ser muy pesado y se puede comprimir mediante c&oacute;digo binario en un formato m&aacute;s liviano conocido como BAM (para hacer este tipo de conversi&oacute;n se puede emplear SAMtools disponible en <a href="http://samtools.sourceforge.net" target="_blank">http://samtools.sourceforge.net</a>). Algunos progra-mas encargados de ensamblar transcritos a partir de lecturas alineadas y estimar sus abundancias utilizan archivos BAM de entrada (Cufflinks). Otros, sin embargo, &uacute;nicamente aceptan archivos SAM (HTSeq-count). De la misma forma, los alineadores suelen tener un formato predeterminado de salida (TopHat produce archivos BAM). En caso de utilizar TopHat y HTSeq-count, por ejemplo, habr&aacute; un problema de compatibilidad y SAMtools no permite convertir un archivo BAM en SAM. Por consiguiente, resulta &uacute;til saber qu&eacute; tipo de archivo queremos para poder especificarlo en el alineador que estemos utilizando.</p>     <p>Para evitar que TopHat convierta los resultados SAM en BAM (comportamiento predeterminado) se debe utilizar el comando --no-convert-bam (<a href="http://tophat.cbcb.umd.edu" target="_blank">http://tophat.cbcb.umd.edu</a>) a trav&eacute;s de la terminal. Tambi&eacute;n es recomendable especificar el tipo de librer&iacute;a utilizada en el momento de alinear y ensamblar las lecturas; en el caso de TopHat y Cufflinks -- library-type=fr-firststrand corresponde al m&eacute;todo dUTP (Trapnell <i>et al</i>., 2012).</p>     <p><b>Identificaci&oacute;n de transcritos novedosos con Cufflinks.</b> </p>     <p>En   algunas ocasiones, adem&aacute;s de contar con el genoma del   organismo estudiado, tambi&eacute;n se tendr&aacute; un archivo de   anotaci&oacute;n (formato .gtf o .gff). Este archivo suele tener   informaci&oacute;n sobre los genes codificados y resulta muy &uacute;til   para la identificaci&oacute;n de genes diferencialmente expresados   porque se puede suministrar como una gu&iacute;a para facilitar el   ensamble de transcritos hipot&eacute;ticos. Para utilizar un archivo   de anotaci&oacute;n (recomendado si se tiene) en Cufflinks se debe   emplear -g o -G. Si &uacute;nicamente se est&aacute; interesado en la   identificaci&oacute;n de transcritos anotados, se debe suministrar   el genoma de referencia con -G a trav&eacute;s de la terminal; -g   permite la identificaci&oacute;n adicional de transcritos no anotados,   aunque existe el riesgo de asignar transcritos previamente   anotados como novedosos (dichos transcritos no   ser&aacute;n encontrados en todos los tratamientos). En caso de   tener problemas o dudas respecto al formato de anotaci&oacute;n   (.gff3), existe una aplicaci&oacute;n en l&iacute;nea para validar este tipo   de archivos (<a href="http://modencode.oicr.on.ca/cgi-bin/validate_ gff3_online" target="_blank">http://modencode.oicr.on.ca/cgi-bin/validategff3online</a>). Tambi&eacute;n se recomienda leer el manual de   Cufflinks disponible en la p&aacute;gina de los desarrolladores   (<a href="http://cufflinks.cbcb.umd.edu" target="_blank">http://cufflinks.cbcb.umd.edu</a>).</p>   <hr/>     <p><b>BIBLIOGRAF&Iacute;A</b></p>     <!-- ref --><p>Agarwal A, Koppstein D, Rozowsky J, Sboner A, Habegger L,   Hillier LW, <i>et al</i>. Comparison and calibration of transcriptome   data from RNA-Seq and tiling arrays. BMC Genomics.   2010;11:383. DOI:10.1186/1471-2164-11-383.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000078&pid=S0120-548X201400020000100001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Anders S, Huber W. Differential expression analysis for   sequence count data. Genome Biol. 2010;11(10):R106.   DOI:10.1186/gb-2010-11-10-r106.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000080&pid=S0120-548X201400020000100002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Auer PL, Doerge RW. Statistical design and analysis of RNA   sequencing data. Genetics. 2010;185(2):405-416. DOI:   10.1534/genetics.110.114983.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000082&pid=S0120-548X201400020000100003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Auer PL, Srivastava S, Doerge RW. Differential expression-- the next generation and beyond. Brief Funct Genomics. 2012;11(1):57-62. DOI:10.1093/bfgp/elr041.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000084&pid=S0120-548X201400020000100004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>Benjamini Y, Hochberg Y. Controlling the false discovery rate:   a practical and powerful approach to multiple testing. J   R Stat Soc Ser B. 1995;57(1):289-300. Available at:   <a href="http://www.jstor.org/stable/10.2307/2346101" target="_blank">http://www.jstor.org/stable/10.2307/2346101</a>. Accessed   February 5, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000086&pid=S0120-548X201400020000100005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>Bhargava V, Head SR, Ordoukhanian P, Mercola M,   Subramaniam S. Technical Variations in Low-Input RNAseq   Methodologies. Sci Rep. 2014;4:3678. DOI:10.   1038/srep03678.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000088&pid=S0120-548X201400020000100006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Bi Y, Davuluri RV. NPEBseq: nonparametric empirical bayesian   -based procedure for differential expression analysis of   RNA-seq data. BMC Bioinformatics. 2013;14:262.   DOI:10.1186/1471-2105-14-262.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000090&pid=S0120-548X201400020000100007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Bradford JR, Hey Y, Yates T, Li Y, Pepper SD, Miller CJ. A   comparison of massively parallel nucleotide sequencing   with oligonucleotide microarrays for global transcription   profiling. BMC Genomics. 2010;11:282. DOI:10.1186/   1471-2164-11-282.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000092&pid=S0120-548X201400020000100008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Bullard JH, Purdom E, Hansen KD, Dudoit S. Evaluation of   statistical methods for normalization and differential   expression in mRNA-Seq experiments. BMC Bioinformatics.   2010;11:94. DOI:10.1186/1471-2105-11-94.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000094&pid=S0120-548X201400020000100009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Cai G, Li H, Lu Y, Huang X, Lee J, M&uuml;ller P, <i>et al</i>. Accuracy of RNASeq   and its dependence on sequencing depth. BMC   Bioinformatics. 2012;13 Suppl 1(Suppl 13):S5. DOI:10.   1186/1471-2105-13-S13-S5.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000096&pid=S0120-548X201400020000100010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Chen G, Wang C, Shi T. Overview of available methods for   diverse RNA-Seq data analyses. Sci China Life Sci. 2011;   54(12):1121-1128. DOI:10.1007/s11427-011-4255-x.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000098&pid=S0120-548X201400020000100011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Dillies M-A, Rau A, Aubert J, Hennequet-Antier C, Jeanmougin   M, Servant N, <i>et al</i>. A comprehensive evaluation of normalization   methods for Illumina high-throughput RNA   sequencing data analysis. Brief Bioinform. 2013;14 (6):   671-683. DOI:10.1093/bib/bbs046.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000100&pid=S0120-548X201400020000100012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Fullwood MJ, Wei C-L, Liu ET, Ruan Y. Next-generation DNA   sequencing of paired-end tags (PET) for transcriptome   and genome analyses. Genome Res. 2009;19(4):521-   532. DOI:10.1101/gr.074906.107.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000102&pid=S0120-548X201400020000100013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Giannoukos G, Ciulla DM, Huang K, Haas BJ, Izard J, Levin   JZ, <i>et al</i>. Efficient and robust RNA-seq process for   cultured bacteria and complex community transcriptomes.   Genome Biol. 2012;13(3):R23. DOI:10.1186/   gb-2012-13-3-r23.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000104&pid=S0120-548X201400020000100014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Hashimshony T, Wagner F, Sher N, Yanai I. CEL-Seq: singlecell   RNA-Seq by multiplexed linear amplification. Cell Rep.   2012;2(3):666-673. DOI:10.1016/j.celrep.2012.08.003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000106&pid=S0120-548X201400020000100015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>He Y, Vogelstein B, Velculescu VE, Papadopoulos N, Kinzler KW.   The antisense transcriptomes of human cells. Science. 2008;   322(5909):1855-1857. DOI:10.1126/ science.1163853.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000108&pid=S0120-548X201400020000100016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Hoen P, Ariyurek Y, Thygesen HH, Vreugdenhil E, Vossen RH,   de Menezes RX, <i>et al</i>. Deep sequencing-based expression   analysis shows major advances in robustness, resolution   and inter-lab portability over five microarray platforms.   Nucleic Acids Res. 2008;36(21): e141. DOI:10.1093/   nar/gkn705.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000110&pid=S0120-548X201400020000100017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Kapranov P, Cheng J, Dike S, Nix DA, Duttagupta R,   Willingham AT, <i>et al</i>. RNA maps reveal new RNA classes   and a possible function for pervasive transcription. Science.   2007;316 (5830):1484-1488. DOI:10.1126/science.   1138341.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000112&pid=S0120-548X201400020000100018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Kuo C-H, Ochman H. The fate of new bacterial genes. FEMS   Microbiol Rev. 2009;33(1):38-43. DOI:10.1111/j.1574-6976.2008.00140.x.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000114&pid=S0120-548X201400020000100019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>           <!-- ref --><p>Langmead B, Salzberg SL. Fast gapped-read alignment with   Bowtie 2. Nat Methods. 2012;9(4):357-359. DOI:10.1038/nmeth.1923.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000116&pid=S0120-548X201400020000100020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>                 <!-- ref --><p> Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and   memory-efficient alignment of short DNA sequences to   the human genome. Genome Biol. 2009;10(3):R25.   DOI:10.1186/gb-2009-10-3-r25.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000118&pid=S0120-548X201400020000100021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>        <!-- ref --><p>Levin JZ, Yassour M, Adiconis X, Nusbaum Ch, Thompson D,   Friedman N, <i>et al</i>. Comprehensive com-parative analysis of   <i>strand-specific</i> RNA sequencing methods. 2010;7(9):709-   715. DOI:10.1038/NMETH.1491.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000120&pid=S0120-548X201400020000100022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Li H, Durbin R. Fast and accurate short read alignment with   Burrows-Wheeler transform. Bioinformatics. 2009;25(14):   1754-1760. DOI:10.1093/bioinformatics/ btp324.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000122&pid=S0120-548X201400020000100023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Li J, Tibshirani R. Finding consistent patterns: a nonparametric   approach for identifying differential expression in RNASeq   data. Stat Methods Med Res. 2011;22(5):519-536.   DOI:10.1177/0962280211428386.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000124&pid=S0120-548X201400020000100024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Li J, Witten DM, Johnstone IM, Tibshirani R. Normalization,   testing, and false discovery rate estimation for RNAsequencing   data. Biostatistics. 2012;13(3):523-538.   DOI:10.1093/biostatistics/kxr031.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000126&pid=S0120-548X201400020000100025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Marioni JC, Mason CE, Mane SM, Stephens M, Gilad Y.   RNA-seq: an assessment of technical reproducibility and   comparison with gene expression arrays. Genome Res.   2008;18(9):1509-1517. DOI:10.1101/gr.079558.108.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000128&pid=S0120-548X201400020000100026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>McClure R, Balasubramanian D, Sun Y, Amin V, Oberg AL,   Young LJ, <i>et al</i>. Computational analysis of bacterial RNASeq   data. Nucleic Acids Res. 2013;41(14):e140. DOI:10.   1093/nar/gkt444.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000130&pid=S0120-548X201400020000100027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> McIntyre LM, Lopiano KK, Morse AM, Amin V, Oberg AL,   Young LJ, <i>et al</i>. RNA-seq: technical variability and   sampling. BMC Genomics. 2011;12(1):293. DOI:10.11   86/1471-2164-12-293.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000132&pid=S0120-548X201400020000100028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Metzker ML. Sequencing technologies - the next generation.   Nat Rev Genet. 2010;11(1):31-46. DOI:10.1038/nrg2626.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000134&pid=S0120-548X201400020000100029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B.   Mapping and quantifying mammalian transcriptomes by   RNA-Seq. Nat Methods. 2008;5(7):621-628. DOI:10.   1038/nmeth.1226.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000136&pid=S0120-548X201400020000100030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Nookaew I, Papini M, Pornputtapong N, Scalcinati G,   Fagerberg L, Uhl&eacute;n M, Nielsen J. A comprehensive comparison of RNA-Seq-based transcriptome analysis from   reads to differential gene expression and cross-comparison   with microarrays: A case study in Saccharomyces cerevisiae.   Nucleic Acids Res. 2012;40(20):10084-10097. DOI:10.   1093/nar/gks804.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000138&pid=S0120-548X201400020000100031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Oshlack A, Robinson MD, Young MD. From RNA-seq reads   to differential expression results. Genome Biol. 2010;   11(12):220. DOI:10.1186/gb-2010-11-12-220.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000140&pid=S0120-548X201400020000100032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Oshlack A, Wakefield MJ. Transcript length bias in RNA-seq   data confounds systems biology. Biol Direct. 2009;4:14.   DOI:10.1186/1745-6150-4-14.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000142&pid=S0120-548X201400020000100033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Ozsolak F, Milos PM. High-Throughput Next Generation   Sequencing. 2011;733(11):51-61. DOI:10.1007/978-1-   61779-089-8.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000144&pid=S0120-548X201400020000100034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Parkhomchuk D, Borodina T, Amstislavskiy V, Banaru M,   Hallen L, Krobitsch S. Transcriptome analysis by strandspecific   sequencing of complementary DNA. Nucleic   Acids Res. 2009;37(18):e123. DOI:10.1093/nar/gkp596.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000146&pid=S0120-548X201400020000100035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Peng Y, Leung HCM, Yiu SM, Chin FYL. IDBA-UD: a de novo   assembler for single-cell and metagenomic sequencing   data with highly uneven depth. Bioinformatics. 2012;   28(11):1420-1428. DOI:10.1093/bioinformatics/bts174.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000148&pid=S0120-548X201400020000100036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Robinson MD, McCarthy DJ, Smyth GK. edgeR: a Bioconductor   package for differential expression analysis of   digital gene expression data. Bioinformatics. 2010;26(1):   139-140. DOI:10.1093/bioinformatics/btp616.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000150&pid=S0120-548X201400020000100037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Robinson MD, Oshlack A. A scaling normalization method   for differential expression analysis of RNA-seq data.   Genome Biol. 2010;11(3):R25. DOI:10.1186/gb-2010-   11-3-r25.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000152&pid=S0120-548X201400020000100038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Robles J, Qureshi SE, Stephen SJ, Wilson SR, Burden CJ,   Taylor JM. Efficient experimental design and analysis   strategies for the detection of differential expression   using RNA-Sequencing. BMC Genomics. 2012;13:484.   DOI:10.1186/1471-2164-13-484.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000154&pid=S0120-548X201400020000100039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Ruan X, Ruan Y. Transcriptional Regulation. Vancura A, ed.   2012;809. DOI:10.1007/978-1-61779-376-9.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000156&pid=S0120-548X201400020000100040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Shendure J, Ji H. Next-generation DNA sequencing. Nat   Biotechnol. 2008;26(10):1135-1145. DOI:10.1038/   nbt1486.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000158&pid=S0120-548X201400020000100041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Smyth G. Linear Models and Empirical Bayes Methods for   Assessing Differential Expression in Microarray Experiments.   Stat Appl Genet Mol Biol. 2004;3(1):   1544-6115.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000160&pid=S0120-548X201400020000100042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Soneson C, Delorenzi M. A comparison of methods for   differential expression analysis of RNA-seq data. BMC   Bioinformatics. 2013;14:91. DOI:10.1186/1471-2105-   14-91.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000162&pid=S0120-548X201400020000100043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Strickler SR, Bombarely A, Mueller L a. Designing a transcriptome   <i>Next-generation sequencing</i> project for a   nonmodel plant species. Am J Bot. 2012;99(2):257-66.   DOI:10.3732/ajb.1100292.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000164&pid=S0120-548X201400020000100044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Tang F, Lao K, Surani M. Development and applications of   single-cell transcriptome analysis. Nat Meth. 2011;8:S6-11.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000166&pid=S0120-548X201400020000100045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Tarazona S, Furi P, Ferrer A, Conesa A. NOISeq : Differential   Expression in RNA-seq. 2013. Available at: <a href="http://www.bioconductor.org/packages/release/bioc/vignettes/NOISeq/inst/doc/NOISeq.pdf" target="_blank">http://www.bioconductor.org/packages/release/bioc/vignettes/NOISeq/inst/doc/NOISeq.pdf</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000168&pid=S0120-548X201400020000100046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p> Tarazona S, Garc&iacute;a F, Ferrer A. NOIseq: a RNA-seq differential   expression method robust for sequencing depth   biases. EMBnet Journal. 2012;17:18-19. DOI:10.1101/   gr.124321.11.2.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000169&pid=S0120-548X201400020000100047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Tarazona S, Garc&iacute;a-Alcalde F, Dopazo J, Ferrer A, Conesa A.   Differential expression in RNA-seq: a matter of depth.   Genome Res. 2011;21(12):2213-2223. DOI:10.1101/gr.   124321.111.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000171&pid=S0120-548X201400020000100048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice   junctions with RNA-Seq. Bioinformatics. 2009;25(9):1105-   1111. doi:10.1093/bioinformatics/btp120.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000173&pid=S0120-548X201400020000100049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Trapnell C, Williams B A, Pertea G, Mortazavi A, Kwan G,   van Baren MJ, <i>et al</i>. Transcript assembly and quantification   by RNA-Seq reveals unannotated transcripts   and isoform switching during cell differentiation. Nat   Biotechnol. 2010;28(5):511-5. DOI: 10.1038/nbt.1621.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000175&pid=S0120-548X201400020000100050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley D, <i>et al</i>. Differential gene and transcript expression analysis of   RNA-seq experiments with TopHat and Cufflinks. Nat   Protoc. 2012;7(3):562-578. DOI:10.10 38/nprot.2012.016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000177&pid=S0120-548X201400020000100051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Tucker T, Marra M, Friedman JM. Massively parallel sequencing:   the next big thing in genetic medicine. Am J Hum Genet.   2009;85(2):142-154. DOI:10.1016/j.ajhg. 2009.06.022.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000179&pid=S0120-548X201400020000100052&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p> Van Verk MC, Hickman R, Pieterse CMJ, Van Wees SCM.   RNA-Seq: revelation of the messengers. Trends Plant Sci.   2013;18(4):175-179. DOI:10.1016/j.tplants.2013.02.001.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000181&pid=S0120-548X201400020000100053&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     ]]></body>
<body><![CDATA[<!-- ref --><p>Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool   for transcriptomics. Nat Rev Genet. 2009;10(1):57-63.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000183&pid=S0120-548X201400020000100054&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref -->  </p>     <!-- ref --><p>Wu Z, Jenkins BD, Rynearson T Empirical bayes analysis of   sequencing-based transcriptional profiling without replicates.   BMC Bioinformatics. 2010;11:564. DOI:10.1186/   1471-2105-11-564.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000185&pid=S0120-548X201400020000100055&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p><hr/> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Agarwal]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Koppstein]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Rozowsky]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Sboner]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Habegger]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Hillier]]></surname>
<given-names><![CDATA[LW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays]]></article-title>
<source><![CDATA[BMC Genomics]]></source>
<year>2010</year>
<page-range>11:383</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[S]]></surname>
<given-names><![CDATA[Anders]]></given-names>
</name>
<name>
<surname><![CDATA[W.]]></surname>
<given-names><![CDATA[Huber]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differential expression analysis for sequence count data]]></article-title>
<source><![CDATA[Genome Biol.]]></source>
<year>2010</year>
<volume>11</volume>
<numero>10</numero>
<issue>10</issue>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Auer]]></surname>
<given-names><![CDATA[PL]]></given-names>
</name>
<name>
<surname><![CDATA[Doerge]]></surname>
<given-names><![CDATA[RW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical design and analysis of RNA sequencing data]]></article-title>
<source><![CDATA[Genetics]]></source>
<year>2010</year>
<volume>185</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>405-416</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Auer]]></surname>
<given-names><![CDATA[PL]]></given-names>
</name>
<name>
<surname><![CDATA[Srivastava]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Doerge]]></surname>
<given-names><![CDATA[RW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differential expression-- the next generation and beyond]]></article-title>
<source><![CDATA[Brief Funct Genomics]]></source>
<year>2012</year>
<volume>11</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>57-62</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Y]]></surname>
<given-names><![CDATA[Benjamini]]></given-names>
</name>
<name>
<surname><![CDATA[Hochberg]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Controlling the false discovery rate: a practical and powerful approach to multiple testing]]></article-title>
<source><![CDATA[J R Stat Soc Ser B]]></source>
<year>1995</year>
<month>Fe</month>
<day>br</day>
<volume>57</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>289-300</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bhargava]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Head]]></surname>
<given-names><![CDATA[SR]]></given-names>
</name>
<name>
<surname><![CDATA[Ordoukhanian]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Mercola]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Subramaniam]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Technical Variations in Low-Input RNAseq Methodologies]]></article-title>
<source><![CDATA[Sci Rep.]]></source>
<year>2014</year>
<volume>4</volume>
<page-range>3678</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bi]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Davuluri]]></surname>
<given-names><![CDATA[RV]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[NPEBseq: nonparametric empirical bayesian -based procedure for differential expression analysis of RNA-seq data]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2013</year>
<volume>14</volume>
<page-range>262</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bradford]]></surname>
<given-names><![CDATA[JR]]></given-names>
</name>
<name>
<surname><![CDATA[Hey]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Yates]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Pepper]]></surname>
<given-names><![CDATA[SD]]></given-names>
</name>
<name>
<surname><![CDATA[Miller]]></surname>
<given-names><![CDATA[CJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comparison of massively parallel nucleotide sequencing with oligonucleotide microarrays for global transcription profiling]]></article-title>
<source><![CDATA[BMC Genomics]]></source>
<year>2010</year>
<volume>11</volume>
<page-range>282</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bullard]]></surname>
<given-names><![CDATA[JH]]></given-names>
</name>
<name>
<surname><![CDATA[Purdom]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Hansen]]></surname>
<given-names><![CDATA[KD]]></given-names>
</name>
<name>
<surname><![CDATA[Dudoit]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluation of statistical methods for normalization and differential expression in mRNA-Seq experiments]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2010</year>
<volume>11</volume>
<numero>94</numero>
<issue>94</issue>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cai]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Lu]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Müller]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Accuracy of RNASeq and its dependence on sequencing depth]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2012</year>
<volume>13</volume>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Shi]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Overview of available methods for diverse RNA-Seq data analyses]]></article-title>
<source><![CDATA[Sci China Life Sci]]></source>
<year>2011</year>
<volume>54</volume>
<numero>12</numero>
<issue>12</issue>
<page-range>1121-1128</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dillies]]></surname>
<given-names><![CDATA[M&ndash;A]]></given-names>
</name>
<name>
<surname><![CDATA[Rau]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Aubert]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Hennequet]]></surname>
<given-names><![CDATA[Antier C]]></given-names>
</name>
<name>
<surname><![CDATA[Jeanmougin]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Servant]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comprehensive evaluation of normalization methods for Illumina high&ndash;throughput RNA sequencing data analysis]]></article-title>
<source><![CDATA[Brief Bioinform]]></source>
<year>2013</year>
<volume>14</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>671-683</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fullwood]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
<name>
<surname><![CDATA[Wei]]></surname>
<given-names><![CDATA[C-L]]></given-names>
</name>
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[ET]]></given-names>
</name>
<name>
<surname><![CDATA[Ruan]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Next-generation DNA sequencing of paired-end tags (PET) for transcriptome and genome analyses]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2009</year>
<volume>19</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>521- 532</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Giannoukos]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Ciulla]]></surname>
<given-names><![CDATA[DM]]></given-names>
</name>
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Haas]]></surname>
<given-names><![CDATA[BJ]]></given-names>
</name>
<name>
<surname><![CDATA[Izard]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Levin]]></surname>
<given-names><![CDATA[JZ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Efficient and robust RNA-seq process for cultured bacteria and complex community transcriptomes]]></article-title>
<source><![CDATA[Genome Biol]]></source>
<year>2012</year>
<volume>13</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hashimshony]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Wagner]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Sher]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[I]]></surname>
<given-names><![CDATA[Yanai]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[CEL-Seq: singlecell RNA-Seq by multiplexed linear amplification]]></article-title>
<source><![CDATA[Cell Rep]]></source>
<year>2012</year>
<volume>2</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>666-673</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[He]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Vogelstein]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Velculescu]]></surname>
<given-names><![CDATA[VE]]></given-names>
</name>
<name>
<surname><![CDATA[Papadopoulos]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Kinzler]]></surname>
<given-names><![CDATA[KW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The antisense transcriptomes of human cells]]></article-title>
<source><![CDATA[Science]]></source>
<year>2008</year>
<volume>322</volume>
<numero>5909</numero>
<issue>5909</issue>
<page-range>1855-1857</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hoen]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Ariyurek]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Thygesen]]></surname>
<given-names><![CDATA[HH]]></given-names>
</name>
<name>
<surname><![CDATA[Vreugdenhil]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
<name>
<surname><![CDATA[Vossen]]></surname>
<given-names><![CDATA[RH]]></given-names>
</name>
<name>
<surname><![CDATA[de Menezes]]></surname>
<given-names><![CDATA[RX]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Deep sequencing-based expression analysis shows major advances in robustness, resolution and inter-lab portability over five microarray platforms]]></article-title>
<source><![CDATA[Nucleic Acids Res]]></source>
<year>2008</year>
<volume>36</volume>
<numero>21</numero>
<issue>21</issue>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kapranov]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Cheng]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Dike]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Nix]]></surname>
<given-names><![CDATA[DA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Duttagupta R, Willingham AT, et al. RNA maps reveal new RNA classes and a possible function for pervasive transcription]]></article-title>
<source><![CDATA[Science]]></source>
<year>2007</year>
<volume>316</volume>
<numero>5830</numero>
<issue>5830</issue>
<page-range>1484-1488</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kuo]]></surname>
<given-names><![CDATA[C-H]]></given-names>
</name>
<name>
<surname><![CDATA[Ochman]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The fate of new bacterial genes]]></article-title>
<source><![CDATA[FEMS Microbiol Rev]]></source>
<year>2009</year>
<volume>33</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>38-43</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Langmead]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast gapped-read alignment with Bowtie 2]]></article-title>
<source><![CDATA[Nat Methods]]></source>
<year>2012</year>
<numero>4</numero>
<issue>4</issue>
<page-range>357-359</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Langmead]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Trapnell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Pop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.]]></article-title>
<source><![CDATA[Genome Biol]]></source>
<year>2009</year>
<volume>10</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>R25.</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Levin]]></surname>
<given-names><![CDATA[JZ]]></given-names>
</name>
<name>
<surname><![CDATA[Yassour]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Adiconis]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Nusbaum]]></surname>
<given-names><![CDATA[Ch]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Friedman]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Comprehensive com-parative analysis of strand-specific RNA sequencing methods]]></article-title>
<source><![CDATA[]]></source>
<year>2010</year>
<volume>7</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>709- 715</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li H]]></surname>
<given-names><![CDATA[Durbin R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Fast and accurate short read alignment with Burrows-Wheeler transform]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2009</year>
<volume>25</volume>
<numero>14</numero>
<issue>14</issue>
<page-range>1754-1760</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li J]]></surname>
<given-names><![CDATA[Tibshirani R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Finding consistent patterns: a nonparametric approach for identifying differential expression in RNASeq data]]></article-title>
<source><![CDATA[Stat Methods Med Res]]></source>
<year>2011</year>
<volume>22</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>519-536</page-range></nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li J]]></surname>
<given-names><![CDATA[Witten DM]]></given-names>
</name>
<name>
<surname><![CDATA[Johnstone]]></surname>
<given-names><![CDATA[IM]]></given-names>
</name>
<name>
<surname><![CDATA[Tibshirani]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Normalization, testing, and false discovery rate estimation for RNAsequencing data]]></article-title>
<source><![CDATA[Biostatistics]]></source>
<year>2012</year>
<volume>13</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>523-538</page-range></nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Marioni]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
<name>
<surname><![CDATA[Mason]]></surname>
<given-names><![CDATA[CE]]></given-names>
</name>
<name>
<surname><![CDATA[Mane]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
<name>
<surname><![CDATA[Stephens]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Gilad]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA-seq: an assessment of technical reproducibility and comparison with gene expression arrays]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2008</year>
<volume>18</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>1509-1517</page-range></nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McClure]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Balasubramanian]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Sun]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Amin]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Oberg]]></surname>
<given-names><![CDATA[AL]]></given-names>
</name>
<name>
<surname><![CDATA[Young]]></surname>
<given-names><![CDATA[LJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computational analysis of bacterial RNASeq data]]></article-title>
<source><![CDATA[Nucleic Acids Res.]]></source>
<year>2013</year>
<volume>41</volume>
<numero>14</numero>
<issue>14</issue>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McIntyre]]></surname>
<given-names><![CDATA[LM]]></given-names>
</name>
<name>
<surname><![CDATA[Lopiano]]></surname>
<given-names><![CDATA[KK]]></given-names>
</name>
<name>
<surname><![CDATA[Morse]]></surname>
<given-names><![CDATA[AM]]></given-names>
</name>
<name>
<surname><![CDATA[Amin]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Oberg]]></surname>
<given-names><![CDATA[AL]]></given-names>
</name>
<name>
<surname><![CDATA[Young]]></surname>
<given-names><![CDATA[LJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA-seq: technical variability and sampling]]></article-title>
<source><![CDATA[BMC Genomics]]></source>
<year>2011</year>
<volume>12</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>293</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Metzker]]></surname>
<given-names><![CDATA[ML]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sequencing technologies - the next generation]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2010</year>
<volume>11</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>31-46</page-range></nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mortazavi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[BA]]></given-names>
</name>
<name>
<surname><![CDATA[McCue]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Schaeffer]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Wold]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mapping and quantifying mammalian transcriptomes by RNA&ndash;Seq]]></article-title>
<source><![CDATA[Nat Methods]]></source>
<year>2008</year>
<volume>5</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>621-628</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nookaew]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Papini]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Pornputtapong]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Scalcinati]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Fagerberg]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Uhlén]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Nielsen]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: A case study in Saccharomyces cerevisiae]]></article-title>
<source><![CDATA[Nucleic Acids Res]]></source>
<year>2012</year>
<volume>40</volume>
<numero>20^s10084-10097</numero>
<issue>20^s10084-10097</issue>
<supplement>10084-10097</supplement>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Oshlack]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[MD]]></surname>
<given-names><![CDATA[Robinson]]></given-names>
</name>
<name>
<surname><![CDATA[Young]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[From RNA-seq reads to differential expression results]]></article-title>
<source><![CDATA[Genome Biol.]]></source>
<year>2010</year>
<volume>11</volume>
<numero>12</numero>
<issue>12</issue>
<page-range>220</page-range></nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Oshlack]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Wakefield]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transcript length bias in RNA-seq data confounds systems biology]]></article-title>
<source><![CDATA[Biol Direct.]]></source>
<year>2009</year>
<volume>4</volume>
<numero>14</numero>
<issue>14</issue>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ozsolak]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Milos]]></surname>
<given-names><![CDATA[PM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[High-Throughput Next Generation Sequencing]]></article-title>
<source><![CDATA[]]></source>
<year>2011</year>
<volume>733</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>51-61</page-range></nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Parkhomchuk]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Borodina]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Amstislavskiy]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
<name>
<surname><![CDATA[Banaru]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Hallen]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Krobitsch]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transcriptome analysis by strandspecific sequencing of complementary DNA]]></article-title>
<source><![CDATA[Nucleic Acids Res]]></source>
<year>2009</year>
<volume>37</volume>
<numero>18</numero>
<issue>18</issue>
<page-range>123</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Peng]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[HCM]]></given-names>
</name>
<name>
<surname><![CDATA[Yiu]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
<name>
<surname><![CDATA[Chin]]></surname>
<given-names><![CDATA[FYL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2012</year>
<volume>28</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>1420-1428</page-range></nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
<name>
<surname><![CDATA[McCarthy]]></surname>
<given-names><![CDATA[DJ]]></given-names>
</name>
<name>
<surname><![CDATA[Smyth]]></surname>
<given-names><![CDATA[GK]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[edgeR: a Bioconductor package for differential expression analysis of digital gene expression data]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2010</year>
<volume>26</volume><volume>1</volume>
<page-range>139-140</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
<name>
<surname><![CDATA[Oshlack]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A scaling normalization method for differential expression analysis of RNA-seq data]]></article-title>
<source><![CDATA[Genome Biol.]]></source>
<year>2010</year>
<volume>11</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Robles]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Qureshi]]></surname>
<given-names><![CDATA[SE]]></given-names>
</name>
<name>
<surname><![CDATA[SJ]]></surname>
<given-names><![CDATA[Stephen]]></given-names>
</name>
<name>
<surname><![CDATA[SR]]></surname>
<given-names><![CDATA[Wilson]]></given-names>
</name>
<name>
<surname><![CDATA[Burden]]></surname>
<given-names><![CDATA[CJ]]></given-names>
</name>
<name>
<surname><![CDATA[Taylor]]></surname>
<given-names><![CDATA[JM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Efficient experimental design and analysis strategies for the detection of differential expression using RNA&ndash;Sequencing]]></article-title>
<source><![CDATA[BMC Genomics]]></source>
<year>2012</year>
<volume>13</volume>
<numero>484</numero>
<issue>484</issue>
</nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ruan]]></surname>
<given-names><![CDATA[X]]></given-names>
</name>
<name>
<surname><![CDATA[Y]]></surname>
<given-names><![CDATA[Ruan]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transcriptional Regulation]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Vancura]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shendure]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Ji]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Next-generation DNA sequencing]]></article-title>
<source><![CDATA[Nat Biotechnol]]></source>
<year>2008</year>
<volume>26</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>1135-1145</page-range></nlm-citation>
</ref>
<ref id="B42">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Smyth]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Linear Models and Empirical Bayes Methods for Assessing Differential Expression in Microarray Experiments]]></article-title>
<source><![CDATA[Stat Appl Genet Mol Biol.]]></source>
<year>2004</year>
<volume>3</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1544-6115</page-range></nlm-citation>
</ref>
<ref id="B43">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Soneson]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Delorenzi]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comparison of methods for differential expression analysis of RNA-seq data]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2013</year>
<page-range>14:91</page-range></nlm-citation>
</ref>
<ref id="B44">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Strickler]]></surname>
<given-names><![CDATA[SR]]></given-names>
</name>
<name>
<surname><![CDATA[Bombarely]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Mueller]]></surname>
<given-names><![CDATA[L a]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Designing a transcriptome Next-generation sequencing project for a nonmodel plant species]]></article-title>
<source><![CDATA[Am J Bot.]]></source>
<year>2012</year>
<volume>99</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>257-66</page-range></nlm-citation>
</ref>
<ref id="B45">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tang]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Lao]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Surani]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Development and applications of single-cell transcriptome analysis]]></article-title>
<source><![CDATA[Nat Meth]]></source>
<year>2011</year>
<volume>8</volume>
<page-range>6-11</page-range></nlm-citation>
</ref>
<ref id="B46">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tarazona]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Furi]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Ferrer]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Conesa]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[NOISeq: Differential Expression in RNA-seq]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B47">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tarazona]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[García]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Ferrer]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[NOIseq: a RNA-seq differential expression method robust for sequencing depth biases]]></article-title>
<source><![CDATA[EMBnet Journal]]></source>
<year>2012</year>
<volume>17</volume>
<page-range>18-19</page-range></nlm-citation>
</ref>
<ref id="B48">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tarazona]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[García-Alcalde]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
<name>
<surname><![CDATA[Dopazo]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Ferrer]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Conesa]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differential expression in RNA-seq: a matter of depth]]></article-title>
<source><![CDATA[Genome Res]]></source>
<year>2011</year>
<volume>21</volume>
<numero>12</numero>
<issue>12</issue>
<page-range>2213-2223</page-range></nlm-citation>
</ref>
<ref id="B49">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Trapnell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Pachter]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Salzberg]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[TopHat: discovering splice junctions with RNA-Seq]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>2009</year>
<volume>25</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>1105- 1111</page-range></nlm-citation>
</ref>
<ref id="B50">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Trapnell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[B A]]></given-names>
</name>
<name>
<surname><![CDATA[Pertea]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Mortazavi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Kwan]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[van Baren]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation]]></article-title>
<source><![CDATA[Nat Biotechnol]]></source>
<year>2010</year>
<volume>28</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>511-5</page-range></nlm-citation>
</ref>
<ref id="B51">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Trapnell]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[A]]></surname>
<given-names><![CDATA[Roberts]]></given-names>
</name>
<name>
<surname><![CDATA[Goff]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Pertea]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
<name>
<surname><![CDATA[Kim]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Kelley]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks]]></article-title>
<source><![CDATA[Nat Protoc.]]></source>
<year>2012</year>
<volume>7</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>562-578</page-range></nlm-citation>
</ref>
<ref id="B52">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tucker]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Marra]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Friedman]]></surname>
<given-names><![CDATA[JM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Massively parallel sequencing: the next big thing in genetic medicine]]></article-title>
<source><![CDATA[Am J Hum Genet]]></source>
<year>2009</year>
<volume>85</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>142-154</page-range></nlm-citation>
</ref>
<ref id="B53">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Van Verk]]></surname>
<given-names><![CDATA[MC]]></given-names>
</name>
<name>
<surname><![CDATA[Hickman]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Pieterse]]></surname>
<given-names><![CDATA[CMJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Van Wees SCM. RNA-Seq: revelation of the messengers]]></article-title>
<source><![CDATA[Trends Plant Sci]]></source>
<year>2013</year>
<volume>18</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>175-179</page-range></nlm-citation>
</ref>
<ref id="B54">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[Gerstein]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Snyder]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[RNA-Seq: a revolutionary tool for transcriptomics]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2009</year>
<volume>10</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>57-63</page-range></nlm-citation>
</ref>
<ref id="B55">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wu]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
<name>
<surname><![CDATA[BD]]></surname>
<given-names><![CDATA[Jenkins]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Rynearson T Empirical bayes analysis of sequencing-based transcriptional profiling without replicates]]></article-title>
<source><![CDATA[BMC Bioinformatics]]></source>
<year>2010</year>
<volume>11</volume>
<numero>564</numero>
<issue>564</issue>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
