<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0123-7799</journal-id>
<journal-title><![CDATA[TecnoLógicas]]></journal-title>
<abbrev-journal-title><![CDATA[TecnoL.]]></abbrev-journal-title>
<issn>0123-7799</issn>
<publisher>
<publisher-name><![CDATA[Instituto Tecnológico Metropolitano - ITM]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0123-77992017000200002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Big Data: una exploración de investigaciones, tecnologías y casos de aplicación]]></article-title>
<article-title xml:lang="en"><![CDATA[Big Data: an exploration of research, technologies and application cases]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Hernández-Leal]]></surname>
<given-names><![CDATA[Emilcy J.]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Duque-Méndez]]></surname>
<given-names><![CDATA[Néstor D.]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Moreno-Cadavid]]></surname>
<given-names><![CDATA[Julián]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Minas Departamento de Ingeniería de la Organización]]></institution>
<addr-line><![CDATA[Medellín ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Administración Departamento de Ingformática y Computación]]></institution>
<addr-line><![CDATA[Manizales ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Nacional de Colombia Facultad de Minas Departamento de Ciencias de la Computación y de la Decisión]]></institution>
<addr-line><![CDATA[Medellín ]]></addr-line>
<country>Colombia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>08</month>
<year>2017</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>08</month>
<year>2017</year>
</pub-date>
<volume>20</volume>
<numero>39</numero>
<fpage>17</fpage>
<lpage>24</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0123-77992017000200002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0123-77992017000200002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0123-77992017000200002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Resumen Big Data se ha convertido en una tendencia a nivel mundial y aunque aún no cuenta con un concepto científico o académico consensuado, se augura cada día mayor crecimiento del mercado que lo envuelve y de las áreas de investigación asociadas. En este artículo se reporta una exploración de literatura sobre Big Data, que comprende un estado del arte de las técnicas y tecnologías asociadas a Big Data, las cuales abarcan captura, procesamiento, análisis y visualización de datos. Se exploran también las características, fortalezas, debilidades y oportunidades de algunas aplicaciones y modelos que incluyen Big Data, principalmente para el soporte al modelado de datos, análisis y minería de datos. Asimismo, se introducen algunas de las tendencias futuras para el desarrollo de Big Data por medio de la definición de aspectos básicos, alcance e importancia de cada una. La metodología empleada para la exploración incluye la aplicación de dos estrategias, una primera corresponde a un análisis cienciométrico; y la segunda, una categorización de documentos por medio de una herramienta web de apoyo a los procesos de revisión literaria. Como resultados se obtiene una síntesis y conclusiones en torno a la temática y se plantean posibles escenarios para trabajos investigativos en el campo de dominio.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Abstract Big Data has become a worldwide trend and although still lacks a scientific or academic consensual concept, every day it portends greater market growth that surrounds and the associated research areas. This paper reports a systematic review of the literature on Big Data considering a state of the art about techniques and technologies associated with Big Data, which include capture, processing, analysis and data visualization. The characteristics, strengths, weaknesses and opportunities for some applications and Big Data models that include support mainly for modeling, analysis, and data mining are explored. Likewise, some of the future trends for the development of Big Data are introduced by basic aspects, scope, and importance of each one. The methodology used for exploration involves the application of two strategies, the first corresponds to a scientometric analysis and the second corresponds to a categorization of documents through a web tool to support the process of literature review. As results, a summary and conclusions about the subject are generated and possible scenarios arise for research work in the field.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Big Data]]></kwd>
<kwd lng="es"><![CDATA[análisis de datos]]></kwd>
<kwd lng="es"><![CDATA[ciencia de los datos]]></kwd>
<kwd lng="es"><![CDATA[minería de datos]]></kwd>
<kwd lng="es"><![CDATA[análisis Big Data]]></kwd>
<kwd lng="en"><![CDATA[Big data]]></kwd>
<kwd lng="en"><![CDATA[data analysis]]></kwd>
<kwd lng="en"><![CDATA[data science]]></kwd>
<kwd lng="en"><![CDATA[data mining]]></kwd>
<kwd lng="en"><![CDATA[big data analysis]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[   <font size="2" face="verdana">     <p align="right"><b>Art&iacute;culo de investigaci&oacute;n/Research article</b></p>      <p align="center"><font size="4" face="verdana"><b>Big Data: una exploraci&oacute;n de investigaciones, tecnolog&iacute;as y casos de aplicaci&oacute;n</b></font></p>     <p align="center"><font size="3" face="verdana"><b>Big Data: an exploration of research, technologies and application cases</b></font></p>      <p><b>Emilcy J. Hern&aacute;ndez-Leal<sup>1</sup>, N&eacute;stor  D. Duque-M&eacute;ndez<sup>2</sup> y Juli&aacute;n  Moreno-Cadavid<sup>3</sup></b></p>     <p><sup>1</sup> Esp. en Gerencia Estrat&eacute;gica de Proyectos, Estudiante de Maestr&iacute;a en Ingenier&iacute;a Administrativa, Administradora de sistemas inform&aacute;ticos, Departamento de Ingenier&iacute;a de la Organizaci&oacute;n, Facultad de Minas, Universidad Nacional de Colombia, Medell&iacute;n-Colombia, <a href="mailto:ejhernandezle@unal.edu.co">ejhernandezle@unal.edu.co</a></p>     <p><sup>2</sup> PhD. en Ingenier&iacute;a, MSc. en Ingenier&iacute;a de Sistemas, Especialista en Sistemas, Ingeniero Mec&aacute;nico, Facultad de Administraci&oacute;n, Departamento de Inform&aacute;tica y Computaci&oacute;n, Universidad Nacional de Colombia, Manizales-Colombia, <a href="mailto:ndduqueme@unal.edu.co">ndduqueme@unal.edu.co</a></p>     <p><sup>3</sup> PhD. en Ingenier&iacute;a de Sistemas, MSc. en Ingenier&iacute;a de Sistemas, Ingeniero de Sistemas e Inform&aacute;tica, Departamento de Ciencias de la Computaci&oacute;n y de la Decisi&oacute;n, Facultad de Minas, Universidad Nacional de Colombia, Medell&iacute;n-Colombia, <a href="mailto:jmoreno1@unal.edu.co">jmoreno1@unal.edu.co</a></p>      <p></p>     <p align="center">Fecha de recepci&oacute;n: 28  de mayo de 2016/ Fecha de aceptaci&oacute;n: 15  de marzo de 2017</p> <hr>     ]]></body>
<body><![CDATA[<p>Como citar / How to  cite</p>     <p>E.J. Hern&aacute;ndez-Leal, N.D. Duque-M&eacute;ndez y J. Moreno-Cadavid, &#147;Big Data: una exploraci&oacute;n de investigaciones, tecnolog&iacute;as y casos de aplicaci&oacute;n&rdquo;, <i>TecnoL&oacute;gicas</i>, vol. 20, no. 39, mayo - agosto, 2017</p> <hr>      <p><font size="3"><b>Resumen</b></font></p>     <p> Big Data se ha convertido en una tendencia a nivel mundial y aunque a&uacute;n no cuenta con un concepto cient&iacute;fico o acad&eacute;mico consensuado, se augura cada d&iacute;a mayor crecimiento del mercado que lo envuelve y de las &aacute;reas de investigaci&oacute;n asociadas. En este art&iacute;culo se reporta una exploraci&oacute;n de literatura sobre Big Data, que comprende un estado del arte de las t&eacute;cnicas y tecnolog&iacute;as asociadas a Big Data, las cuales abarcan captura, procesamiento, an&aacute;lisis y visualizaci&oacute;n de datos. Se exploran tambi&eacute;n las caracter&iacute;sticas, fortalezas, debilidades y oportunidades de algunas aplicaciones y modelos que incluyen Big Data, principalmente para el soporte al modelado de datos, an&aacute;lisis y miner&iacute;a de datos. Asimismo, se introducen algunas de las tendencias futuras para el desarrollo de Big Data por medio de la definici&oacute;n de aspectos b&aacute;sicos, alcance e importancia de cada una. La metodolog&iacute;a empleada para la exploraci&oacute;n incluye la aplicaci&oacute;n de dos estrategias, una primera corresponde a un an&aacute;lisis cienciom&eacute;trico; y la segunda, una categorizaci&oacute;n de documentos por medio de una herramienta web de apoyo a los procesos de revisi&oacute;n literaria. Como resultados se obtiene una s&iacute;ntesis y conclusiones en torno a la tem&aacute;tica y se plantean posibles escenarios para trabajos investigativos en el campo de dominio.</p>     <p><b>Palabras clave: </b>Big Data, an&aacute;lisis de datos, ciencia de los datos, miner&iacute;a de datos, an&aacute;lisis Big Data.</p>      <p><font size="3"><b>Abstract</b></font></p>     <p>Big Data has become a worldwide trend and although still lacks a scientific or academic consensual concept, every day it portends greater market growth that surrounds and the associated research areas. This paper reports a systematic review of the literature on Big Data considering a state of the art about techniques and technologies associated with Big Data, which include capture, processing, analysis and data visualization. The characteristics, strengths, weaknesses and opportunities for some applications and Big Data models that include support mainly for modeling, analysis, and data mining are explored. Likewise, some of the future trends for the development of Big Data are introduced by basic aspects, scope, and importance of each one. The methodology used for exploration involves the application of two strategies, the first corresponds to a scientometric analysis and the second corresponds to a categorization of documents through a web tool to support the process of literature review. As results, a summary and conclusions about the subject are generated and possible scenarios arise for research work in the field.</p>      <p><b>Keywords: </b>Big data, data analysis, data science, data mining, big data analysis.</p>     <p></p>     <p><font size="3"><b>1. Introducci&oacute;n</b></font></p>     ]]></body>
<body><![CDATA[<p>El crecimiento en el volumen de datos generados por diferentes sistemas y actividades cotidianas en la sociedad ha forjado la necesidad de modificar, optimizar y generar m&eacute;todos y modelos de almacenamiento y tratamiento de datos que suplan las falencias que presentan las bases de datos y los sistemas de gesti&oacute;n de datos tradicionales. Respondiendo a esto aparece Big Data, t&eacute;rmino que incluye diferentes tecnolog&iacute;as asociadas a la administraci&oacute;n de grandes vol&uacute;menes de datos provenientes de diferentes fuentes y que se generan con rapidez &#91;1&#93;.</p>      <p>A pesar de que el t&eacute;rmino Big Data se asocia principalmente con cantidades de datos exorbitantes, se debe dejar de lado esta percepci&oacute;n, pues Big Data no va dirigido solo a gran tama&ntilde;o, sino que abarca tanto volumen como variedad de datos y velocidad de acceso y procesamiento. En la actualidad se ha pasado de la transacci&oacute;n a la interacci&oacute;n, con el prop&oacute;sito de obtener el mejor provecho de la informaci&oacute;n que se genera minuto a minuto&#91;2&#93;.</p>      <p>Con el auge del Big Data se ha dado cabida tambi&eacute;n a un nuevo concepto, Data Science o Ciencia de los Datos, que se usa de forma gen&eacute;rica para hacer referencia a la serie de t&eacute;cnicas necesarias para el tratamiento y manipulaci&oacute;n de informaci&oacute;n masiva desde un enfoque estad&iacute;stico e inform&aacute;tico. Incluyendo tambi&eacute;n el surgimiento de un nuevo perfil profesional,  el &#147;Data Scientist&#148;&#91;3&#93;, las personas capacitadas en este perfil deben saber del negocio, de las herramientas computacionales y de an&aacute;lisis e interpretaci&oacute;n estad&iacute;stica.</p>      <p>Ahora bien, al revisar Big Data, pensando en la creaci&oacute;n de soluciones que incluyan problemas enmarcados en este enfoque, se pueden encontrar cuatro fases donde se agrupan o clasifican las diferentes  tecnolog&iacute;as de soporte, estas son: generaci&oacute;n, adquisici&oacute;n, almacenamiento y an&aacute;lisis de datos. En &#91;4&#93;, se define la primera fase, generaci&oacute;n, como un proceso propio de diversas actividades de la sociedad, en estas se genera una cantidad inmensa de datos, que, seg&uacute;n su naturaleza, puede estar almacenada y estructurada o puede corresponder a datos sin ninguna estructura, pero con caracter&iacute;sticas de gran valor. En la segunda fase, se incluye la colecci&oacute;n de todos estos datos generados en la vida diaria, la trasmisi&oacute;n y pre-procesamiento de los mismos es de gran importancia, ya que muchos conjuntos de datos presentan redundancia o datos in&uacute;tiles y si no se tratan pueden incrementar el espacio de almacenamiento innecesariamente y afectar los resultados de una fase de an&aacute;lisis. La fase de almacenamiento de Big Data ha generado la necesidad de generar estudios y propuestas de nuevas estrategias que permitan afrontar los tipos de datos que no se pueden gestionar con un sistema de gesti&oacute;n de bases de datos relacionales. Surgen entonces, tecnolog&iacute;as de almacenamiento de datos masivos como almacenamiento con conexi&oacute;n directa y el almacenamiento en red, tambi&eacute;n diferentes motores NoSQL. Finalmente, la fase de an&aacute;lisis debe atender a la necesidad de extraer r&aacute;pidamente informaci&oacute;n desde los datos masivos para poder generar valor en las organizaciones y facilitar procesos de toma de decisiones, se requiere de tecnolog&iacute;as que faciliten incluso el an&aacute;lisis en tiempo real.</p>      <p>Siguiendo los lineamientos para la construcci&oacute;n de art&iacute;culos de revisi&oacute;n &#91;5&#93;, este art&iacute;culo tiene como objetivo presentar una visi&oacute;n general acerca de Big Data incluyendo un an&aacute;lisis cienciom&eacute;trico de las publicaciones en este campo y haciendo una exploraci&oacute;n cuidadosa de una serie de trabajos en el tema, que contemplan aplicaciones, oportunidades, desaf&iacute;os y retos de Big Data. A su vez, se hace una breve introducci&oacute;n de algunas tecnolog&iacute;as y t&eacute;cnicas adoptadas para la implementaci&oacute;n de soluciones a problemas de Big Data. Esta exploraci&oacute;n concluye con la presentaci&oacute;n de puntos clave y principales aportes encontrados.</p>      <p>Lo que resta del art&iacute;culo se organiza de la siguiente forma: en la siguiente Secci&oacute;n se presenta la metodolog&iacute;a y principales hallazgos de esta exploraci&oacute;n. En la Secci&oacute;n 3 se muestran las tecnolog&iacute;as y t&eacute;cnicas para el tratamiento de Big Data. Por su parte, en la Secci&oacute;n 4 se muestran algunas tendencias y retos en el campo, y se finaliza en la Secci&oacute;n 5, con las conclusiones que parten del an&aacute;lisis del contexto presentado en las secciones previas.</p>      <p></p>     <p><font size="3"><b>2. Metodolog&iacute;a</b></font></p>      <p>El desarrollo de esta exploraci&oacute;n se realiz&oacute; siguiendo dos estrategias. Como primera estrategia, se hizo un acercamiento cienciom&eacute;trico por medio de la herramienta bibliogr&aacute;fica SCOPUS, un &iacute;ndice bibliogr&aacute;fico que contiene una colecci&oacute;n representativa, completa y multidisciplinar a nivel mundial. La segunda estrategia comprende el an&aacute;lisis de algunos trabajos particulares  referentes al soporte y estructura conceptual de la tem&aacute;tica abordada. Estos fueron seleccionados y clasificados por medio de la herramienta ToS (Tree of Science), desarrollada en la Universidad Nacional de Colombia. A continuaci&oacute;n, se detallar&aacute;n cada una de las estrategias y se mostrar&aacute;n los resultados obtenidos.</p>      <p><i><b>2.1 Primera estrategia de exploraci&oacute;n</b></i></p>      ]]></body>
<body><![CDATA[<p>SCOPUS es una de las m&aacute;s grandes bases de datos de res&uacute;menes y citas de literatura revisadas por pares, contienen art&iacute;culos de revistas cient&iacute;ficas, libros y art&iacute;culos de congresos, posibilitando tener una visi&oacute;n global de la producci&oacute;n acad&eacute;mica e investigativa en campos de la ciencia, tecnolog&iacute;a, medicina, artes y  humanidades &#91;6&#93;. Adem&aacute;s, esta herramienta permite clasificar, refinar y analizar de forma &aacute;gil los resultados obtenidos a partir de una ecuaci&oacute;n de b&uacute;squeda, con ello se puede extraer informaci&oacute;n relevante de la tem&aacute;tica de inter&eacute;s que se est&eacute; abordando. Para este acercamiento se utiliz&oacute; como ecuaci&oacute;n de b&uacute;squeda &#147;big data&#148;y a  continuaci&oacute;n se presentan algunos aspectos relevantes que se extrajeron de los resultados en SCOPUS. Se decidi&oacute; utilizar esta ecuaci&oacute;n de b&uacute;squeda poco  delimitada, porque se pretende presentar un estado general de presencia y tratamiento de la tem&aacute;tica.</p>      <p>El total de recursos encontrados fue de 16.902. En la <a href="#Figura1">Fig. 1</a> se presenta el n&uacute;mero de documentos publicados por a&ntilde;o. Se aprecia que los estudios del tema llevan poco m&aacute;s de un lustro, se puede ver que en el a&ntilde;o 2012 es cuando realmente toma fuerza y viene teniendo un crecimiento significativo, pasando de 646 resultados en 2012 a 7508 resultados en 2015. Para el 2016 se presentan los resultados correspondientes a los cuatro primeros meses del a&ntilde;o.</p>      <p align="center"><a name="Figura1"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig01.jpg"></p>      <p>Como se aprecia en la <a href="#Figura2">Fig. 2</a>, si se revisa seg&uacute;n el tipo de recurso, se ve una marcada tendencia hacia los art&iacute;culos de conferencia, con un total de 9.493 resultados. Los art&iacute;culos cient&iacute;ficos muestran 4.824 resultados, mientras que los cap&iacute;tulos de libro y los libros solo despliegan 388 y 88 resultados respectivamente, lo anterior ratifica la etapa naciente en que se encuentra este campo de estudio, puesto que sus bases te&oacute;ricas apenas se est&aacute;n consolidando.</p>      <p align="center"><a name="Figura2"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig02.jpg"></p>      <p>Revisando los resultados agrupados por pa&iacute;s de publicaci&oacute;n, se puede ver una concentraci&oacute;n en Estados Unidos y China como  se aprecia en la <a href="#Figura3">Fig. 3</a>. En los pa&iacute;ses europeos se encuentra un n&uacute;mero tambi&eacute;n significativo de trabajos, mientras que, en Sur Am&eacute;rica, Ocean&iacute;a y &Aacute;frica, el desarrollo de investigaciones en el campo es a&uacute;n incipiente.</p>      <p align="center"><a name="Figura3"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig03.jpg"></p>      <p><i><b>2.2 Segunda estrategia de exploraci&oacute;n</b></i></p>      <p>Como segunda estrategia se hizo un an&aacute;lisis detallado de algunos documentos, utilizando para su selecci&oacute;n y clasificaci&oacute;n  una herramienta desarrollada desde el Grupo de Investigaci&oacute;n en Ambientes Inteligentes Adaptativos - GAIA - y como parte de una tesis doctoral en la Universidad Nacional de Colombia - Sede Manizales. La herramienta llamada ToS (Tree of Science)&#91;7&#93;, funciona en la web y se puede acceder a ella a trav&eacute;s del enlace <a href="http://tos.manizales.unal.edu.co/">http://tos.manizales.unal.edu.co/</a>.</p>     <p>Los resultados que brinda la herramienta son  construidos a partir de la utilizaci&oacute;n de una serie de algoritmos de redes complejas, los cuales optimizan los resultados de la b&uacute;squeda y selecci&oacute;n de documentos cient&iacute;ficos publicados. Esta herramienta clasifica los documentos en &#147;ra&iacute;z&rdquo;, &#147;tronco&#148;y &#147;ramas&#148;a partir de la lista de trabajos encontrados. Los  documentos ra&iacute;z hacen referencia a las investigaciones que dan soporte al enfoque o tem&aacute;tica abarcada, los documentos tronco son aquellos que dan  estructura al tema y los documentos rama son las perspectivas y tendencias.&nbsp; Para el caso particular, se usaron los  siguientes par&aacute;metros para la b&uacute;squeda:</p>        ]]></body>
<body><![CDATA[<li>Palabras de b&uacute;squeda: &#147;Big Data&rdquo;</li>       <li>Restricci&oacute;n de a&ntilde;os: 2010-2016</li>       <li>Categor&iacute;a de Web of Science: computer science information systems</li>       <li>Tipo de documento: documentos cient&iacute;ficos</li>      <p>Se hizo la b&uacute;squeda en el &iacute;ndice bibliogr&aacute;fico Web of Science (&iacute;ndice con el cual trabaja la herramienta ToS) y se obtuvo un total de ciento setenta y cuatro (174) art&iacute;culos para los par&aacute;metros de b&uacute;squeda. A partir del an&aacute;lisis de este grupo de art&iacute;culos y de las referencias citadas en los mismos, la herramienta ToS hizo el respectivo refinamiento y retorn&oacute; diez art&iacute;culos considerados ra&iacute;z, en el tronco se clasificaron otros diez y setenta art&iacute;culos fueron ubicados en las ramas, como  se aprecia en la <a href="#Figura4">Fig. 4</a>. Cabe aclarar que en este documento no se reportar&aacute; la totalidad de los art&iacute;culos arrojados por la herramienta, se ha realizado una selecci&oacute;n de los documentos que cubren la tem&aacute;tica, permitiendo tener una visi&oacute;n general del estado del arte y de las tendencias y campos de trabajo.</p>      <p align="center"><a name="Figura4"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig04.jpg"></p>      <p>Seguidamente, se presenta un recuento de cinco de los documentos clasificados como ra&iacute;z del enfoque, la selecci&oacute;n de los  documentos presentados en este escrito se hace despu&eacute;s del an&aacute;lisis por parte de los autores de la totalidad de los documentos ra&iacute;z e identificando los m&aacute;s relevantes. </p>      <p>Retomando lo anteriormente mencionado, los documentos ra&iacute;z corresponden a investigaciones o aportes que dan soporte a la tem&aacute;tica. Dos de los art&iacute;culos corresponden a revisiones acerca de tecnolog&iacute;as que permitieron y dieron pie al nacimiento de la tendencia Big Data: la computaci&oacute;n en la nube y el paradigma de programaci&oacute;n Map Reduce. Los dos documentos siguientes corresponden a dos libros, el primero concebido por la empresa IBM, en el que se analiza Big Data desde una perspectiva empresarial y una perspectiva tecnol&oacute;gica, cabe se&ntilde;alar que IBM es una de las compa&ntilde;&iacute;as que provee soluciones Big Data a nivel empresarial. El segundo es una Gu&iacute;a de Hadoop, donde se describen los conceptos asociados a este paradigma, se habla del modelo MapReduce, de otras herramientas Big Data y se presentan algunos casos de estudio donde se ha aplicado Hadoop. Finalmente, se toma un informe producto de los puntos de vista recogidos por el autor en un evento de exploraci&oacute;n de Big Data e inferencia de software.</p>      <p>Map Reduce &#91;8&#93; es un modelo de programaci&oacute;n asociado a las implementaciones que requieren procesamiento y generaci&oacute;n de grandes bases de datos. Los c&oacute;mputos se hacen en t&eacute;rminos de una funci&oacute;n de mapeo y otra de reducci&oacute;n y el c&aacute;lculo se hace de forma paralelizada. Los autores muestran Map Reduce como un modelo que facilita el trabajo con sistemas paralelos y distribuidos, ya que oculta detalles de paralelizaci&oacute;n, tolerancia a fallos,  optimizaci&oacute;n y balance de carga. Es necesario optimizar los recursos de red cuando se trabaja con Map Reduce, por ello es bueno leer los datos desde discos locales y reducir la cantidad de datos enviados a trav&eacute;s de la red. Tambi&eacute;n la ejecuci&oacute;n redundante disminuye el impacto de las m&aacute;quinas lentas, p&eacute;rdida de  datos y fallos de m&aacute;quina.</p>      <p>Otra de las bases de Big Data es la computaci&oacute;n en la nube o cloud computing logrando que los desarrolladores ya no requieran de grandes inversiones en hardware, la elasticidad de recursos sin necesidad de pagar por servicios Premium de gran escala es un hito fundamental en la historia de las tecnolog&iacute;as de la informaci&oacute;n. Cloud computing se convirti&oacute; en un tema popular y objeto de art&iacute;culos, workshops, conferencias y revistas. Se augur&oacute; el crecimiento de cloud computing independientemente de si los servicios adquiridos son a bajo o alto nivel de abstracci&oacute;n. Se afirma que el almacenamiento, c&oacute;mputo y las redes deben concentrarse en la escalabilidad horizontal de los recursos virtualizados en lugar del rendimiento de un solo nodo. Se plante&oacute; la necesidad de que las aplicaciones de software tuviesen una r&aacute;pida escalabilidad y que los sistemas de hardware fuesen dise&ntilde;ados a escala de contenedor &#91;9&#93;.</p>      ]]></body>
<body><![CDATA[<p>Big Data surge como una nueva era en la exploraci&oacute;n y utilizaci&oacute;n de datos. Desde la perspectiva empresarial Big Data no representa solo grandes vol&uacute;menes de datos, se deben considerar los patrones extra&iacute;dos a partir de los datos y que pueden generar procesos de innovaci&oacute;n. Desde la perspectiva tecnol&oacute;gica se presenta Hadoop como la principal herramienta desarrollada para el tratamiento de Big Data, incluyendo el manejo de sistemas de archivos  distribuidos y el paradigma de programaci&oacute;n Map Reduce. En la primera parte, correspondiente a la perspectiva empresarial, se presenta una comparaci&oacute;n entre las soluciones Big Data y las soluciones tradicionales de Datawarehouse. Sin querer buscar una ganadora, se expone la ventaja de usar Datawarehouse cuando se trata de analizar datos estructurados que vienen de varios sistemas y de mediciones relativamente estables. Respecto a las plataformas basadas en Hadoop, funcionan bien con datos semiestructurados y desestructurados, as&iacute; como tambi&eacute;n cuando se requiere de procesos de descubrimiento de datos &#91;10&#93;.</p>      <p>Partiendo de la necesidad de almacenamiento y an&aacute;lisis de los datos se desarrolla el ecosistema Hadoop, los sistemas de archivos distribuidos, el desarrollo de aplicaciones con MapReduce, el lenguaje de consultas Hive y otras  herramientas como HBase, ZooKeeper y Sqoop. En &#91;11&#93; se presenta una gu&iacute;a completa, tanto de forma conceptual como con ejemplos de aplicaci&oacute;n de Hadoop y de varias herramientas asociadas a este. Uno de los casos estudiados es el de Hadoop y Hive para Facebook. Facebook inicialmente usaba data warehousing sobre una  instancia Oracle, sin embargo, con su crecimiento se tuvo que pensar en nuevas alternativas, Hadoop fue atractiva porque ya se usaba en Yahoo para procesamientos internos y usaba el modelo MapReduce popularizado por Google.</p>      <p>El crecimiento de los datos, como la explosi&oacute;n de las redes m&oacute;viles, la computaci&oacute;n en la nube y las nuevas tecnolog&iacute;as son descritas en &#91;12&#93;. Esto ha dado un aumento al incomprensible mundo de la informaci&oacute;n, que se suele describir como Big Data. Este informe captura los puntos de vista recogidos durante un evento de exploraci&oacute;n de temas de Big Data e inferencia de software. Las compa&ntilde;&iacute;as que han sido pioneras en el uso de anal&iacute;ticas profundas sobre grandes bases de datos han sido las que operan sobre internet, como son los motores de b&uacute;squeda, los sitios de redes sociales y los sitios de comercio en l&iacute;nea. Sin embargo, el desarrollo de nuevos tipos de sensores remotos como telescopios, videoc&aacute;maras, monitores de tr&aacute;fico, m&aacute;quinas de resonancia magn&eacute;tica, sensores qu&iacute;micos y biol&oacute;gicos y sensores de monitoreo ambiental, se han generado nuevos flujos de datos digitales. As&iacute; mismo, las personas a trav&eacute;s de sus tel&eacute;fonos celulares, computadores personales, sitios web y otro tipo de dispositivos digitales generan grandes flujos de datos personales. Lo anterior deja ver que Big Data presenta oportunidades incalculables para la formulaci&oacute;n de investigaci&oacute;n cient&iacute;fica, acelera la innovaci&oacute;n y puede ayudar a mejorar &aacute;mbitos que van desde la salud hasta el Gobierno. Tambi&eacute;n se abren nuevas oportunidades de negocio porque surgen mecanismos que permiten entender las din&aacute;micas de negocio en tiempo real, como el comportamiento de los consumidores, las actividades de vida nocturna, los mercados, entre otros. Cabe anotar que Big Data presenta tambi&eacute;n retos y peligros, ya que las tecnolog&iacute;as de datos son cada vez m&aacute;s penetrantes, intrusivas y dif&iacute;ciles de entender.</p>      <p>A manera de resumen de los principales documentos considerados ra&iacute;z, en la <a href="#Tabla1">Tabla 1</a> se presenta una s&iacute;ntesis de estos.</p>      <p align="center"><a name="Tabla1"></a><img src="img/revistas/teclo/v20n39/v20n39a02tab01.jpg"></p>      <p>Los documentos ubicados en el tronco, son aquellos que dan estructura a la tem&aacute;tica o campo de estudio, hacen referencia a estudios de revisi&oacute;n frente a los avances, desaf&iacute;os y perspectivas de Big Data y tecnolog&iacute;as asociadas, estos son presentados a continuaci&oacute;n. En este caso tambi&eacute;n se opt&oacute; por  presentar los cinco documentos que despu&eacute;s de la revisi&oacute;n por parte de los autores son considerados los m&aacute;s relevantes.</p>      <p>En &#91;13&#93; se presenta Big Data, sus aplicaciones, las oportunidades y desaf&iacute;os de estas tecnolog&iacute;as, as&iacute; como tambi&eacute;n t&eacute;cnicas de &uacute;ltima generaci&oacute;n que se han adoptado para hacer frente a los problemas de Big Data. Se  discuten algunas  metodolog&iacute;as utilizadas para tratar cantidades considerables de datos como es la computaci&oacute;n granular, la computaci&oacute;n en la nube, la computaci&oacute;n bio-inspirada y la computaci&oacute;n cu&aacute;ntica. Destacan el papel que han jugado los datos como promotores de diferentes campos cient&iacute;ficos, como la astronom&iacute;a, la meteorolog&iacute;a, la bioinform&aacute;tica y la biolog&iacute;a computacional. Dichos campos basan gran parte de su descubrimiento cient&iacute;fico en el an&aacute;lisis de grandes vol&uacute;menes de datos. Otro de los aportes significativos, es la descripci&oacute;n de los principios para el dise&ntilde;o de sistemas Big Data. Estos son:(1) Buenas arquitecturas y frameworks son necesarios y de alta prioridad. (2) Soportar una variedad de m&eacute;todos anal&iacute;ticos. (3) No hay un tama&ntilde;o definido para todo. (4) Conducir el an&aacute;lisis de los datos. (5) El procesamiento debe ser distribuido. (6) El almacenamiento de los datos debe ser distribuido. (7) Es necesaria una coordinaci&oacute;n entre las unidades de procesamiento y de datos.</p>      <p>En &#91;4&#93; se revisan  algunas de las tecnolog&iacute;as relacionadas a Big Data como computaci&oacute;n en la nube, Internet de las cosas, centros de datos y Hadoop. Tambi&eacute;n se mencionan las fases de la cadena de valor de Big Data y finalmente se examinan algunos casos de aplicaci&oacute;n como gesti&oacute;n empresarial, internet de las cosas, redes sociales, aplicaciones m&eacute;dicas, inteligencia colectiva y redes el&eacute;ctricas inteligentes. En cuanto a las fases de Big Data, se definen cuatro principales: generaci&oacute;n, adquisici&oacute;n, almacenamiento y an&aacute;lisis de datos. Los autores afirman que, sin  tratar de predecir el futuro, el panorama de Big Data se concentrar&aacute; en: datos con escalas y diversidad cada vez mayores y estructuras mucho m&aacute;s complejas, la necesidad de rendimiento de los recursos de datos, Big Data promover&aacute; la fusi&oacute;n transversal de la ciencia, tendr&aacute; grandes retos de visualizaci&oacute;n de datos y una orientaci&oacute;n a los datos cada vez m&aacute;s marcada. A su vez, se presentan los desaf&iacute;os de Big Data, estos requieren de un esfuerzo investigativo y son agrupados en las siguientes categor&iacute;as: investigaci&oacute;n te&oacute;rica, desarrollo tecnol&oacute;gico, implicaciones pr&aacute;cticas y seguridad de datos.</p>      <p>Desde una perspectiva de la administraci&oacute;n de los datos, en &#91;14&#93; se presenta una discusi&oacute;n acerca de la diversidad de Big Data, las necesidades de integraci&oacute;n y limpieza, las consultas e indexaci&oacute;n y finalmente la miner&iacute;a y an&aacute;lisis sobre Big Data. El inicio de Big Data va directamente relacionado con el crecimiento de los datos generados por la sociedad. Estos datos suelen caracterizarse por su heterogeneidad y por la variedad de fuentes desde las cuales provienen, sin embargo, se pueden clasificar estas fuentes de acuerdo con donde son generadas. Los autores proponen las siguientes: contenidos generados por usuarios, estos vienen de aplicaciones que cuentan con usuarios masivos, por ejemplo tweets o blogs; datos transaccionales, son  generados por sistemas masivos que procesan transacciones y operaciones como por ejemplo lectores de radio frecuencia, transacciones empresariales, entre otras; datos cient&iacute;ficos, estos son producidos por aplicaciones o experimentos de datos-intensivos, por ejemplo datos del genoma o datos de asistencia sanitaria; datos web, provienen de los procesos que soportan aplicaciones web como b&uacute;squedas y miner&iacute;a, tambi&eacute;n de los billones de p&aacute;ginas web que existen; Grafos de datos, corresponden a un enorme n&uacute;mero de nodos de informaci&oacute;n y las relaciones entre estos nodos.&nbsp;  Adicionalmente, se habla de la reducci&oacute;n de Big Data, entendida como la reducci&oacute;n de las cantidades exorbitantes a los segmentos significativos, se presentan t&eacute;cnicas como machine learning y el procesamiento paralelo masivo para este fin.</p>      <p>Es importante tambi&eacute;n, tener en cuenta c&oacute;mo en el &aacute;rea de la industria y los negocios se ha presentado una explosi&oacute;n en el n&uacute;mero de datos, causada principalmente por el r&aacute;pido desarrollo del internet, nuevos conceptos como el internet de las cosas y la computaci&oacute;n en la nube. Big data se ha constituido como un &#147;t&oacute;pico caliente&#148;que atrae la atenci&oacute;n no solo de la industria, sino tambi&eacute;n de la academia y del Gobierno. Los autores presentan desde diferentes perspectivas el  significado y las oportunidades que nos brinda el ecosistema Big Data y dan una serie de condiciones necesarias para que un proyecto de Big Data sea exitoso. En primer lugar, se deben tener claros los requerimientos independientemente de si son t&eacute;cnicos, sociales o econ&oacute;micos. En segundo lugar, para trabajar de forma eficiente con Big Data se requiere explorar y encontrar la estructura central o el kernel de los datos a ser procesados, ya que al tener esto se puede caracterizar el comportamiento y las propiedades subyacentes a Big Data. En tercer lugar, se debe adoptar un modelo de administraci&oacute;n top-down, se puede  considerar tambi&eacute;n un modelo bottom-up, sin embargo, solo servir&iacute;a cuando se  trata de problemas espec&iacute;ficos, y luego tratar de unirlos para formar una soluci&oacute;n completa es complejo. Por &uacute;ltimo, los autores exponen la necesidad de abordar desde los proyectos Big Data soluciones integradas, no con esfuerzos aislados &#91;15&#93;.</p>      ]]></body>
<body><![CDATA[<p>Los retos que se desprenden del consumo y creaci&oacute;n de informaci&oacute;n a trav&eacute;s de la red incluyen necesidades de captura, manejo y procesamiento de grandes vol&uacute;menes de datos. En &#91;16&#93; los autores proponen un teorema llamado &#147;HACE&#148;(Heterogeneous,  Autonomous, Complex y Evolving), con el cual buscan describir las caracter&iacute;sticas de la revoluci&oacute;n de Big Data. El teorema plantea la existencia de un gran volumen de datos heterog&eacute;neos y provenientes de fuentes aut&oacute;nomas con control distribuido y descentralizado, y que trata de explorar relaciones complejas y cambiantes entre los datos. Los autores plantean que hay un gran desaf&iacute;o para descubrir conocimiento &uacute;til desde Big Data. La heterogeneidad se refiere a los diferentes tipos de representaciones para los mismos individuos, y la diversidad de caracter&iacute;sticas se refiere a la variedad a la hora de representar cada observaci&oacute;n particular. Las fuentes de datos aut&oacute;nomas con control distribuido y descentralizado son, seg&uacute;n los autores, la principal caracter&iacute;stica de las aplicaciones de Big Data. Al ser aut&oacute;nomas, cada fuente de datos tiene la capacidad de generar y recopilar informaci&oacute;n sin la participaci&oacute;n de un ente de control centralizado. Se plantea, adem&aacute;s, que un marco de trabajo para el procesamiento de Big Data presenta ciertos desaf&iacute;os de investigaci&oacute;n, los cuales se pueden reunir en una estructura de tres niveles. La parte central, la &quot;plataforma de miner&iacute;a de Big Data&quot; (nivel I), que se enfoca en el acceso a los datos de bajo nivel y computaci&oacute;n. Los desaf&iacute;os en el intercambio de informaci&oacute;n y la privacidad, los dominios de aplicaci&oacute;n de Big Data y el conocimiento forman el nivel II, que se concentra en la sem&aacute;ntica de alto nivel, las aplicaciones de dominio de conocimiento y los problemas de privacidad del usuario. Ya en el nivel III se presentan los desaf&iacute;os en los actuales algoritmos de miner&iacute;a.</p>      <p>Cabe resaltar, que los documentos considerados tronco, para este caso, corresponden a revisiones del estado del arte en Big Data. En la <a href="#Tabla2">Tabla 2</a> se presenta una s&iacute;ntesis de los  mismos. </p>      <p align="center"><a name="Tabla2"></a><img src="img/revistas/teclo/v20n39/v20n39a02tab02.jpg"></p>      <p>En la exploraci&oacute;n se encontr&oacute; que el termino Big Data ha tenido gran acogida en la comunidad, representado esto en el surgimiento de tecnolog&iacute;as, t&eacute;cnicas y enfoques.Sin embargo, se presenta a&uacute;n una marcada tendencia hacia los aportes de tipo conceptual, son pocos los resultados y hallazgos que permitan realmente vislumbrar de forma tangible sus beneficios frente a otras tendencias o tecnolog&iacute;as tradicionales. Los trabajos se concentran, en su gran mayor&iacute;a, en asociar Big Data a grandes vol&uacute;menes de datos o a la distribuci&oacute;n de procesamiento. En el primer caso, no es claro cu&aacute;l es la cantidad de datos que permite esta calificaci&oacute;n; y para el segundo, no hay coincidencia en determinar para qu&eacute; tipo de datos el procesamiento distribuido consigue mejores resultados. La volatilidad y variabilidad a&uacute;n no reciben la atenci&oacute;n necesaria. Con lo anterior, se ratifica que existen numerosos vac&iacute;os conceptuales y  tecnol&oacute;gicos en los cuales se pueden plantear trabajos investigativos y pr&aacute;cticos. </p>       <p><font size="3"><b>3. Tratamiento de Big Data</b></font></p>      <p>Como se ha venido comentando, el tratamiento de Big Data ha exigido el desarrollo de soluciones computacionales que permitan afrontar las necesidades y retos que traen consigo los grandes vol&uacute;menes de datos, su variedad de fuentes y la velocidad con que se generan.</p>     <p>A continuaci&oacute;n, se da una breve descripci&oacute;n de algunas tecnolog&iacute;as y t&eacute;cnicas de Big Data, los art&iacute;culos referenciados en esta secci&oacute;n comprenden algunos de los documentos &#147;ramas&#148;encontrados en la exploraci&oacute;n con la herramienta ToS, otros hacen parte de la b&uacute;squeda inicial en Scopus y otros son fuentes adicionales consultadas por los autores para ampliar el tema y cubrir el objetivo de brindar una visi&oacute;n del estado del arte referente a la tem&aacute;tica abordada.</p>      <p><i><b>3.1 Tecnolog&iacute;as Big Data</b></i></p>      <p>Como tecnolog&iacute;as de Big Data se clasifican aquellas que dan soporte a la captura, transformaci&oacute;n, procesamiento y an&aacute;lisis de los datos, ya sean estructurados, semiestructurados o no estructurados. Seguidamente, en la <a href="#Figura5">Fig. 5</a>, se muestran las tecnolog&iacute;as de Big Data que se revisar&aacute;n en este documento. Se decide presentar estas tecnolog&iacute;as ya que son software de libre uso y que permite la generaci&oacute;n de soluciones de Big Data de acuerdo con las necesidades particulares de un dominio de datos u organizaci&oacute;n. Cabe aclarar que existen un mayor n&uacute;mero de tecnolog&iacute;as que soportan Big Data, tanto libres como propietarias, pero para efectos de este documento se ha acotado de acuerdo con lo anteriormente expuesto y tomando las tecnolog&iacute;as que dieron las bases iniciales al ecosistema Big Data.</p>      <p align="center"><a name="Figura5"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig05.jpg"></p>      ]]></body>
<body><![CDATA[<p><i>Hadoop</i></p>      <p>Hadoop es una librer&iacute;a de Apache definida como un framework que permite hacer procesamiento de datos distribuido sobre vol&uacute;menes de datos de considerable tama&ntilde;o sobre cl&uacute;ster. Est&aacute; dise&ntilde;ado pensando en brindar poder de escalamiento desde un par  de servidores hasta cientos de m&aacute;quinas o nodos, las cuales manejan  almacenamiento y procesamiento local &#91;17&#93;.</p>      <p>Hadoop cuenta con dos componentes principales, el HDFS, sistema de archivos distribuidos que permite distribuir los ficheros en distintas m&aacute;quinas y MapReduce, framework que permite al desarrollador aislarse de la programaci&oacute;n paralela, permite ejecutar programas escritos en lenguajes de programaci&oacute;n conocidos (p.e Java) en el cl&uacute;ster de Haddop. El HDFS cuenta con tres pilares b&aacute;sicos. Namenode, se ocupa del control de acceso y tiene la informaci&oacute;n sobre la distribuci&oacute;n de datos en el resto de nodos. Datanodes, son los encargados de ejecutar el c&oacute;mputo, es decir, las funciones Map y Reduce, sobre los datos almacenados de manera local en cada uno de dichos nodos. Jobtracker, este nodo se encarga de  las tareas y ejerce el control sobre la ejecuci&oacute;n del proceso de MapReduce. Adem&aacute;s, el HDFS cuenta con las siguientes caracter&iacute;sticas fundamentales:</p>        <li>Tolerancia a fallos</li>       <li>Acceso a datos en streaming</li>       <li>Facilidad para el trabajo</li>       <li>Modelo sencillo de coherencia</li>       <li>Portabilidad de convivencia</li>      <p>Varios trabajos donde se ha tomado Hadoop como base y se ha potencializado algunas de sus caracter&iacute;sticas o se ha fusionado con otra herramienta o tecnolog&iacute;a. Ejemplos de esto se pueden encontrar en &#91;18&#93;-&#91;20&#93;.</p>       <p><i>MapReduce</i></p>      ]]></body>
<body><![CDATA[<p>MapReduce es un modelo de programaci&oacute;n que se ha asociado tambi&eacute;n a la implementaci&oacute;n de estrategias de procesamiento de grandes conjuntos de datos que puede ser aplicado a una gran variedad de tareas del mundo real &#91;8&#93;. Este modelo de programaci&oacute;n fue utilizado inicialmente por Google para resolver el problema de ranking de p&aacute;ginas (&#147;Page Rank&rdquo;). El modelo se basa en los siguientes conceptos: iteraciones sobre los datos de entrada, construcci&oacute;n de los pares clave-valor a partir de cada pieza de entrada, agrupaci&oacute;n de los valores intermedios de acuerdo con las claves, iteraci&oacute;n sobre los grupos resultantes y reducci&oacute;n de cada grupo &#91;21&#93;. En la <a href="#Figura6">Fig. 6</a> se presenta el esquema de un proceso MapReduce y seguidamente, se hace una descripci&oacute;n de cada una de fases que involucra.</p>      <p align="center"><a name="Figura6"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig06.jpg"></p>      <p>Mapeo: se aplica en paralelo para cada uno de los &iacute;tems en la entrada de datos. Por medio de la tarea de mapeo (Map) a cada llamada se asignar&aacute; una lista de pares clave-valor (key-value). Por cada clave generada se crea un grupo, el framework agrupa todos los pares con la misma clave extra&iacute;dos de todas las listas tratadas.</p>      <p>Reducci&oacute;n: se aplica en paralelo para el grupo  asociado a una clave. El resultado es la producci&oacute;n de una colecci&oacute;n de valores  para cada dominio. </p>      <p>Distribuci&oacute;n y ordenamiento: tiene dos misiones, por una parte, se encarga de ordenar por clave todos los resultados emitidos por los mapper y por otra parte recoge todos los valores intermedios pertenecientes a una clave para combinarlos en una lista asociada a ella.</p>      <p>Las caracter&iacute;sticas de MapReduce se resumen a continuaci&oacute;n:</p>        <li>Distribuci&oacute;n y paralelizaci&oacute;n autom&aacute;ticas</li>       <li>Tolerancia a fallos y a redundancias</li>       <li>Transparencia</li>       <li>Escalabilidad horizontal</li>       ]]></body>
<body><![CDATA[<li>Localizaci&oacute;n de los datos</li>       <li>Herramientas de monitorizaci&oacute;n</li>      <p>Este paradigma ha sido implementado en numerosas aplicaciones, algunos ejemplos se pueden encontrar en los siguientes documentos, todos se caracterizan por el uso de MapReduce como base de su implementaci&oacute;n. En &#91;22&#93; se presenta una herramienta para el an&aacute;lisis de producci&oacute;n mediante simulaciones a gran escala, en &#91;23&#93; se introduce una estrategia para la extracci&oacute;n de patrones significativos a partir de textos de fecha y hora, por su parte en &#91;24&#93; se muestra la implementaci&oacute;n paralela de redes neuronales multicapa sobre cloud computing clusters, en &#91;25&#93; se eval&uacute;a MapReduce para la realizaci&oacute;n de miner&iacute;a de texto en informaci&oacute;n biom&eacute;dica y en &#91;26&#93; se reporta la utilizaci&oacute;n del paradigma para la construcci&oacute;n de un sistema de recomendaci&oacute;n de art&iacute;culos considerado como un problema dentro del alcance de las soluciones de Big Data. Como se puede apreciar, son variados los campos de dominio y problem&aacute;ticas que pueden ser abordadas mediante la adopci&oacute;n de MapReduce para la simplificaci&oacute;n de complejos.</p>      <p><i>HBase</i></p>      <p>Es una base de datos Hadoop, distribuida y escalable. HBase ha sido desarrollada por Apache y  se recomienda su uso cuando se necesita acceso a lectura y escritura de datos en tiempo real sobre Big Data. El objetivo de HBase es el almacenamiento de tablas de gran tama&ntilde;o, con billones de filas por millones de columnas&#91;27&#93;. Esta base de datos no relacional fue modelada despu&eacute;s de Bigtable de Google &#91;28&#93;, es open source, distribuida y versionada. HBase provee capacidades similares a Bigtable sobre Hadoop y HDFS. Algunas de sus principales caracter&iacute;sticas son:</p>        <li>Escalabilidad modular y linear</li>       <li>Estricta consistencia de lectura y escritura</li>       <li>Facilidad de uso de la API de Java para el acceso de clientes</li>       <li>Bloqueo de la cach&eacute; para consultas en tiempo real</li>       <li>Soporte de para exportar m&eacute;tricas a trav&eacute;s del subsistema de m&eacute;tricas de Hadoop </li>      ]]></body>
<body><![CDATA[<p><i>Cassandra</i></p>      <p>La base de datos Cassandra, propiedad de Apache, brinda escalabilidad y alta disponibilidad sin comprometer el rendimiento. Se considera una plataforma ideal para tratar problemas de datos cr&iacute;ticos, puesto que cuenta con escalabilidad lineal y la tolerancia a fallos en el hardware o en la infraestructura en la nube &#91;29&#93;. Cassandra ofrece un modelo de datos que cuenta con comodidad para la indexaci&oacute;n de columnas, soporte a la desnormalizaci&oacute;n y materializaci&oacute;n a las vistas y un poderoso almacenamiento en cach&eacute; integrado. Es un sistema de almacenamiento distribuido con un modelo de datos que soporta un control din&aacute;mico sobre el dise&ntilde;o y el formato de los datos &#91;30&#93;. Algunos de los principales atributos de Cassandra son:</p>        <li>Tolerancia a fallos, por medio de la replicaci&oacute;n autom&aacute;tica de los datos en m&uacute;ltiples nodos</li>       <li>Descentralizaci&oacute;n, uso de muchos nodos id&eacute;nticos, sin cuellos de botella en la red</li>       <li>Durable, dise&ntilde;ada para evitar la p&eacute;rdida de datos</li>       <li>Elasticidad, capacidad de a&ntilde;adir nuevas m&aacute;quinas para aumentar el rendimiento de lectura y escritura</li>      <p><i>Mahout</i></p>      <p>Mahout es un proyecto de Apache que tiene como objetivo ofrecer un ambiente para la creaci&oacute;n r&aacute;pida de aplicaciones de aprendizaje m&aacute;quina escalables y eficientes &#91;31&#93;. Mahout ofrece una suite de algoritmos para clustering, categorizaci&oacute;n, filtrado colaborativo, clasificaci&oacute;n y programaci&oacute;n evolutiva. Algunas de sus principales aplicaciones pr&aacute;cticas se enmarcan en la realizaci&oacute;n de cl&uacute;ster de documentos, recomendaciones y organizaci&oacute;n de contenidos &#91;32&#93;. El machine learning o aprendizaje m&aacute;quina es el trasfondo principal de Mahout y corresponde a un subcampo de la inteligencia artificial que se centra en el mejoramiento de procesamientos computacionales a partir del an&aacute;lisis de experiencias previas. Mahout desde su aparici&oacute;n ha seguido siendo un proyecto en desarrollo, crecimiento y expansi&oacute;n. Grant Ingersoll en &#91;33&#93; presenta una descripci&oacute;n de algunos de los m&aacute;s recientes algoritmos implementados en Mahout, resumi&eacute;ndolos en la <a href="#Tabla3">Tabla 3</a>, la cual se presenta a continuaci&oacute;n.      <p align="center"><a name="Tabla3"></a><img src="img/revistas/teclo/v20n39/v20n39a02tab03.jpg"></p>      <p><i>T&eacute;cnicas Big Data</i></p>      ]]></body>
<body><![CDATA[<p>En cuanto a t&eacute;cnicas de Big Data, se dar&aacute; una breve introducci&oacute;n, cabe aclarar que existen diferentes clasificaciones y que muchas de estas t&eacute;cnicas se aplican tanto en soluciones Big Data como en otros enfoques. En &#91;34&#93; se presenta una clasificaci&oacute;n de las t&eacute;cnicas de Big data en t&eacute;cnicas estad&iacute;sticas, m&eacute;todos de optimizaci&oacute;n, miner&iacute;a de datos, t&eacute;cnicas de machine learning (aprendizaje m&aacute;quina), t&eacute;cnicas de clasificaci&oacute;n y Clustering y t&eacute;cnicas de an&aacute;lisis y regresi&oacute;n. Para efectos de este documento se describen, sin entrar en detalle, la miner&iacute;a de datos, el aprendizaje m&aacute;quina, el reconocimiento de patrones, los algoritmos gen&eacute;ticos y las reglas de asociaci&oacute;n</p>      <p><i>Miner&iacute;a de Datos</i></p>      <p>La miner&iacute;a de datos (data mining - DM) se puede definir como el proceso de extracci&oacute;n de conocimiento a partir de c&uacute;mulos de datos. Se suele utilizar el t&eacute;rmino miner&iacute;a de datos como sin&oacute;nimo de descubrimiento de conocimiento, pero realmente no son sin&oacute;nimos, la miner&iacute;a de datos es solo un paso en el proceso de descubrimiento de conocimiento &#91;35&#93;. La miner&iacute;a de datos nace de la necesidad de conocer informaci&oacute;n &uacute;til a partir de los bases de datos o Datawarehouse, con el crecimiento de los datos disponibles, la inteligencia de negocios tuvo que dar paso a la aplicaci&oacute;n de la miner&iacute;a de datos en soluciones empresariales y comerciales, puesto que de esta manera se permite el descubrimiento autom&aacute;tico o semiautom&aacute;tico de informaci&oacute;n relevante a partir de estos c&uacute;mulos de datos. En las ciencias y la ingenier&iacute;a existe un amplio rango de problemas y dominios de aplicaci&oacute;n para la miner&iacute;a de datos &#91;36&#93;. Se encuentran soluciones a partir de miner&iacute;a de datos para problemas de los campos de mercadeo, comercio, salud, predicci&oacute;n, transporte, meteorolog&iacute;a, entre otros.</p>      <p><i>Machine learning </i></p>      <p>Aprendizaje m&aacute;quina es un &aacute;rea de investigaci&oacute;n bastante reconocida en las ciencias de la  computaci&oacute;n, principalmente comprende el descubrimiento de modelos, patrones y regularidades en los datos&#91;37&#93;. El aprendizaje m&aacute;quina puede ser visto desde dos enfoques, los simb&oacute;licos y los estad&iacute;sticos. Los primeros trabajan aprendizaje inductivo de descripciones simb&oacute;licas, mientras que los segundos se centran en los m&eacute;todos de reconocimiento de patrones o en la estad&iacute;stica. En los &uacute;ltimos a&ntilde;os, el uso del aprendizaje m&aacute;quina se ha extendido con rapidez &#91;38&#93;, se ven aplicaciones en dominios como detecci&oacute;n de fraudes, sistemas de recomendaci&oacute;n &#91;39&#93;, detecci&oacute;n de spam &#91;40&#93;, predicciones financieras &#91;41&#93;, comercio y mercadeo &#91;42&#93;, &#91;43&#93;, entre otros. Los algoritmos de aprendizaje m&aacute;quina se clasifican en supervisados y no supervisados.</p>      <p><i>Reconocimiento de patrones</i></p>      <p>El reconocimiento de patrones (Pattern Recognition) es una t&eacute;cnica que se aplica principalmente en procesos de ingenier&iacute;a, computaci&oacute;n y matem&aacute;ticas que tiene como objetivo extraer informaci&oacute;n, a partir de un c&uacute;mulo de datos, que brinde la posibilidad de establecer propiedades o relaciones entre estos datos. En el procesamiento de patrones generalmente se usan algoritmos de optimizaci&oacute;n, puesto que su intenci&oacute;n es hallar una mejor soluci&oacute;n respecto a un criterio definido, teniendo en cuenta que un proceso de optimizaci&oacute;n es una situaci&oacute;n que requiere elegir desde un conjunto de alternativas, la que lleve al fin requerido con el costo m&iacute;nimo &#91;44&#93;.</p>      <p><i>Algoritmos gen&eacute;ticos</i></p>      <p>Los algoritmos gen&eacute;ticos (genetic algorithms - GA) son una t&eacute;cnica aplicada en la ingenier&iacute;a computacional, pero que parte de la concepci&oacute;n biol&oacute;gica de la gen&eacute;tica. Estos algoritmos comprenden un enfoque que busca dar soluci&oacute;n a diversos problemas matem&aacute;ticos intangibles que no han podido tener soluci&oacute;n desde otros enfoques  matem&aacute;ticos tradicionales&#91;45&#93;. Los algoritmos gen&eacute;ticos utilizan tambi&eacute;n operaciones gen&eacute;ticas como la mutaci&oacute;n, recombinaci&oacute;n y cruce. En &#91;46&#93;, se definen los algoritmos gen&eacute;ticos como m&eacute;todos de b&uacute;squeda estoc&aacute;sticos dise&ntilde;ados para explorar problemas complejos, con el fin de encontrar una soluci&oacute;n&oacute;ptima, generalmente usando informaci&oacute;n propia del problema como gu&iacute;a de la b&uacute;squeda. Los algoritmos gen&eacute;ticos se enmarcan dentro de los Algoritmos Evolutivos (Evolutionay Algorithms - EA) siendo uno de los componentes m&aacute;s importantes, junto con la programaci&oacute;n gen&eacute;tica y las estrategias evolutivas. En &#91;47&#93;, se presentan como componentes esenciales de los algoritmos gen&eacute;ticos los siguientes:</p>        <li>Estrategia de codificaci&oacute;n que determina la forma en que se representar&aacute; la soluci&oacute;n en forma de cromosomas</li>       ]]></body>
<body><![CDATA[<li>Poblaci&oacute;n de cromosomas o individuos</li>       <li>Mecanismo para la evaluaci&oacute;n de cada cromosoma</li>       <li>Procedimiento de selecci&oacute;n/reproducci&oacute;n</li>       <li>Operadores gen&eacute;ticos: cruce, mutaci&oacute;n</li>       <li>Probabilidades para los operadores gen&eacute;ticos</li>       <li>Un criterio de finalizaci&oacute;n</li>      <p><i>Aprendizaje de reglas de asociaci&oacute;n</i></p>  El aprendizaje de reglas de asociaci&oacute;n (Association rule learning), es un m&eacute;todo para encontrar las relaciones entre variables en grandes bases de datos, su objetivo es identificar reglas usando algunas medidas de relaci&oacute;n de intereses, por ejemplo, en el caso de las redes sociales, se tratar&iacute;a de revisar las personas que posiblemente le interesar&iacute;an  seguir a otras dependiendo de sus amistades o seguidores. En el caso de tiendas de productos, podr&iacute;a ser la revisi&oacute;n de los productos que se compran juntos con  frecuencia para sugerirlos a un cliente que adquiera uno de los productos relacionados. Algunas aplicaciones del aprendizaje de reglas de asociaci&oacute;n se encuentran en &#91;48&#93;-&#91;50&#93;.      <p><font size="3"><b>4. Tendencias y retos en Big Data</b></font></p>      <p>En esta secci&oacute;n se presenta la exploraci&oacute;n de algunos trabajos que presentan una visi&oacute;n general de las tendencias y enfoques en el desarrollo de investigaciones en el campo de Big Data.</p>      <p>En &#91;51&#93; se muestra una revisi&oacute;n del estado del arte en cuanto a sistemas de almacenamiento para grandes vol&uacute;menes de datos, incluyendo un comparativo entre los Sistemas de Administraci&oacute;n de Bases de Datos (DBMS) tradicionales y los  nuevos enfoques NoSQL (Not Only SQL). En el trabajo se considera la necesidad de que estos sistemas sigan garantizando caracter&iacute;sticas como: escalabilidad, fiabilidad, durabilidad, tiempos de respuesta, interfaces de consulta, esquemas de particionamiento y estructura o carencia de esta. Se describen los modelos de almacenamiento NoSQL: dep&oacute;sitos llave-valor, basado en documentos, tabular y orientados a grafos. Los autores afirman que los sistemas NoSQL se adecuan a casos en los que se necesita atender a muchos usuarios sin perder rendimiento, como puede pasar en el caso de las redes sociales. Por su parte, recomiendan los sistemas de bases de datos relacionales cuando se trata de garantizar integridad referencial, se requiere el uso de conexiones entre servidores y clientes, consultas arbitrarias, estandarizaci&oacute;n, herramientas de an&aacute;lisis y  pruebas de rendimiento.</p>      ]]></body>
<body><![CDATA[<p>En &#91;52&#93; presentan la revisi&oacute;n de varios aspectos relacionados con Big Data, tales como contenido, alcance, m&eacute;todos, ventajas, desaf&iacute;os, ejemplos y privacidad de los datos. La revisi&oacute;n realizada por los autores muestra que incluso con las herramientas y t&eacute;cnicas disponibles en la actualidad y la  literatura al respecto, existen muchos puntos a ser considerados, desarrollados, mejorados y analizados. Es claro que la cantidad de datos ha ido en aumento, lo cual exige que tambi&eacute;n las t&eacute;cnicas de an&aacute;lisis y tratamiento de datos se hagan m&aacute;s competitivas, el reto no es solo para recoger y gestionar el  gran volumen y diferentes tipos de datos, sino tambi&eacute;n para extraer valor significativo de estos. Se presentan como las principales barreras para la implementaci&oacute;n de anal&iacute;ticas de Big Data: la carencia de expertos en el tema de Big Data, el costo, el manejo de la privacidad en la manipulaci&oacute;n de los datos, la dificultad en el dise&ntilde;o de sistemas de an&aacute;lisis, la falta de software que soporte grandes bases de datos permitiendo an&aacute;lisis con tiempos de procesamiento r&aacute;pido, los problemas de escalabilidad, la incapacidad de hacer que Big Data sea utilizable por usuarios finales, la falta de rapidez en la carga de datos con los sistemas de gesti&oacute;n de bases de datos actuales y&nbsp; la ausencia de un modelo de negocio convincente y rentable en torno al tema.</p>      <p>En &#91;4&#93; los autores analizan algunas tecnolog&iacute;as relacionadas con Big Data como computaci&oacute;n en la nube, internet de las cosas, centros de datos y Hadoop. Tambi&eacute;n se enfocan en la discusi&oacute;n de los desaf&iacute;os t&eacute;cnicos y adelantos en cada una de las fases de Big Data: generaci&oacute;n, adquisici&oacute;n, almacenamiento y an&aacute;lisis de datos. El an&aacute;lisis de Big Data tiene que afrontar muchos desaf&iacute;os, se requieren considerables esfuerzos investigativos, los cuales se pueden agrupar en los problemas abiertos presentados en la <a href="#Figura7">Fig. 7</a>.</p>      <p align="center"><a name="Figura7"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig07.jpg"></p>      <p>En &#91;53&#93; se hace &eacute;nfasis en la utilizaci&oacute;n de t&eacute;cnicas de Inteligencia Artificial (IA) para facilitar la captura y estructuraci&oacute;n de grandes vol&uacute;menes de datos y tambi&eacute;n c&oacute;mo se han implementado para el an&aacute;lisis de estos. Se  presentan algunas preocupaciones respecto a la integraci&oacute;n de IA con Big Data, que no se resuelven solo con pensar en la distribuci&oacute;n y paralelizaci&oacute;n, sino  que requieren otros an&aacute;lisis. Las t&eacute;cnicas de IA para el tratamiento de Big Data permiten la delegaci&oacute;n de tareas complejas de reconocimiento de patrones, aprendizaje y otras tareas basadas en enfoques computacionales, la IA contribuye a la velocidad en la manipulaci&oacute;n de los datos, facilitando la toma de decisiones r&aacute;pidas. Por ejemplo, muchas operaciones de la bolsa son hechas por sistemas basados en IA en lugar de personas, la velocidad de las operaciones puede aumentar y una transacci&oacute;n puede conducir a otras. Existen varios problemas emergentes asociados a la IA y Big Data, en primer lugar, la naturaleza de algunos de los algoritmos de machine-learning son dif&iacute;cilmente usados en ambientes como MapReduce, por lo cual se requiere de su adaptaci&oacute;n. En segundo lugar, Big Data trae consigo datos &#147;sucios&rdquo;, con errores  potenciales, incompletos o de diferente precisi&oacute;n, la IA puede ser usada para  identificar y limpiar estos datos sucios. En tercer lugar, la visualizaci&oacute;n de los datos, con la IA se puede lograr incluir la captura de capacidades de visualizaci&oacute;n de conocimiento para facilitar el an&aacute;lisis de datos, un enfoque es crear aplicaciones inteligentes de visualizaci&oacute;n para determinados tipos de datos. En cuarto lugar, ya que las tecnolog&iacute;as de almacenamiento evolucionan, es cada vez m&aacute;s factible proporcionar a los usuarios, casi en tiempo real, an&aacute;lisis de bases de datos m&aacute;s grandes, lo que acelera las capacidades de toma de decisiones.</p>      <p>En&#91;54&#93; presentan una descripci&oacute;n consolidada del concepto de Big Data, partiendo de las definiciones dadas por profesionales y acad&eacute;micos del campo, como se ve en la <a href="#Figura8">Fig. 8</a>. Sin embargo, el art&iacute;culo se concentra en revisar los m&eacute;todos de an&aacute;lisis usados para Big Data. Se destaca que Big Data no tiene un verdadero sentido si solo se trata de un gran c&uacute;mulo de datos, su valor potencial se desbloquea solo cuando estos datos son aprovechados para impulsar la toma de decisiones. Para ello es necesario mover y dar significado a los datos, esto se puede hacer por medio de dos subprocesos principales: la gesti&oacute;n y an&aacute;lisis de datos. La gesti&oacute;n de datos implica procesos y tecnolog&iacute;as de apoyo para adquirir, almacenar, preparar y recuperar los datos para su an&aacute;lisis. El an&aacute;lisis, por su parte, se refiere a las t&eacute;cnicas utilizadas para adquirir inteligencia a partir de Big Data. </p>      <p align="center"><a name="Figura8"></a><img src="img/revistas/teclo/v20n39/v20n39a02fig08.jpg"></p>      <p>Los m&eacute;todos de an&aacute;lisis de Big Data a los que hacen referencia los autores se enfocan en los tipos de datos tratados, por lo que se describen anal&iacute;ticas de texto, anal&iacute;ticas de audio, anal&iacute;ticas de social media y anal&iacute;ticas predictivas. Estas  &uacute;ltimas, las predictivas, se basan principalmente en los m&eacute;todos estad&iacute;sticos, sin embargo, hay algunos factores que requieren el desarrollo de nuevos m&eacute;todos estad&iacute;sticos para Big Data. En primer lugar, los m&eacute;todos estad&iacute;sticos convencionales se concentran en una peque&ntilde;a muestra de la poblaci&oacute;n y los resultados se generalizan a toda la poblaci&oacute;n, pero para el caso de Big Data, las muestras son enormes y representan la mayor&iacute;a o la totalidad de la poblaci&oacute;n. En segundo lugar, en t&eacute;rminos de eficiencia de c&oacute;mputo muchos m&eacute;todos convencionales para muestras peque&ntilde;as no se logran escalar hasta Big Data. El tercer factor corresponde a algunos de los rasgos distintivos de Big Data: la heterogeneidad, la acumulaci&oacute;n de ruido, las falsas correlaciones y la endogeneidad incidental.</p>      <p>Los trabajos revisados en esta secci&oacute;n muestran el estado actual del enfoque Big Data y de las tendencias que giran en torno a este, incluyendo el planteamiento de varios campos de investigaci&oacute;n que se encuentran abiertos, principalmente relacionados con la optimizaci&oacute;n de los sistemas de almacenamiento para grandes vol&uacute;menes de datos, los cuales todav&iacute;a presentan falencias en cuanto al tratamiento de distintos tipos de datos a la vez, la optimizaci&oacute;n de consultas complejas y operaciones sobre los datos.</p>      <p>Tambi&eacute;n se ve la diversidad de planteamientos que presentan los autores en cuanto al concepto de Big Data y las caracter&iacute;sticas que este debe atender. Es claro que el tema ha tomado un car&aacute;cter de moda mundial y que se ha dejado de asociar solo a la caracter&iacute;stica de gran tama&ntilde;o. Se ven tambi&eacute;n posibilidades de explorar la aplicaci&oacute;n de Big Data a nuevos dominios de datos, ya que actualmente se han concentrado en social media, medicina, bioinform&aacute;tica y seguridad, principalmente.</p>      <p><font size="3"><b>5. Conclusiones</b></font></p>      ]]></body>
<body><![CDATA[<p>Teniendo en cuenta los objetivos planteados para la realizaci&oacute;n de esta exploraci&oacute;n, el principal aporte logrado con el art&iacute;culo es la caracterizaci&oacute;n en un solo documento de trabajos, enfoques y herramientas recientes relacionadas con el t&eacute;rmino en boga Big Data, que puede servir como referente para trabajos posteriores y para la consulta de investigadores que deseen adelantar trabajos en el marco de los campos de estudio abiertos que se dejan ver tras la exploraci&oacute;n presentada.</p>      <p>Este art&iacute;culo se traz&oacute; como objetivo mostrar algunos trabajos desarrollados entorno a la tem&aacute;tica y describir tecnolog&iacute;as y t&eacute;cnicas de Big Data, not&aacute;ndose que siguen siendo materia de investigaci&oacute;n y discusi&oacute;n, generando la posibilidad de proponer alternativas y modelos basados en la t&aacute;ctica de divide y vencer&aacute;s.</p>      <p>Las tecnolog&iacute;as asociadas al enfoque de Big Data ya han comenzado a tomar madurez y se vislumbran grandes oportunidades y retos en su utilizaci&oacute;n, optimizaci&oacute;n y adaptaci&oacute;n a diferentes dominios de datos. Sin embargo, ya se encuentran resultados que muestran sus beneficios en aspectos como la reducci&oacute;n de tiempos, optimizaci&oacute;n de recursos y mayor flexibilidad. Existe una estrecha relaci&oacute;n entre diferentes m&eacute;todos y tecnolog&iacute;as para la construcci&oacute;n de soluciones que integren las capacidades de cada uno de estos y las potencien en nuevas propuestas.</p>      <p>Big Data no trata solo de grandes vol&uacute;menes de datos, sino que incluye otras dimensiones significativas en el tratamiento de datos, como son la variedad, velocidad y veracidad. No obstante, una implementaci&oacute;n de Big Data requiere altos costos en expertos, mayor tiempo de adaptaci&oacute;n tecnol&oacute;gica, dificultad para implementar nuevos an&aacute;lisis y percepci&oacute;n limitada. Big Data no busca sustituir a los sistemas tradicionales, sino construir una nueva tendencia donde se construyan arquitecturas de sistemas que permitan manejar todas las peticiones. Y ya ha logrado incentivar en la comunidad acad&eacute;mica y comercial el desarrollo de tecnolog&iacute;as de apoyo que toman los paradigmas base y los emplean en la construcci&oacute;n de soluciones particularizadas a problemas de entornos de investigaci&oacute;n y producci&oacute;n reales.</p>      <p><font size="3"><b>6. Agradecimientos</b></font></p>      <p>Este trabajo est&aacute; en el marco del proyecto titulado: &quot;Consolidaci&oacute;n de las l&iacute;neas de investigaci&oacute;n del Grupo de Investigaci&oacute;n en Ambientes Inteligentes Adaptativos GAIA&quot; con c&oacute;digo 32059, en el marco de la convocatoria interna de investigaci&oacute;n de la Facultad de Administraci&oacute;n 2015, para la formulaci&oacute;n y ejecuci&oacute;n de proyectos de consolidaci&oacute;n y/o fortalecimiento de los grupos de investigaci&oacute;n de la Universidad Nacional de Colombia, sede Manizales.</p>      <p><font size="3" face="verdana"><b>Referencias</b></font></p>      <!-- ref --><p>&#91;1&#93; K.C. Li, H. Jiang, L. T. Yang, and A. Cuzzocrea, <i>Big Data: Algorithms, Analytics, and Applications</i>, Chapman &amp;. CRC Press, 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144374&pid=S0123-7799201700020000200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;2&#93; H. Mohanty, P. Bhuyan, and D. Chenthati, <i>Big Data: A Primer</i>, vol. 11. Springer, 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144376&pid=S0123-7799201700020000200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;3&#93;W. M. P. van der Aalst, &#147;Data Scientist: The Engineer of the Future,&#148;in <i>Enterprise Interoperability VI</i>, no. 7, K. Mertins, F. B&eacute;naben, R. Poler, and J. P. Bourri&egrave;res, Eds. Springer International Publishing, 2014, pp. 13-26.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144378&pid=S0123-7799201700020000200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;4&#93; M. Chen, S. Mao, and Y. Liu, &#147;Big Data: A Survey,&#148;<i>Mob. Networks Appl.</i>, vol. 19, no. 2, pp. 171-209, Apr. 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144380&pid=S0123-7799201700020000200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;5&#93; L. A. Montenegro Mora, &#147;&iquest;C&oacute;mo elaborar un art&iacute;culo de revisi&oacute;n?,&#148;San Juan de Pasto, Nari&ntilde;o, Colombia, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144382&pid=S0123-7799201700020000200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;6&#93; Elsevier, &#147;Scopus The largest database of peer-reviewed literature,&#148;<i>Scopus Elsevier</i>. 2016. &#91;Online&#93;. Available: <a href="https://www.elsevier.com/solutions/scopus" target="_blank">https://www.elsevier.com/solutions/scopus</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144384&pid=S0123-7799201700020000200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>        <!-- ref --><p>&#91;7&#93; S. Robledo  Giraldo, G. Osorio Zuluaga, and C. L&oacute;pez Espinosa, &#147;Networking en peque&ntilde;a empresa: una revisi&oacute;n bibliogr&aacute;fica utilizando la teor&iacute;a de grafos,&#148;<i>Rev. V&iacute;nculos</i>, vol. 11, no. 2, pp. 6-16, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144386&pid=S0123-7799201700020000200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;8&#93; J. Dean and S. Ghemawat, &#147;MapReduce,&#148;<i>Commun. ACM</i>, vol. 51, no. 1, p. 107, Jan. 2008.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144388&pid=S0123-7799201700020000200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;9&#93; M. Armbrust, I. Stoica, M. Zaharia, A. Fox, R. Griffith, A. D. Joseph, R. Katz, A. Konwinski, G. Lee, D. Patterson, and A. Rabkin, &#147;A view of cloud computing,&#148;<i>Commun. ACM</i>, vol. 53, no. 4, p. 50, Apr. 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144390&pid=S0123-7799201700020000200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;10&#93; P. Zikopoulos and C. Eaton, <i>Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data</i>, 1st ed. McGraw-Hill Osborne Media, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144392&pid=S0123-7799201700020000200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;11&#93; T. White, <i>Hadoop: The Definitive Guide</i>, 2nd ed. United States of America: O'Reilly Media, Inc, 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144394&pid=S0123-7799201700020000200011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;12&#93; D. Bollier, &#147;The Promise and Peril of Big Data,&#148;Washington, DC, 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144396&pid=S0123-7799201700020000200012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;13&#93; C. L. P. Chen and C.-Y. Zhang, &#147;Data-intensive applications, challenges, techniques and technologies: A survey on Big Data,&#148;<i>Inf. Sci. (Ny).</i>, vol. 275, pp. 314-347, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144398&pid=S0123-7799201700020000200013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;14&#93; J. Chen, Y. Chen, X. Du, C. Li, J. Lu, S. Zhao, and X. Zhou, &#147;Big data challenge: a data management perspective,&#148;<i>Front. Comput. Sci.</i>, vol. 7, no. 2, pp. 157-164, Apr. 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144400&pid=S0123-7799201700020000200014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;15&#93; X. Jin, B. W. Wah, X. Cheng, and Y. Wang, &#147;Significance and Challenges of Big Data Research,&#148;<i>Big Data Res.</i>, vol. 2, no. 2, pp. 59-64, Jun. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144402&pid=S0123-7799201700020000200015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;16&#93; Xindong Wu, Xingquan Zhu, Gong-Qing Wu, and Wei Ding, &#147;Data mining with big data,&#148;<i>IEEE Trans. Knowl. Data Eng.</i>, vol. 26, no. 1, pp. 97-107, Jan. 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144404&pid=S0123-7799201700020000200016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;17&#93; T. A. S. Foundation, &#147;Welcome to ApacheTM Hadoop&reg;!,&#148;<i>hadoop</i>. 2016. &#91;Online&#93;. Available:<a href="http://hadoop.apache.org/" target="_blank">http://hadoop.apache.org/</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144406&pid=S0123-7799201700020000200017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;18&#93; M. Klein, R. Sharma, C. H. Bohrer, C. M.  Avelis, and E. Roberts, &#147;Biospark: scalable analysis of large numerical datasets from biological simulations and experiments using Hadoop and Spark,&#148;<i>Bioinformatics</i>, vol. 33, no. 2, pp. 303-305, Jan. 2017.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144408&pid=S0123-7799201700020000200018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;19&#93; A. Aji, F. Wang, H. Vo, R. Lee, Q. Liu, X. Zhang, and J. Saltz, &#147;Hadoop GIS: a high performance spatial data warehousing system over mapreduce,&#148;<i>Proc. VLDB Endow.</i>, vol. 6, no. 11, pp. 1009-1020, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144410&pid=S0123-7799201700020000200019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;20&#93; A. M. Aly, H. Elmeleegy, Y. Qi, and W. Aref, &#147;Kangaroo,&#148;in <i>Proceedings of the Ninth ACM International Conference on Web Search and Data Mining - WSDM '16</i>, 2016, pp. 397-406.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144412&pid=S0123-7799201700020000200020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;21&#93; R. L&auml;mmel, &#147;Google's MapReduce programming model - Revisited,&#148;<i>Sci. Comput. Program.</i>, vol. 70, no. 1, pp. 1-30, Jan. 2008.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144414&pid=S0123-7799201700020000200021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;22&#93; K. Lee, K. Jung, J. Park, and D. Kwon, &#147;ARLS: A MapReduce-based output analysis tool for large-scale simulations,&#148;<i>Adv. Eng. Softw.</i>, vol. 95, pp. 28-37, May 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144416&pid=S0123-7799201700020000200022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;23&#93; J.D. Wang, &#147;Extracting significant pattern histories from timestamped texts using MapReduce,&#148;<i>J. Supercomput.</i>, vol.  72, no. 8, pp. 3236-3260, Aug. 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144418&pid=S0123-7799201700020000200023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;24&#93; H. Zhang and N. Xiao, &#147;Parallel implementation of multilayered neural networks based on Map-Reduce on cloud computing clusters,&#148;<i>Soft Comput.</i>, vol. 20, no. 4, pp. 1471-1483, Apr. 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144420&pid=S0123-7799201700020000200024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;25&#93; Y. Ji, Y. Tian, F. Shen, and J. Tran, &#147;Experimental Evaluations of MapReduce in Biomedical Text Mining,&#148;in <i>Information Technology: New Generations</i>, Springer, 2016, pp. 665-675.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144422&pid=S0123-7799201700020000200025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;26&#93; S. Singh and N. Ahuja, &#147;Article recommendation system based on keyword using map-reduce,&#148;in <i>2015 Third International Conference on Image Information Processing (ICIIP)</i>, 2015, pp. 548-550.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144424&pid=S0123-7799201700020000200026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <p>&#91;27&#93; T. A. S. Foundation, &#147;Apache HBase,&#148;<i>Apache HBase</i>. 2016. &#91;Online&#93;. Available: <a href="http://hbase.apache.org/" target="_blank">http://hbase.apache.org/</a>.</p>       ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;28&#93; G. C. Deka, &#147;A Survey of Cloud Database Systems,&#148;<i>IT Prof.</i>, vol. 16, no. 2, pp. 50-57, Mar. 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144427&pid=S0123-7799201700020000200027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;29&#93; T. A. S. Foundation, &#147;The Apache Cassandra Project,&#148;<i>Apache Cassandra</i>. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144429&pid=S0123-7799201700020000200028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;30&#93; E. Dede, B. Sendir, P. Kuzlu, J. Hartog, and  M. Govindaraju, &#147;An Evaluation of Cassandra for Hadoop,&#148;in <i>2013 IEEE Sixth International Conference on Cloud Computing</i>, 2013, vol. 2013, pp. 494-501.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144431&pid=S0123-7799201700020000200029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;31&#93; T. A. S. Foundation, &#147;Apache Mahout: Scalable machine learning and data mining,&#148;<i>Apache Mahout</i>. 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144433&pid=S0123-7799201700020000200030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;32&#93; G. Ingersoll, &#147;Introducing Apache Mahout,&#148;<i>IBM  developerWorks</i>. 2009. &#91;Online&#93;. Available: <a href="http://www.ibm.com/developerworks/java/library/j-mahout/" target="_blank">http://www.ibm.com/developerworks/java/library/j-mahout/</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144435&pid=S0123-7799201700020000200031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>       ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;33&#93; G. Ingersoll, &#147;Apache Mahout: Aprendizaje escalable con m&aacute;quina para todos,&#148;<i>IBM developerWorks</i>. 2012. &#91;Online&#93;. Available: <a href="http://www.ibm.com/developerworks/ssa/library/j-mahout-scaling/" target="_blank">http://www.ibm.com/developerworks/ssa/library/j-mahout-scaling/</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144437&pid=S0123-7799201700020000200032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;34&#93; S. M. D. MUJEEB and L. K. NAIDU, &#147;A Relative Study on Big Data Applications and Techniques,&#148;<i>Int. J. Eng. Innov. Technol.</i>, vol. 4, no. 10, pp. 133-138, 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144439&pid=S0123-7799201700020000200033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;35&#93; J. Han, J. Pei, and M. Kamber, &#147;Data mining: concepts and techniques,&#148;3rd ed., E. Inc., Ed. Morgan Kaufmann Publishers,  2011, p. 703.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144441&pid=S0123-7799201700020000200034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;36&#93; R. L. Grossman, C. Kamath, P. Kegelmeyer, V. Kumar, and R. Namburu, <i>Data Mining for Scientific and Engineering Applications</i>, vol. 2. Boston, MA: Springer US, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144443&pid=S0123-7799201700020000200035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;37&#93; R. S. Michalski, J. G. Carbonell, and T. M. Mitchell, <i>Machine learning: An artificial intelligence approach</i>. Springer Science &amp; Business Media, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144445&pid=S0123-7799201700020000200036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;38&#93; P. Domingos, &#147;A few useful things to know about machine learning,&#148;<i>Commun. ACM</i>, vol. 55, no. 10, p. 78, Oct. 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144447&pid=S0123-7799201700020000200037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;39&#93; I. Portugal, P. Alencar, and D. Cowan, &#147;The Use of Machine Learning Algorithms in Recommender Systems: A Systematic Review,&#148;<i>arXiv</i>, vol. 4, pp. 1-16, Nov. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144449&pid=S0123-7799201700020000200038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;40&#93; M. Crawford, T. M. Khoshgoftaar, J. D. Prusa, A. N. Richter, and H. Al Najada, &#147;Survey of review spam detection using machine learning techniques,&#148;<i>J. Big Data</i>, vol. 2, no. 1, p. 23, Dec. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144451&pid=S0123-7799201700020000200039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;41&#93; Wei-Yang Lin, Ya-Han Hu, and Chih-Fong Tsai, &#147;Machine Learning in Financial Crisis Prediction: A Survey,&#148;<i>IEEE Trans. Syst. Man, Cybern. Part C (Applications Rev.</i>, vol. 42, no. 4, pp. 421-436, Jul. 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144453&pid=S0123-7799201700020000200040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;42&#93; R. Dash and P. K. Dash, &#147;A hybrid stock trading framework integrating technical analysis with machine learning techniques,&#148;<i>J. Financ. Data Sci.</i>, vol. 2, no. 1, pp. 42-57, Mar. 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144455&pid=S0123-7799201700020000200041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;43&#93; J. Patel, S. Shah, P. Thakkar, and K. Kotecha, &#147;Predicting stock and stock price index movement using Trend Deterministic Data Preparation and machine learning techniques,&#148;<i>Expert  Syst. Appl.</i>, vol. 42, no. 1, pp. 259-268, Jan. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144457&pid=S0123-7799201700020000200042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;44&#93; E. Cuevas, D. Zald&iacute;var, and M. Perez-Cisneros,<i>Applications of Evolutionary Computation in Image Processing and Pattern Recognition</i>, 1st ed., vol. 100. Cham: Springer International Publishing, 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144459&pid=S0123-7799201700020000200043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;45&#93; K.F. Man, K. S. TANG, and S. Kwong, <i>Genetic Algorithms: Concepts and Designs</i>. Springer Science &amp; Business Media, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144461&pid=S0123-7799201700020000200044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;46&#93; G. Luque and E. Alba, <i>Parallel Genetic Algorithms: Theory and Real World Applications</i>, vol. 367. Springer, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144463&pid=S0123-7799201700020000200045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;47&#93; U. Maulik, S. Bandyopadhyay, and A. Mukhopadhyay, <i>Multiobjective Genetic Algorithms for Clustering: Applications in Data Mining and Bioinformatics</i>. Springer Science &amp; Business Media,  2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144465&pid=S0123-7799201700020000200046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;48&#93; A. E. Doub, M. L. Small, A. Levin, K. LeVangie, and T. R. Brick, &#147;Identifying users of traditional and Internet-based resources for meal ideas: An association rule learning approach,&#148;<i>Appetite</i>, vol. 103, pp. 128-136, Aug. 2016.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144467&pid=S0123-7799201700020000200047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;49&#93; H. Sundell, R. Konig, and U. Johansson, &#147;Pragmatic Approach to Association Rule Learning in Real-World Scenarios,&#148;in <i>2015  International Conference on Computational Science and Computational  Intelligence (CSCI)</i>, 2015, pp. 356-361.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144469&pid=S0123-7799201700020000200048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;50&#93; R. Sarno, R. D. Dewandono, T. Ahmad, M. F. Naufal, and F. Sinaga, &#147;Hybrid association rule learning and process mining for fraud detection,&#148;<i>IAENG Int. J. Comput. Sci.</i>, vol. 42, no. 2, pp. 1-14, 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144471&pid=S0123-7799201700020000200049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;51&#93; S. Jaramillo Valbuena and J. M. Londo&ntilde;o, &#147;Sistemas para almacenar grandes vol&uacute;menes de  datos,&#148;<i>Rev. Gerenc. Tecnol&oacute;gica Inform&aacute;tica</i>, vol. 13, no.  37, pp. 17-28, 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144473&pid=S0123-7799201700020000200050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;52&#93; S. Sagiroglu and D. Sinanc, "Big  data: A review," in <i>2013 International Conference on Collaboration Technologies and Systems (CTS)</i>, 2013, pp. 42-47.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144475&pid=S0123-7799201700020000200051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      ]]></body>
<body><![CDATA[<!-- ref --><p>&#91;53&#93; D. E. O'Leary, &#147;Artificial Intelligence and Big Data,&#148;<i>IEEE Intell. Syst.</i>, vol. 28, no. 2, pp. 96-99, Mar. 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144477&pid=S0123-7799201700020000200052&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>      <!-- ref --><p>&#91;54&#93; A. Gandomi and M. Haider, &#147;Beyond the hype: Big data concepts, methods, and analytics,&#148;<i>Int. J. Inf. </i><i>Manage.</i>, vol. 35, no. 2, pp. 137-144, Apr. 2015.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5144479&pid=S0123-7799201700020000200053&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>  </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[K.C.]]></given-names>
</name>
<name>
<surname><![CDATA[Jiang]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Yang]]></surname>
<given-names><![CDATA[L. T.]]></given-names>
</name>
<name>
<surname><![CDATA[Cuzzocrea]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Big Data: Algorithms, Analytics, and Applications]]></source>
<year>2015</year>
<publisher-name><![CDATA[Chapman &. CRC Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mohanty]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Bhuyan]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Chenthati]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Big Data: A Primer]]></source>
<year>2015</year>
<volume>11</volume>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aalst]]></surname>
<given-names><![CDATA[W. M. P. van der]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data Scientist: The Engineer of the Future]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Mertins]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Bénaben]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Poler]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Bourrières]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year>2014</year>
<conf-name><![CDATA[ Enterprise Interoperability VI]]></conf-name>
<conf-loc> </conf-loc>
<publisher-name><![CDATA[Eds. Springer International Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Mao]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Big Data: A Survey]]></article-title>
<source><![CDATA[Mob. Networks Appl.]]></source>
<year>Apr.</year>
<month> 2</month>
<day>01</day>
<volume>19</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>171-209</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mora]]></surname>
<given-names><![CDATA[L. A. Montenegro]]></given-names>
</name>
</person-group>
<source><![CDATA[¿Cómo elaborar un artículo de revisión?]]></source>
<year>2013</year>
<publisher-loc><![CDATA[Nariño ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<collab>Elsevier</collab>
<source><![CDATA[Scopus The largest database of peer-reviewed literature]]></source>
<year>2016</year>
<publisher-name><![CDATA[Scopus Elsevier]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Giraldo]]></surname>
<given-names><![CDATA[S. Robledo]]></given-names>
</name>
<name>
<surname><![CDATA[Zuluaga]]></surname>
<given-names><![CDATA[G. Osorio]]></given-names>
</name>
<name>
<surname><![CDATA[Espinosa]]></surname>
<given-names><![CDATA[C. López]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Networking en pequeña empresa: una revisión bibliográfica utilizando la teoría de grafos]]></article-title>
<source><![CDATA[Rev. Vínculos]]></source>
<year>2014</year>
<volume>11</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>6-16</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dean]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Ghemawat]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[MapReduce]]></article-title>
<source><![CDATA[Commun. ACM]]></source>
<year>Jan.</year>
<month> 2</month>
<day>00</day>
<volume>51</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>107</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Armbrust]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Stoica]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Zaharia]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Fox]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Griffith]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Joseph]]></surname>
<given-names><![CDATA[A. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Katz]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Konwinski]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Patterson]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Rabkin]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A view of cloud computing]]></article-title>
<source><![CDATA[Commun. ACM]]></source>
<year>Apr.</year>
<month> 2</month>
<day>01</day>
<volume>53</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>50</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zikopoulos]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Eaton]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data]]></source>
<year>2011</year>
<edition>1</edition>
<publisher-name><![CDATA[McGraw-Hill Osborne Media]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[White]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[Hadoop: The Definitive Guide]]></source>
<year>2010</year>
<edition>2</edition>
<publisher-name><![CDATA[O'Reilly Media, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bollier]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[The Promise and Peril of Big Data]]></source>
<year>2010</year>
<publisher-loc><![CDATA[Washington, DC ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[C. L. P.]]></given-names>
</name>
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[C.-Y.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data-intensive applications, challenges, techniques and technologies: A survey on Big Data]]></article-title>
<source><![CDATA[Inf. Sci. (Ny).]]></source>
<year>2014</year>
<volume>275</volume>
<page-range>314-347</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Chen]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Du]]></surname>
<given-names><![CDATA[X.]]></given-names>
</name>
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[Lu]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Zhao]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Zhou]]></surname>
<given-names><![CDATA[X.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Big data challenge: a data management perspective]]></article-title>
<source><![CDATA[Front. Comput. Sci.]]></source>
<year>Apr.</year>
<month> 2</month>
<day>01</day>
<volume>7</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>157-164</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jin]]></surname>
<given-names><![CDATA[X.]]></given-names>
</name>
<name>
<surname><![CDATA[Wah]]></surname>
<given-names><![CDATA[B. W.]]></given-names>
</name>
<name>
<surname><![CDATA[Cheng]]></surname>
<given-names><![CDATA[X.]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Significance and Challenges of Big Data Research]]></article-title>
<source><![CDATA[Big Data Res.]]></source>
<year>Jun.</year>
<month> 2</month>
<day>01</day>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>59-64</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wu]]></surname>
<given-names><![CDATA[Xindong]]></given-names>
</name>
<name>
<surname><![CDATA[Zhu]]></surname>
<given-names><![CDATA[Xingquan]]></given-names>
</name>
<name>
<surname><![CDATA[Wu]]></surname>
<given-names><![CDATA[Gong-Qing]]></given-names>
</name>
<name>
<surname><![CDATA[Ding]]></surname>
<given-names><![CDATA[Wei]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data mining with big data]]></article-title>
<source><![CDATA[IEEE Trans. Knowl. Data Eng.]]></source>
<year>Jan.</year>
<month> 2</month>
<day>01</day>
<volume>26</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>97-107</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="book">
<collab>T. A. S. Foundation</collab>
<source><![CDATA[Welcome to ApacheTM Hadoop®!]]></source>
<year>2016</year>
<publisher-name><![CDATA[hadoop]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Klein]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Sharma]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Bohrer]]></surname>
<given-names><![CDATA[C. H.]]></given-names>
</name>
<name>
<surname><![CDATA[Avelis]]></surname>
<given-names><![CDATA[C. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Roberts]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Biospark: scalable analysis of large numerical datasets from biological simulations and experiments using Hadoop and Spark]]></article-title>
<source><![CDATA[Bioinformatics]]></source>
<year>Jan.</year>
<month> 2</month>
<day>01</day>
<volume>33</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>303-305</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aji]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Vo]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[Q.]]></given-names>
</name>
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[X.]]></given-names>
</name>
<name>
<surname><![CDATA[Saltz]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hadoop GIS: a high performance spatial data warehousing system over mapreduce]]></article-title>
<source><![CDATA[Proc. VLDB Endow.]]></source>
<year>2013</year>
<volume>6</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>1009-1020</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aly]]></surname>
<given-names><![CDATA[A. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Elmeleegy]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Qi]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Aref]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Kangaroo]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ Proceedings of the Ninth ACM International Conference on Web Search and Data Mining - WSDM '16]]></conf-name>
<conf-loc>2016, 2016,</conf-loc>
</nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lämmel]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Google's MapReduce programming model - Revisited]]></article-title>
<source><![CDATA[Sci. Comput. Program.]]></source>
<year>Jan.</year>
<month> 2</month>
<day>00</day>
<volume>70</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-30</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Jung]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Park]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Kwon]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[ARLS: A MapReduce-based output analysis tool for large-scale simulations]]></article-title>
<source><![CDATA[Adv. Eng. Softw.]]></source>
<year>May </year>
<month>20</month>
<day>16</day>
<volume>95</volume>
<page-range>28-37</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wang]]></surname>
<given-names><![CDATA[J.D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Extracting significant pattern histories from timestamped texts using MapReduce]]></article-title>
<source><![CDATA[J. Supercomput.]]></source>
<year>Aug.</year>
<month> 2</month>
<day>01</day>
<volume>72</volume>
<numero>8</numero>
<issue>8</issue>
<page-range>3236-3260</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhang]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Xiao]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Parallel implementation of multilayered neural networks based on Map-Reduce on cloud computing clusters]]></article-title>
<source><![CDATA[Soft Comput.]]></source>
<year>Apr.</year>
<month> 2</month>
<day>01</day>
<volume>20</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>1471-1483</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ji]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Tian]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Shen]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Tran]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Experimental Evaluations of MapReduce in Biomedical Text Mining]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ Information Technology: New Generations]]></conf-name>
<conf-date>2016</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Singh]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Ahuja]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Article recommendation system based on keyword using map-reduce]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ 2015 Third International Conference on Image Information Processing (ICIIP)]]></conf-name>
<conf-date>2015</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B27">
<label>28</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Deka]]></surname>
<given-names><![CDATA[G. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Survey of Cloud Database Systems]]></article-title>
<source><![CDATA[IT Prof.]]></source>
<year>Mar.</year>
<month> 2</month>
<day>01</day>
<volume>16</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>50-57</page-range></nlm-citation>
</ref>
<ref id="B28">
<label>29</label><nlm-citation citation-type="book">
<collab>T. A. S. Foundation</collab>
<source><![CDATA[The Apache Cassandra Project]]></source>
<year>2015</year>
<publisher-name><![CDATA[Apache Cassandra]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B29">
<label>30</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dede]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Sendir]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Kuzlu]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Hartog]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Govindaraju]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Evaluation of Cassandra for Hadoop]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ 2013 IEEE Sixth International Conference on Cloud Computing]]></conf-name>
<conf-date>2013</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B30">
<label>31</label><nlm-citation citation-type="book">
<collab>T. A. S. Foundation</collab>
<source><![CDATA[Apache Mahout: Scalable machine learning and data mining]]></source>
<year>2016</year>
<publisher-name><![CDATA[Apache Mahout]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B31">
<label>32</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ingersoll]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[Introducing Apache Mahout]]></source>
<year>2009</year>
<publisher-name><![CDATA[IBM developerWorks]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B32">
<label>33</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ingersoll]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[Apache Mahout: Aprendizaje escalable con máquina para todos]]></source>
<year>2012</year>
<publisher-name><![CDATA[IBM developerWorks]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B33">
<label>34</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[S. M. D.]]></surname>
<given-names><![CDATA[MUJEEB]]></given-names>
</name>
<name>
<surname><![CDATA[L. K.]]></surname>
<given-names><![CDATA[NAIDU]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A Relative Study on Big Data Applications and Techniques]]></article-title>
<source><![CDATA[Int. J. Eng. Innov. Technol.]]></source>
<year>2015</year>
<volume>4</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>133-138</page-range></nlm-citation>
</ref>
<ref id="B34">
<label>35</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Han]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Pei]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Kamber]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Data mining: concepts and techniques]]></source>
<year>2011</year>
<edition>3</edition>
<page-range>703</page-range><publisher-name><![CDATA[Ed. Morgan Kaufmann Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B35">
<label>36</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Grossman]]></surname>
<given-names><![CDATA[R. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Kamath]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[Kegelmeyer]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Kumar]]></surname>
<given-names><![CDATA[V.]]></given-names>
</name>
<name>
<surname><![CDATA[Namburu]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining for Scientific and Engineering Applications]]></source>
<year>2013</year>
<volume>2</volume>
<publisher-loc><![CDATA[Boston ]]></publisher-loc>
<publisher-name><![CDATA[MA: Springer US]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B36">
<label>37</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Michalski]]></surname>
<given-names><![CDATA[R. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Carbonell]]></surname>
<given-names><![CDATA[J. G.]]></given-names>
</name>
<name>
<surname><![CDATA[Mitchell]]></surname>
<given-names><![CDATA[T. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Machine learning: An artificial intelligence approach]]></source>
<year>2013</year>
<publisher-name><![CDATA[Springer Science & Business Media]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<label>38</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Domingos]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A few useful things to know about machine learning]]></article-title>
<source><![CDATA[Commun. ACM]]></source>
<year>Oct.</year>
<month> 2</month>
<day>01</day>
<volume>55</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>78</page-range></nlm-citation>
</ref>
<ref id="B38">
<label>39</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Portugal]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Alencar]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Cowan]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Use of Machine Learning Algorithms in Recommender Systems: A Systematic Review]]></article-title>
<source><![CDATA[arXiv]]></source>
<year>Nov.</year>
<month> 2</month>
<day>01</day>
<volume>4</volume>
<page-range>1-16</page-range></nlm-citation>
</ref>
<ref id="B39">
<label>40</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Crawford]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Khoshgoftaar]]></surname>
<given-names><![CDATA[T. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Prusa]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Richter]]></surname>
<given-names><![CDATA[A. N.]]></given-names>
</name>
<name>
<surname><![CDATA[Najada]]></surname>
<given-names><![CDATA[H. Al]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Survey of review spam detection using machine learning techniques]]></article-title>
<source><![CDATA[J. Big Data]]></source>
<year>Dec.</year>
<month> 2</month>
<day>01</day>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>23</page-range></nlm-citation>
</ref>
<ref id="B40">
<label>41</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lin]]></surname>
<given-names><![CDATA[Wei-Yang]]></given-names>
</name>
<name>
<surname><![CDATA[Hu]]></surname>
<given-names><![CDATA[Ya-Han]]></given-names>
</name>
<name>
<surname><![CDATA[Tsai]]></surname>
<given-names><![CDATA[Chih-Fong]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Machine Learning in Financial Crisis Prediction: :: A Survey]]></article-title>
<source><![CDATA[IEEE Trans. Syst. Man, Cybern. Part C (Applications Rev.]]></source>
<year>Jul.</year>
<month> 2</month>
<day>01</day>
<volume>42</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>421-436</page-range></nlm-citation>
</ref>
<ref id="B41">
<label>42</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dash]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Dash]]></surname>
<given-names><![CDATA[P. K.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A hybrid stock trading framework integrating technical analysis with machine learning techniques]]></article-title>
<source><![CDATA[J. Financ. Data Sci.]]></source>
<year>Mar.</year>
<month> 2</month>
<day>01</day>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>42-57</page-range></nlm-citation>
</ref>
<ref id="B42">
<label>43</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Patel]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Shah]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Thakkar]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Kotecha]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Predicting stock and stock price index movement using Trend Deterministic Data Preparation and machine learning techniques]]></article-title>
<source><![CDATA[Expert Syst. Appl.]]></source>
<year>Jan.</year>
<month> 2</month>
<day>01</day>
<volume>42</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>259-268</page-range></nlm-citation>
</ref>
<ref id="B43">
<label>44</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cuevas]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Zaldívar]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Perez-Cisneros]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Applications of Evolutionary Computation in Image Processing and Pattern Recognition]]></source>
<year>2016</year>
<volume>100</volume>
<edition>1</edition>
<publisher-loc><![CDATA[Cham ]]></publisher-loc>
<publisher-name><![CDATA[Springer International Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B44">
<label>45</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Man]]></surname>
<given-names><![CDATA[K.F.]]></given-names>
</name>
<name>
<surname><![CDATA[K. S.]]></surname>
<given-names><![CDATA[TANG]]></given-names>
</name>
<name>
<surname><![CDATA[Kwong]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Genetic Algorithms: Concepts and Designs]]></source>
<year>2012</year>
<publisher-name><![CDATA[Springer Science & Business Media]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B45">
<label>46</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Luque]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Alba]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<source><![CDATA[Parallel Genetic Algorithms: Theory and Real World Applications]]></source>
<year>2011</year>
<volume>367</volume>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B46">
<label>47</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Maulik]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
<name>
<surname><![CDATA[Bandyopadhyay]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Mukhopadhyay]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Multiobjective Genetic Algorithms for Clustering: Applications in Data Mining and Bioinformatics]]></source>
<year>2011</year>
<publisher-name><![CDATA[Springer Science & Business Media]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B47">
<label>48</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Doub]]></surname>
<given-names><![CDATA[A. E.]]></given-names>
</name>
<name>
<surname><![CDATA[Small]]></surname>
<given-names><![CDATA[M. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Levin]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[LeVangie]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Brick]]></surname>
<given-names><![CDATA[T. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Identifying users of traditional and Internet-based resources for meal ideas: An association rule learning approach]]></article-title>
<source><![CDATA[Appetite]]></source>
<year>Aug.</year>
<month> 2</month>
<day>01</day>
<volume>103</volume>
<page-range>128-136</page-range></nlm-citation>
</ref>
<ref id="B48">
<label>49</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sundell]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Konig]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Johansson]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Pragmatic Approach to Association Rule Learning in Real-World Scenarios]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ 2015 International Conference on Computational Science and Computational Intelligence (CSCI)]]></conf-name>
<conf-date>2015</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B49">
<label>50</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sarno]]></surname>
<given-names><![CDATA[.]]></given-names>
</name>
<name>
<surname><![CDATA[Dewandono]]></surname>
<given-names><![CDATA[R. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Ahmad]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[Naufal]]></surname>
<given-names><![CDATA[M. F.]]></given-names>
</name>
<name>
<surname><![CDATA[Sinaga]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hybrid association rule learning and process mining for fraud detection]]></article-title>
<source><![CDATA[IAENG Int. J. Comput. Sci.]]></source>
<year>2015</year>
<volume>42</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>1-14</page-range></nlm-citation>
</ref>
<ref id="B50">
<label>51</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Valbuena]]></surname>
<given-names><![CDATA[S. Jaramillo]]></given-names>
</name>
<name>
<surname><![CDATA[Londoño]]></surname>
<given-names><![CDATA[J. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Sistemas para almacenar grandes volúmenes de datos]]></article-title>
<source><![CDATA[Rev. Gerenc. Tecnológica Informática]]></source>
<year>2015</year>
<volume>13</volume>
<numero>37</numero>
<issue>37</issue>
<page-range>17-28</page-range></nlm-citation>
</ref>
<ref id="B51">
<label>52</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sagiroglu]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Sinanc]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Big data: A review]]></article-title>
<source><![CDATA[]]></source>
<year></year>
<conf-name><![CDATA[ 2013 International Conference on Collaboration Technologies and Systems (CTS)]]></conf-name>
<conf-date>2013</conf-date>
<conf-loc> </conf-loc>
</nlm-citation>
</ref>
<ref id="B52">
<label>53</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[O'Leary]]></surname>
<given-names><![CDATA[D. E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Artificial Intelligence and Big Data]]></article-title>
<source><![CDATA[IEEE Intell. Syst.]]></source>
<year>Mar.</year>
<month> 2</month>
<day>01</day>
<volume>28</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>96-99</page-range></nlm-citation>
</ref>
<ref id="B53">
<label>54</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gandomi]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Haider]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Beyond the hype: Big data concepts, methods, and analytics]]></article-title>
<source><![CDATA[Int. J. Inf. Manage.]]></source>
<year>Apr.</year>
<month> 2</month>
<day>01</day>
<volume>35</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>137-144</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
