<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0121-1129</journal-id>
<journal-title><![CDATA[Revista Facultad de Ingeniería]]></journal-title>
<abbrev-journal-title><![CDATA[Rev. Fac. ing.]]></abbrev-journal-title>
<issn>0121-1129</issn>
<publisher>
<publisher-name><![CDATA[Universidad Pedagógica y Tecnológica de Colombia]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0121-11292015000100006</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Conociendo Big Data]]></article-title>
<article-title xml:lang="en"><![CDATA[Knowing the Big Data]]></article-title>
<article-title xml:lang="pt"><![CDATA[Conhecendo Big Data]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Camargo-Vega]]></surname>
<given-names><![CDATA[Juan José]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Camargo-Ortega]]></surname>
<given-names><![CDATA[Jonathan Felipe]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Joyanes-Aguilar]]></surname>
<given-names><![CDATA[Luis]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Pedagógica y Tecnológica de Colombia  ]]></institution>
<addr-line><![CDATA[Tunja ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad El Bosque  ]]></institution>
<addr-line><![CDATA[Bogotá ]]></addr-line>
<country>Colombia</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Pontificia de Salamanca  ]]></institution>
<addr-line><![CDATA[Madrid ]]></addr-line>
<country>España</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>01</month>
<year>2015</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>01</month>
<year>2015</year>
</pub-date>
<volume>24</volume>
<numero>38</numero>
<fpage>63</fpage>
<lpage>77</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_arttext&amp;pid=S0121-11292015000100006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_abstract&amp;pid=S0121-11292015000100006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.co/scielo.php?script=sci_pdf&amp;pid=S0121-11292015000100006&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Teniendo en cuenta la importancia que ha adquirido el término Big Data, la presente investigación buscó estudiar y analizar de manera exhaustiva el estado del arte del Big Data; además, y como segundo objetivo, analizó las características, las herramientas, las tecnologías, los modelos y los estándares relacionados con Big Data, y por último buscó identificar las características más relevantes en la gestión de Big Data, para que con ello se pueda conocer todo lo concerniente al tema central de la investigación. La metodología utilizada incluyó revisar el estado del arte de Big Data y enseñar su situación actual; conocer las tecnologías de Big Data; presentar algunas de las bases de datos NoSQL, que son las que permiten procesar datos con formatos no estructurados, y mostrar los modelos de datos y las tecnologías de análisis de ellos, para terminar con algunos beneficios de Big Data. El diseño metodológico usado para la investigación fue no experimental, pues no se manipulan variables, y de tipo exploratorio, debido a que con esta investigación se empieza a conocer el ambiente del Big Data.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Given the importance acquired by the term Big Data, the present investigation aims to study and analyze thoroughly the Big Data state of art. Moreover, a second objective is to study the features, tools, technologies, models and standards related to Big Data. And finally it seeks to identify the most relevant features that manage Big Data, so it can be known everything about the focus of the investigation. Regarding the methodology used in the development of the research, included to review the state of the art of Big Data, and show what is its current situation, to know the Big Data technologies, to present some of the NoSQL databases, which are those that allow to process unstructured data formats. Also display data models and the analysis technologies they offer, to end with some benefits from Big Data. The methodology desing used in this investigation, was not experimental, because no variables are manipulated, neither exploratory ones, because with the present investigation, only begins to know the Big Data evirioment.]]></p></abstract>
<abstract abstract-type="short" xml:lang="pt"><p><![CDATA[Tendo em conta a importância adquirida pelo termo Big Data, a presente pesquisa buscou estudar e analisar de maneira exaustiva o estado da arte do Big Data; além disso, e como segundo objetivo, analisou as características, as ferramentas, as tecnologias, os modelos e os standards relacionados com Big Data, e por último buscou identificar as características mais relevantes na gestão de Big Data, para que com ele possa conhecer-se todo o concernente ao tema central da pesquisa. A metodologia utilizada incluiu revisar o estado da arte de Big Data e ensinar sua situação atual; conhecer as tecnologias de Big Data; apresentar algumas das bases de dados NOSQL, que permitem processar dados com formatos não estruturados, e mostrar os modelos de dados e as tecnologias de análise deles, para terminar com alguns benefícios de Big Data. O desenho metodológico usado para a pesquisa foi não experimental, pois não se manipulam variáveis, e sim de tipo exploratório, devido a que com esta pesquisa se começa a conhecer o ambiente do Big Data.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Big Data, Hadoop]]></kwd>
<kwd lng="es"><![CDATA[MapReduce]]></kwd>
<kwd lng="es"><![CDATA[NoSQL]]></kwd>
<kwd lng="es"><![CDATA[Análisis de datos]]></kwd>
<kwd lng="es"><![CDATA[Modelo de datos]]></kwd>
<kwd lng="en"><![CDATA[Big Data]]></kwd>
<kwd lng="en"><![CDATA[Hadoop]]></kwd>
<kwd lng="en"><![CDATA[MapReduce]]></kwd>
<kwd lng="en"><![CDATA[NoSQL]]></kwd>
<kwd lng="en"><![CDATA[Data Analysis]]></kwd>
<kwd lng="en"><![CDATA[Data Model]]></kwd>
<kwd lng="pt"><![CDATA[Big Data]]></kwd>
<kwd lng="pt"><![CDATA[Hadoop]]></kwd>
<kwd lng="pt"><![CDATA[MapReduce]]></kwd>
<kwd lng="pt"><![CDATA[NoSQL]]></kwd>
<kwd lng="pt"><![CDATA[Análise de dados]]></kwd>
<kwd lng="pt"><![CDATA[Modelo de dados]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  <font face="Verdana" size="2">      <p align="center"><font size="4"><b>Conociendo Big Data</b></font></p>     <p align="center"><font size="3"><b>Knowing the Big Data</b></font></p>     <p align="center"><font size="3"><b>Conhecendo Big Data</b></font></p>      <p align="center">Juan Jos&eacute; Camargo-Vega<sup>*</sup>, Jonathan Felipe Camargo-Ortega<sup>**</sup>, Luis Joyanes-Aguilar<sup>***</sup></p>     <p><sup>*</sup> D.E.A. - M. Sc. Universidad Pedag&oacute;gica y Tecnol&oacute;gica de Colombia (Tunja-Boyac&aacute;, Colombia). <a href="mailto:jjcamargovega@uptc.edu.co">jjcamargovega@uptc.edu.co</a>    <br> <sup>**</sup> Universidad El Bosque (Bogot&aacute;-Cundinamarca, Colombia). <a href="mailto:jfcamargo@unbosque.edu.co">jfcamargo@unbosque.edu.co</a>    <br> <sup>***</sup> Ph. D. Universidad Pontificia de Salamanca (Madrid, Espa&ntilde;a). <a href="mailto:luis.joyanes@upsam.es">luis.joyanes@upsam.es</a></p>       <p align="center">Fecha de Recepci&oacute;n: 1 de Octubre de 2014 Fecha de Aceptaci&oacute;n: 1 de Diciembre de 2014</p>  <hr>     <p><font size="3"><b>Resumen</b></font></p>      ]]></body>
<body><![CDATA[<p>Teniendo en cuenta la importancia que ha adquirido el t&eacute;rmino Big Data, la presente investigaci&oacute;n busc&oacute; estudiar y analizar de manera exhaustiva el estado del arte del Big Data; adem&aacute;s, y como segundo objetivo, analiz&oacute; las caracter&iacute;sticas, las herramientas, las tecnolog&iacute;as, los modelos y los est&aacute;ndares relacionados con Big Data, y por &uacute;ltimo busc&oacute; identificar las caracter&iacute;sticas m&aacute;s relevantes en la gesti&oacute;n de Big Data, para que con ello se pueda conocer todo lo concerniente al tema central de la investigaci&oacute;n. </p>     <p>La metodolog&iacute;a utilizada incluy&oacute; revisar el estado del arte de Big Data y ense&ntilde;ar su situaci&oacute;n actual; conocer las tecnolog&iacute;as de Big Data; presentar algunas de las bases de datos NoSQL, que son las que permiten procesar datos con formatos no estructurados, y mostrar los modelos de datos y las tecnolog&iacute;as de an&aacute;lisis de ellos, para terminar con algunos beneficios de Big Data. </p>     <p>El dise&ntilde;o metodol&oacute;gico usado para la investigaci&oacute;n fue no experimental, pues no se manipulan variables, y de tipo exploratorio, debido a que con esta investigaci&oacute;n se empieza a conocer el ambiente del Big Data. </p>     <p><b>Palabras clave</b>: Big Data, Hadoop, MapReduce, NoSQL, An&aacute;lisis de datos, Modelo de datos. </p> <hr>     <p><b>Abstract </b></p>      <p> Given the importance acquired by the term Big Data, the present investigation aims to study and analyze thoroughly the Big Data state of art. Moreover, a second objective is to study the features, tools, technologies, models and standards related to Big Data. And finally it seeks to identify the most relevant features that manage Big Data, so it can be known everything about the focus of the investigation. </p>       <p>Regarding the methodology used in the development of the research, included to review the state of the art of Big Data, and show what is its current situation, to know the Big Data technologies, to present some of the NoSQL databases, which are those that allow to process unstructured data formats. Also display data models and the analysis technologies they offer, to end with some benefits from Big Data. </p>     <p>The methodology desing used in this investigation, was not experimental, because no variables are manipulated, neither exploratory ones, because with the present investigation, only begins to know the Big Data evirioment. </p>     <p><b>Keywords: </b>Big Data, Hadoop, MapReduce, NoSQL, Data Analysis, Data Model.</p>  <hr>     <p><b>Resumo </b></p>      ]]></body>
<body><![CDATA[<p> Tendo em conta a import&acirc;ncia adquirida pelo termo Big Data, a presente pesquisa buscou estudar e analisar de maneira exaustiva o estado da arte do Big Data; al&eacute;m disso, e como segundo objetivo, analisou as caracter&iacute;sticas, as ferramentas, as tecnologias, os modelos e os standards relacionados com Big Data, e por &uacute;ltimo buscou identificar as caracter&iacute;sticas mais relevantes na gest&atilde;o de Big Data, para que com ele possa conhecer-se todo o concernente ao tema central da pesquisa. </p>      <p>A metodologia utilizada incluiu revisar o estado da arte de Big Data e ensinar sua situa&ccedil;&atilde;o atual; conhecer as tecnologias de Big Data; apresentar algumas das bases de dados NOSQL, que permitem processar dados com formatos n&atilde;o estruturados, e mostrar os modelos de dados e as tecnologias de an&aacute;lise deles, para terminar com alguns benef&iacute;cios de Big Data. </p>     <p>O desenho metodol&oacute;gico usado para a pesquisa foi n&atilde;o experimental, pois n&atilde;o se manipulam vari&aacute;veis, e sim de tipo explorat&oacute;rio, devido a que com esta pesquisa se come&ccedil;a a conhecer o ambiente do Big Data. </p>     <p><b>Palavras chave</b>: Big Data, Hadoop, MapReduce, NoSQL, An&aacute;lise de dados, Modelo de dados. </p> <hr>     <p align="center"><font size="3"><b>I. Introducci&oacute;n</b></font></p>      <p> El sector empresarial presenta gran desconocimiento sobre lo que significa Big Data; hoy las compa&ntilde;&iacute;as no saben qu&eacute; hacer con el gran volumen de datos e informaci&oacute;n almacenada en diferentes medios o bases de datos, los cuales pueden ser de gran importancia, principalmente en la toma de decisiones. Es por ello que la presente investigaci&oacute;n se orient&oacute; a evidenciar la importancia de la Big Data y a mostrar que los datos se generan con cierta velocidad y variedad, ocasionando el crecimiento en volumen. </p>      <p>Como un problema de Big Data se puede contemplar la forma como hoy crecen los datos en volumen, velocidad y variedad; esto es debido al gran avance y uso de las tecnolog&iacute;as de informaci&oacute;n, y al uso diario que las personas hacen de ellas. </p>     <p>La presente investigaci&oacute;n es &uacute;til para las personas que no tienen mayor conocimiento sobre lo que significa Big Data, sobre sus alcances, sus tecnolog&iacute;as y su aprovechamiento. De la misma forma, a las empresas, independientemente su tama&ntilde;o, siempre y cuando desconozcan el uso de Big Data, de forma que puedan gestionar datos y convertirlos en conocimiento &uacute;til en sus labores diarias. </p>     <p align="center"><font size="3"><b>II. Estado del arte de Big Data</b></font></p>      <p> Para iniciar, se presentan algunas definiciones sobre el t&eacute;rmino Big Data, del cual existen innumerables definiciones, entre ellas se tienen: </p>      ]]></body>
<body><![CDATA[<p>Seg&uacute;n [1], el t&eacute;rmino aplica a la informaci&oacute;n que no puede ser procesada o analizada mediante procesos tradicionales. Para [2], Big Data son "cantidades masivas de datos que se acumulan con el tiempo que son dif&iacute;ciles de analizar y manejar utilizando herramientas comunes de gesti&oacute;n de bases de datos", y para [3], Big Data se refiere "al tratamiento y an&aacute;lisis de enormes repositorios de datos, tan desproporcionadamente grandes que resulta imposible tratarlos con las herramientas de bases de datos y anal&iacute;ticas convencionales". </p>     <p>Por su parte, el analista Dan Kusnetzky, del Grupo Kusnetzky [4], se&ntilde;ala que "La frase Big Data se refiere a las herramientas, procesos y procedimientos que permitan a una organizaci&oacute;n crear, manipular y administrar grandes conjuntos de datos e instalaciones de almacenamiento". </p>     <p>En [5],"Forrester define Big Data como las t&eacute;cnicas y tecnolog&iacute;as que hacen que sea econ&oacute;mico hacer frente a los datos a una escala extrema. Big Data trata de tres cosas: 1) Las t&eacute;cnicas y la tecnolog&iacute;a, lo que significa que la empresa tenga personal, el cual tenga gran representaci&oacute;n y an&aacute;lisis de datos para tener un valor agregado con informaci&oacute;n que no ha sido manejada. 2) Escala extrema de datos que supera a la tecnolog&iacute;a actual debido a su volumen, velocidad y variedad. 3) El valor econ&oacute;mico, haciendo que las soluciones sean asequibles y ayuden a la inversi&oacute;n de los negocios". </p>     <p>Seg&uacute;n [7], Big Data "se refiere a las herramientas, los procesos y procedimientos que permitan a una organizaci&oacute;n crear, manipular y gestionar conjuntos de datos muy grandes y las instalaciones de almacenamiento". </p>     <p>Gartner [8] define el Big Data como "un gran volumen, velocidad o variedad de informaci&oacute;n que demanda formas costeables e innovadoras de procesamiento de informaci&oacute;n que permitan ideas extendidas, toma de decisiones y automatizaci&oacute;n del proceso". Y [9] indica que "Big Data consiste en consolidar toda la informaci&oacute;n de una organizaci&oacute;n y ponerla al servicio del negocio". </p>     <p><b><i>A. </i><i>Estado actual de Big Data </i></b></p>     <p> Las investigaciones en Big Data son bastantes en la actualidad; aqu&iacute; se presentan algunas de ellas: </p>     <p>Una encuesta realizada por LogLogic encuentra que el 49% de las organizaciones est&aacute;n algo o muy preocupados por la gesti&oacute;n de Big Data, pero que el 38% no entiende lo que es, y el 27% dice que tiene una comprensi&oacute;n parcial [10]; adem&aacute;s, la encuesta encontr&oacute; que 59% de las organizaciones carecen de las herramientas necesarias para gestionar los datos de sus sistemas de TI [10]. Khera explic&oacute; que: "Big Data se trata de muchos terabytes de datos no estructurados", donde "La informaci&oacute;n es poder, y Big Data, si se gestiona correctamente, puede proporcionar una cantidad de conocimiento&hellip;" [10]. Seg&uacute;n la encuesta, el 62% mencion&oacute; que ya hab&iacute;a gestionado m&aacute;s de Conociendo Big Data un terabyte de datos; eso indica que el volumen de datos en el mundo est&aacute; aumentando a un ritmo casi incomprensible. </p>     <p>Se&ntilde;ala Beyer de Gartner y otros expertos que: "los grandes vol&uacute;menes de datos, o Big Data, requieren grandes cambios en el servidor, la infraestructura de almacenamiento y la arquitectura de administraci&oacute;n de la informaci&oacute;n en la mayor&iacute;a de las empresas" [11]. </p>     <p>En [11], McKinsey dice que es necesario prepararse para contratar o reciclar personal, pues las empresas u organizaciones carecen de personas capacitadas en Big Data. Adem&aacute;s, "proyecta que para el 2018, solo en Estados Unidos, se necesitar&aacute;n entre 140 mil y 190 mil nuevos expertos en m&eacute;todos estad&iacute;sticos y tecnolog&iacute;as de an&aacute;lisis de datos, incluyendo el ampliamente publicitado papel de cient&iacute;fico de datos". Se&ntilde;ala Williams de Catalina, en [11], que "La gente que construy&oacute; las bases de datos del pasado no son necesariamente las personas que van a construir las bases de datos del futuro". </p>     ]]></body>
<body><![CDATA[<p>Seg&uacute;n el estudio de Worldwide Big DataTechnology and Services 2013-2017 de IDC, "La tecnolog&iacute;a y servicios de Big Data crecer&aacute; con una tasa anual de crecimiento compuesto del 27% hasta llegar a los 32.400 millones de d&oacute;lares en 2017, unas seis veces la tasa de crecimiento del mercado general de tecnolog&iacute;as de la informaci&oacute;n y comunicaciones" [12]. </p>     <p><b><i>B.</i><i> Dimensiones de Big Data </i></b></p>     <p> Existen tres caracter&iacute;sticas o dimensiones: Volumen, Velocidad y Variedad. </p>     <p><b><i>1</i><i>) Volumen</i><i>: </i></b>cada d&iacute;a, las empresas registran un aumento significativo de sus datos (terabytes, petabytes y exabytes), creados por personas y m&aacute;quinas. En el a&ntilde;o 2000 se generaron 800.000 petabytes (PB), de datos almacenados y se espera que esta cifra alcance los 35 zettabytes (ZB) en el 2020. Las redes sociales tambi&eacute;n generan datos, es el caso de Twitter, que por s&iacute; sola genera m&aacute;s de 7 terabytes (TB) diariamente, y de Facebook, 10 TB de datos cada d&iacute;a. Algunas empresas generan terabytes de datos cada hora de cada d&iacute;a del a&ntilde;o, es decir, las empresas est&aacute;n inundadas de datos [13]. </p>      <p><b><i>2) </i><i>Variedad</i>: </b>Se puede mencionar que va muy de la mano con el volumen, pues de acuerdo con &eacute;ste y con el desarrollo de la tecnolog&iacute;a, existen muchas formas de representar los datos; es el caso de datos estructurados y no estructurados; estos &uacute;ltimos son los que se generan desde p&aacute;ginas web, archivos de b&uacute;squedas, redes sociales, foros, correos electr&oacute;nicos o producto de sensores en diferentes actividades de las personas; un ejemplo [14] es el convertir 350 mil millones de lecturas de los medidores por a&ntilde;o para predecir el consumo de energ&iacute;a. </p>     <p><b><i>3) V</i><i>elocidad: </i></b>Se refiere a la velocidad con que se crean los datos, que es la medida en que aumentan los productos de desarrollos de software (p&aacute;ginas web, archivos de b&uacute;squedas, redes sociales, foros, correos electr&oacute;nicos, entre otros). </p>     <p>Las tres caracter&iacute;sticas tienen coherencia entre s&iacute;; por ejemplo [13], analizar 500 millones de registros de llamadas al d&iacute;a en tiempo real para predecir la p&eacute;rdida de clientes. </p>     <p><b><i>C. </i><i>An&aacute;lisis de Big Data </i></b></p>     <p> El Big Data crece diariamente, como ya se mencion&oacute;,y una de las justificaciones es que los datos provienen de gran variedad de fuentes, tales como la Web, bases de datos, rastros de clics, redes sociales, Call Center, datos geoespaciales, datos semiestructurados (XML, RSS), provenientes de audio y video, los datos generados por los term&oacute;metros, datos de navegaci&oacute;n de sitios web durante cierto tiempo, las RFID (Radio Frequency Identification -identificaci&oacute;n por radiofrecuencia) [15]. </p>     <p>Existen algunos beneficios del an&aacute;lisis de Big Data para las organizaciones, tal como se observ&oacute; en el &aacute;rea de marketing, demostrados en la encuesta realizada por TDWI (The Data Warehousing Institute), cuando pregunt&oacute;: "&iquest;Cu&aacute;l de los siguientes beneficios se producir&iacute;a si la organizaci&oacute;n implementa alguna forma de an&aacute;lisis de Big Data?". El 61% respondi&oacute; que influye de manera social; el 45%, que habr&aacute; m&aacute;s puntos de vista de negocio; el 37% se inclin&oacute; por las decisiones automatizadas en los procesos en tiempo real; el 29% mencion&oacute; que se mejorar&iacute;a la planificaci&oacute;n y la previsi&oacute;n, y el 27%, que se entender&iacute;a el comportamiento del consumidor [16]. </p>     ]]></body>
<body><![CDATA[<p>Seg&uacute;n la misma encuesta, se encontraron ciertos inconvenientes del an&aacute;lisis del Big Data, entre ellos: la falta de personal y de habilidades del recurso humano (46%), la dificultad en la arquitectura de un sistema de an&aacute;lisis de Big Data (33%), problemas con el Big Data utilizable para los usuarios finales (22%), la falta de patrocinio empresarial (38%) y la deficiencia de un argumento empresarial convincente (28%), la carencia de an&aacute;lisis de bases de datos (32%), problemas de escalabilidad de Big Data (23%), rapidez en las consultas (22%) y dificultad para cargar los datos lo suficientemente r&aacute;pido (21%), entre otros [16]. </p>     <p>Ante la pregunta sobre cada cu&aacute;nto realizan an&aacute;lisis de Big Data, se hall&oacute; que anualmente, el 15%; mensual, el 35%; semanal, el 14%; diario, 24%; cada pocas horas, 5%; cada hora, 4%; en tiempo real, 4%. Lo anterior fue el resultado de 96 entrevistados [16]. </p>     <p>El objetivo del an&aacute;lisis de datos es examinar grandes cantidades de datos con una variedad de clases, con el fin de descubrir informaci&oacute;n que sea relevante y &uacute;til para la empresa, de manera que le permita tomar las mejores decisiones y obtener ventajas competitivas en comparaci&oacute;n con otras de su clase. </p>     <p>El an&aacute;lisis de datos se realiza con tecnolog&iacute;as de bases de datos como NoSQL, Hadoop y MapReduce, las cuales soportan el procesamiento del Big Data. </p>     <p align="center"><font size="3"><b>III. Tecnolog&iacute;as de Big Data</b></font></p>      <p> Para el manejo de datos es necesario tener dos componentes b&aacute;sicos, tanto el hardware como el software; respecto al primero, se tienen tecnolog&iacute;as tales como arquitecturas de Procesamiento Paralelo Masivo (MPP), que ayudan de forma r&aacute;pida a su 	procesamiento. Para el manejo de datos no estructurados o semiestructurados es necesario acudir a otras tecnolog&iacute;as; es aqu&iacute; donde aparecen nuevas t&eacute;cnicas y tecnolog&iacute;as, como MapReduce o Hadoop, dise&ntilde;ado para el manejo de informaci&oacute;n estructurada, no estructurada o semiestructurada. </p>      <p><b><i>A.</i><i> Apache Hadoop </i></b></p>     <p> Seg&uacute;n [18],"Apache Hadoop es un marco de software de c&oacute;digo abierto para aplicaciones intensivas de datos distribuidos originalmente creado por Doug Cutting para apoyar su trabajo en Nutch, una Web de c&oacute;digo abierto motor de b&uacute;squeda. Hadoop es ahora una de las tecnolog&iacute;as m&aacute;s populares para el almacenamiento de los datos estructurados, semi-estructurados y no estructurados que forman Big Data. Hadoop est&aacute; disponible bajo la licencia Apache 2.0". </p>     <p>Seg&uacute;n [19], "es una biblioteca de software que permite el procesamiento distribuido de grandes conjuntos de datos a trav&eacute;s de grupos de ordenadores que utilizan modelos sencillos de programaci&oacute;n. Est&aacute; dise&ntilde;ado para pasar de los servidores individuales a miles de m&aacute;quinas, cada oferta local de computaci&oacute;n y almacenamiento". </p>     <p>Seg&uacute;n [20], Hadoop es un framework de c&oacute;digo abierto, el cual permite escribir y ejecutar aplicaciones distribuidas que procesan grandes cantidades de datos. Tiene algunas caracter&iacute;sticas importantes: </p> <ul>    ]]></body>
<body><![CDATA[<li>    <p>Fue dise&ntilde;ado para ejecutarse en grupos relativamente grandes de hardware, es decir, en cl&uacute;ster robustos.</p></li>     <li>    <p>Es robusto, pues ante un mal funcionamiento del hardware puede superar tales situaciones sin mayor inconveniente. </p></li>     <li>    <p>Tiene la ventaja de poder ser escalable, lo que indica que permite crecer o agregar nodos al cl&uacute;ster con relativa facilidad; por ejemplo, ante la forma vertiginosa como crecen las redes sociales, permite agregar m&aacute;s nodos con facilidad. </p></li>     <li>    <p>Es simple, por lo que permite a los usuarios escribir c&oacute;digo con eficiencia, para software distribuido. </p></li>    </ul>     <p>Hadoop tiene sus inicios como un subproyecto de Nutch, que era a su vez un subproyecto de Apache Lucene; es una indexaci&oacute;n de texto y de b&uacute;squeda bibliogr&aacute;fica, es decir, permite realizar b&uacute;squedas dentro de documentos. Nutch es un proyecto m&aacute;s ambicioso que Apache Lucene, lo que se busca es dise&ntilde;ar un motor de b&uacute;squeda para la web, el cual Conociendo Big Data contiene analizador para HTML, un rastreador web, una base de datos de link-gr&aacute;fica y otros componentes adicionales necesarios. </p>     ]]></body>
<body><![CDATA[<p>Hoy en d&iacute;a, Hadoop muestra ventajas significativas frente a bases de datos SQL (Structured Query Language), que se presentan como un dise&ntilde;o para el manejo de informaci&oacute;n estructurada, donde los datos residen en tablas relacionales que tienen una estructura definida, pues fue dise&ntilde;ado para informaci&oacute;n no estructurada o semiestructurada, como documentos de texto, im&aacute;genes y archivos XML. </p>     <p>"Hadoop puede manejar todos los tipos de datos de sistemas dispares: estructurado, no estructurado, los archivos de registro, im&aacute;genes, archivos de audio, archivos de correo electr&oacute;nico, las comunicaciones&hellip;, casi cualquier cosa que se pueda imaginar, sin importar su formato nativo" [21]. </p>     <p>Seg&uacute;n [20], Hadoop es un framework usado para escribir y ejecutar aplicaciones distribuidas que permite procesar grandes cantidades de datos. Hadoop est&aacute; compuesto por dos m&oacute;dulos [19]: Hadoop Distributed File System (HDFS), y HadoopMapReduce. </p>     <p><b><i>1) Hadoop Distributed File System </i></b><i>(HDFS: Sistema de archivos distribuido Hadoop): </i>Es un sistema de archivos altamente tolerante a fallos, escalable y con una arquitectura distribuida; puede llegar a almacenar 100 TB en un solo archivo, lo cual no es tan f&aacute;cil en otros tipos de sistemas de archivos. Adem&aacute;s, brinda la apariencia de estar trabajando en un solo archivo, pero realmente lo que se tiene es que est&aacute;n distribuidos en varias m&aacute;quinas para su procesamiento. </p>     <p>Lam menciona [20] que HDFS se dise&ntilde;&oacute; para el procesamiento por lotes, en lugar de uso interactivo por los usuarios; pero realmente se dise&ntilde;&oacute; para resolver dos problemas importantes que se presentan en el procesamiento de datos a gran escala: el primero es la capacidad de descomponer los archivos en varias partes y procesar cada una independientemente de las dem&aacute;s, y al final consolidar todas las divisiones del archivo en uno solo; el segundo problema era la tolerancia a fallos, tanto en el nivel de procesamiento de archivos como de forma general del software, al momento de realizar el procesamiento de datos distribuidos; lo que se busca es que el sistema pueda recuperarse de la falla que se pueda presentar sin afectar demasiado el proceso [20,21]. </p>     <p>Cuando se cre&oacute; HDFS se propusieron tres objetivos [21]: </p> <ul>    <li>    <p>Permitir procesar archivos con tama&ntilde;os de gigabytes (GB) hasta petabytes (PB). </p></li>     <li>    <p>Poder leer datos a grandes velocidades.</p></li>     ]]></body>
<body><![CDATA[<li>    <p>Capacidad para ser ejecutado en una m&aacute;quina, sin solicitar hardware especial. </p></li>    </ul>     <p>La arquitectura de HDFS est&aacute; compuesta por un nodo principal (NameNode) y varios nodos esclavos (DataNodes). </p>     <p>El nodo principal es el servidor maestro, dedicado a gestionar el espacio del nombre de los archivos y controlar el acceso de los diferentes archivos de usuarios; adem&aacute;s, el nodo maestro se encarga de gestionar las operaciones de abrir, cerrar, mover, nombrar y renombrar archivos y directorios. </p>     <p>Los nodos esclavos (DataNodes), como su nombre lo indica, representan los esclavos de la arquitectura HDFS. En un HDFS pueden existir miles de nodos esclavos y decenas de miles de clientes HDFS por cl&uacute;ster; esto se debe a que cada nodo esclavo puede ejecutar m&uacute;ltiples tareas de aplicaciones de forma simult&aacute;nea. La funci&oacute;n del nodo esclavo es la de gestionar tanto la lectura como la escritura de los archivos de los usuarios, y realizar la replicaci&oacute;n de acuerdo a como lo indique el nodo maestro (NameNode) [21]. </p>     <p><b><i>2) Hadoop MapReduce: </i></b>Seg&uacute;n [19],"Es un sistema basado en hilados para el procesamiento paralelo de grandes conjuntos de datos". Hadoop MapReduce es un marco de software creado con el fin de hacer aplicaciones que puedan procesar grandes cantidades de datos de forma paralela, en un mismo hardware. Cuando los datos entran para ser procesados se dividen de manera independiente, para su procesamiento, es decir, de manera distribuida en diferente hardware que exista. MapReduce est&aacute; compuesto de un maestro, llamado JobTracker, y un esclavo, TaskTracker, por cada nodo. El primero se encarga de programar las tareas, los componentes que manejan el esclavo, y &eacute;ste ejecuta las tareas seg&uacute;n las indicaciones del maestro. </p>     <p>MapReduce es usado en soluciones donde se pueda procesar de forma paralela y, adem&aacute;s, con grandes cantidades de informaci&oacute;n, es decir, con vol&uacute;menes de petabytes, de lo contrario no ser&iacute;a una soluci&oacute;n adecuada. Otra condici&oacute;n es que se puede usar MapReduce en procesos que se puedan disgregar en operaciones map () y reduce (), las cuales se definen en funci&oacute;n de datos estructurados [19]. MapReduce se dise&ntilde;&oacute; como un modelo de programaci&oacute;n, para que se pudiera realizar procesamiento de datos de gran tama&ntilde;o, y, de la misma forma, para que resolviera el problema existente de escalabilidad. MapReduce "es un modelo de programaci&oacute;n para el procesamiento de datos". Puede ser ejecutado en varios lenguajes de programaci&oacute;n, como Java, Ruby, Python, and C++ [22]. </p>     <p align="center"><font size="3"><b>IV. Bases de datos NoSQL</b></font></p>      <p> En 1998 aparece el t&eacute;rmino NoSQL, que significa no solo SQL. El nombre fue creado por Carlo Strozzi, para denominar su base de datos que no ofrec&iacute;a SQL. Las NoSQL no presentan el modelo de las bases de datos relacionales; estas no tienen esquemas, no usan SQL, tampoco permiten joins (uni&oacute;n), no almacenan datos en tablas de filas y columnas de manera uniforme, presentan escalabilidad de forma horizontal, para su labor usan la memoria principal del computador; su objetivo es gestionar grandes vol&uacute;menes de informaci&oacute;n. Las bases de datos NoSQL tienen como caracter&iacute;stica principal que su estructura es distribuida, es decir, los datos se hallan distribuidos en varias m&aacute;quinas [21, 24, 25]. Las bases de datos NoSQL permiten obtener los datos con mayor velocidad que en otras con modelo relacional. </p>      ]]></body>
<body><![CDATA[<p>En la <a href="#tab1">Tabla 1</a> se presenta un ejemplo de una clase de bases de datos NoSQL, con las caracter&iacute;sticas mencionadas anteriormente. </p>     <p align="center"><a name="tab1"><img src="img/revistas/rfing/v24n38/v24n38a06t1.jpg"></a></p>      <p>Existen varias clases de bases de datos NoSQL, dependiendo de su forma de almacenar los datos, tales como: almacenamiento Clave-Valor, orientadas a columnas y las orientadas a documentos. A continuaci&oacute;n se presentan algunas Bases de Datos NoSQL: </p>      <p><b><i>A.</i><i> DynamoDB </i></b></p>     <p> DynamoDB fue desarrollada y probada de manera interna en Amazon; guarda muy f&aacute;cil y econ&oacute;micamente cualquier cantidad de informaci&oacute;n. Los datos son almacenados en unidades de estado s&oacute;lido SSD (Solid State Drive), las cuales permiten mayor velocidad a la hora de encontrar la informaci&oacute;n, pues estas unidades funcionan de manera diferente a como lo hace el disco duro del computador [40]. Con el uso de SSD se tiene un excelente rendimiento, mayor fiabilidad y un alto grado de seguridad de los datos. </p>     <p><b><i>B.</i><i> Cassandra </i></b></p>     <p> Proyecto iniciado por Facebook; es del tipo c&oacute;digo abierto (Open Source). Se puede decir que despu&eacute;s de la implementaci&oacute;n de Cassandra, las redes sociales se dispararon en popularidad [41]. Es una base de datos distribuida, y almacena los datos en forma de clave-valor; fue desarrollada en java, adem&aacute;s, hoy en d&iacute;a es usada en la red social Twitter. </p>      <p>Otras caracter&iacute;sticas importantes de Cassandra es que es <i>descentralizada</i>, lo que significa que cada nodo es id&eacute;ntico, y, adem&aacute;s, que no existe ning&uacute;n punto &uacute;nico de fallo; que es escalable, es decir, que el software puede atender un n&uacute;mero mayor de solicitudes de los usuarios sin que se note alg&uacute;n tipo de degradaci&oacute;n en su rendimiento, y que es tolerante a fallos, es decir, que puede reemplazar nodos que fallen en el cl&uacute;ster sin perder tiempo. </p>      <p><b><i>C.</i><i> Voldemort </i></b></p>     <p> Voldemort fue creada por LinkedIn, con el fin de solucionar los problemas de escalabilidad que ten&iacute;an las bases de datos relacionales; los datos los almacena en forma de clave-valor; es de ambiente distribuido, los datos se replican autom&aacute;ticamente en los diferentes nodos o servidores, donde cada nodo es independiente de los dem&aacute;s; permite con cierta facilidad la expansi&oacute;n del cl&uacute;ster, sin necesidad de reequilibrar todos los datos. El c&oacute;digo fuente est&aacute; disponible bajo la licencia Apache 2.0 [42]. </p>     ]]></body>
<body><![CDATA[<p><b><i>D.</i><i> Google BigTable </i></b></p>     <p> BigTable fue creado por Google en el a&ntilde;o 2004, con la idea inicial de que fuera distribuido para varias m&aacute;quinas, por lo que necesitaban que fuese altamente eficiente. El sistema divide la informaci&oacute;n en columnas, y para almacenarla utiliza tablas multidimensionales compuestas por celdas [25]. El sistema de archivos usado por BigTable es GFS (Google File System) es de tipo distribuido, del mismo propietario Google, y se desarroll&oacute; con el objetivo de almacenar informaci&oacute;n en sistemas de archivos distribuidos con cierta velocidad. Puede almacenar hasta tres copias de la informaci&oacute;n. Maneja dos servidores diferentes: uno llamado Master, que se encarga de guardar la direcci&oacute;n donde se alojan los archivos, y otro llamado Chunk Server, que es donde almacena los datos. Para terminar, GFS no depende de un sistema operativo espec&iacute;fico, es decir, funciona en cualquier plataforma. </p>     <p><b><i>E.</i><i> HBase </i></b></p>     <p> HBase es una base de datos de tipo c&oacute;digo abierto (Open Source); almacena los datos de forma clave-valor; tambi&eacute;n almacena y recupera los datos de forma aleatoria, es decir, que al momento de escribir los datos lo hace a su manera, y al leerlos funciona de igual forma. Trabaja con los tres tipos de datos: no estructurados, semiestructurados y estructurados, siempre y cuando no sean tan grandes. HBase no permite consultas SQL y, adem&aacute;s, est&aacute; dise&ntilde;ada para ejecutarse en un cl&uacute;ster de equipos, lo que indica que no puede trabajar en un solo servidor. En la medida que se aumenten m&aacute;s servidores, HBase no presenta inconvenientes en ese sentido, y, tambi&eacute;n, cuando uno de ellos presenta alg&uacute;n tipo de inconveniente se puede sustituir por otro sin mayor problema [26, 27]. </p>     <p><b><i>F.</i><i> Riak </i></b></p>     <p> Riak es una base de datos que almacena la informaci&oacute;n en forma de clave-valor y es de ambiente distribuido, presenta la caracter&iacute;stica de que es tolerante a fallos, lo que indica que puede eliminar errores y sus efectos antes de que ocurra una falla, buscando de esta manera maximizar la fiabilidad del sistema. Utiliza JSON (JavaScript Object Notation -Notaci&oacute;n de Objetos de JavaScript), que es un formato para el intercambio de datos. Adem&aacute;s, Riak tiene mayor ventaja a la hora de trabajar en la Web, en la familia de bases de datos de su especie, medida en las peticiones de muchos usuarios simult&aacute;neamente [28, 29]. </p>     <p><b><i>G.</i><i> CouchDB </i></b></p>     <p> CouchDB es el acr&oacute;nimo en ingl&eacute;s de Clusterof UnreliableCommodity Hardware; fue creado en el a&ntilde;o 2005, por Damien Katz. En el 2011 se hace el lanzamiento al p&uacute;blico de la versi&oacute;n 1.1.1. Se considera que CouchDB es un servidor de base de datos documental, lo cual indica que los datos no los almacena en tablas, sino que la base de datos est&aacute; compuesta por documentos, que a su vez trabajan como objetos. Hace uso de JSON, que es un formato para el intercambio de datos, usado cuando los datos son de gran volumen; por eso, para las consultas hace uso de JavaScript; debido a lo anterior, es muy usado por empresas como Yahoo y Google [28, 30]. </p>     <p>CouchDB presenta una caracter&iacute;stica importante: se puede instalar desde un datacenter hasta un Smartphone, y se puede ejecutar en un celular Android, en un MacBook o en un datacenter, lo que quiere decir que se pueden almacenar datos peque&ntilde;os en un celular, como tambi&eacute;n grandes vol&uacute;menes de datos en un servidor. Tambi&eacute;n es muy flexible para estructurar y distribuir datos. Otra caracter&iacute;stica importante es la facilidad con la que permite hacer replicaciones. </p>     <p>Una desventaja consiste en que no permite consultas din&aacute;micas, pues las realiza de manera est&aacute;tica; por ejemplo, para buscar un libro por el nombre de autor, primero crea un &iacute;ndice con todos los nombres de autores para todos los documentos. </p>     ]]></body>
<body><![CDATA[<p>Una ventaja desde el punto de vista de seguridad que maneja CouchDB es que cada vez que un documento se almacena nunca se sobrescribe el original, se crea uno nuevo con las modificaciones sucedidas de los datos; lo anterior indica que CouchDB guarda una copia de seguridad de los documentos viejos [28, 31]. </p>     <p><b><i>H.</i><i> MongoDB </i></b></p>     <p> MongoDB es una base de datos con el perfil NoSQL orientada a documentos, bajo la filosof&iacute;a de c&oacute;digo abierto. La importancia de MongoDBradica en su versatilidad, su potencia y su facilidad de uso, al igual que en su capacidad para manejar tanto grandes como peque&ntilde;os vol&uacute;menes de datos. Es una base de datos que no tiene concepto de tablas, esquemas, SQL, columnas o filas. No cumple con las caracter&iacute;sticas ACID, que es el acr&oacute;nimo de Atomicity, Consistency, Isolation and Durability (Atomicidad, Consistencia, Aislamiento y Durabilidad, en espa&ntilde;ol). </p>     <p>MongoDB permite las operaciones CRUD, que es el acr&oacute;nimo de Create, Read, Update and Delete (Crear, Obtener, Actualizar y Borrar); para almacenar y recuperar los datos hace uso de JSON, pero utiliza BSON, que es una forma binaria de JSON, el cual ocupa menos espacio al almacenar los datos. Adem&aacute;s, BSON es m&aacute;s eficiente y r&aacute;pida para convertir a un formato de datos de un lenguaje de programaci&oacute;n. Otra caracter&iacute;stica de MongoDB es que realiza consultas din&aacute;micas, es decir, puede realizar consultas sin demasiada planificaci&oacute;n. MongoDB se desarroll&oacute; en C++ [28, 32, 33, 34]. </p>     <p><b><i>I.</i><i> BaseX </i></b></p>     <p> Es una base de datos de tipo documental, la cual permite almacenar, recuperar y gestionar datos de documentos; es de la clase de bases de datos NoSQL; tiene como caracter&iacute;stica importante que permite escalar y, adem&aacute;s, que es de alto rendimiento. Su arquitectura es cliente/servidor, permitiendo realizar lecturas y escrituras de datos de manera simult&aacute;nea. Cumple con el est&aacute;ndar, ACID (acr&oacute;nimo de Atomicity, Consistency, Isolation and Durability-Atomicidad, Consistencia, Aislamiento y Durabilidad). Soporta grandes documentos en XML, JSON y formatos binarios. BaseX est&aacute; desarrollado bajo Java y XQuery [35]. </p>     <p align="center"><font size="3"><b>V. Modelo de datos</b></font></p>      <p> Los datos se clasifican en estructurados, no estructurados y semiestructurados. </p>      <p><b><i>A. </i><i>D</i><i>atos estructurados </i></b></p>     <p> Este tipo de datos se dividen en est&aacute;ticos (array, cadena de caracteres y registros) y din&aacute;micos (listas, pilas, colas, &aacute;rboles, archivos). Se puede definir que los datos estructurados son aquellos de mayor facilidad para acceder, pues tienen una estructura bien especificada [31, 36]. Un array es una colecci&oacute;n finita de elementos en formatos definidos del mismo tipo, es decir, son homog&eacute;neos, y ordenados por un &iacute;ndice; con estos formatos se facilita la administraci&oacute;n de los datos; ejemplo de ellos, un campo que contiene una fecha DD, MM, AA, que contiene seis caracteres, o un formato con la direcci&oacute;n de la persona, que puede ser alfanum&eacute;rico, con tama&ntilde;o de 40 caracteres. </p>     ]]></body>
<body><![CDATA[<p><b><i>B.</i><i> Datos semiestructurados </i></b></p>     <p> Estos datos no tienen un formato definido, lo que tienen son etiquetas que facilitan separar un dato de otro. Un dato de estos se lee con un conjunto de reglas de cierto nivel de complejidad [36]. </p>     <p>Los datos semiestructurados presentan las siguientes caracter&iacute;sticas [23]: </p> <ul>    <li>Son datos irregulares, que pueden no tener un esquema en particular, es el caso del ejemplo que se presenta en las <a href="#tab2">Tablas 2</a>, <a href="#tab3">3</a>, y <a href="#tab4">4</a>.</li>    </ul>      <p align="center"><a name="tab2"><img src="img/revistas/rfing/v24n38/v24n38a06t2.jpg"></a></p>     <p align="center"><a name="tab3"><img src="img/revistas/rfing/v24n38/v24n38a06t3.jpg"></a></p>     <p align="center"><a name="tab4"><img src="img/revistas/rfing/v24n38/v24n38a06t4.jpg"></a></p>  <ul>    <li>En este tipo de datos semiestructurados se pueden presentar datos incompletos, es el caso del ejemplo que se observa en las <a href="#tab5">Tablas 5</a> y <a href="#tab6">6</a>.</li>    </ul>     ]]></body>
<body><![CDATA[<p align="center"><a name="tab5"><img src="img/revistas/rfing/v24n38/v24n38a06t5.jpg"></a></p>     <p align="center"><a name="tab6"><img src="img/revistas/rfing/v24n38/v24n38a06t6.jpg"></a></p>  <ul>    <li>Los componentes de este tipo de datos, pueden cambiar de tipo (ver <a href="#tab7">Tabla 7</a>).</li>    </ul>     <p align="center"><a name="tab7"><img src="img/revistas/rfing/v24n38/v24n38a06t7.jpg"></a></p>  <ul>    <li>Otra caracter&iacute;stica de los datos   semiestructurados es que pueden aparecer datos   nuevos cuya estructura nada tiene que ver con la ya   existente, es decir, para seguir el ejemplo, se puede   observar las <a href="#tab7">Tablas 7</a> y <a href="#tab8">8</a>: la primera presenta cinco   campos, y la segunda, seis, y los dos registros dentro del mismo archivo de datos.</li>    </ul>     <p align="center"><a name="tab8"><img src="img/revistas/rfing/v24n38/v24n38a06t8.jpg"></a></p>      <p>Algunas de las anteriores caracter&iacute;sticas se presentan debido a que cada quien publica sus datos a su manera, y esto se presenta en internet; al observar cualquier p&aacute;gina web se puede visualizar tal situaci&oacute;n, es decir, no existe un formato o estructura definida para presentar los datos. </p>     <p>Es de aclarar que los ejemplos anteriores, expuestos en las <a href="#tab2">Tablas 2</a> a <a href="#tab8">8</a>, son parte de un archivo con datos semiestructurados, donde ser&iacute;a dif&iacute;cil realizar cualquier gesti&oacute;n o procesamiento con este tipo de datos, pues el primer motivo es la diferencia de tama&ntilde;o en los campos de cada registro. </p>     ]]></body>
<body><![CDATA[<p><b><i>C. </i><i>D</i><i>atos no estructurados </i></b></p>     <p> Son aquellos que no pueden ser normalizados, no tienen tipos definidos ni est&aacute;n organizados bajo alg&uacute;n patr&oacute;n; tampoco son almacenados de manera relacional, o con base jer&aacute;rquica de datos, debido a que no son un tipo de dato predefinido; es decir, no tienen un formato normalizado determinado. Sin embargo, los datos deben poder ser organizados, clasificados, almacenados, eliminados, buscados de alguna forma. Estos datos se pueden observar a diario en correos electr&oacute;nicos, archivos de texto, un documento de alg&uacute;n procesador de palabra, hojas electr&oacute;nicas, una imagen, un objeto, archivos de audio, blogs, mensajes de correo de voz, mensajes instant&aacute;neos, contenidos Web y archivos de video, entre otros [31, 37]. </p>     <p>En este caso de datos no estructurados, no tienen un identificador definido, no se puede reconocer su estado f&iacute;sico ni l&oacute;gico; tampoco se puede identificar su tipo o clase; su tama&ntilde;o no se puede encajar en una tabla predefinida, es el caso de los datos contenidos en una p&aacute;gina web. Se puede tener el siguiente ejemplo: "Pedro naci&oacute; el d&iacute;a 24 de noviembre de 1978, y el 20 de septiembre se gradu&oacute; Julio en la universidad". Como se puede observar, no es tan f&aacute;cil la administraci&oacute;n de este tipo de informaci&oacute;n, no estructurada. </p>     <p>Lo que s&iacute; se puede respecto a los datos no estructurados es hacer uso de los metadatos, es decir, usar datos que puedan describir otros datos. Por ejemplo, en una biblioteca se tiene en fichas o en un sistema de informaci&oacute;n datos de los libros como: autor, t&iacute;tulo, editorial, ISBN y tema, entre otros. Lo anterior con el fin de hallar con facilidad un determinado libro; esta es la forma como los metadatos ayudan a buscar datos. </p>     <p align="center"><font size="3"><b>VI. Tecnolog&iacute;as de an&aacute;lisis de datos</b></font></p>      <p><b><i>A. BigQuery</i></b></p>      <p>"Google BigQuery es un servicio web que permite hacer un an&aacute;lisis interactivo de enormes conjuntos de datos hasta miles de millones de filas. Escalable y f&aacute;cil de usar, permite a los desarrolladores BigQuery y las empresas aprovechar los an&aacute;lisis de datos de gran alcance en la demanda" [38]. BigQuery es un servicio que presta Google con el fin de almacenar y consultar grandes datos no estructurados. </p>     <p><b><i>B.</i><i> ThinkUp </i></b></p>     <p> Seg&uacute;n [39], "ThinkUp es un potente motor de an&aacute;lisis de datos que permite extraer informaci&oacute;n de Twitter, Facebook y Google+". Para la instalaci&oacute;n es necesario un servidor con PHP y una base de datos en MySQL. ThinkUp se desarroll&oacute; bajo licencia GPL y su gran potencial es la extracci&oacute;n de datos; es una aplicaci&oacute;n web gratuita, de c&oacute;digo abierto, puede almacenar actividades sociales en una base de datos con el control de cada persona [43]. </p>     <p><b><i>C.</i><i> Infosphere Streams </i></b></p>     ]]></body>
<body><![CDATA[<p> Es una plataforma desarrollada por IBM, que permite el an&aacute;lisis de datos en milisegundos [44]. Streams analiza y transforma datos en memoria y en tiempo real, no como sucede con otras aplicaciones, que Conociendo Big Data primero gestionan, almacenan y por &uacute;ltimo analizan los datos. Con Streams, los datos se analizan directamente, es decir, en tiempo real, lo cual permite obtener resultados m&aacute;s r&aacute;pidamente [45, 53]. Un Stream es una secuencia continua de elementos, que para este caso son datos; permite manejar altas tasas de transferencia de datos hasta millones de eventos o mensajes por segundo. </p>     <p><b><i>D.</i><i> Biginsights Infosphere </i></b></p>     <p> Es una plataforma desarrollada por IBM para Hadoop, buscando suplir las necesidades de las empresas [45, 53], lo cual se puede lograr facilitando el trabajo de los analistas de sistemas, sin volverlos programadores en una herramienta de dif&iacute;cil manejo. Otra forma es facilitar la consulta de los datos almacenados. </p>     <p><b><i>E.</i><i> System PureData </i></b></p>     <p> El sistema PureData es una herramienta de IBM; permite realizar an&aacute;lisis de Big Data en menos tiempo que otras herramientas de an&aacute;lisis; la velocidad de lectura de datos promedia los 128 gigabytes por segundo; fue dise&ntilde;ado para manejar m&aacute;s de 1000 consultas simult&aacute;neamente; se puede decir que las consultas son tres veces m&aacute;s r&aacute;pidas que la versi&oacute;n anterior de InfoSphereWarehouse software; permite el an&aacute;lisis de datos tanto estructurados como no estructurados. SystemPureData permite cargar cinco terabytes en una hora [47]. </p>     <p><b><i>F.</i><i> Infosphere Information Server </i></b></p>     <p> Es una plataforma de integraci&oacute;n de datos, producto desarrollado por IBM; permite limpiar y transformar datos, para luego entregar informaci&oacute;n confiable a la empresa o negocio. Esta herramienta permite trabajar inteligencia de negocios, facilitando la mejor toma de decisiones; ayuda en el almacenamiento de los datos; reduce costos de operaci&oacute;n, al permitir f&aacute;cilmente la relaci&oacute;n entre los sistemas, de manera que proporciona informaci&oacute;n a otras aplicaciones y a procesos de negocios, lo cual trae consigo mayor agilidad en el negocio de la empresa, es decir, lo que sucede es una transformaci&oacute;n del negocio en la empresa [46, 47, 45]. </p>     <p><b><i>G.</i><i> Sap Hana </i></b></p>     <p> Sap Hana (System Applications Products High-Performance Analytic Appliance) es una herramienta para el an&aacute;lisis de Big Data, la cual se compone de hardware y software, con gran velocidad de procesamiento de datos y en los tiempos de respuesta cuando de consultas se trata; lo anterior debido a que para el procesamiento de datos usa tecnolog&iacute;a in-memory [6]. Esta tecnolog&iacute;a permite realizar procesamiento de grandes cantidades de datos en la memoria principal del servidor, lo cual trae consigo ofrecer resultados con mayor prontitud, comparados con datos almacenados en el disco del servidor. La tecnolog&iacute;a in-memory promete un desempe&ntilde;o entre diez y veinte veces m&aacute;s veloz que los modelos tradicionales basados en disco [48, 49]. </p>     <p><b><i>H.</i><i> Oracle Big Data Appliance </i></b></p>     ]]></body>
<body><![CDATA[<p> Es un software desarrollado por la empresa Oracle, que combina hardware con software optimizado, ofreciendo una soluci&oacute;n completa y f&aacute;cil de implementar para la organizaci&oacute;n de Big Data. En la parte de hardware, est&aacute; compuesto por un rack de 18 servidores; cada servidor tiene 64 GB de memoria, es decir, el rack tiene 1,152 GB de capacidad total de memoria. Adem&aacute;s, cada servidor tiene dos CPU, y cada uno con ocho n&uacute;cleos, es decir, que en su totalidad posee 288 n&uacute;cleos el rack [50]. </p>     <p><b><i>I.</i><i> HDinsight </i></b></p>     <p> Es un producto Microsoft, basado en Hadoop, permite gestionar datos estructurados y no estructurados de cualquier tama&ntilde;o, que se pueden llegar a combinar perfectamente con herramientas de Inteligencia de Negocios de Microsoft, fortaleciendo de esta forma los servicios a usuarios y p&uacute;blico en general con ayuda de software como Office y SharePoint [24]. </p>     <p><b><i>J.</i><i> Textalytics </i></b></p>     <p> Textalytics es un software desarrollado por Daedalus (Data Decisions and Language S. A.), dedicado al an&aacute;lisis de texto; extrae con facilidad significado de lo escrito en medios sociales y todo tipo de documentos. Dichos datos se transforman en modelos estructurados para poder ser procesados y gestionados con facilidad. Textalytics, permite realizar tareas tales como extracci&oacute;n de conceptos, relaci&oacute;n entre conceptos, correcci&oacute;n ortogr&aacute;fica, correcci&oacute;n gramatical, correcci&oacute;n de estilo, entre otras funciones, es Multiidioma, pues acepta contenidos en espa&ntilde;ol, ingl&eacute;s, franc&eacute;s y otros idiomas [51]. </p>     <p align="center"><font size="3"><b>VII. Beneficios del Big Data</b></font></p>      <p> Las empresas que saben sacar provecho del Big Data pueden mejorar su estrategia y as&iacute; permanecer en el mercado posicionadas, pues har&aacute; uso de nuevos conocimientos, con el gran volumen de datos o informaci&oacute;n que maneja a diario, que inicialmente no se les dio la suficiente importancia, por no tener una herramienta tecnol&oacute;gica que permitiera procesarla. Con la tecnolog&iacute;a de Big Data, las empresas pueden ofrecer mejores productos, desarrollar excelentes relaciones con sus clientes, adem&aacute;s, se transforman en m&aacute;s &aacute;giles y competitivas [17]. </p>      <p>Es importante tener en cuenta algunos pasos para la implementaci&oacute;n de Big Data, como se menciona en [52]. </p> <ul>    <li>    <p>Entender el negocio y los datos. Este primer paso pide un an&aacute;lisis detallado con las personas que hoy laboran y entienden los procesos y los datos que la empresa maneja. </p></li>     ]]></body>
<body><![CDATA[<li>    <p>El segundo paso consiste en determinar los problemas y c&oacute;mo los datos pueden ayudar. Al momento de conocer los procesos es muy posible que se encuentren los problemas de la empresa o del negocio. </p></li>     <li>    <p>Establecer expectativas razonables, es decir, definir metas alcanzables; esto se puede lograr si al implementar la soluci&oacute;n de un problema &eacute;ste no presenta alguna mejora, y se debe buscar otra soluci&oacute;n. </p></li>     <li>    <p>Existe una recomendaci&oacute;n especial, y es que cuando se inicia un proyecto de Big Data es necesario trabajar en paralelo con el sistema que hoy est&aacute; funcionando. </p></li>     <li>    <p>Al tratar de implementar un proyecto de Big Data se debe ser flexible con la metodolog&iacute;a y las herramientas; esto se debe a que las dos anteriores son recientes y pueden llegar a presentar problemas al implementarlas. Esto se puede solucionar realizando investigaci&oacute;n e inversi&oacute;n en este tipo de tecnolog&iacute;a. </p></li>     <li>    <p>Es importante mantener el objetivo de Big Data en mente; esto porque el proceso es pesado y porque no es tedioso, m&aacute;xime cuando los m&eacute;todos y herramientas que usan Big Data para el an&aacute;lisis de datos a&uacute;n pueden presentar problemas, y la idea es que se mantenga en mente la meta final del proyecto sin desanimarse pronto. </p></li>    ]]></body>
<body><![CDATA[</ul>     <p align="center"><font size="3"><b>VIII. Conclusiones</b></font></p>      <p> Dentro del estado del arte se encuentran desde diversas definiciones del t&eacute;rmino Big Data por parte de varios investigadores hasta las tecnolog&iacute;as existentes para iniciar un proyecto en una instituci&oacute;n de cualquier ramo productivo, comercial o educativo. </p>      <p>Se estudiaron y analizaron las herramientas tecnol&oacute;gicas que se pueden usar a la hora de desarrollar un proyecto de Big Data. Es as&iacute; como se pudieron observar empresas desarrolladoras de software que presentan herramientas para enfrentar proyectos de Big Data, con sus caracter&iacute;sticas. </p>     <p>Se 	pudieron identificar las caracter&iacute;sticas m&aacute;s importantes en la gesti&oacute;n de Big Data, desde los diferentes formatos de datos que hoy existen o se manejan por los usuarios, hasta conocer las tecnolog&iacute;as necesarias para convertir datos no estructurados en informaci&oacute;n y conocimiento que beneficie tanto a personas como a empresas en la toma de decisiones. </p>     <p>Dicha herramienta para tal labor es Hadoop, que, como se mencion&oacute; anteriormente, permite convertir datos poco &uacute;tiles en informaci&oacute;n estructurada, ayudando de esta forma a los tomadores de decisiones. </p>     <p>Parte de la investigaci&oacute;n arroj&oacute; que hoy existe un sinn&uacute;mero de herramientas tecnol&oacute;gicas para realizar an&aacute;lisis de datos, la gran mayor&iacute;a basadas en Hadoop, algunas en ambiente web y otras para escritorio, y algunas en ambiente de la nube. Se nota el esfuerzo que han realizado varias empresas desarrolladoras de software, al servicio de los usuarios. </p>     <p>Tambi&eacute;n se pudo conocer una metodolog&iacute;a para implementar un proyecto de Big Data, de forma que pueda servir de gu&iacute;a a quienes deseen sacarle un mayor usufructo a los datos y convertirlos en conocimiento,   que les sea &uacute;til a las empresas u organizaciones, buscando mayor beneficio en estrategias empresariales.</p>  <hr>     <p align="center"><font size="3"><b>Referencias</b></font></p>     <!-- ref --><p>[1] ZDNet.com, CBS Interactive, <i>What is "Big Data?"</i>. Disponible en: <a href="http://www.zdnet.com/topic-big-data/" target="_blank">http://www.zdnet.com/topic-big-data/</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000192&pid=S0121-1129201500010000600001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>      <!-- ref --><p>[2] thinkupapp.com, (2012). Disponible en: <a href="http://thinkupapp.com/" target="_blank">http://thinkupapp.com/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000194&pid=S0121-1129201500010000600002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[3] E. Dans. Disponible en: <a href="http://www.enriquedans.com/2011/10/big-data-una-pequena-introduccion.html" target="_blank">http://www.enriquedans.com/2011/10/big-data-una-pequena-introduccion.html</a>, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000196&pid=S0121-1129201500010000600003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[4] E. Plugge, P. Membrey &amp; T. Hawkins, <i>The </i><i>Definitive Guide to MongoDB: The NoSQL </i><i>Database for Cloud and Desktop Computing</i>, Published Apress Media LLC, New York, 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000198&pid=S0121-1129201500010000600004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[5] B. Hopkins, <i>Beyond the Hype of Big Data</i>. Disponible en: <a href="http://www.cio.com/article/692724/Beyond_the_Hype_of_Big_Data" target="_blank">http://www.cio.com/article/692724/Beyond_the_Hype_of_Big_Data</a>, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000200&pid=S0121-1129201500010000600005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[6] Business Software, Disponible en: <a href="http://www.businessoftware.net/que-es-big-data/" target="_blank">http://www.businessoftware.net/que-es-big-data/</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000202&pid=S0121-1129201500010000600006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[7] Zdnet.com, Big Data. Disponible en: <a href="http://www.zdnet.com/search?q=big+data" target="_blank">http://www.zdnet.com/search?q=big+data</a>, 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000204&pid=S0121-1129201500010000600007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[8] M. Salgado, Oracle apuesta por Big Data con tecnolog&iacute;a y proyectos. Disponible en: <a href="http://www.computerworld.es/big-data/oracle-apuesta-por-big-data-con-tecnologia-y-proyectos" target="_blank">http://www.computerworld.es/big-data/oracle-apuesta-por-big-data-con-tecnologia-y-proyectos</a>, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000206&pid=S0121-1129201500010000600008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[9] P. Russom, Big Data Analytics, TDWI (The Data Warehousing Institute), 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000208&pid=S0121-1129201500010000600009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[10] S. Montoro, Server and Cloud Platform. Disponible en: <a href="http://lapastillaroja.net/2012/02/NoSQL-for-non-programmers/" target="_blank">http://lapastillaroja.net/2012/02/NoSQL-for-non-programmers/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000210&pid=S0121-1129201500010000600010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[11] searchstorage.techtarget.com, <i>Examining HDFS and NameNode in Hadoop architecture</i>. Disponible en: <a href="http://searchstorage.techtarget.com/video/Examining-HDFS-and-NameNode-in-Hadoop-architecture" target="_blank">http://searchstorage.techtarget.com/video/Examining-HDFS-and-NameNode-in-Hadoop-architecture</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000212&pid=S0121-1129201500010000600011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[12] computerworld.es, Disponible en: <a href="http://www.computerworld.es/sociedad-de-la-informacion/el-mercado-del-big-data-crecera-hasta-los-32400-millones-de-dolares-en-2017" target="_blank">http://www.computerworld.es/sociedad-de-la-informacion/el-mercado-del-big-data-crecera-hasta-los-32400-millones-de-dolares-en-2017</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000214&pid=S0121-1129201500010000600012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[13] -01.ibm.com, <i>IBM Big Data and analytics platform.</i> Disponible en: <a href="http://www-01.ibm.com/software/data/bigdata" target="_blank">http://www-01.ibm.com/software/data/bigdata</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000216&pid=S0121-1129201500010000600013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[14] ibm.com, &iquest;Qu&eacute; es Big Data? Disponible en:   <a href="http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/index.html" target="_blank">http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/index.html</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000218&pid=S0121-1129201500010000600014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></p>     <!-- ref --><p>[15] es.wikipedia.org, <i>RFID</i>. Disponible en: <a href="http://es.wikipedia.org/wiki/RFID" target="_blank">http://es.wikipedia.org/wiki/RFID</a>, 2010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000220&pid=S0121-1129201500010000600015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[16] E. Redmond, &amp; J. Wilson, <i>Seven Databases in Seven Weeks</i>, USA: O'Reilly Media, Inc., Pragmatic Programmers, LLC. 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000222&pid=S0121-1129201500010000600016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[17] Emc.com, <i>Big Data transforms Business</i>. Disponible en: <a href="http://www.emc.com/microsites/ebook/index.htm#/slide-intro" target="_blank">http://www.emc.com/microsites/ebook/index.htm#/slide-intro</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000224&pid=S0121-1129201500010000600017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[18] T. Olavsrud, <i>Big Data Causes Concern and Big Confusion</i>. Disponible en: <a href="http://www.cio.com/article/700804/Big_Data_Causes_Concern_and_Big_Confusion?page=2&amp;taxonomyId=3002" target="_blank">http://www.cio.com/article/700804/Big_Data_Causes_Concern_and_Big_Confusion?page=2&amp;taxonomyId=3002</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000226&pid=S0121-1129201500010000600018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[19] hadoop.apache.org, Disponible en: <a href="http://hadoop.apache.org/" target="_blank">http://hadoop.apache.org/</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000228&pid=S0121-1129201500010000600019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[20] Chuck Lam, Hadoop in Action, Publisher: Manning Publications Co., Stamford, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000230&pid=S0121-1129201500010000600020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[21] Cloudera.com, Cloudera, Inc. Disponible en: <a href="http://www.cloudera.com/content/cloudera/en/why-cloudera/hadoop-and-big-data.html" target="_blank">http://www.cloudera.com/content/cloudera/en/why-cloudera/hadoop-and-big-data.html</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000232&pid=S0121-1129201500010000600021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[22] P. Zikopoulos, C. Eaton, D. DeRoos, T. Deutsch, &amp; G. Lapis, <i>Understanding Big Data</i>, USA: McGraw-Hill Books, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000234&pid=S0121-1129201500010000600022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[23] Universidad Sim&oacute;n Bol&iacute;var, <i>Laboratorio Docente de Computaci&oacute;n</i>. Disponible en: <a href="http://ldc.usb.ve/~ruckhaus/materias/ci7453/clase3.pdf" target="_blank">http://ldc.usb.ve/~ruckhaus/materias/ci7453/clase3.pdf</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000236&pid=S0121-1129201500010000600023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[24] Microsoft, <i>SharePoint</i>. Disponible en: <a href="http://office.microsoft.com/es-es/sharepoint/informacion-general-de-sharepoint-2013caracteristicas-del-software-de-colaboracionFX103789323.asp" target="_blank">http://office.microsoft.com/es-es/sharepoint/informacion-general-de-sharepoint-2013caracteristicas-del-software-de-colaboracionFX103789323.asp</a>, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000238&pid=S0121-1129201500010000600024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[25] S. Montoro, Disponible en: <a href="http://www.versioncero.com/articulo/596/almacenamientodistribuido-no-relacional" target="_blank">http://www.versioncero.com/articulo/596/almacenamientodistribuido-no-relacional</a>, 2009.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000240&pid=S0121-1129201500010000600025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[26] N. Dimiduk, &amp; A. Khurana, <i>HBase in Action</i>, USA: Manning Publications Co, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000242&pid=S0121-1129201500010000600026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[27] textalytics.com, <i>El motor de an&aacute;lisis de texto m&aacute;s f&aacute;cil de usar</i>. Disponible en: <a href="https://textalytics.com/inicio" target="_blank">https://textalytics.com/inicio</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000244&pid=S0121-1129201500010000600027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[28] C. Preimesberger, <i>eWeek.</i> Disponible en: <a href="http://search.proquest.com/view/885430073/1366B171EE72EDB474F/1?accountid=43790" target="_blank">http://search.proquest.com/view/885430073/1366B171EE72EDB474F/1?accountid=43790</a>, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000246&pid=S0121-1129201500010000600028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[29] Basho Technologies, Inc., Disponible en: <a href="http://docs.basho.com/riak/latest/" target="_blank">http://docs.basho.com/riak/latest/</a>, 2011-2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000248&pid=S0121-1129201500010000600029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[30] T. Juravich, <i>CouchDB and PHP Web Development Beginner's Guide</i>, Birmingham - Mumbai: Packt Publishing Ltd., 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000250&pid=S0121-1129201500010000600030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[31] L. Joyanes, <i>Big Data: An&aacute;lisis de grandes vol&uacute;menes de datos en organizaciones</i>, Editorial Alfaomega, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000252&pid=S0121-1129201500010000600031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[32] networkworld.com, <i>9 Open Source Big Data Technologies to Watch</i>. Disponible en: <a href="http://www.networkworld.com/slideshow/51090/" target="_blank">http://www.networkworld.com/slideshow/51090/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000254&pid=S0121-1129201500010000600032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[33] K. Chodorow, <i>MongoDB: The Definitive Guide</i>, Second Edition, USA: O'Reilly Media, Inc., 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000256&pid=S0121-1129201500010000600033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>      <!-- ref --><p>[34] S. Francia, <i>MongoDB and PHP</i>, USA: O'Reilly Media, Inc., 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000258&pid=S0121-1129201500010000600034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>      <!-- ref --><p>[35] BaseXTeam, Disponible en: <a href="http://basex.org/products/download/all-downloads/" target="_blank">http://basex.org/products/download/all-downloads/</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000260&pid=S0121-1129201500010000600035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[36] P. Karl, <i>Moving Media Storage Technologies: </i><i>Applications &amp;Workflows for Video and Media </i><i>Server Platforms</i>, USA: Elsevier, Inc, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000262&pid=S0121-1129201500010000600036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[37] Adelman Sid, Moss Larissa T., &amp; Abai Majid, <i>Data Strategy, </i>USA: Prentice Hall, 2005.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000264&pid=S0121-1129201500010000600037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[38] Developers.google.com, <i>Google BigQuery</i>. Disponible en: <a href="https://developers.google.com/bigquery/" target="_blank">https://developers.google.com/bigquery/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000266&pid=S0121-1129201500010000600038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[39] effectandaffect.es,<i> ThinkUp, un motor de an&aacute;lisis de datos.</i> Disponible en: <a href="http://www.effectandaffect.es/blog/thinkup-motor-analisis-datos/" target="_blank">http://www.effectandaffect.es/blog/thinkup-motor-analisis-datos/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000268&pid=S0121-1129201500010000600039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[40] T. White, <i>Hadoop: The Definitive Guide</i>, USA: O'Reilly, Media, Inc, 2009.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000270&pid=S0121-1129201500010000600040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[41] T. Rodr&iacute;guez, Amazon lanza DynamoDB, una base de datos NoSQL desarrollada internamente. Disponible en: <a href="http://www.genbetadev.com/programacion-en-la-nube/amazon-lanza-dynamodb-una-base-de-datos-NoSQL-desarrollada-integramente-por-ellos" target="_blank">http://www.genbetadev.com/programacion-en-la-nube/amazon-lanza-dynamodb-una-base-de-datos-NoSQL-desarrollada-integramente-por-ellos</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000272&pid=S0121-1129201500010000600041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[42] The Apache Software Foundation, Welcome to Apache Cassandra. Disponible en: <a href="http://cassandra.apache.org/" target="_blank">http://cassandra.apache.org/</a>, 2009.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000274&pid=S0121-1129201500010000600042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[43] The Apache Software Foundation, <i>ApacheHBase</i>. Disponible en: <a href="http://hbase.apache.org/" target="_blank">http://hbase.apache.org/</a>, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000276&pid=S0121-1129201500010000600043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[44] -03.ibm.com, InfoSphere Streams. Disponible en: <a href="http://www-03.ibm.com/software/products/en/infosphere-streams" target="_blank">http://www-03.ibm.com/software/products/en/infosphere-streams</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000278&pid=S0121-1129201500010000600044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[45] project-voldemort, Voldemort is a distributed key-value storage system. Disponible en: <a href="http://www.project-voldemort.com/voldemort/" target="_blank">http://www.project-voldemort.com/voldemort/</a>, 2014.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000280&pid=S0121-1129201500010000600045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[46] IBM International Business Machines Corporation, IBM InfoSphere Information Server. Disponible en: <a href="http://www-01.ibm.com/software/data/integration/info_server/" target="_blank">http://www-01.ibm.com/software/data/integration/info_server/</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000282&pid=S0121-1129201500010000600046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[47] IBM Corporation Software Group Route 100 Somers, <i>IBM PureData System for Operational Analytics</i>. NY 10589. Disponible en: <a href="http://public.dhe.ibm.com/common/ssi/ecm/en/wad12351usen/WAD12351USEN.PDF" target="_blank">http://public.dhe.ibm.com/common/ssi/ecm/en/wad12351usen/WAD12351USEN.PDF</a>, 2012.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000284&pid=S0121-1129201500010000600047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[48] Mari&ntilde;o E., <i>Business Software, In-Memory: </i><i>edificaci&oacute;n de una empresa que opera en </i><i>tiempo real</i>. Disponible en: <a href="http://www.americaeconomia.com/analisis-opinion/memory-edificacion-de-una-empresa-que-opera-en-tiempo-real" target="_blank">http://www.americaeconomia.com/analisis-opinion/memory-edificacion-de-una-empresa-que-opera-en-tiempo-real</a>, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000286&pid=S0121-1129201500010000600048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[49] itelligence AG, <i>SAP In-Memory Computing</i>. Disponible en: <a href="http://www.itelligence.es/14878.php" target="_blank">http://www.itelligence.es/14878.php</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000288&pid=S0121-1129201500010000600049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[50] J. P. Dijcks, <i>Oracle: Big Data for the Enterprise</i>. Disponible en: <a href="http://www.oracle.com/technetwork/database/bigdata-appliance/overview/wp-bigdatawithoracle-1453236.pdf?ssSourceSiteId=ocomes" target="_blank">http://www.oracle.com/technetwork/database/bigdata-appliance/overview/wp-bigdatawithoracle-1453236.pdf?ssSourceSiteId=ocomes</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000290&pid=S0121-1129201500010000600050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[51] StackpoleBeth, Disponible en: <a href="http://www.cio.com.mx/Articulo.aspx?id=13527" target="_blank">http://www.cio.com.mx/Articulo.aspx?id=13527</a>, 2011.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000292&pid=S0121-1129201500010000600051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[52] F. Carrasco, <i>Los 6 pasos que su organizaci&oacute;n </i><i>debe seguir para confiar en Big Data</i>. Am&eacute;rica Latina. Disponible en: <a href="http://www.cioal.com/2013/07/31/los-6-pasos-que-su-organizacion-debe-seguir-para-confiar-en-big-data/" target="_blank">http://www.cioal.com/2013/07/31/los-6-pasos-que-su-organizacion-debe-seguir-para-confiar-en-big-data/</a>, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000294&pid=S0121-1129201500010000600052&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p>     <!-- ref --><p>[53] P. Zikopoulos, D. deRoos, K. Parasuraman, T. Deutsch, D. Corrigan, &amp;J. Giles, <i>Harness the Power of Big Data</i>, McGraw-Hill Companies, 2013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000296&pid=S0121-1129201500010000600053&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </p> </font>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="">
<collab>ZDNet.com</collab>
<source><![CDATA[CBS Interactive, What is "Big Data?"]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<collab>thinkupapp.com</collab>
<source><![CDATA[]]></source>
<year>2012</year>
<month>20</month>
<day>12</day>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dans]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Plugge]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Membrey]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Hawkins]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[The Definitive Guide to MongoDB: The NoSQL Database for Cloud and Desktop Computing]]></source>
<year>2010</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Published Apress Media LLC]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hopkins]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<source><![CDATA[Beyond the Hype of Big Data]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="">
<collab>Business Software</collab>
<source><![CDATA[]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="">
<collab>Zdnet.com</collab>
<source><![CDATA[Big Data]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salgado]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Oracle apuesta por Big Data con tecnología y proyectos]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Russom]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Big Data Analytics]]></source>
<year>2012</year>
<publisher-name><![CDATA[TDWI (The Data Warehousing Institute)]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montoro]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Server and Cloud Platform]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="">
<collab>searchstorage.techtarget.com</collab>
<source><![CDATA[Examining HDFS and NameNode in Hadoop architecture]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="">
<collab>computerworld.es</collab>
<source><![CDATA[]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="">
<collab>-01.ibm.com</collab>
<source><![CDATA[IBM Big Data and analytics platform]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="">
<collab>ibm.com</collab>
<source><![CDATA[¿Qué es Big Data?]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="">
<collab>es.wikipedia.org</collab>
<source><![CDATA[RFID]]></source>
<year>2010</year>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Redmond]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Wilson]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Seven Databases in Seven Weeks]]></source>
<year>2012</year>
<publisher-name><![CDATA[O'Reilly Media, IncPragmatic Programmers, LLC]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="">
<collab>Emc.com</collab>
<source><![CDATA[Big Data transforms Business]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Olavsrud]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[Big Data Causes Concern and Big Confusion]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="">
<collab>hadoop.apache.org</collab>
<source><![CDATA[]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="book">
<source><![CDATA[Chuck Lam, Hadoop in Action]]></source>
<year>2011</year>
<publisher-loc><![CDATA[Stamford ]]></publisher-loc>
<publisher-name><![CDATA[Manning Publications Co]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="book">
<collab>Cloudera.com</collab>
<source><![CDATA[]]></source>
<year>2013</year>
<publisher-name><![CDATA[Cloudera, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zikopoulos]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Eaton]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[DeRoos]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Deutsch]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[Lapis]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[Understanding Big Data]]></source>
<year>2012</year>
<publisher-name><![CDATA[McGraw-Hill Books]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="">
<collab>Universidad Simón Bolívar</collab>
<source><![CDATA[Laboratorio Docente de Computación]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="">
<collab>Microsoft</collab>
<source><![CDATA[SharePoint]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montoro]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dimiduk]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[Khurana]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[HBase in Action]]></source>
<year>2013</year>
<publisher-name><![CDATA[Manning Publications Co]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="">
<collab>textalytics.com</collab>
<source><![CDATA[El motor de análisis de texto más fácil de usar]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Preimesberger]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[eWeek]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="book">
<source><![CDATA[]]></source>
<year>2011</year>
<month>20</month>
<day>14</day>
<publisher-name><![CDATA[Basho Technologies, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<label>30</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Juravich]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[CouchDB and PHP Web Development Beginner's Guide]]></source>
<year>2012</year>
<publisher-loc><![CDATA[BirminghamMumbai ]]></publisher-loc>
<publisher-name><![CDATA[Packt Publishing Ltd]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B31">
<label>31</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Joyanes]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Big Data: Análisis de grandes volúmenes de datos en organizaciones]]></source>
<year>2013</year>
<publisher-name><![CDATA[Editorial Alfaomega]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B32">
<label>32</label><nlm-citation citation-type="">
<collab>networkworld.com</collab>
<source><![CDATA[9 Open Source Big Data Technologies to Watch]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B33">
<label>33</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chodorow]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
</person-group>
<source><![CDATA[MongoDB: The Definitive Guide]]></source>
<year>2013</year>
<edition>Second</edition>
<publisher-name><![CDATA[O'Reilly Media, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B34">
<label>34</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Francia]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[MongoDB and PHP]]></source>
<year>2012</year>
<publisher-name><![CDATA[O'Reilly Media, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B35">
<label>35</label><nlm-citation citation-type="book">
<source><![CDATA[]]></source>
<year>2013</year>
<publisher-name><![CDATA[BaseXTeam]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B36">
<label>36</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Karl]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Moving Media Storage Technologies: Applications &Workflows for Video and Media Server Platforms]]></source>
<year>2011</year>
<publisher-name><![CDATA[Elsevier, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<label>37</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sid]]></surname>
<given-names><![CDATA[Adelman]]></given-names>
</name>
<name>
<surname><![CDATA[Moss Larissa]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Majid]]></surname>
<given-names><![CDATA[Abai]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Strategy]]></source>
<year>2005</year>
<publisher-name><![CDATA[Prentice Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B38">
<label>38</label><nlm-citation citation-type="">
<collab>Developers.google.com</collab>
<source><![CDATA[Google BigQuery]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B39">
<label>39</label><nlm-citation citation-type="">
<collab>effectandaffect.es</collab>
<source><![CDATA[ThinkUp, un motor de análisis de datos]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B40">
<label>40</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[White]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[Hadoop: The Definitive Guide]]></source>
<year>2009</year>
<publisher-name><![CDATA[O'Reilly, Media, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B41">
<label>41</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<source><![CDATA[Amazon lanza DynamoDB, una base de datos NoSQL desarrollada internamente]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B42">
<label>42</label><nlm-citation citation-type="">
<source><![CDATA[The Apache Software Foundation, Welcome to Apache Cassandra]]></source>
<year>2009</year>
</nlm-citation>
</ref>
<ref id="B43">
<label>43</label><nlm-citation citation-type="book">
<source><![CDATA[The Apache Software Foundation]]></source>
<year>2014</year>
<publisher-name><![CDATA[ApacheHBase]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B44">
<label>44</label><nlm-citation citation-type="">
<collab>-03.ibm.com</collab>
<source><![CDATA[InfoSphere Streams]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B45">
<label>45</label><nlm-citation citation-type="">
<source><![CDATA[project-voldemort, Voldemort is a distributed key-value storage system]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B46">
<label>46</label><nlm-citation citation-type="book">
<collab>IBM International Business Machines Corporation</collab>
<source><![CDATA[]]></source>
<year>2012</year>
<publisher-name><![CDATA[IBM InfoSphere Information Server]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B47">
<label>47</label><nlm-citation citation-type="">
<collab>IBM Corporation Software Group Route 100 Somers</collab>
<source><![CDATA[IBM PureData System for Operational Analytics]]></source>
<year>2012</year>
</nlm-citation>
</ref>
<ref id="B48">
<label>48</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mariño]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<source><![CDATA[Business Software, In-Memory: edificación de una empresa que opera en tiempo real]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B49">
<label>49</label><nlm-citation citation-type="">
<collab>itelligence AG</collab>
<source><![CDATA[SAP In-Memory Computing]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B50">
<label>50</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dijcks]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Oracle: Big Data for the Enterprise]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B51">
<label>51</label><nlm-citation citation-type="">
<collab>StackpoleBeth</collab>
<source><![CDATA[]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B52">
<label>52</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carrasco]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
</person-group>
<source><![CDATA[Los 6 pasos que su organización debe seguir para confiar en Big Data]]></source>
<year>2013</year>
</nlm-citation>
</ref>
<ref id="B53">
<label>53</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zikopoulos]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[DeRoos]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Parasuraman]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Deutsch]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[Corrigan]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Giles]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Harness the Power of Big Data]]></source>
<year>2013</year>
<publisher-name><![CDATA[McGraw-Hill Companies]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
