En los últimos años se ha hablado muchísimo del Big Data y ha quedado ahora en la conciencia colectiva pero realmente saben que es el “Big Data”?
La Big Data se definió como una masiva cantidad de información almacenada de forma estructurada o no estructurada con la intención de analizar los datos y obtener la mayor información posible para mejorar las decisiones empresariales.
Ahora que ya tenemos una ligera idea de que es Big Data es tiempo de darnos un breve recorrido de a través de los sucesos más importantes que ocurrieron como antecedentes de esta tecnología.
Alan Turing
Si hablamos de computación e historia es imposible dejar de lado al padre de la computación, allá por los años 30 soñó con una computadora capaz de ejecutar tareas una tras otra de manera autónoma lo cual era algo un poco ridículo para los tiempos que corrían pero hoy en día en más que una realidad la idea de este genio de la computación.
Alan fue participe en la segunda guerra mundial desarrollando un modo de descifrar los mensajes de los alemanes y según los expertos esto acorto la segunda guerra mundial al menos 2 años y así comenzó.
Durante y después de la segunda guerra mundial
La segunda guerra mundial es un buen parte aguas para los avances comunicacionales ya que después de que termino esta se pudieron destinar los esfuerzos científicos fuera de los campos militares y aquí algunos de ellos
- 1940: El problema con las bibliotecas. Las bibliotecas son las primeras instituciones modernas dedicadas al almacenamiento de información y con el aumento de esta tuvieron que desarrollar mejores modelos de búsqueda, he aquí los primeros indicios del aumento de información.
- 1956: Memoria Virtual. El físico alemán Fritz Rudolf Güntsch crea una forma de manejar memoria finita como memoria infinita, esencial para poder procesar información sin límite.
- 1961: Conocimiento científico. El científico Derek Price declaro que la llamada revolución científica como el aumento de la comunicación de información científica iba a ser la responsable que los registros creados se duplicaran cada 15 años
- 1962: Reconocimiento de voz. William C. Dersch de IBM presenta la primera máquina de reconocimiento de voz la cual podía reconocer 16 palabras y 10 dígitos del idioma inglés.
- 1966: Sistemas centralizados. EL sector de los negocios estaba en crecimiento y empiezan a adoptar la computación desarrollando sistemas que les permite automatizar la administración de sus inventarios.
- 1970: Base de datos. Edgar F. Codd. Ingeniero de IBM presenta un informe donde dicta que existe una forma de acceder a data sin saber siquiera donde se encontraba cosa que para la época debías tener conocimientos avanzados de ingeniería.
- 1980: En una charla, I. A. Tjomsland comentó la primera Ley de Parkinson. Esta dice que “el trabajo se expande hasta llenar el tiempo disponible para que se termine”. Se podía parafrasear para la industria de aquella época de la siguiente manera: “Los datos se expanden hasta llenar el espacio disponible para el almacenamiento”.
Nacimiento y explosión de WWW
La creación de WWW (Word Wide Web) es un punto de inflexión en la historia del big data pues es la fuente de la data.
- 1989: La World Wide Web nace de la mano de Tim Berners-Lee. Es el sistema que distribuye documentos de hipertexto accesibles a través de Internet.
- 1992: Crystal Reports crea el primer informe de base de datos fácil de interpretar, y con esto se vuelve fácil y asequible integrar sistemas de base de datos.
- 1995: En esta década se produce un boom tecnológico y esto se vio reflejado en un aumento de los archivos de Word Excel.
- 1997: Big Data es mencionado por primera vez en un artículo de la NASA en donde se afirmó que el crecimiento de los datos se estaba convirtiendo en un real problema para el procesamiento de estos mismos
- 1997: Michael Lesk public el libro How much information is there in the world? Y llega a la conclusión de que para el 2000 se crearan peta bytes y que la producción de cinta magnética alcanzara la información creada y no habrá necesidad de borrar nada y que la mayoría de la información nunca será consultada por un humano.
- 1999: Internet de las cosas. Kevin Ashton acuño el termino IOT (internet of thing) con las siguientes palabras “si tuviéramos equipos que supieran todo lo que hay que saber de las cosas, a partir de los datos recopilados sin nuestra ayuda, seriamos capaces de monitorear todo, y así reducir considerablemente los costes, desperdicios y las perdidas”
- 2001: Doug Laney publica el articulo 3D Data Management: Controlling Data Volume, Velocity and Variety conocido hoy como las 3 “V” siendo las dimensiones del big data
- 2006: Hadoop. Nace Hadoop por la necesidad de la creación de nuevos programas para gestionar los datos generados en la web, Hadoop es de código abierto y permite el procesamiento en paralelo distribuido de enormes cantidades de información.
- 2009: Linked Data. Tem Berners-Lee uso por primera vez el término “Linked date” que describe un método de publicación de datos estructurados para que se puedan ínter-conectar y leídos automáticamente con datos externos
- 2011: #IBMBIGDATA IBM creo el hashtag #IBMBIGDATA para discutir o simplemente hablar acerca del tema
- 2012: Política. Este año fue un buen año para el “big data” ya que fue parte de la campaña política del ex-presidente Barack Obama
- 2014: Geo Localización. Nació la geo localización y con ella un nuevo campo de investigación
- 2015: Smart Cities. Las ciudades inteligentes se hacen presentes y cada vez más dispositivos inteligentes se conectan a la red
El futuro del big data
Se espera que la generación de datos para el 2020 aumente en un 4300% y también para ese mismo año se predice que habrá más de 25000 millones de dispositivos conectados a Internet lo cual se traduce en mucha información que tiene esta tecnología para poder procesar