Estudiar Big Data

Estudiar Big Data

Hace unos 15 años, tal vez alguno menos, conocí el concepto de Business Intelligence (BI). Trabajaba para una empresa de formación que me ofreció impartir un curso de esta materia. En aquel momento el concepto BI se traducía en la práctica como el análisis de un gran volumen de datos. La empresa cliente era una de las más grandes de España.

Hoy en día, al análisis masivo de datos lo llamamos Big Data, y tenemos nuevas herramientas tecnológicas de software para acercarnos a su análisis. En aquél momento se veía venir, ahora es una realidad que una empresa grande o mediana, que almacena una gran cantidad de información, necesita sacar provecho de su know-how oculto en los datos para sobrevivir en un mercado altamente competitivo.

De hecho la necesidad de extraer información de datos más o menos desestructurados ha venido de la mano con el aumento de la capacidad de  almacenamiento de información (abaratamiento de costes de almacenamiento) y con el aumento de la generación de información que nos proporcionan tanto las nuevas herramientas de marketing social existentes como el aumento de los dispositivos conectados (IoT).

Como hacemos de vez en cuando en Loogic, hablamos de cursos de formación de terceros, y en este caso os presento el  Master Big Data de la Universidad Complutense de Madrid. Consta de 530 horas de formación presencial los viernes y sábados para compatibilizarlo con el trabajo. Es una buena oportunidad si estás pensando en evolucionar tu carrera profesional hacia un sector que hoy por hoy sólo tiene a la vista una curva de crecimiento enorme.

El mercado del Big Data no ha hecho más que empezar, y el mercado de los especialistas en análisis de datos experimentará un crecimiento exponencial. Lo podemos encontrar con otros nombres como Data Science o Machine Learning (este último más relacionado con la Inteligencia Artificial), y en un sinfín de nombres diferentes si nos referimos a puestos de trabajo. De hecho la gran variedad de nombres para el mismo trabajo (o muy parecido) es un indicador de que el sector tiene una gran amplitud. Pero el destino es el mismo: ser capaz de sacar información de valor de un montón de información aparentemente inconexa.

Para hacer este trabajo son necesarias dos cosas. Por un lado conocer en profundidad las herramientas de software necesarias para procesar y analizar los datos. Por otro, la mentalidad analítico-científica de plantear hipótesis para buscar su validación (o no), y para ser capaces de evitar sacar conclusiones precipitadas o alteradas por factores que no se han tenido en cuenta en el estudio de cada caso. Ambas tareas se pueden aprender, pero para eso hay que practicar.

Si quieres estudiar Big Data, en lo que se refiera a herramientas de software, deberías empezar por aprender el lenguaje de programación Python. Curiosamente este lenguaje de programación no es nada nuevo sino que comenzó a desarrollarse al final de los años ochenta. Ha evolucionado mucho desde entonces y se ha convertido en un paradigma de lenguaje de programación flexible muy adaptable al desarrollo de algoritmos. A la vez que se ha convertido en un lenguaje actual y moderno, tiene la ventaja de que su aprendizaje es sencillo si lo comparamos con otros lenguajes de programación. De hecho es el lenguaje recomendado para empezar a aprender programación para todo aquél que no tenga nociones previas.

A partir de aquí hay multitud de herramientas que se deben conocer para analizar grandes volúmenes de datos, y existen herramientas de código libre (bibliotecas de código, bases de datos, etc) específicamente desarrolladas y adaptadas para el análisis de Big Data.

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *