Actualmente, la profesión de ingeniería en big data es una de las especializaciones con más demanda en el mercado global. En el último informe de Jobs Report de LinkedIn, se coloca dentro de las 15 ocupaciones más destacadas de los últimos cinco años.
Pero, realmente ¿sabemos de qué se ocupa un ingeniero de datos? Para empezar, un ingeniero de datos es el encargado de diseñar, construir y gestionar los datos en una organización. Su principal labor consiste en configurar la infraestructura tecnológica, para que los datos no estructurados se conviertan en materia accesible para otros especialistas en big data.
¿Cómo es el día de un ingeniero en big data?
Principalmente su día a día se basa en extraer, transformar y cargar datos, también conocido como proceso ETL (Extract, Transform, Load). Mediante dicho proceso apoya y facilita el trabajo a científicos y analistas de datos.
¿En qué consiste el proceso ETL?
El proceso consta de tres pasos:
1. Extracción:
Es el primer paso del proceso, y busca como objetivo sintetizar toda la información en estructuras comunes, dejando los datos homogeneizados y organizados.
2. Transformación:
En esta fase se empieza a añadir valor a la data extraída, siguiendo el modelo de negocio de la empresa u organización. Es decir, deberán ser clasificados, normalizados y verificados según el tipo de empresa.
3. Carga:
Es el último paso del proceso ETL. Consiste en cargar los datos en un servidor propio de la empresa o en un Data Warehouse en la nube. A partir de este punto, los datos estarán listos para ser utilizados por las distintas áreas de la organización.
¿Qué formación necesito para trabajar como ingeniero en Big Data?
Para poder trabajar como ingeniero de datos, deberás tener una formación en ADE, ingeniería, matemáticas o estadística, así como, una formación superior o un Máster en Big Data.