Es normal que en cualquier ámbito de la vida existan roles para definir el alcance y los límites que tiene una persona dentro de un contexto. En parte es lo que hacemos cuando le damos nombre a las profesiones, no tiene las mismas responsabilidades un desarrollador que un tester de calidad, por ejemplo.

Dentro del ámbito del Big Data específicamente ocurre lo mismo, existen varios roles dependiendo de las responsabilidades que tengas en este tipo de proyecto. En este artículo vamos a explicar alguno de ellos.

Ingeniero de datos

Data engineer

Este rol es el encargado de obtener y guardar los datos. Esto incluye preparar los pipelines para la extracción de datos automática desde cada fuente con el objetivo de unificar nuestro centro de datos. En resumen, extraer, transformar y guardar los datos crudos, crear un buen data lake.

Esto quiere decir que este rol ha de conocer tecnologías en la nube como Amazon S3, Azure storage, kafka, spark y hadoop entre otros.

Científico de datos

Data scientist

Es un profesional que evalúa, genera, divide e integra el conocimiento del negocio y los datos que se guardan del mismo (en el data lake ya mencionado). Básicamente diseña modelos analíticos, define algoritmos y queries con el objetivo de mejorar el negocio en cuestión.

Tienen conocimientos en programación y diferentes herramientas estadísticas como SPSS. Además de estos conocimientos, un científico de datos ha de saber sobre matemática y estadística para poder diseñar estos modelos de forma correcta.

Arquitecto de datos

Data Architect

Se encargan de que el ecosistema big data funcione correctamente y con la menor fricción posible. Organiza, administra, maneja y gobierna la infraestructura Big Data en grandes clusters.

Necesita tener experiencia en Java, MapReduce, Hive, HBase, PIG, Sqoop, Linux/Unix, configuración del cluster, nodos de datos, etc.

Otros roles

Aparte de los roles ya mencionados, podremos escuchar nombrar otros como desarrollador (data developer), ingeniero de machine learning, analista de datos, desarrollador de visualización de datos (data visualization developer) en función de las necesidades de cada empresa y la especialización que requiera el puesto.

¡Si crees que nos hemos dejado algún rol relevante no dudes en decirlo por cualquiera de nuestras redes sociales!

Recursos consultados

Te dejo la lista de enlaces que he consultado para escribir este artículo aparte de mi propia experiencia.

Big Data Roles & Job Responsibilities - Different Types Of Big Data Jobs

Job Roles and Responsibilities in Big Data | Career in Big Data

Job Roles Big Data - Roles and Responsibilities in Big data jobs

Data Engineer vs. Data Scientist: What They Do and How They Work Together

Data Scientist vs. Data Engineer: What’s the Difference?