Si sigues el Blog MBA USP/Esalq, entonces ya sabes algunas informaciones importantes sobre Data Science, ¿no? ¿Pero sabes exactamente cuál es la importancia de la ingeniería de datos para esa ciencia?
Conversamos con Jeronymo Marcondes, profesor del MBA en Data Science y Analytics USP/Esalq que explicó por qué la ingeniería de datos es tan importante para los proyectos de Data Science.
¿Pero antes, si todavía no viste, que tal verificar los 3 pilares de Data Science para quien quiere destacarse?
¿Qué es?
Después de todo, ¿sabes lo que es ingeniería de datos? Según Marcondes: “Es el nombre que damos al área que trabaja los datos para el científico de datos. Básicamente, ingenieros de datos realizan los procesos de extracción, transformación y carga de datos (extract, transform, load – ETL).
Es el ingeniero de datos que garantiza que los datos lleguen listos para ser utilizados por los científicos de datos.
¿Para qué sirve?
¿Y qué los científicos de datos hacen con las informaciones que llegan hasta ellos a partir de la ingeniería de datos? Bien, Data Science es un concepto bastante amplio y complejo de resumir. Pero Marcondes busca elucidar algunos procesos importantes.
“En términos generales, los científicos de datos trabajan con previsiones e inferencias. A partir de conocimientos multidisciplinares como matemáticas, computación y estadística, el científico de datos busca captar, almacenar y procesar informaciones con base en datos, pudiendo ser generadas esas previsiones e inferencias”, explica.
La relación de la ingeniería de datos con los procesos
La ingeniería de datos es responsable, entonces, por crear los procesos que generan los bancos de datos a partir de ETLs.
“El mantenimiento de esos procesos, la optimización de respuesta de los datos y la arquitectura de alimentación de los sistemas son algunos ejemplos de otras atribuciones del ingeniero de datos. Resumiendo, el ingeniero de datos va a garantizar que los datos que serán utilizados por los científicos de datos estén actualizados, disponibles y con una arquitectura eficiente, lo que facilita la consulta de estos”, detalle Marcondes.
El profesional de la ingeniería de datos
¡Y si estás preguntando qué características son importantes para el ingeniero de datos, el profesor da la pista!
“Creo que las principales características son: pensamiento analítico, conocimientos profundos de bancos de datos y métodos de almacenamiento y transferencia de datos y, principalmente, voluntad de resolver problemas. Esa última es la principal característica, en mi opinión.»
La ingeniería de datos en las crisis
Según Marcondes, la pandemia de Covid-19 fue un buen ejemplo de la importancia de la ingeniería de datos. “Mucha gente fue para el home office y necesitó que los datos a ser utilizados por una empresa estuvieran disponibles a distancia”, pondera.
¿Cómo garantizar bancos de datos eficientes para los científicos de datos? ¿Cómo garantizar que los datos a ser utilizados por los funcionarios y por las aplicaciones mantengan su eficiencia en la consulta?
El profesor responde: “A pesar del papel indispensable de los profesionales de infraestructura de TI (Tecnología de la Información), el papel del ingeniero de datos fue fundamental en esos momentos.
¿Ya conocías el trabajo del profesional de ingeniería de datos? ¿Qué te pareció? ¡Deje su comentario!