La Ciencia de Datos es un área totalmente multidisciplinaria. Eso significa que profesionales de todos los segmentos de actuación o departamentos corporativos pueden y deben conocer los tres pilares de Data Science para contribuir con la toma de decisión, una de las habilidades más importantes para el profesional del futuro.
Antes de listar cuáles son esos tres pilares de Data Science y explicar la importancia de cada uno, ¿qué tal entender un poco sobre el contexto de los profesionales que buscan el MBA en Data Science y Analytics USP/Esalq y lo que el mercado de trabajo espera de ellos?
Quien explica todo eso es el profesor Luiz Paulo Fávero, que también es vicecoordinador USP del curso. “Es muy común encontrar en el postgrado en DSA alumnos de áreas como ciencia de la computación, ingeniería, estadística, ciencias sociales aplicadas, economía, administración, marketing, finanzas, contabilidad entre otras.
“Sin embargo, profesionales que, aparentemente, no tienen relación alguna con el área, como periodistas, médicos, dentistas, veterinarios y abogados, por ejemplo, también hacen uso directo o indirecto de los conceptos de la Ciencia de Datos para la toma de decisión», explica.
¿Trabajo sin datos?
Pensando en eso, el profesor es enfático al decir que, actualmente, es imposible trabajar sin tener en consideración la Ciencia de Datos. “Independientemente del sector, sea industria, comercio minorista, servicios, agronegocios o financiero, por ejemplo, hoy somos inundados por datos, estructurados o no, procedentes de diversas fuentes”, destaca Fávero.
Esas fuentes son clasificadas en:
- Primarias: como investigaciones con consumidores e investigaciones de satisfacción
- Secundarias: como datos de asociaciones, del Banco Central etc.
“Hoy, la cantidad de datos es tan grande, extensa y venida de múltiples fuentes, que no tiene sentido decir que una determinada área está más o menos relacionada con Data Science que otra.”
Estudio continuo y especializado
Todavía contextualizando antes de presentar los tres pilares de Data Science, Fávero compara, atentando a las debidas proporciones, el profesional de la Ciencia de Datos con la Medicina.
“El estudio en ese área es continuo y convertirse en un científico de datos es un arrojo muy grande. En analogía, los médicos pasan una vida estudiando sobre determinada área de especialización. En la Ciencia de Datos, también tenemos los especialistas.”
El profesor hizo una lista de ejemplos:
- Ingeniero de datos, responsable de la estructura o recopilación de los datos
- Ingeniero de Machine Learning, que trata los datos e implementa el algoritmo
- Ingeniero de software, que analiza el background para estructurar y analizar los datos
- Arquitecto de datos, que desarrolla toda la relación entre los datos
“Además de eso, todavía tenemos profesionales de tecnología de la información y estadística. Pero no quiere decir que profesionales de otras áreas no pueden entrar en el campo del Data Science, porque nada de eso tendría sentido si no tenemos en cuenta esa parte de estructuración y análisis de datos con enfoque en generación de outputs para toma de decisión”, completa.
Según Fávero, el conocimiento profundo y estratégico del negocio, incluso que sin mucho conocimiento sobre la implementación de determinado algoritmo o motivación estadística, por ejemplo, es esencial.
Pilares de Data Science
“La cuestión por detrás de la Ciencia de Datos involucra un análisis profundo para todas las esferas de la organización. Eso quiere decir que todas las áreas, departamentos y dirigentes necesitan entender la importancia del Data Science, de Analytics, del análisis de datos y del reconocimiento de patrones, que es de hecho el Machine Learning, para fines de determinación de modelos predictivos o modelos diagnósticos”, comenta el profesor.
“No cabe más llegar, por ejemplo, al departamento jurídico de una empresa, pedir un dato y los profesionales de ese área no tener tiempo o estar muy enfocados en otras actividades. Ellos necesitan entender que Data Science genera payback para toda la organización. Esa cuestión cultural es fundamental.»
Ahora sí, con esa fundamentación completa, vea los tres pilares de Data Science:
- Fundamentos: ellos son imprescindibles para saber exactamente lo que estamos implementando en término de código. Es preciso conocer los conceptos y fundamentos estadísticos, algebraicos , económicos, de cálculo, de investigación de operaciones entre otros.
- Implementación correcta de algoritmos: ese pilar se deriva del primero. Después de todo, sólo es posible implementar el código de forma eficiente si hay base en los fundamentos descritos arriba, independientemente del software utilizado (en el MBA en Data Science, utilizamos más el R; en el MBA en Digital Business USP/Esalq, es utilizado el Gretl. También existen opciones pagadas, como el Stata).
- Interpretación de outputs: el tercer pilar está relacionado a la obtención de resultados y a la capacidad de interpretarlos para fines de toma de decisión. Para eso, es importante tener conocimiento del negocio para poder extraer informaciones que van a orientar la asignación de recursos, por ejemplo.
Equilibrio es todo
Mucho cuidado aquí para no pensar que sólo porque los pilares de Data Science fueron presentados en un orden ellos necesariamente poseen una jerarquía entre sí. “Un pilar no es más importante que el otro. Es preciso prestar atención con el desbalancea de importancia entre ellos”, alerta Fávero.
“El pilar del fundamento, por ejemplo, es muy importante, pero por si sólo no hace con que sean traducidos de manera correcta los datos e informaciones que fundamentan la toma de decisión”, dice.
El segundo pilar que presentamos son las herramientas. Sin conocimiento de fundamentos, los profesionales pueden implementar algoritmos equivocados, que no tienen en consideración determinada naturaleza de una variable.
“Aquí en el MBA USP/Esalq nosotros no graduamos apretadores de código. Muchas personas anhelan en conocer inmediatamente los software, pero es preciso comenzar y conocer los fundamentos de cada tipo de técnica de Machine Learning y Analytics. A partir de eso, es posible implementar los códigos en el software elegido”, enfatiza el profesor.
Y sobre el pilar de los outputs, Fávero es claro: “Si usted no tiene condiciones de evaluar, por ejemplo, la naturaleza de los datos, la escala de medición de cada variable y la implementación, usted se hace un tomador de decisión vacío, completamente sin fundamento.»
Los principales errores de Analytics
Ahora que usted ya sabe cuáles son los pilares de Data Science y como ellos están interconectados, sepa que los principales errores de Analytics tienen que ver con el desequilibrio entre los pilares y el desconocimiento de buenas prácticas dentro de cada uno de ellos.
Fávero ejemplifica al hablar sobre técnicas de Machine Learning que tienen por fundamento la utilización de apenas un determinado tipo de variable, como la cuantitativa.
“Esa técnica, entonces, va a extraer un core a partir del tratamiento de la interrelación de variables cuantitativas, como el análisis de cluster, por ejemplo. Sin embargo, seguimos viendo profesionales del mundo académico y del mercado de trabajo que implementan algoritmos para generar clusters haciendo uso de variables cualitativas, implementando una ponderación arbitraria”, detalla.
El profesor continúa: “Esa ponderación arbitraria para variables que representan, por ejemplo, solamente diferencial semántico, hace con que los modelos surjan cada vez más de manera tendenciosa. Y, a partir de ahí, sigue la toma de decisión. Existen técnicas que tienen por prerrogativa el uso de variables apenas cualitativas, sólo con medidas de frecuencia, en porcentaje, por ejemplo. Sin necesitar atribuir pesos arbitrarios a las categorías.”
El profesional unicornio
Encontrar un científico de datos o un profesional de Ciencia de Datos que tenga dominio de los tres pilares de Data Science es muy raro. Por eso, son llamados de unicornios.
“Lo que vemos son los equipos ‘unicornios’, con profesionales distribuidos en funciones relacionadas a esos pilares. Así, es fundamental que las empresas reconozcan esas atribuciones, esas carreras, para que efectivamente las decisiones puedan ser más bien fundamentadas”, concluye.
¿Te gustó conocer los pilares de Data Science con quien entiende del asunto? Comente😊