Conoce el perfil de los científicos de datos y su papel en la 4ta revolución industrial

Los científicos de datos o Data Scientists, son una nueva generación de expertos en datos analíticos que tienen las habilidades técnicas para resolver problemas complejos, y la curiosidad de explorar qué problemas necesitan ser resueltos.

Son en parte matemáticos, en parte informáticos y en parte localizadores de tendencias. Y, debido a que se encuentran tanto en el mundo de los negocios como en el de las TI, son muy solicitados y bien remunerados. ¿Quién no querría ser uno de ellos?

También son un signo de los tiempos. Los científicos de datos no estaban en muchos radares hace una década, pero su repentina popularidad refleja cómo las empresas piensan ahora sobre los grandes datos. No se puede seguir ignorando y olvidando esa masa de información desestructurada y poco manejable. Es una mina de oro virtual que ayuda a aumentar los ingresos, siempre y cuando haya alguien que excave y descubra conocimientos empresariales que nadie pensó en buscar antes. Sonríe el científico de datos.

Muchos científicos de datos comenzaron sus carreras como estadísticos o analistas de datos. Pero a medida que los grandes datos (y las grandes tecnologías de almacenamiento y procesamiento de datos) comenzaron a crecer y a evolucionar, esos roles también evolucionaron. Los datos ya no son sólo una cuestión de última hora que debe tratar el departamento de TI. Es información clave que requiere análisis, curiosidad creativa y habilidad para traducir ideas de alta tecnología en nuevas formas de obtener beneficios.

El papel del científico de datos también tiene orígenes académicos. Hace unos años, las universidades comenzaron a reconocer que los empleadores querían personas que fueran programadores y jugadores de equipo. Los profesores ajustaron sus clases para acomodar esto, y algunos programas como el Instituto de Análisis Avanzado de la Universidad Estatal de Carolina del Norte, se prepararon para producir la siguiente generación de científicos de datos. Actualmente existen más de 60 programas similares en universidades de los Estados Unidos.

En términos más generales, un científico de datos es alguien que sabe cómo extraer el significado de los datos e interpretarlos, lo que requiere tanto herramientas y métodos de la estadística y el aprendizaje automático, como ser humano. Él o ella, pasan mucho tiempo en el proceso de recolectar, limpiar y masticar datos, porque los datos nunca están limpios. Este proceso requiere persistencia, estadísticas y habilidades de ingeniería de software, habilidades que también son necesarias para comprender los sesgos en los datos.

Una vez se ponen los datos en forma, una parte crucial es el análisis exploratorio de datos, que combina la visualización y el sentido de los datos. El científico de datos encuentra patrones, modelos de construcción y algoritmos; puede diseñar experimentos, y es una parte crítica de la toma de decisiones basada en datos. Se comunica con los miembros del equipo, los ingenieros y los líderes en un lenguaje claro y con visualizaciones de datos, de modo que incluso si sus colegas no están inmersos en los datos mismos, entiendan las implicaciones.

Científicos de datos 4.0

La 4ª Revolución Industrial se anunció públicamente en 2011, y desde entonces, han aparecido muchos recursos en torno a la llamada Industria 4.0. Elementos como los Gemelos Digitales (Digital twins), el Internet de las Cosas (IoT) o los Sistemas Cibernéticos han entrado en escena como elementos inseparables, proporcionando los ingredientes necesarios para un cambio de paradigma en muchas áreas de fabricación.

Sobre todos estos componentes, los pioneros están relacionados con la analítica predictiva y la inteligencia artificial (IA), aplicadas directamente a casos de uso real que no pudieron ser resueltos hace tan sólo unos años. El mantenimiento predictivo, la visión artificial o los mecanismos de reconocimiento de patrones para identificar posibles fallos en tiempo real, son algunos ejemplos de los muchos casos de uso que se están aplicando en la nueva industria.

Por lo tanto, la ciencia de los datos se está convirtiendo en una herramienta valiosa para la industria con el fin de transformar la información en conocimiento. Los científicos de datos están desempeñando un papel fundamental en esta nueva forma de entender la actividad empresarial. Sin embargo, un nuevo desafío aparece cuando los ingenieros de datos deben enfrentar un problema en la industria: tienen que lidiar con procesos, procedimientos, operaciones, ciencia y casos específicos desconocidos donde se encuentran las respuestas que están buscando. Así, los científicos de datos llegan a ser como detectives que están desarrollando sus habilidades en diferentes escenarios de crimen en cada proyecto. Se debe agregar un nuevo conjunto de habilidades multidisciplinarias a la experiencia de los científicos de datos para proporcionar el valor agregado requerido en el análisis especializado de cada problema.

Cada industria requiere diferentes sistemas de aprendizaje automático y sistemas de aprendizaje profundo para obtener beneficios de la información disponible. Como ejemplo, el sector minorista está totalmente orientado al cliente y la oportunidad está detrás de las preferencias y necesidades del comprador, la entrega justo a tiempo y la minimización del stock. El procesamiento del lenguaje natural y el análisis de medios son herramientas ampliamente aceptadas para hacer sugerencias atractivas al consumidor final.

A pesar de los avances y del respectivo entendimiento, la actividad manufacturera definida por la Industria 4.0 es aún más compleja de lo que se piensa. Por ejemplo, el sector de la automoción interactúa con los proveedores y con la cadena de montaje (personas y robots) reduciendo los costes de almacenaje, mientras que la demanda del mercado debe ser satisfecha con la última tecnología en elementos de autocontrol, seguridad inteligente y confort.

El concepto de Industria Inteligente surge como una evolución impulsada desde la sociedad a la esfera de la fabricación y el comercio. Las toneladas de datos generados por los seres humanos y los dispositivos forzaron la aparición de avances tecnológicos específicos para gestionar y procesar la información heterogénea disponible en la red. Imágenes, geolocalizaciones, datos de redes sociales, estado del tráfico, pronósticos, tendencias de stock o documentos deben ser accesibles en tiempo real, así como sugerencias relacionadas con el tema que se está buscando. Este flujo continuo de conocimiento listo para ser consumido en tiempo real se ha convertido en una mercancía a la que no es posible renunciar.

Las peculiares características que aporta la industria 4.0 requieren que los especialistas que tienen que suministrar bienes a una sociedad acostumbrada a consumir conocimiento, cuiden también de un nuevo producto que está siendo envuelto con la salsa de la ciencia de la información como valor añadido en los bienes distribuidos. Los científicos de datos 4.0 deben conocer los algoritmos a aplicar sobre el ecosistema de datos y este hecho requiere ser multidisciplinar y especializado al mismo tiempo. Tienen la enorme misión de satisfacer la creciente demanda de servicios de ciencias de la información aplicados en todas partes.