¿Cómo difiere ser un científico de datos en todas las industrias?

Trabajé como científico de datos en las industrias de aerolínea y salud: planificación de redes aéreas y seguro de salud para ser más preciso.

La investigación de ciencia de datos y operaciones es bastante madura en todo el dominio de la aerolínea. Muchos de los modelos básicos y formulaciones se realizaron ya en la década de 1960, y los desafíos actuales giran en torno a lograr que trabajen para una situación del mundo real en lugar de una situación idealizada o de “juguete”. Por ejemplo, la dimensión de robustez es un área clave de la investigación en curso sobre una serie de problemas de las aerolíneas, aunque la parte de “maximizar los ingresos” podría haberse resuelto mucho antes. Esto significa que puede hablar con expertos existentes en el campo, leer documentos de investigación que han resuelto parcialmente su problema, asistir a conferencias donde todos se entienden entre sí. Reducir todo a ecuaciones y números teniendo en cuenta las peculiaridades y los detalles del dominio es más fácil, porque los expertos en negocios tienen un historial de trabajo con los geeks de matemáticas y viceversa. Existe una comprensión más clara de lo que constituye información “limpia”, lo que hace que sea más fácil limpiar los procesos en la fuente para obtener datos limpios.

La industria del cuidado de la salud, por otro lado, todavía está tratando de encontrar la manera de unir el conocimiento del negocio con las técnicas matemáticas. Parte del problema es que los expertos en la industria de la salud, especialmente el conocimiento clínico, no están acostumbrados a hablar con geeks matemáticos, y prácticamente hablan un idioma diferente. Todavía hay una gran cantidad de “frutas que cuelgan poco”, en el sentido de que hay algunos problemas que en un dominio diferente preguntarías: “¿Quieres decirme que no resuelves esto matemáticamente?” Sin embargo, esto no significa que esas cosas se puedan resolver rápida o fácilmente, porque es un dominio complejo e incorporar sus giros y vueltas puede hacer tropezar a cualquiera. Es solo que matemática o teóricamente no tienes que ir muy lejos. La parte práctica de esto es otra historia en total. Comprender qué constituye información limpia, o cuáles son los problemas conocidos, los sesgos o las anomalías en los datos es en sí una tarea difícil.

Por supuesto, estos se basan en mis experiencias específicas y no debemos tratar de extrapolar desde un punto de datos 🙂, por lo que me encantaría escuchar de otros Data Scientists en estos y otros dominios.