¿Qué es un científico de datos?
Un científico de datos es una profesión que requiere una variedad de habilidades técnicas y basadas en el dominio para administrar y analizar datos para resolver problemas empresariales. Son a veces matemáticos, algunos son analistas de negocios y otras veces son científicos informáticos. Un buen científico de datos verá tendencias y patrones en los datos y sabrá cómo utilizarlos para producir resultados útiles y procesables. Los científicos de datos están a la vanguardia de las empresas modernas, transformando la forma en que trabajamos.
Historia de los científicos de datos
En 2001, un científico informático, William S. Cleveland, escribió un artículo "Ciencia de datos: un plan de acción para ampliar el área técnica de la estadística". Este artículo presentó la ciencia de datos como una disciplina de los estadísticos aplicados. Eso fue hace solo 20 años, y el mundo de la tecnología y los negocios se ha movido rápidamente desde entonces.
Debido a que esta es una carrera profesional relativamente nueva, los científicos de datos actuales provienen de una variedad de antecedentes y especialidades. Muchos comienzan sus carreras como estadísticos, matemáticos o analistas de datos. Pero su importancia evolucionó a medida que el acceso a los ordenadores, la inteligencia artificial (AI) y las herramientas de aprendizaje de datos se volvieron más comunes. Un científico de datos ya no se limita al departamento de TI, sino que se ha convertido en una parte integral del negocio en general. Debido a su expansión e influencia decisiva en el negocio, el rol del científico de datos requiere a una persona con pensamiento lógico e innovador para poder traducir los conocimientos de los datos en una estrategia empresarial.
¿Qué requisitos debe cumplir un científico de datos?
En los últimos diez años, las instituciones de educación superior desarrollaron cursos específicos para los científicos de datos. Aquellos que deseen trabajar en la industria pueden obtener una licenciatura o una maestría en ciencia de datos de una gran cantidad de universidades.
Los cursos que toman los científicos de datos generalmente cubren el modelado estadístico, la gestión de datos, la visualización de datos, Machine Learning, la ingeniería de software, la ética de datos, el diseño de investigación y la experiencia del usuario. Pueden aprender SQL, Python, Perl y una variedad de otros lenguajes de programación como R. También se familiarizarán con Hadoop, Pig, Spark, Hive y MapReduce.
Sin embargo, con más software de código abierto disponible y más herramientas de la ciencia de datos comercializadas, lo que la gente aprende hoy podría volverse obsoleto prontamente. Por lo tanto, los científicos de datos deben ser ágiles y continuar aprendiendo nuevas aptitudes y técnicas dentro de la industria.

Los científicos de datos necesitan más que un título
Un científico de datos competente deberá ser curioso, siempre buscando nueva información y nuevas formas de pensar sobre los desafíos empresariales. Un fuerte sentido de la intuición y el hábito de ser probado también son características excelentes que deberá tener un científico de datos. Deberán ser lo suficientemente creativos para encontrar respuestas donde no las había, buscando continuamente información y resultados.
Los científicos de datos también necesitan un profundo sentido del conocimiento empresarial. Conocer los datos y la programación es una cosa, tener el conocimiento para crear una estrategia comercial a partir de esos conocimientos es otra. Deben ver los riesgos y las oportunidades para el negocio y poder utilizar los datos para proporcionar estrategias para el crecimiento empresarial. Una cosa es saber que la gente compra más en un determinado tipo de clima, pero ¿cómo puede una empresa aprovechar este tipo de información? El papel del científico de datos es descubrir y responder preguntas como estas, que conducen continuamente al negocio a nuevos niveles.
Un gran científico de datos también deberá tener excelentes habilidades de comunicación con el fin de informar a las partes interesadas y los gerentes, y explicar claramente los resultados de los análisis. Ser capaz de explicar dónde estaban incompletos los datos y qué se necesita para resolverlos. Convencer y persuadir sobre el mejor procedimiento a seguir basado en esos resultados. Los nuevos programas y técnicas cambiarán, pero siempre existirá una demanda sobre la capacidad de pensar críticamente y tener buenas habilidades cuantitativas y específicas de dominio.
¿Qué hace un científico de datos?
Un científico de datos toma datos, desarrolla hipótesis e inferencias y luego utiliza Machine Learning para detectar patrones, relaciones y tendencias dentro de esos datos. En un día cualquiera, podría:
- Analizar conjuntos de datos
- Realizar limpieza de datos
- Crear paneles e informes
- Visualizar datos
- Hacer inferencias estadísticas
- Desarrollar modelos de aprendizaje estadístico
- Crear complejos modelos predictivos
- Utilizar herramientas estadísticas
- Comunicar los resultados del análisis a las partes interesadas
- Convencer a los responsables de la toma de decisiones
Las grandes empresas minoristas pueden producir hasta 40 petabytes de datos al día. Sus científicos de datos utilizan esos datos para predecir una variedad de resultados, incluido cuándo y dónde las personas compran ciertos artículos, lo cual les permitirá planificar eventos y ventas para maximizar las mismas, fijar precios que todavía les permitan obtener el máximo beneficio, pero también para poder mover la mayor cantidad de stock.
Los científicos de datos normalmente trabajan en equipos para extraer grandes cantidades de datos en busca de información relevante. También pueden asesorar a la gerencia sobre qué tipo de datos deben recopilarse, cómo deben analizarse y los resultados de esa interpretación. Un estudio de 2017 demostró que el 80 por ciento del tiempo de un científico de datos se dedica a la gestión de datos: encontrar, limpiar y organizar. Esto deja solo el 20 por ciento de su tiempo de trabajo para realizar el análisis. Sin embargo, incluso esto está cambiando, con el advenimiento de Machine Learning automatizado y el aprendizaje profundo, los científicos de datos observaron que tienen más tiempo para el análisis, ya que estas herramientas se han vuelto más automatizadas y se hacen cargo de gran parte de la limpieza y la organización de los datos, lo que deja a los científicos más tiempo para el análisis.
¿Por qué es tan importante la tarea de los científicos de datos?
Para una empresa, un científico de datos es invaluable. Toman millones, incluso miles de millones de puntos de datos y los convierten en información crucial para hacer predicciones sobre una organización que podría salvar o hacer crecer un negocio. Algunos ejemplos de científicos de datos por industria incluyen:
Optimización de marketing
Los científicos de datos son una parte crucial del marketing. Por ejemplo, un científico de datos puede producir un conjunto de factores desencadenantes que alertan a la empresa de que sus clientes tienen un alto riesgo de abandono. En marketing, es bien sabido que el costo de encontrar un nuevo cliente supera con creces el costo de retener uno existente. Los activadores configurados por el científico de datos permiten que una empresa intervenga y realice cambios o hable con el cliente para retenerlos.
Sector sanitario
Este es un campo enorme con enormes oportunidades para los científicos de datos. Desde administrar listas y dotación de personal en niveles óptimos hasta identificar qué pacientes tienen un alto riesgo de no cumplir con las indicaciones de su médico, un científico de datos puede encontrar miles de oportunidades para mejorar las prácticas empresariales y los resultados médicos.
Detección de fraudes
Las industrias de seguros y banca están ahorrando miles de millones de dólares cada año mediante el uso de científicos de datos para identificar riesgos de fraude. Por ejemplo, cuando un cliente solicita un préstamo, se recopilan varios puntos de datos sobre él. Esta información se procesa y se compara con información conocida sobre casos de fraude anteriores. Casi de inmediato, el sistema notificará si esta persona representa un riesgo.
Cómo convertirse en un científico de datos
Si tiene una mente lógica, podrá manejar cifras, disfrutará trabajando con ordenadores y tendrá un profundo conocimiento de los negocios, entonces la tarea como un científico de datos podría ser el trabajo de sus sueños.
El primer paso es obtener una licenciatura en informática, estadística o un campo relacionado. Este título lo equipará con aptitudes en:
- Matemáticas, en particular estadísticas
- Codificación
- Bases de datos, lagos de datos y almacenamiento distribuido
- Técnicas de limpieza de datos
- Aptitudes de visualización y generación de informes de datos
Una licenciatura le brindará conocimientos de nivel básico, pero a medida que el campo crece, se requerirán más calificaciones o especializaciones. Considere una maestría en datos o un campo relacionado, y comience a profundizar en un dominio empresarial específico que le interese.
Una vez que se obtienen las calificaciones, el siguiente paso es adquirir experiencia en el campo de interés. La atención médica, el marketing, el gobierno o las empresas ofrecen excelentes perspectivas de especialización. Si bien se pueden transmitir las aptitudes de un científico de datos, comprender las relaciones entre los datos y las implicaciones de la vida real requiere experiencia y tiempo dedicado a la empresa.

Desafíos que enfrentan los científicos de datos
Debido en parte al hecho de que es una industria nueva, los científicos de datos se enfrentan a algunos desafíos. Es una industria dominada por hombres y, como muchas carreras STEM (ciencia, tecnología, ingeniería y matemáticas), las mujeres a veces enfrentan obstáculos adicionales para ingresar y mantener sus carreras. En 2019, solo el 18 por ciento de los científicos de datos eran mujeres. Esta falta de diversidad está comenzando a crear problemas en el campo. Los algoritmos son creados por seres humanos y son susceptibles a sesgos. Por ejemplo, en la industria bancaria, ser una mujer sola será negativo al momento de obtener un préstamo. Sin embargo, los datos muestran que las mujeres son mejores que los hombres para liquidar préstamos. Los bancos podrían estar perdiendo a sus mejores clientes y las mujeres podrían estar perdiendo seguridad e independencia financieras. Tener una fuerza laboral diversa ayudará a combatir esos errores y prejuicios.
Debido a que es una industria nueva, también está luchando con el vocabulario y las normas de práctica que sean consistentes. Se espera que las normas se logren como un consenso entre las partes interesadas, los propios científicos de datos y los legisladores, pero hasta el momento no se ha formado ninguno.
También existe una motivación para una AI explicable que se puede interpretar fácilmente. Los líderes de opinión consideran que las predicciones no deberían ser solo una figura extraída de la nada, sino que deberían poder rastrear y explicar fácilmente la lógica detrás de los modelos de Machine Learning.
Perspectiva actual para los científicos de datos
Como la mayoría de las carreras STEM, los científicos de datos son empleados muy buscados y valorados. Actualmente, existe una escasez de científicos de datos calificados con aptitudes analíticas adecuadas. Con expectativas salariales superiores al promedio, un mercado en rápido crecimiento y una mayor comprensión de su valor, las opciones de empleo para los científicos de datos son excelentes. En 2018, hubo una escasez de 151.000 científicos de datos, lo que lo convierte en un campo seguro y en crecimiento.
En particular, se anima a las personas de grupos subrepresentados a ingresar al campo. Es una opción de empleo atractiva y estable siendo que algunas universidades ofrecen incentivos para que estos grupos subrepresentados se unan a programas de la ciencia de datos y además, las empresas reconocen cada vez más que la diversidad es necesaria para obtener resultados no sesgados.