¿Qué es un Citizen Data Scientist?

Un Citizen Data Scientist es un trabajador intelectual sin capacitación formal en matemáticas y estadísticas avanzadas que utiliza aplicaciones para extraer información valiosa de los datos. Un Citizen Data Scientist utiliza datos y análisis a diario para resolver problemas comerciales específicos con una interfaz de 'apunte y haga clic'. Dependen de herramientas para abstraer gran parte de la dificultad de tareas como la abstracción de datos y automatizar gran parte del trabajo de modelado y detección de patrones en los datos.

Diagrama de Citizen Data Scientist

Las iniciativas de transformación digital impactaron todos los aspectos de cómo las organizaciones hacen negocios en la actualidad. Estos cambios impulsados por los datos llevaron a que cada vez más líderes empresariales recurran a los Citizen Data Scientists para llenar la brecha entre la demanda de datos y análisis, y la oferta limitada de científicos de datos capacitados en el mercado actual. Los Citizen Data Scientist pueden hacer frente a esta escasez de aptitudes, pueden crear modelos de ciencia de datos utilizando la analítica predictiva y avanzada sin alguna experiencia en análisis estadístico.

Descargue este libro electrónico para aprender las seis aptitudes principales que necesita para diferenciarse como científico de datos.
¿Qué superhéroe de DataScience es usted?
Descargue este libro electrónico para aprender las seis aptitudes principales que necesita para diferenciarse como científico de datos.

¿Por qué hay una demanda creciente de Citizen Data Scientists?

El papel del Citizen Data Scientist es fundamental para sacar más provecho de la tecnología analítica avanzada sin gastar grandes sumas de dinero para contratar científicos de datos bien capacitados. El Citizen Data Scientist es la mejor oportunidad de la organización para desarrollar las escasas aptitudes analíticas y de modelado que les permitirán satisfacer las demandas comerciales urgentes y convertir los datos en acciones. Hoy en día, las organizaciones inteligentes emplean equipos de la ciencia de datos que incluyen una combinación de científicos de datos y científicos de datos. Sin embargo, el objetivo de los Citizen Data Scientists no es reemplazar a los científicos de datos, sino complementarlos y llenar los vacíos de aptitudes para comprender tanto los datos como la empresa.

The Rise of the Citizen Data Scientist (El auge de los científicos de datos no profesionales)

El auge del Citizen Data Scientist se puede atribuir a:

  1. Cuán fuertes están demostrando ser los Citizen Data Scientist como activos. Son una opción rentable para los científicos de datos especializados, más fáciles de encontrar y menos costosos de contratar, pero logran complementar el trabajo de los científicos de datos.
  2. Cómo la ciencia de datos como campo es más accesible para los no expertos. Las herramientas modernas de análisis e inteligencia de negocio (BI) permiten a los usuarios de toda la empresa interactuar y comprender mejor los datos. Las soluciones relacionadas con Augmented Analytics y Machine Learning (ML) están ayudando a los Citizen Data Scientists a completar más fácilmente las tareas de análisis y el descubrimiento de datos que antes solo realizaban aquellos científicos de datos especializados.

Cómo facultar a los Citizen Data Scientists

La analítica avanzada y Machine Learning son cada vez más importantes en el mundo conectado de hoy.

Impulsar el valor de estas tecnologías se basa en organizaciones que facultan a los Citizen Data Scientists para desarrollar modelos en torno a la analítica de datos, Machine Learning y negocios algorítmicos avanzados. Y luego entregar esos modelos a los gerentes de línea de negocio (LOB) y a los usuarios comerciales que los necesitan para tomar mejores decisiones.

Los Citizen Data Scientist son la clave para obtener el máximo valor de su inversión en analítica avanzada sin gastar demasiado en científicos de datos especializados. Cuando la organización los faculta, los Citizen Data Scientists sin capacitación formal aún pueden extraer información valiosa de los datos. Emplean una variedad de herramientas para hacer que las tareas de la ciencia de datos sean menos difíciles, como herramientas de automatización para la preparación de datos, modelado y reconocimiento de patrones.

Las organizaciones pueden facultar a los Citizen Data Scientists con una combinación de personas, procesos y tecnología

Personas

La mayoría de las definiciones de los Citizen Data Scientists son lo suficientemente amplias como para abarcar al personal de LOB, los analistas comerciales y los empleados en inteligencia de negocio (BI) e incluso TI. Con un alcance tan amplio, el Citizen Data Scientist desempeña un papel valioso en lo que el analista Howard Dresner llama "democracia de la información", asegurando que los datos y los conocimientos se compartan en toda la empresa. Las empresas ya no pueden arreglárselas sin BI y aplicaciones analíticas. Es fundamental poner información valiosa en manos de la empresa y otras partes interesadas, en lugar de solo los científicos de datos y otros expertos en datos.

Proceso

El proceso mediante el cual los científicos de datos y los Citizen Data Scientists hacen un mejor uso de los datos y el análisis se basa en una pregunta más profunda sobre la organización en su conjunto: ¿tiene procesos para compartir algo? Esto no siempre es un hecho en las empresas que crecieron rápidamente, crecieron a través de fusiones y adquisiciones, o comenzaron a reducirse. Si la cultura nunca adoptó o fomentó la noción de transparencia e intercambio, entonces es poco probable que tenga éxito cualquier proceso que la empresa implemente para utilizar software para publicar modelos analíticos y los datos que recopilen.

Una vez que los Citizen Data Scientists dieron un paso adelante y los científicos de datos los calificaron, comienza el proceso de la división del trabajo.

El objetivo de involucrar a los Citizen Data Scientists no es reemplazar a los científicos de datos, sino complementarlos con un conjunto de usuarios avanzados que pueden utilizar sus aplicaciones para continuar donde los científicos lo dejaron y llenar cualquier brecha de aptitudes. Dado que el uso óptimo de Big Data requiere conocimientos de codificación, estadísticas, Machine Learning, administración de bases de datos, técnicas de visualización y conocimiento específico de la industria, la mejor manera de lograrlo es combinando múltiples conjuntos de aptitudes. Como mínimo, los Citizen Data Scientists ofrecen el mayor valor en el área del conocimiento de LOB, algo que sería ineficiente que un científico de datos se detuviera y aprendiera hasta cierto punto.

Una vez que se implementa un proceso, las barreras tradicionales a las que se enfrentan los científicos de datos para ganar aceptación, tanto en sentido ascendente a la administración como en sentido descendente al personal, comienzan a disminuir a medida que la democracia de la información pone más datos en más manos. Más allá de llegar a conocimientos que aumenten los ingresos o reduzcan los costos a corto plazo, la promesa de la ciencia de datos radica en aplicar esos conocimientos de manera que den forma beneficiosa a la dirección de la empresa a largo plazo. La forma más sencilla es vincular los esfuerzos de los científicos de datos capacitados y los Citizen Data Scientists.

En la práctica, tiene sentido que los científicos de datos se ciñan al trabajo de análisis y estadísticas avanzados para los que están capacitados, creando flujos de trabajo para la preparación y el modelado de datos. Cuando esos flujos de trabajo están listos para probarlos o ponerlos en producción, los científicos de datos utilizan su software de análisis para enviarlos a los Citizen Data Scientists, quienes los ejecutan y se aseguran de que funcionen según lo diseñado. Con el tiempo, los Citizen Data Scientists podrán asumir una mayor responsabilidad, utilizando su aplicación para modificar los flujos de trabajo y crear los suyos propios.

TECNOLOGÍA

La mayoría de los analistas buscan reflexivamente un programa de hoja de cálculo para procesar números y llegar a conocimientos. El formato intuitivo y confiable de filas y columnas tiene sentido inmediato y es infinitamente flexible. Sin embargo, el software de hoja de cálculo eventualmente se queda sin combustible, ya sea al colaborar, compartir, combinar conjuntos de datos dispares, realizar análisis avanzados o ejecutar flujos de trabajo repetibles.

Los científicos de datos saben que es inútil imponer matemáticas y estadísticas en bruto a personas que no son expertas en ellas. El objetivo es poner una plataforma analítica en manos de personas que puedan construir los modelos para su uso en toda la organización. Todas las plataformas analíticas afirman ser fáciles de utilizar, pero eso no es suficiente. Debe ser lo suficientemente potente para satisfacer las necesidades de los científicos de datos, pero lo suficientemente fácil para que el personal no técnico utilice los flujos de trabajo automatizados y que los mismos se puedan compartir en toda la empresa.