Qu'est-ce qu'un « Citizen Data Scientist » ?

Un citoyen scientifique des données est un travailleur du savoir sans formation formelle en mathématiques ou statistiques avancées qui utilise des applications pour extraire des données des informations à forte valeur ajoutée. Un citizen data scientist utilise quotidiennement des données et des analyses pour résoudre des problèmes commerciaux spécifiques à l'aide d'une interface de type pointer-cliquer. Il s'appuie sur des outils qui lui permettent d'éliminer une grande partie de la difficulté de tâches telles que l'abstraction de données et d'automatiser une grande partie du travail de modélisation et de détection de modèles dans les données.

Diagramme du citizen data scientist

Les initiatives de transformation numérique ont eu un impact sur chaque aspect de la façon dont les organisations font des affaires aujourd'hui. Ces changements axés sur les données ont conduit de plus en plus de chefs d'entreprise à se tourner vers des citizen data scientists pour combler l'écart entre la demande de données et d'analyses et l'offre limitée de data scientists qualifiés sur le marché actuel. Les citizen data scientists peuvent répondre à cette pénurie de compétences. Ils sont capables de créer des modèles de data science à l'aide d'analyses prédictives avancées et sans avoir de formation en analyse statistique.

Téléchargez cet e-book pour connaître les six compétences principales dont vous avez besoin pour vous démarquer en tant que data scientist.
Quel super-héros de la Data Science êtes-vous ?
Téléchargez cet e-book pour connaître les six compétences principales dont vous avez besoin pour vous démarquer en tant que data scientist.

Pourquoi y a-t-il une demande croissante de citizen data scientists ?

Le rôle du citizen data scientist est au cœur de l'exploitation des technologies analytiques avancées sans avoir à dépenser de grosses sommes d'argent pour embaucher des scientifiques bien formés. Obtenir l'aide de citizen data scientists est la meilleure opportunité pour l'entreprise de développer les rares compétences en modélisation et en analyse qui lui permettront de répondre aux demandes commerciales urgentes et de transformer les données en actions. Les organisations intelligentes emploient aujourd'hui des équipes de data science qui comprennent une combinaison de data scientists et de citizen data scientist. L'objectif des citizen data scientists n'est toutefois pas de remplacer les data scientists, mais de les compléter et de combler les lacunes en matière de compréhension des données et de l'entreprise.

The Rise of the Citizen Data Scientist (L’essor du citizen data scientist)

La montée en puissance du citizen data scientist peut être attribuée à :

  1. Les citizen data scientists se révèlent être un atout considérable. Ils constituent une option rentable par rapport aux data scientists experts, plus faciles à trouver et moins coûteux à embaucher, mais qui sont capables de compléter le travail de ces data scientists.
  2. Comment la data science en tant que domaine est-elle devenue plus accessible aux non-experts. Les outils modernes d'analyse et de business intelligence (BI) permettent aux utilisateurs de l'entreprise de s'engager et de mieux comprendre les données. Les solutions liées à l'analytique augmentée et au machine learning (ML) aident les citizen data scientists à accomplir plus facilement la data discovery et les tâches d'analyse qui n'étaient autrefois accomplies que par des data scientists experts.

Comment donner les moyens d'agir aux citizen data scientists ?

L'analyse avancée et le machine learning prennent de plus en plus d'importance dans le monde connecté d'aujourd'hui.

Pour tirer parti de ces technologies, les entreprises doivent donner aux citizen data scientists les moyens de développer des modèles d'analyse avancée des données, de machine learning et de gestion algorithmique. Elles doivent ensuite fournir ces modèles aux responsables de service (Line-Of-Business, LOB) et aux utilisateurs de l'entreprise qui en ont besoin pour prendre de meilleures décisions.

Les citizen data scientists sont la clé pour tirer le maximum de valeur de votre investissement en analyse avancée sans dépenser trop pour des data scientists experts. Lorsqu'ils sont habilités par l'organisation, les citizen data scientists qui n'ont pas de formation formelle sont tout de même capables d'extraire des informations précieuses des données. Ils utilisent une variété d'outils pour rendre les tâches de data science moins difficiles, tels que des outils d'automatisation pour la préparation des données, la modélisation et la reconnaissance des formes.

Les organisations peuvent habiliter les citizen data scientists en combinant les personnes, les processus et la technologie

Individus

La plupart des définitions de citizen data scientists sont suffisamment larges pour englober le personnel du LOB, les analystes commerciaux et les employés de la business intelligence (BI), voire de l'informatique. Avec une portée aussi large, le citizen data scientist joue un rôle précieux dans ce que l'analyste Howard Dresner appelle la « démocratie de l'information », en veillant à ce que les données et les idées soient partagées dans toute l'entreprise. Les entreprises ne peuvent plus se passer des applications de BI et d'analyse. Il est essentiel de mettre les informations précieuses entre les mains de l'entreprise et des autres parties prenantes, et non plus seulement entre celles des data scientists et autres experts en données.

Traitement

Le processus par lequel les data scientists et les citizen data scientists font un meilleur usage des données et des analyses est sous-tendu par une question plus profonde sur l'organisation dans son ensemble : Y-a-t'il des processus en place pour tout partager ? Cela ne va pas toujours de soi dans les entreprises qui ont connu une croissance rapide, qui se sont développées par le biais de fusions et d'acquisitions ou qui ont commencé à se réduire. Si la culture de l'entreprise n'a jamais adopté ou encouragé la notion de transparence et de partage, alors tout processus mis en place par l'entreprise pour utiliser des logiciels afin de publier des modèles analytiques et les données qu'ils récoltent a peu de chances de réussir.

Une fois que les citizen data scientists se sont manifestés et que les data scientists les ont qualifiés, le processus de partage du travail commence.

L'objectif d'engager des citizen data scientists n'est pas de remplacer les data scientists, mais de les compléter par un ensemble d'utilisateurs expérimentés qui peuvent utiliser vos applications pour reprendre là où les scientifiques s'arrêtent et combler les lacunes en matière de compétences. Étant donné que l'utilisation optimale du big data nécessite des connaissances en matière de codage, de statistiques, de machine learning, de gestion des bases de données, de techniques de visualisation et de connaissances spécifiques au secteur, la meilleure façon de réussir est de combiner plusieurs ensembles de compétences. Au minimum, les citizen data scientists offrent la plus grande valeur dans le domaine de la connaissance de la LOB. Si un data scientist devait s'arrêter et apprendre la LOB à un niveau suffisant, ce serait inefficace.

Une fois qu'un processus est en place, les barrières traditionnelles auxquelles les data scientists sont confrontés pour obtenir l'adhésion (en amont de la direction et en aval du personnel) commencent à diminuer, car la démocratie de l'information met davantage de données entre les mains d'un plus grand nombre. Au-delà de l'obtention d'informations qui augmentent le chiffre d'affaires ou réduisent les coûts à court terme, la promesse de la data science réside dans l'application de ces informations de manière à façonner de manière avantageuse l'orientation de l'entreprise à long terme. Le moyen le plus simple d'y parvenir est d'associer les efforts des data scientists expérimentés et des citizen data scientists.

En pratique, il est logique que les data scientists s'en tiennent au travail d'analyse avancée et de statistiques pour lesquels ils ont été formés, en créant des flux de travail pour la préparation et la modélisation des données. Lorsque ces flux sont prêts à être testés ou mis en production, les data scientists utilisent votre logiciel d'analyse pour les transmettre aux citizen data scientists, qui les exécutent et s'assurent qu'ils fonctionnent comme prévu. Avec le temps, les citizen data scientists peuvent assumer une plus grande responsabilité, en utilisant votre application pour modifier les flux de travail et créer les leurs.

Technologie

La plupart des analystes ont le réflexe d'utiliser un tableur pour calculer des chiffres et obtenir des informations. Le format intuitif, fiable, en lignes et colonnes, paraît logique et est infiniment flexible. Cependant, les tableurs finissent par s'essouffler, que ce soit pour collaborer, partager, combiner des ensembles de données disparates, effectuer des analyses avancées ou exécuter des flux de travail reproductibles.

Les data scientists savent qu'il est vain d'imposer des mathématiques et des statistiques brutes à des personnes qui n'en sont pas capables. L'objectif est de mettre une plateforme analytique entre les mains de personnes capables de construire des modèles qui seront utilisés dans toute l'organisation. Toutes les plateformes analytiques revendiquent leur facilité d'utilisation, mais cela ne suffit pas. Elles doivent être suffisamment puissantes pour répondre aux besoins des data scientists, mais suffisamment simple pour que le personnel non technique puisse utiliser des flux de travail automatisés et partageables dans toute l'entreprise.