O que é um Citizen Data Scientist?
Um Citizen Data Scientist é um trabalhador do conhecimento sem treinamento formal em matemática e estatística avançada que usa aplicativos para extrair percepções de alto valor dos dados. Um Citizen Data Scientist usa dados e análises diariamente para resolver problemas de negócios específicos com uma interface de apontar e clicar. Eles contam com ferramentas para abstrair grande parte da dificuldade de tarefas como abstração de dados e automatizar uma grande parte do trabalho de modelagem e detecção de padrões nos dados.
As iniciativas de transformação digital impactaram todos os aspectos de como as organizações fazem negócios hoje em dia. Essas mudanças baseadas em dados levaram cada vez mais líderes de negócios a se voltarem para Citizen Data Scientists para preencher a lacuna entre a demanda por dados e análises e a oferta limitada de cientistas de dados qualificados no mercado atual. Os Citizen Data Scientists são capazes de preencher essa escassez de habilidades. Eles são capazes de criar modelos de ciência de dados usando análises avançadas e preditivas sem experiência em análise estatística.

Por que há uma demanda crescente por Citizen Data Scientists?
A função do Citizen Data Scientist está no cerne de obter mais da tecnologia analítica avançada sem gastar grandes quantias de dinheiro para contratar cientistas de dados bem treinados. O Citizen Data Scientist é a melhor chance da organização de preparar modelagem escassa e habilidades analíticas que lhes permitirão atender às demandas urgentes de negócios e transformar dados em ação. As organizações inteligentes hoje empregam equipes de ciência de dados que incluem uma combinação de cientistas de dados e citizen data scientists. O objetivo dos Citizen Data Scientists não é, entretanto, substituir os cientistas de dados, mas complementá-los e preencher as lacunas de habilidade na compreensão dos dados e do negócio.
A ascensão do Citizen Data Scientist
A ascensão do Citizen Data Scientist pode ser atribuída a:
- O quão forte os Citizen Data Scientists estão provando ser. Eles são uma opção econômica para cientistas de dados especialistas, mais fáceis de encontrar e menos caros de contratar, mas são capazes de complementar o trabalho desses cientistas de dados.
- Como a ciência de dados como um campo pode ser mais acessível para não especialistas? Ferramentas modernas de análise e inteligência de negócios ( BI ) estão permitindo que os usuários em toda a empresa se envolvam e entendam melhor os dados. As soluções relacionadas à análise aumentada e machine learning (ML) estão ajudando os Citizen Data Scientists a concluir com mais facilidade as tarefas de descoberta e análise de dados que antes só eram realizadas por cientistas de dados especialistas.
Como capacitar Citizen Data Scientists
A análise avançada e o machine learning estão se tornando cada vez mais importantes no mundo conectado de hoje.
Gerar valor a partir dessas tecnologias depende de organizações que capacitam Citizen Data Scientists a desenvolver modelos em torno de análises de dados avançadas, machine learning e negócios algorítmicos. E, em seguida, entregar esses modelos aos gerentes e usuários de negócios que precisam deles para tomar melhores decisões.
Os Citizen Data Scientists são a chave para obter o máximo valor de seu investimento em análises avançadas sem gastar muito com cientistas de dados especialistas. Quando capacitados pela organização, os Citizen Data Scientists sem treinamento formal ainda são capazes de extrair percepções valiosas dos dados. Eles empregam uma variedade de ferramentas para tornar as tarefas de ciência de dados menos difíceis, como ferramentas de automação para preparação de dados, modelagem e reconhecimento de padrões.
As organizações podem capacitar Citizen Data Scientists com uma combinação de pessoas, processos e tecnologia
Pessoas
A maioria das definições de Citizen Data Scientists é ampla o suficiente para abranger a equipe de gerentes de linhas de negócios, analistas de negócios e funcionários em inteligência de negócios (BI) e até mesmo TI. Com um alcance tão amplo, o Citizen Data Scientist desempenha um papel valioso no que o analista Howard Dresner chama de “democracia da informação”, garantindo que os dados e as informações sejam compartilhados por toda a empresa. As empresas não podem mais viver sem BI e aplicativos analíticos. É fundamental colocar informações valiosas nas mãos da empresa e de outras partes interessadas, ao invés de apenas os cientistas de dados e outros especialistas em dados.
Processos
O processo pelo qual os cientistas de dados e os Citizen Data Scientists fazem melhor uso de dados e análises é sustentado por uma questão mais profunda sobre a organização como um todo: ela tem processos para compartilhar alguma coisa? Isso nem sempre é um dado em empresas que cresceram rapidamente, cresceram por meio de fusões e aquisições ou começaram a diminuir. Se a cultura nunca adotou ou fomentou a noção de transparência e compartilhamento, então, qualquer processo que a empresa possa implementar para usar o software de publicação de modelos analíticos e os dados que eles coletam provavelmente não terá sucesso.
Depois que os Citizen Data Scientists avançam e os cientistas de dados os qualificam, o processo de divisão do trabalho começa.
O objetivo de envolver Citizen Data Scientists não é substituir os cientistas de dados, mas complementá-los com um conjunto de usuários avançados que podem usar seus aplicativos para retomar onde os cientistas pararam e preencher quaisquer lacunas de habilidade. Dado que o uso ideal de big data requer conhecimento de codificação, estatística, machine learning, gerenciamento de banco de dados, técnicas de visualização e conhecimento específico do setor, a melhor maneira de fazer isso é combinando vários conjuntos de habilidades. No mínimo, os Citizen Data Scientists oferecem o maior valor à área de conhecimento de linhas de negócios, algo que seria ineficiente para um cientista de dados parar e aprender em qualquer grau útil.
Uma vez que o processo está implementado, as barreiras tradicionais que os cientistas de dados enfrentam para ganhar adesão - a montante para a gestão ou a jusante para o pessoal - começam a diminuir fazendo com que a democracia da informação coloque mais dados em mais mãos. Além de chegar a insights que aumentam a receita ou diminuem os custos no curto prazo, a promessa da ciência de dados está em aplicar esses insights de forma a moldar beneficamente a direção da empresa no longo prazo. A maneira mais fácil é unir os esforços de cientistas de dados treinados e Citizen Data Scientists.
Na prática, faz sentido para os cientistas de dados se limitarem aos trabalhos de análises e estatísticas avançadas para os quais foram treinados, criando fluxos de trabalho para preparação e modelagem de dados. Quando esses fluxos de trabalho estão prontos para serem testados ou colocados em produção, os cientistas de dados usam seu software analítico para enviá-los aos Citizen Data Scientists, que os executam e garantem que funcionem conforme o planejado. Com o tempo, os Citizen Data Scientists podem assumir uma responsabilidade maior, usando seu aplicativo para modificar fluxos de trabalho e criar os seus próprios.
Tecnologia
A maioria dos analistas busca reflexivamente um programa de planilha para processar números e chegar a informações. O formato intuitivo e confiável de linha e coluna faz sentido imediatamente e é infinitamente flexível. No entanto, o software de planilha eventualmente é limitado, seja na colaboração, no compartilhamento, na combinação de conjuntos de dados díspares, na realização de análises avançadas ou na execução de fluxos de trabalho repetíveis.
Os cientistas de dados sabem que é inútil impor matemática e estatísticas brutas a pessoas que não as conhecem. O objetivo é colocar uma plataforma de análise nas mãos de pessoas que possam construir os modelos para uso em toda a organização. Cada plataforma analítica afirma ser fácil de usar, mas isso não é suficiente. Deve ser suficientemente poderosa para atender às necessidades dos cientistas de dados, mas fácil o suficiente para a equipe não técnica usar fluxos de trabalho automatizados e compartilháveis em toda a empresa.