什么是公民数据科学家?
公民数据科学家 是没有接受过高级数学和统计学正式培训的知识工作者,他们使用应用程序从数据中提取高价值见解。公民数据科学家每天使用数据和分析通过点击式界面来解决特定的业务问题。他们依靠工具从数据抽象等任务中抽出大部分难度,并自动执行建模和检测数据模式的大部分工作。
数字化转型计划已经影响了当今组织开展业务的各个方面。这些数据驱动的变化已导致越来越多的企业领袖转向公民数据科学家来填补对数据和分析的需求与当今市场上熟练数据科学家供应有限之间的差距。公民数据科学家能够应对这种技能短缺的问题。他们能够使用高级和 预测分析 来创建数据科学模型,而无需统计分析背景。

为什么对公民数据科学家的需求不断增长?
公民数据科学家的角色是在不花大量资金聘请训练有素的数据科学家的情况下更多地利用先进分析技术的核心。公民数据科学家是组织培养稀缺的建模和分析技能的最佳机会,使他们能够满足紧迫的业务需求并将数据转化为行动。如今,智能组织雇用包括公民数据科学家和数据科学家的组合在内的数据科学团队。然而,公民数据科学家的目标不是取代数据科学家,而是补充他们,填补在理解数据和业务方面的技能差距。
公民数据科学家的崛起
公民数据科学家的崛起可以归因于:
- 公民数据科学家被证明是多强大的一项资产。对于专业数据科学家来说是一种经济高效的选择,他们更容易找到,雇用成本更低,但能够补充这些数据科学家的工作。
- 数据科学作为一个领域是如何更容易被非专业人士获得的。现代分析和 商业智能 ( BI ) 工具使整个企业的用户能够参与和更好地理解数据。与增强分析和 机器学习 (ML) 相关的解决方案正在帮助公民数据科学家更轻松地完成曾经只由专家数据科学家完成的 数据发现 和分析任务。
如何授权公民数据科学家
在当今互联世界中, 高级分析 和机器学习变得越来越重要。
这些技术中的驱动价值取决于组织对公民科学家围绕高级数据分析、机器学习和算法业务开发模型的授权。然后将这些模型交付给需要做出更好决策的行业经理和企业用户。
公民数据科学家是从高级分析投资中获得最大价值的关键,而无需过多花费在专家数据科学家身上。如果得到组织的授权,未经正式培训的公民数据科学家仍然能够从数据中提取有价值的见解。他们使用各种工具来减少数据科学任务的难度,例如用于数据准备、建模和模式识别的自动化工具。
组织可以通过人员、流程和技术的组合为公民数据科学家提供支持
人员
大多数公民数据科学家的定义都足够广泛,足以涵盖行业工人、企业分析师和商业智能 (BI) 甚至 IT 领域的员工。在影响范围如此广泛的情况下,公民数据科学家在分析师霍华德·德累斯纳称之为 “信息民主” 方面发挥了宝贵的作用,确保数据和见解在整个企业中共享。如果没有商业智能和分析应用程序,公司再也无法生存。将有价值的信息交给企业和其他利益相关者,而不仅仅是数据科学家和其他数据专家,这一点至关重要。
流程
数据科学家和公民数据科学家更好地利用数据和分析的过程得到了关于整个组织的更深层次问题的支持:组织是否有共享任何内容的流程?对于增长迅速、通过兼并和收购而成长或已经开始萎缩的公司来说,这并不总是既定的情况。如果文化从未接受或促进透明度和共享的概念,那么无论公司采取何种流程来使用软件发布分析模型和他们收集的数据,都不可能成功。
一旦公民数据科学家向前迈步并且数据科学家使其具有资格,分工的过程就开始了。
让公民数据科学家参与的目标不是取代数据科学家,而是用一组高级用户来补充他们,可以使用您的应用程序来发现科学家遗漏的地方并填补任何技能缺口。鉴于大数据的最佳使用需要编码、统计、机器学习、数据库管理、可视化技术和行业特定知识方面的知识,最好的方法是把多种技能结合起来。至少,公民数据科学家在行业知识领域提供了最大的价值,这对于数据科学家来说停下来学习到任何有用程度都是低效的。
一旦流程到位,随着信息民主将更多的数据交给更多人手中,数据科学家面临的传统障碍—无论是上游管理层还是下游员工购买—开始减少。除了获得在短期内提高收入或降低成本的见解之外,数据科学的前景还在于以有利地塑造公司长期方向的方式应用这些见解。最顺畅的方法是将训练有素的数据科学家和公民数据科学家的努力联系起来。
在实践中,数据科学家坚持接受培训的高级分析和统计工作是有意义的,从而创建数据准备和建模的工作流程。当这些工作流程准备好测试或投入生产时,数据科学家会使用您的分析软件将它们推送给公民数据科学家,由他们运行这些工作流程并确保工作按设计工作。适时地,公民数据科学家可以承担更大的责任,使用您的应用程序修改工作流程并创建自己的工作流程。
技术
大多数分析师都会自然地使用电子表格程序来分析金融报告并得出见解。直观、值得信赖的行列格式立即产生意义,并且具有无限灵活性。但是,无论是在协作、共享、合并不同的数据集、执行高级分析还是执行可重复的工作流程方面,电子表格软件最终都会功力耗尽。
数据科学家知道,将原始数学和统计数据强加给不擅长这些的人是徒劳的。我们的目标是将 分析平台 交给可以构建模型供组织各地使用的人手中。每个分析平台都声称易用性,但这还不够。它必须足够强大,以满足数据科学家的需求,同时对非技术人员来说必须很容易在整个企业中使用自动化、可共享的工作流程。