业务驱动的数据科学

文章 (146) 2021-01-31 22:26:03

如今,每个数据项目都是一个数据科学项目,业务利益相关者必须在数据科学中发挥积极作用,以实现预期价值。

当大多数人听到数据科学时,他们会想到一个黑匣子。内部工作非常复杂且难以理解,但是他们知道从中获得的输出(分析数据以获取有价值的业务见解的有效方法)非常重要。

我相信公司需要采取更科学的方法来进行创新-无论是通过改善客户服务,削减不必要的成本还是销售更多的产品。

许多公司正在尝试培养数据科学以获取竞争优势。弄清楚“如何”是他们被绊倒的地方。改进数据科学的最简单方法之一是使数据科学方法在整个企业中无处不在,并在业务线人员和数据科学家之间建立更牢固的伙伴关系。以后再说。

首先让我们看一下许多公司如何以及为什么要努力进行有效的数据科学研究。

挑战围绕感知和行为。业务线人员(业务开发,市场营销,客户成功,财务分析师等)已经越来越意识到数据科学创造业务价值的力量。有些甚至实现了用户友好的仪表板和报告,它们提供了复杂的数据见解,即使是很少或根本没有数据科学专业知识的人也可以使用。但是,这些工具中的许多工具并未包含真实的数据科学,也无法替代能够解决复杂问题的熟练,经验丰富的数据科学家的专业知识。因此,对于复杂的数据科学要求,业务人员将与数据科学家联系以解决他们的问题,例如说“这将为我创造价值”,然后交给数据科学团队加以解决。

这种更孤立的方法通常是滥用每个人的时间,并且可能无法产生预期的结果。数据科学家将尽最大努力使用自动化和机器学习来分析数据。但是,与业务决策脱节意味着他们通常无法很好地理解和解释数据以获取所需的见解。他们将建立惊人的模型,这些模型可能无法回答正确的问题。

企业可以通过两种方式打破这些数据孤岛。首先,不应再有“数据科学项目”。每个项目和每个应用程序都应嵌入数据科学。希望以数据为驱动力和以客户为中心的公司没有其他前进的道路。其次,数据科学不应该是一项僻静的工作-业务与数据科学家之间应该加强合作与伙伴关系。数据科学不能成为黑匣子。

业务人员和数据科学家如何更有效地合作?有一个称为CRISP-DM的长期存在的模型,它代表跨行业的数据挖掘过程。该模型创建于1996年,我发现它非常有效。有很多更新和变体,但是这里是关键步骤:

•业务理解:首先了解您的业务挑战以及哪些类型的见识会带来好处。业务线人员将在这里为数据科学家提供分析及其成功标准的用例。

•数据理解:在这里,业务人员,数据科学家和数据库管理员(DBA)应该共同确定可用数据以支持其用例,包括数据源以及数据是否完整和可信赖。

•数据准备:现在,DBA在数据科学家的输入和指导下,提取和构建机器学习将在以后的步骤中评估的数据。

•建模:数据科学家识别正确的机器学习算法并将其应用于数据。

•评估:业务人员和数据科学家一起工作,以查看数据挖掘结果,并确定模型是否满足业务目标。如果结果不可接受,则返回“业务理解”步骤并再次循环。

•部署:最后,业务人员与IT和DBA一起确定用于部署结果的策略。例如,他们可以将模型集成到移动应用程序或业务线应用程序中。

业务部门人员和数据科学家可以通过在数据科学项目上进行更紧密的合作而受益匪浅。数据相对容易收集,但难以分析。目前,许多业务线人士可能希望他们拥有更好的见解,但不知道从哪里开始。数据科学家可能想提供帮助,但对业务问题却一无所知。

通过将数据科学更深入地集成到业务中,以及对包括CRISP-DM模型在内的数据科学如何工作有更好的理解,商人可以成为更有效的合作伙伴,并推动其数据计划向前发展。

THE END

发表回复