在实践中,使用 Scrum 框架时,可能会出现根本没有任何进展或模型被完全拒绝的冲刺周期。重要的是,客户要了解数据科学项目的不确定性和不确定性,并在冲刺评审中抱有现实的期望。
在研究中,Saltz(2018)等人解决了数据科学项目中对系统化过程方法的需求,以取得更好的项目结果。根据 Saltz 和 Suthrland(2019)的说法,CRISP-DM 和 CRISP-ML(Q) 是既定的数据科学方法,必须嵌入敏捷框架中以标准化团队协调、沟通和优先级设置。 CRISP-DM 和 CRISP-ML(Q) 描述了要“做什么”。
敏捷方法和框架还涉及“如何”开发模型和实施迭代。尽管 CRISP-DM 是一种广泛且成熟的方法,但只有一半的专家表示,他们周围的人没有这方面的经验,或者他们纯粹凭直觉使用该程序,而没有明确遵循该流程。只有四人有意识地使用了这个方法。专家们表示,将敏捷方法集成到数据科学工作流程中并非易事,并且在一些项目中已经失败。从流程和项目管理的角度来看,许多项目都失败了。由此得出以下行动建议:需要在数据科学项目中集成和有意识地应用 CRISP-DM 和 CRISP-ML(Q) 等数据科学过程模型,以确保遵循系统方法。
团队的专业知识
数据科学家需要广泛的技能,以便能够了解其他团队成员如何 医疗保健电子邮件列表 在跨学科团队中工作。专家们也强调了这一点。数据科学家从未学过开发软件。您遵循以研究为导向的方法,并与软件开发人员、机器学习工程师或数据工程师合作。然而,专家们强调,不仅数据科学家需要其他学科的技能,软件开发人员或数据工程师也应该具备数据科学主题的专业知识。
数据科学背景下敏捷方法的组合
尽管研究提供了关于在特定项目阶段使用敏捷方法和实践的孤立信息和建议,但缺乏一种整体方法来为在所有项目阶段使用敏捷方法或框架提供建议。在专家访谈中,专家被问到哪些敏捷方法可以在不同的项目阶段为他们提供支持。
业务理解和数据理解
业务和数据理解阶段很重要,因为它们为模型开发奠定了基础。在这些阶段中,必须对问题、需求和数据达成共识,这需要项目团队内部以及与利益相关者进行深入的交流。下面,专家的建议得到了对当前研究状况的进一步行动建议的补充。对于业务和数据理解阶段,这意味着集成设计思维流程,以确保更深入地理解问题和寻找解决方案。设计思维适用于需求和解决方案思路都还不清楚的混乱项目。在数据科学项目中,公司通常不知道他们想要解决什么问题以及他们的要求是什么。因此,设计思维方法可以是定义问题和合适的解决方案的适当选择。
数据科学项目初始阶段的设计(或数据)思维方法可以成为一种适合业务理解和数据理解的技术,具有研讨会等密集的交流形式,并且没有固定冲刺长度的定义。设计思维工作坊在发现问题阶段的特点是只关注问题。专家强调,在项目开始时需要进行深入交流,以达成共识。 Scrum 提供明确的职责,从而创建结构。产品负责人在业务理解方面发挥着至关重要的作用,并且应该拥有识别问题并从中得出需求的技术专业知识。
看板可以用作具有清晰任务结构的工具。专家们多次强调,业务和数据理解阶段的任务不要预估,因为依赖关系太多。例如,可以对任务进行优先级排序,而不是进行估计。在制定产品待办事项列表条目时,“完成的定义”也很有帮助。一些专家将“细化”视为详细描述产品积压项目的机会。然而,专家们对 Scrum 事件的频率和特征有不同的看法。一方面,Scrum 活动被认为是一次有用的交流,但另一方面,又被认为过于耗时。