解决数据困境的人将赢得人工智能革命

数据困境的解决者将赢得人工智能革命

那是因为良好的人工智能结果——无论是推荐的下一步最佳行动、某种异常或威胁检测,还是使用生成型人工智能的客户服务响应——都依赖于使用丰富高质量的数据来训练底层模型。

最近几个月让公众赞叹的生成型人工智能用例——如果能够提供足够的安全性和保护措施——将真正增加我们完成工作的能力。但它们也会很快变得同质化。为了与竞争对手区别开来,您需要利用您组织的专有数据为您的业务提供最佳结果。

尽管数据是人工智能的命脉,但对于您自己的组织来说,可靠的数据往往很难找到。事实上,在由Workday赞助的《A.I. IQ: Insights on Artificial Intelligence in the Enterprise》研究中,77%的参与者担心他们组织的数据既不及时也不可靠,不能与人工智能和机器学习(M.L.)一起使用。同样,不足的数据量或质量是他们的人工智能和机器学习部署未能达到预期的主要原因(29%)。

暂停片刻,让这个事实深入人心:绝大多数组织不完全信任他们自己的数据,以获得最佳的人工智能结果。

这主要是因为平均组织使用的应用程序数量众多。所有这些应用程序都使用和生成数据。Accenture最近的一份报告发现,平均公司使用来自多个供应商的500多个应用程序,80%的调查受访者表示他们将在未来两年购买更多来自其他供应商的应用程序。这是一个困境。您拥有大量非常有价值的东西,但很难将其全部整理成可靠和及时的形式。可以肯定的是,这种数据困境在大多数公司中不会很快得到解决。

过于复杂的技术组合会阻碍数据收集和整理的价值,但复杂性也会使得将所有数据整合到一个位置以供人工智能算法使用变得困难。每一个应用程序都是一个数据孤岛,必须进行整合、整理、管理和保护,如果您希望这些数据为最佳结果和洞察力提供动力。

整合不连贯的系统往往伴随着沉重的开发和维护成本,通过实现这些系统的一致性,您肯定会牺牲统一数据集的及时性。这种牺牲会留下一个过时的视图,只能显示您公司过去的运行情况,而不能反映当前正在发生的事情。如果孤立的数据滋生风险和不可靠性,通过现代平台简化数据领域可以带来希望。支持企业的关键锚定系统——像客户关系管理(CRM)、人力资本管理(HCM)、财务管理、库存管理等核心平台——可以帮助降低安全风险和数据孤岛。

要解决人工智能的数据困境,首先要从您想要提供的业务结果和洞察力入手。然后,您只能开始确定哪些数据将推动这些业务结果和洞察力。许多公司往往从数据开始,然后尝试使用这些数据来推动洞察力。这是一个逆向的做事方式,浪费时间,并且无法提供商业价值。

一旦您有了业务结果的想法,从您拥有的数据中获取最大利益的解决方案——最好是在一个统一的平台而不是一个系统的马赛克中处理数据——是将该数据视为您公司的一种产品。明确为该数据定义一个所有者和服务级别协议(SLA)(指示其可靠性、及时性等)。一旦您完成了使该数据可用的工程工作,重要的是它对整个企业都可用,而不仅仅是创建它、拥有它或最早要求它的团队。

请记住,数量并不是强大人工智能的全部。我们认为,数据质量比数据量更能支持人工智能的发展。同样,对于人工智能所需的数据质量——在规模上要比纯数量更难以达到——但它对工作场所中可靠、负责任和有用的人工智能至关重要。

重要的是要注意,人工智能的变革性质在短期内可能被夸大,而在长期内则可能被低估。我们无法想象到将创造新行业、商业模式和工作方式的用例。但唯一不会改变的是对可靠数据的需求。那些现在努力解决数据问题的人将能够从未来带来的任何好处中获益。

Jim Stratton是Workday的首席技术官。Workday是ANBLE Live Media的合作伙伴。