企业领导或许对其企业的数据已准备好迎接AI充满信心,但IT工作者的说法却大相径庭,他们中的大多数人每天都在花费数小时对数据进行梳理。
根据Capital One最近的一项AI就绪度调查,近九成企业领导表示其企业的数据生态系统已准备好大规模构建和部署AI,然而,在受访的IT从业者中(包括数据科学家、数据架构师和数据分析师),有84%的人每天至少要花费一小时来解决数据问题。
该调查显示,70%的IT专业人员每天花费一到四小时来处理数据问题,而14%的人每天花费超过四小时。
Worldly(一家供应链可持续性数据洞察平台)的CTO John Armstrong表示,这项调查指出了许多企业领导在部署大多数AI工具所需的数据工作方面存在的根本性误解。
“有一种观点认为,我们只需将一堆数据扔给AI,它就会解决我们所有的问题,”他说,“作为技术领导者,我们的工作就是帮助我们的受众了解什么是可能的,以及实现他们的目标需要什么。”
Armstrong补充道,关于AI数据管理需求的持续误解所带来的影响是巨大的。当他与其他IT领导者交流时,他们都表示在采用AI方面承受着巨大压力。
“这是一个非常大的问题,因为如果处理不当,你的企业可能会花费数百万美元在错误的解决方案上,从而实现错误的结果。”他说。
误解AI的力量
BairesDev(一家软件外包提供商)的首席技术官Justice Erolin表示,这项调查凸显了一个典型的脱节现象。
“通常,高管们对AI的承诺感到兴奋——他们在试点项目或演示中看到了AI的光芒——但他们并不总是能看到使其在日常工作中发挥作用的细节,”他说,“这就是摩擦产生的地方。”
Erolin补充道,企业领导的信心往往集中在AI模型或算法上,“而不是数据质量、集成或甚至遗留系统等繁琐的基础工作。”
他说,成功的试点项目或表现良好的算法可能会给企业领导带来虚假的希望。“大局可能会讲述一个不同的故事。”他补充道。
例如,Erolin表示,BairesDev的一个客户在AI项目时间线上花费了30%的时间来集成遗留系统时,感到十分惊讶。
Erolin补充道,虽然在AI项目之前应预料到需要初步解决数据问题,但每天花费数小时工作人员时间来持续修复数据问题,可能是一个警告信号,表明企业的数据尚未为AI做好准备。他表示,为AI做好准备的企业应该能够自动化部分数据管理工作。
“如果你花费大量时间来维持数据运营层面的正常运作和清洗,那么你就无法利用你的领域专家来完成更大的战略任务。”他说。
遗留问题
Evidology Systems(一家合规解决方案提供商)的首席技术官兼创始人Rupert Brown表示,收集和存储有限数据的遗留系统是问题的一部分。他补充说,在一些行业中,公司正在使用遗留软件和中间件,而这些软件和中间件的设计并不符合现代AI模型对数据收集、传输和存储的需求。
“在可预见的未来,数据质量问题将限制AI技术的实用性,”Brown补充道,“行业中仍然普遍存在输入数据字段有限的遗留系统或被迫循环使用帐户号的系统,这也导致了AI无法理解的更正。”
Erolin表示,为了解决过高期望与低数据就绪度并存的问题,CIO和IT领导者应该寻求透明度和协作。他说,BairesDev一直致力于向非技术利益相关者普及AI实施的现实和挑战。
“当高管们了解真正的挑战——以及技术团队花费时间解决这些挑战的情况——他们就更有可能投资于稳健的数据实践并调整期望,”他说,“这都是为了让每个人都达成一致。”
Capital One数据工程副总裁Terren Peterson表示,虽然企业领导的期望与IT从业者的经历之间似乎存在脱节,但围绕GenAI的炒作可能会为CIO和其他IT领导者提供他们解决长期存在的数据问题所需的资源。他补充说,这家金融服务公司委托进行这项调查,是因为它自己有兴趣部署AI工具来服务其客户。
“数据卫生、数据质量和数据安全都是我们谈了20年的话题,”Peterson说,“我内心有一部分在想,AI和机器学习是否会成为催化剂,开始引起人们对这些数据基础元素的关注?”
他补充道,AI革命可能会推动人们认识到数据质量的重要性。“尽管它可能一直排在不同CIO议程的后列,但现在它的优先级将会提高。”
小型模型来救援
虽然许多企业领导由于当前的炒作而专注于部署GenAI,但Worldly的Armstrong建议IT领导者关注用例而不是特定的AI技术。他指出,在某些用例中,对于预期目的而言,较旧的AI技术(如机器学习或神经网络)可能更合适,并且便宜得多。与其他一些AI工具相比,GenAI消耗的能量巨大。
他还建议CIO们推出小型模型,以找到最适合其企业的AI用例,并认识到一些实验可能不会成功。
“实验不必是大规模的,但它能培养熟悉感,”他说,“它开始为可能的艺术提供信息。如果我要给出一条战术建议,那就是慢慢来,持续投资,而不是产品化。”
他补充道,创新往往涉及很多失误。
“你想积累一系列知识,”Armstrong说,“每个人都想要迭代、快速失败、快速开发,但没有人想要真正失败,这是我们的领域中的一种虚伪。尝试吧,如果成功了,你就想要它,如果失败了,你就从中学习。”