最近对参与主动AI和机器学习(ML)项目的225多位企业数据科学家,人工智能技术人员和业务利益相关者的调查表明,对于大多数组织而言,人工智能技术仍处于起步阶段。

到2025年,人工智能市场预计将成为一个1900亿美元的产业(根据市场和市场),到2029年,全球认知和人工智能系统的支出预计将达到358亿美元,比2018年的支出增长44.0%(根据IDC)。 这项研究表明,人工智能是先进的并且在不断发展,已经由大型企业采用,并准备对我们的生活和工作产生影响。

但是,在组织中实施AI的时候,对于AI来说还处于初期,这是有原因的。 人工智能系统在执行其预期功能之前需要经过认真的培训。 当该功能涉及对图像或视频做出类似于人的判断的复杂操作时,换句话说就是“观看”,则系统必须暴露于大量经过精确标记和注释的培训数据中。 随着AI成为企业日益增长的优先事项,数据科学团队面临着交付项目的巨大压力,但经常面临着以所需规模和质量生成培训数据的挑战。

为什么组织在构建适合AI策略的数据时面临挑战

这项挑战的紧迫性是Dimensional Research和AIegion进行的一项调查得出的一项发现,其结果被汇总在数据问题所阻碍的人工智能和机器学习项目报告中。 接受调查的受访者证实,企业机器学习尚处于起步阶段,数据科学团队仍然很小,不断增长的数据科学专业知识还没有与成熟的ML项目专业知识相提并论,培训数据挑战对项目成功提出了广泛的挑战。 96%的受访者反映了这一最后观察结果的图形展示,他们表示缺乏培训数据技术和技能已阻碍了他们训练机器学习算法和获得模型必须提供的信心的能力。

如今, 根据《麻省理工学院斯隆管理评论》(MIT Sloan Management Review)的调查,拥有10万名员工以上的大型企业最有可能采用AI策略,但目前只有50%的企业采用AI策略。 该调查进一步证明了AI在企业中仍处于新生状态:

  • 70%的人表示他们的第一笔AI / ML投资是在过去24个月内
  • 超过一半的企业表示,他们开展的AI和ML项目少于四个
  • 只有一半的企业将AI / ML项目投入生产

不到三分之二的调查受访者表示,他们的机器学习项目已经进展到以标签数据进行培训的程度,这是机器学习项目生命周期中相对较早的阶段。 关于ML在企业中的不成熟性的更多揭示,是有关团队在何处挣扎以及为何一半项目从未部署的报告。

受访者表示:

  • 他们有78%的AI / ML项目在部署之前的某个阶段就停滞了
  • 81%的人承认用数据训练AI的过程比他们预期的要困难
  • 76%的人通过尝试自己标记和注释训练数据来应对这一挑战
  • 63%的人尝试建立自己的标签和注释自动化技术

据报道,将近40%的失败项目在训练数据密集阶段(例如,训练数据准备,算法训练,模型验证和评分以及部署后增强)中停顿了下来。

当被问及失败的原因时,受访者提到:

  • 缺乏专业知识(55%)
  • 意外并发症(55%)
  • 数据问题(36%)
  • 缺乏模型信心(29%)
  • 预算(26%),以及
  • 人数不足(23%)

如前所述,近三分之二的人报告说他们的机器学习项目已经从概念验证(POC)和算法开发发展到训练数据阶段。 对于大多数人来说,这个阶段进展不顺利。 80%的人报告说,训练他们的算法已证明比他们预期的更具挑战性。

训练算法数据具有挑战性的原因很多:

  • 数据存在偏差或错误
  • 资料不足
  • 数据不可用
  • 没有人来标记数据
  • 没有标记数据的工具

不到4%的人报告培训数据没有问题。 这些与数据相关的问题可能源于内部如何生成和标记数据。 调查组中将近四分之三的人表示,他们正试图自己对培训数据进行标记和注释。 略高于40%的受访者表示,他们全部或部分依赖现成的,预先标记的数据。

这些问题导致十分之七的公司将外部服务用于其AI或ML项目,其中许多公司专注于数据收集,标记和专业知识。 由于AI / ML人才稀缺且昂贵,这项研究建议企业应考虑使用外部解决方案提供商进行关键活动,例如数据标记和模型评分。 数据提供了证明,这种外包可以改善结果。

结论
企业将战略价值分配给其机器学习计划,并期望AI和ML改善其业务的各个方面,并可能在其行业领域造成破坏。

但是,AI / ML项目仍处于企业内部的早期开发阶段。 数据科学团队规模相对较小且经验不足,这会影响这些项目的效力和结果。 保护和标记支持算法开发和置信度所需的数据量仍然是这些组织的难题。

注意:与会者来自五大洲,分别代表15个行业(技术,医疗保健,金融服务,教育,制造业,政府,零售,服务,电信,食品和饮料,媒体和广告,能源和公用事业,运输,制药和非营利组织)。 63%的受访者代表拥有5,000多名员工的公司,37%的受访者代表具有1,000至5,000名员工的组织。

要下载完整的调查报告,请在此处单击链接。

上一篇

为什么分析平台使您的数据科学家失败

下一篇文章

为什么全球的在线劳动力可以成为建筑业的未来