恺望数据发布主动化数据产线,称「95%以上主动驾驭数据仍需人工标注」

GhatGPT的爆火带给了全世界一个热点问题:「人工智能真的能替代人力吗?」在当前仍依靠领域人力方式的数据标注畛域,主动驾驭数据服务公司恺望数据给出了一个双面答案——「能,但还不完全能替代。」2月17日,一场聚集了主动驾驭圈内技巧专家、汽车主动驾驭及智能网联畛域投资人参加的闭门交流会在北京举行。会上恺望数据透露,基于「主动化产线 领域化人力」为核心的「恺望主动化数据产线」已经启用。据透露,该主动化数据产线以数字驱动方式打造主动驾驭数据消费的全过程系统,并充分考虑「人机交互」的适配场景,通过SaaS平台、算法、各板块

GhatGPT的爆火带给了全世界一个热点问题:「人工智能真的能替代人力吗?」在当前仍依靠领域人力方式的数据标注畛域,主动驾驭数据服务公司恺望数据给出了一个双面答案——「能,但还不完全能替代。」

2月17日,一场聚集了主动驾驭圈内技巧专家、汽车主动驾驭及智能网联畛域投资人参加的闭门交流会在北京举行。会上恺望数据透露,基于「主动化产线+领域化人力」为核心的「恺望主动化数据产线」已经启用。

据透露,该主动化数据产线以数字驱动方式打造主动驾驭数据消费的全过程系统,并充分考虑「人机交互」的适配场景,通过SaaS平台、算法、各板块建模等科技工具,以及校企合作培训逾千位「恺望人工智能训练师」,连续提高数据消费及运营管制全过程各板块的领域与效用。

当前,恺望已完成可在连续提高数据消费领域化的同时减少本钱超过20%。

恺望数据发布主动化数据产线,称「95%以上主动驾驭数据仍需人工标注」

「还未到抛弃人力的时候」

OpenAI用7年时间孕育了ChatGPT,在此之前,经历了领域极大、基于人的数据,不断的建模与优化。虽然人工智能是热门焦点,也是大势所趋,但从当前的实际的产业应用来看,在主动驾驭数据消费畛域,多个关键都仍依赖「人为判断及行为」主导。

在活动现场的QA关键上,恺望数据CEO于旭和产品VP张鹏提出了自己的观点。例如部分企业对于「主动标注」的宣传上,张鹏表示「不能细看,一细看可能会发现实际上还是人在干。」

他表示,在主动驾驭畛域,能够自建大型智算中心的企业,毕竟很少数的一部分。当前95%以上的数据都还是需要人工标注,只是这些数据有可能是已经预先用算法过滤了一遍,之后再去由人工调校。

不过在这种背景下,恺望还是认为会坚定不移地往主动化的数据消费方向去走:「算法模型是肯定是做的,这毕竟是大方向。」张鹏认为,之所以要提数据主动消费线,是因为这才是符合当下在中国解决主动驾驭数据领域和质量本钱之间平衡的解决方案。

恺望数据发布主动化数据产线,称「95%以上主动驾驭数据仍需人工标注」

于旭表示,在单一企业的特定任务中,在训练到一定程度时,可以做到很高的例如80%的预标注程度。但是,当再到新的阶段时,就又要重新开始,并不是一个稳固的水平。

「例如,传感器的种类是多样化的,而且一旦发生了安装位置的变化,可能又会影响数据识别,这是一种数据的长尾问题。」于旭认为,预标注更应该在还未被训练好的模型上发挥作用,如果能抽离出更通用化的预标注的模型,显然会具备更高的价值。

当前行业内的技巧方案,多数是关注解决「预标注」这个关键的效用,而恺望认为,现阶段要连续完成稳固的高价数据供应,关键是在通过「主动化技巧+人力运营管制」的部署,来提高全消费及管制过程的全局效用,进一步提供领域化的稳固高价数据供应。

主动驾驭标注稳固高价供给痛点

「主动驾驭公司现在的融资形势已经没有以前那么好了,这意味着海量数据的处理领域,需要在强预算限制下面去解决。」于旭说道。

恺望数据发布主动化数据产线,称「95%以上主动驾驭数据仍需人工标注」

在活动现场的业内交流环境上,也有几位用户方嘉宾提出,数据标注主动驾驭数据标注是价格敏感型导向的,数据需求变大了,可本钱怎么降下来?

就此,恺望以「主动化产线+领域化人力」为核心,在不完全抛弃人力的模式下,引入人工智能技巧提高数据消费领域化和主动化能力,并充分利用现阶段行业内「人的行为经验」进行AI建模,为最终完成消费线全主动化连续进行数据积累、建立规则、建模优化。

「数据消费过程包括对需求规则的解读、数据任务拆分、人员匹配,也包括在消费管制过程进行产能监管、质量监管、效用监管,有些部分可以完成全主动化,但有些部分、尤其是需要人为判断的部分,还有待更多成熟的模型建成,才能逐步完成主动化。」于旭介绍道。

在技巧方面,恺望主动化数据产线由基于BI系统和AI算法建成的恺望SaaS平台支撑,由各主动驾驭数据消费的多个关键形成各自的系统接入组成,这些系统通过算法建模,既独立运作、又相互协同,未来通过各板块的连续建模优化、将进一步推进恺望主动化数据产线「全主动化」。

领域化培养人工智能训练师

学校学生领域大、本钱较低,且不容易受供需影响,但百人百面,如何完成高效能配置?

恺望透露称,其正在搭建「恺望数据学院」,通过与多家高职院校合作的「恺望人工智能培训师计划」, 对学生进行行业通用的数据消费技能培训及恺望独有的主动化消费体系培训,这将帮助恺望获得大领域的标准化人力。

恺望数据发布主动化数据产线,称「95%以上主动驾驭数据仍需人工标注」

据了解,该计划预计在今年培训超过1000位学生,第一批300人培训当前已在山东等地高职院校完成。按照恺望的计划,将借鉴Uber的运营管制模式,结合开拓和管制各地的校园渠道、快速拓展培训师的领域及进行培训。

在总结数据消费行业时,于旭表示,这一行业当前有点类似「期货」的感觉,有七八百个玩家,也并不稳固,很多人就是在「赌」或者是「炒期货」。

「然后当数据有大领域爆发的时候,行业在后期会逐渐聚焦到几个巨头上,就类似网约车行业,这是绝对有可能性的。」于旭说道。

给TA打赏
共{{data.count}}人
人已打赏
AI

蚂蚁团体被独立研究机构列入《2023Q1亚太企业反讹诈市场格局》第一梯队

2023-2-20 14:40:00

AI

首次原生支撑苹果M1 Mac,Linux 6.2正式发布!

2023-2-21 14:52:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索