作者丨郭思
编辑丨陈彩娴
继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能文生视频大模型Sora,其火爆效果被誉为即将重塑视频内容创作的未来。而无论是ChatGPT还是Sora,众多身处职场的「男工女工」都在一边期待一边害怕,工作方式被彻底颠覆。
这一切都是因为AI可以通过现有的网络、数据、资料、知识,展示出超出一般人类的记忆、逻辑、分析、综合能力,如果它能够突破与人交互的界面(语言也是一种界面),那这种能力不仅会超过人类,而且超过几万倍,能较大限度地提高生产效率,也可能会取代部分传统工种。
很多人在思考,拥有什么样「可迁移通用能力」,才能不在这次人机之战中处于失势地位,而另一个值得思考的问题则是,究竟怎么样的应用和工具能最大限度的发挥大模型的价值,使每一个人的生产效率都倍增?
对于第二个问题,AI科技评论近期发现了一款大模型原生数据分析产品——办公小浣熊(https://raccoon.sensetime.com/office)。
这款产品由商汤科技推出,可以通过用户的自然语言输入,结合商汤大模型的能力,自动将数据转化为有意义的分析和可视化结果。
在得知办公小浣熊已经开发公测后,AI科技评论也上手体验了一把,亲身感受了这款加载了商汤大模型能力的数据分析产品,验证其是否能真正意义上提高生产力。
1、当AI变成数据预言家
衡量一个大模型原生数据分析产品的能力,首先我们从最基础的做起,根据文字生成表格。
日常生活中,数据文件常见的数据格式类型包括txt、csv、xls、xlsx等常规格式,txt的数据基本都是文字。
对于普罗大众而言,刚刚过去的2023年,疫情刚放开,出行欲望大大增强。笔者首先便用一段国务院春节出行数据放在txt中,让商汤办公小浣熊在大段繁杂且未经严格分类的文字信息中生成表格。办公小浣熊提供了还不错的答案。
另一方面,大模型赋能的数据处理产品备受瞩目的主要原因在于其能像人一样思考并且有媲美人类的逻辑推理能力。
在笔者与多位报告制作人员以及采购人员沟通中得知,大多数从业者对于表格工具的需求是希望其能一键生成多个类型的图表或者能够进行一些公式运算,如果能根据已有数据进行分析研判,对打工人来说就更为省心了。
基于这些需求,我们从基本的数据整合能力开始测试,输入一个复杂含多种物品种类的库存数据,要求办公小浣熊进行含有开关一项的数据进行整合并输出总价、办公小浣熊完美完成了这一任务,并给出了贴心提示,指出有些项目单价或采购数量没有提供,导致无法计算其总价。
此前,依托商汤大语言模型的代码解释器能力,办公小浣熊在数据分析场景中的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。
这足以显示,依托强大的大语言模型能力,办公小浣熊在理论上有超强的数据分析处理能力。当然是骡子是马,我们还是得拉出来遛遛。在进行多项测试之后,我们发现不管是简单还是十分复杂的数据表格,他都先会进行解读,会针对未来趋势进行研判,并且还会条理清晰的罗列了一些科学建议。
第一个测试实例是输入近年来全球手机销量数据,简单地让办公小浣熊进行分析,预测接下来一年全球手机的销售情况。
办公小浣熊首先是基于已有数据,进行了数据分析和总结,分别就全球销量趋势、增长率变化以及全球手机总销量和市场份额进行了要点提炼。
当进一步要求他预测下一年的销售趋势时,他也能进行很好的预判。
这对于从事销售岗位的朋友来说,无疑是巨大的好消息。而为了进一步测试办公小浣熊的预测能力,笔者采用了一份较为复杂的技术文档。
值得一提的是,为了考验小浣熊,这次我们特意采用了CSV格式的数据。
上传数据后,让办公小浣熊进行数据分析,并输出五点要点总结。办公小浣熊则从产品型号、生产技术、价格、核心和线程数、架构等各个方面进行了总结预测,其分析也基本符合逻辑,并未出现明显的事理性错误。
体验了众多基础功能后,如果仅仅满足于这些简单的功能,也许就称不上一个高级打工人了。俗话说,打工人打工魂,开工姿态要端正,如果一个数据分析产品能够按照简单的指令,上传之后就能进行全流程数据分析,对于生产力的提高,无疑是一个重大利好消息。
为了进一步测试办公小浣熊的数据分析能力,我们继续选取了一个数字资产数据表格,并要求办公小浣熊根据数据对投资组合进行分析,包括评估风险、预测收益等。
办公小浣熊在进行30秒的思考后,给出了十分详尽的分析结果,并指出历史表现并不总是未来表现的准确指标,实际收益可能会受到多种因素的影响。因此,这些预测应该谨慎对待,并结合其他信息和分析方法进行综合评估。看来办公小浣熊也充分get到了股市有风险,入市需谨慎的炒股精髓。
而在另一个更为复杂却更为常见的互联网APP数据分析场景中,我们首先用一个包含1000行数据的表格进行测试,要求办公小浣熊总结哪家母公司的下载量最高,且提供三点行业趋势分析。
这一次,办公小浣熊的思考时间变长了,需要53秒的响应时间,但是出来的结果却十分的优秀,他首先点出了下载量最高的母公司是ByteDance,并计算了其总下载量为85487432次。视频编辑和娱乐应用的流行、电商应用的增长、用户参与度的重要性三点给出了详尽的行业分析。
通过实际的测试,我们也验证了办公小浣熊的数据分析和推理能力。
2、实打实的数据清洗 大模型帮你打工干活
在日常工作过程中,进行数据分析工作时,很多人会经常遇到这种困扰:拿到一份复杂的客户名单或者人员信息表,分类整理出一份Excel表格的时候,却发现里面有很多空数据或者说出现了很多错误数据。
而这个看似细微不起眼的问题,却是数据分析工作中非常普遍的场景—数据清洗,也就是需要处理“脏数据”。
举例而言,在从大型数据仓库中抽取用于分析的数据时,由于数据仓库通常汇聚了围绕特定主题而整合自不同业务系统的数据,故难免充斥着各种不完整性。重复且错误的数据记录便是典型的“脏数据”实例。为了确保后续分析结论的精确性和可靠性,我们必须运用专门的工具和技术,依据一套严谨的规定来清理这些“污点”,这个至关重要的步骤就是数据清洗的过程。
根据Anaconda和Figure Eight进行的调查,数据清理可能需要数据科学家四分之一的时间。这也侧面反映了数据清洗在整个数据分析流程中发挥着至关重要的作用。
一般来说数据清洗涉及一致性检查和缺失数据整理。办公小浣熊是专业的数据分析产品,因此我们便测试了一下它在数据清洗方面的种种表现。
首先我们特意将一个有部分字段缺失的表格上传至办公小浣熊,要求检查出缺失数据。只花了5秒,办公小浣熊便检查出了里面总共缺失的数据。(为便于展示,下图已标出缺失字段)
检查缺失字段或许还比较简单,为了刁难一下办公小浣熊,我们特意将一个有计算公式的表格中部分计算数据改错,测试一下办公小浣熊是否能精准识别出哪些数据出现了错误。
在收到指令后,办公小浣熊展示了他的推理计算过程,在指出错误数据之后,给出了正确答案。
可以得见,在数据清洗方面,办公小浣熊也绝不含糊。而另一方面,对于众多的普通打工者而言,在日常工作中,表格美化的需求也十分旺盛。
最近在网络十分热络的梗叫—PPT/表格男工女工便可以反映这个现象。更有甚者,早年间还出现过一个离谱新闻,一男子乘火车从上海前往连云港开会,去了趟厕所回来后,电脑不翼而飞。
偷走电脑的嫌犯的盗窃理由竟然是:自己做PPT一直困扰,而看到电脑里的PPT觉得特别漂亮,所以一时贪念顺走电脑。
所以办公小浣熊究竟能否最高效率的让表格或者PPT变得美观且高大上?
以一个房地产常见的住宅价格指数表格为例,原始表格很朴实,基本是处于能打开excel的人都能制作出的水平。
借助办公小浣熊,可以生成美观的条形图,更令人惊讶的是,办公小浣熊还可以生成平时很少见的箱线图。
除此之外,办公小浣熊生成饼状图、折线图等都不在话下。
办公小浣熊生成的饼状图
办公小浣熊生成的折线图
当然以上测试示例只占据了「办公小浣熊」功能的一小部分,大家可以前去官网,体验更多内容。
官网链接:https://raccoon.sensetime.com/office
经过初步测试评估,办公小浣熊被证实为一款卓越的辅助工具,无需依赖专业的编程技能或复杂的操作流程即可有效利用。可支持多元数据分析,txt、csv、tsv、xls、xlsx等格式数据,处理起来都得心应手。它在确保信息准确性、展现逻辑判断力、理解和适应上下文情境以及执行数据分析与推理任务等方面均表现出色。
通过接纳自然语言指令,结合商汤大模型体系的核心功能,如意图识别技术、深度逻辑解析能力及代码自动生成功能,办公小浣熊能够将原始数据自动转化为富含洞见的分析结论,并进一步生成直观易懂的可视化图表。特别值得注意的是,由于其背后商汤大模型体系对中文语境的强大适应和理解能力,该产品尤其适合满足中国本土的数据分析需求。
在大模型战争中,各家使出浑身解数,但幸运的是,技术内卷之下,大模型产品不断问世、迭代,AGI(通用人工智能)也随之洪波涌起。
每个人都能够成为技术的受益者,生产效率也能不断提高,商汤大模型的使命得以彰显——技术发展的意义从来都不仅仅是技术本身,而是技术潮流带动的社会经济变革,在这一点上,商汤办公小浣熊交出了一份完美的答卷。
本文作者长期关注一大模型领域产品动态与故事,欢迎添加作者微信lionceau2046互通有无。