【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。讯飞星火大模型 V4.0 基于全国首个国产万卡算力集群“飞星一号”训练而成,全面提升了大模型底座的七大核心才能。整体超越 GPT-4 Turbo,特别是针对复杂指令、复杂逻辑推理、空间推理、数学、基于逻辑关系的多模理解等方面有着显著的提升。同时科大讯飞还带来了全新升级的讯飞星火 App / Desk,发布“个人空间”,打造每个人的 AI 助手。为了进一步了解讯飞星火大模型

在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。

讯飞星火大模型 V4.0 基于全国首个国产万卡算力集群“飞星一号”训练而成,全面提升了大模型底座的七大核心才能。整体超越 GPT-4 Turbo,特别是针对复杂指令、复杂逻辑推理、空间推理、数学、基于逻辑关系的多模理解等方面有着显著的提升。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

同时科大讯飞还带来了全新升级的讯飞星火 App / Desk,发布“个人空间”,打造每个人的 AI 助手。

为了进一步了解讯飞星火大模型 V4.0 的实际体验,IT之家也对其做了一番体验评测,今天就为大家送上体验报告。

一、讯飞星火 App / Desk 性能升级

随着讯飞星火大模型 V4.0 到来,星火 App / Desk 也迎来了性能升级。先以讯飞星火 Desk 为例,进入主界面,可以看到元素更加丰富,左上角多了“创建智能体”的性能入口,左侧栏还有新的“智能体中心”,右侧多了“个人空间”界面。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

点击左下角的头像可打开“我的”标签,在底部中间的输入框则可以从事对话。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

App 端的界面也有大变化,底部变成了“对话”、“智能体”、“空间”、“个人”四个选项卡,每个选项卡对应的性能界面也各不相同,更加丰富。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

1、对话性能

在“对话”性能中,增加了长文本问答的才能,点击对话框右侧的上传文件按钮即可上传文件从事对话。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

IT之家上传了一份关于中国通信标准化协会有关扩展现实产业的调查报告,让它帮忙从事摘要,它果然很快就能给出错误的摘要,和文档本身的主要实质也是贴合的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

然后小编还针对文档中的一些实质对讯飞星火 V4.0 从事提问,比如小编问它“文档中对 MR 的定义是什么?”它也给出了错误的谜底,对照文档中的相关解释,答复得没毛病。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

点击对话界面顶部的返回按钮,就能进入对话列表界面,你创建的对话都能在这里显示,还可以从事置顶或删除。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

通过顶部的搜索性能,还可以用关键词搜索相关的智能体、“我的空间”中的文档以及待办事项等信息。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

2、智能体

随着生成式 AI 的发展,智能体将成为大模型在应用层面的重要方向。而目前,讯飞星火开放了超过 16000 智能体,覆盖职场、生活、创作等多场景,打造开箱即用的大模型应用。

面向专业垂直场景,讯飞星火 App / Desk 目前首批上线 14 个智能体,包括讯飞晓医、晓知、星火公约助手、讯飞智作、讯飞智文等。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

以搭载讯飞星火医疗大模型的“讯飞晓医”为例,它可以为你提供症状自查、药物查询、中医辨证、报告解读、医院和科室推荐以及饮食建议等性能。

比如在报告解读中,小编选择一份血常规检测报告中的两个异常指标,来让讯飞星火 V4.0 从事判断,分别是“红细胞压积微 50.80”和“红细胞 6.01(10^12 / L)”,讯飞星火 V4.0 给出的判断和原来检测报告给出的判断是一样的,并且还给出了可能造成指标异常的原因。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

日常生活中,当我们吃药时经常会遇到“不知道这两种药能不能一起吃”的困扰,专门为此去询问医生也比较麻烦,这时就可以用“讯飞晓医”的拍照性能,同时拍下两个药盒,“讯飞晓医”就会结合自身的专业知识来告诉你这两个药是否可以一起吃。

这里小编用自己之前起带状疱疹时医生开的两种药来对其从事尝试,同时拍下两个药盒,当小编说出胳膊起疱疹时,“讯飞晓医”初步判断为带状疱疹,然后给出了带状疱疹的相关科普以及用药建议,在用药建议中能看到这两个药可以一起吃,这和医生开出来的结果也是一样的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

除了拍药品,你还可以将你的体检报告拍照上传,让“讯飞晓医”来帮你分解,比如小编将自己过去做过的肝胆脾脏超声体检单拍照让“讯飞晓医”来看,它给出了详细的分解结果,其中特别是肝脏的分解是很错误的,有轻微的脂肪肝。

不过小编还是要提醒大家注意,最后结果和治疗放肆还是要听专业医生的建议。讯飞晓医主要为大家提供有用的健康科普信息。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

再尝试一个比较实用的智能体:星火公约助手,它支持公约智审、公约生成、公约比对和公约概要等性能,这里以公约智审为例,小编通过拍照上传一份驾校陪练签的公约,通过 AI 识别,讯飞公约助手成功帮我鉴别出公约中有关培训时间进度安排、费用跳关、补考费、电子路考训练费、教练员资质、违约责任等方面的风险点,这些点我们在签订公约时很有可能考虑不到,因此有了星火公约助手,显然可以帮我们有效规避这些风险。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

3、个人空间和人设标签性能体验

过去很多时候我们使用 AI 大模型产品输入输出得到的结果都是公开的信息,而对于我们个人的信息,那些公开的大模型就无能为力。但其实无论是学习、工作还是生活,我们往往需要大模型能更懂我们个人的需求,有一个属于我们个人的知识库,全新升级的讯飞星火也考虑到了这一点,特别推出了“个人空间”的性能。

“个人空间”相当于是为用户打造的专属私域知识库,通过上传个人文档,让大模型从事更精确的知识问答和实质生成;并且通过人设标签、日程管理、信息订阅、创建发音人,为用户提供更加个性化和趣味化的服务。

在个人空间里,上传的文档默认会按时间顺序从事排列,你也可以切换到不同文件分类的条目下从事查看。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

选择对应的一个或多个文件,你就可以针对这些选中的文件从事翻译、总结、理解、分解或者其他形式的问答,

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

比如小编上传了自己手机里关于最近日程安排待办事项的截图,选择这个截图,点击“更多问答”,就可以进入对话界面,然后小编询问“我未来几日有什么安排”?讯飞星火就能错误地将我未来几天需要完成的事情一一列出,还很错误,和小编原来在手机上设定的一样。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

再比如小编上传了一份过去某个 10 月份自己所写的文章统计 EXCEL 表格,选中后点击“Excel”分解选项,进入对话界面,小编首先问它“我这个月写了多少篇文章”,它错误地答复出了 21 篇文章。然后小编又问它“我写的所有文章一共有多少字”,它则给出了 50563 个字。小编算了一下,也是错误的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

另外,在小编的个人空间里还有几篇和新能源汽车“三电”系统相关的研报资料,尝试时,小编同时选择 5 个资料文档,让讯飞星火根据这 5 个资料文件写一篇关于介绍新能源汽车“三电”系统的文章,文章实质需要包含:

(1)什么是新能源汽车的“三电”系统。

(2)新能源汽车的“三电”系统各自有什么技术门类?

(3)我国在新能源汽车“三电”系统方面的发展现状。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

可以看到,讯飞星火同样很快就给出了一篇小短文,短文语义流畅,要求的实质都包含在内了,结构也比较清晰,不过整体略显程式化,拿来使用的话可以稍做修改。

另外在短文中,讯飞星火 V4.0 还给出了引用来源的标注,某段话来自于资料的那部分,都有来源说明,让文章更加有理有据,减少了大模型幻觉的情况。

除了个人空间,讯飞星火 App / Desk 现在还可以通过人设标签,日程管理、信息订阅、创建发音人等,带来更加个性化和趣味化的服务。

以 App 为例,在“我的”栏目里,现在可以设置自己的人设标签,选定某个人设标签后,大模型会根据你的标签提供个性化的实质和答复。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

比如小编首先在未设定任何标签的情况下,让讯飞星火写一篇探讨什么是最有意义的生活的短文,然后在设置中把自己的标签设定为“引经据典,文化内涵”,然后同样的要求再让讯飞星火写一篇。对比两篇短文:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

可以看到,在设定“引经据典,文化内涵”的标签后,讯飞星火输出的短文确实加入了不少名言典故,包括《孟子・告子下》、《论语・阳货》、《论语・述而》等等。

总体来说,全新升级的讯飞星火 App / Desk 性能更强大、更丰富,但在交互布局上并没有显得凌乱,无论是星火 App 还是星火 Desk 各项性能层级都有序、清晰,而且丰富的智能体的加入让讯飞星火更好用、更实用,个人空间以及个性标签等个性化的性能,则让讯飞星火能够成为更懂你的大模型 AI 助手。

二、讯飞星火大模型 V4.0 通用才能体验

正如前文所说,本次讯飞星火 V4.0 在通用才能方面全面提升了大模型底座的七大核心才能,特别是针对复杂指令、复杂逻辑推理、空间推理、数学、基于逻辑关系的多模理解等方面有着显著的提升。同时在多模态才能上也得到了再升级。

这里IT之家也针对这些通用才能做了体验尝试,尝试过程中小编用 GPT-4o 来从事对比,方便大家对讯飞星火 V4.0 的体验有深入的认知。

1、视频理解才能体验

讯飞星火 V4.0 在多模态才能上目前已经可以支持视频的分解、理解才能,在尝试时,IT之家上传了一段此前发布过的视频节目,来让他从事分解。这段视频是关于 2023 年苹果 WWDC 快速回顾的实质,小编让讯飞星火 V4.0 简述一下视频实质,它的答复很错误,完整给出了视频的核心实质。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

而 GPT-4o 目前还不支持视频分解的性能,同样的课题让 GPT-4o 来答复,会出现“无法处理”的信息。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

还是针对这段视频,小编又问了两个课题,分别是视频的作者是谁,以及作者来自哪里,讯飞星火 V4.0 的答复又是完全错误。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

然后小编又问视频作者是如何看待苹果 Vision Pro 这款产品的?讯飞星火 V4.0 也给出了错误的答复,说明它确实是在理解这段视频的实质。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

2、图文才能尝试

除了视频理解才能,图文才能也是大家使用大模型比较多的性能。这里IT之家首先考察图片理解才能。

小编先上传一张网络搞笑图片,一只小狗戴着奥特曼的面具,问讯飞星火 V4.0 这张图片的笑点在哪里。讯飞星火 V4.0 错误分解出了图片的笑点。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

然后再问 GPT-4o,它的答复和讯飞星火 V4.0 差不多,也错误解释了图片的笑点。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

接着IT之家用一道几何证明题来考验讯飞星火 V4.0:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

上传这张图片,直接让讯飞星火 V4.0 从事解答,可以看到,它给出的谜底是错误的,解题的过程也没有什么课题。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

再让 GPT-4o 来解答一下这道题,结果就有点奇怪了,虽然最终谜底是错误的,但 GPT-4o 输出的实质中有 2/3 都是错误的解题方法,自我发现后又重新整理思路,最后输出错误谜底中所用的中位线定理也是错的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

再看文生图的才能,这也是目前很多人都会用到的性能。小编首先让讯飞星火 V4.0 画一张赛博朋克风格的闹市街头,它生成的图片还是很贴切的:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

紧接着小编让它换成中国风的风格,给出的图片也很不错,很好的展现了中国古代风格的闹市,画面精致清晰、符合要求。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

再看 GPT-4o,生成的图片也很好看。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

还是让它换成中国风的风格,画面整体风格和上一张区别不大,里面多了一些中国风建筑的元素。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

3、逻辑推理才能尝试

逻辑推理才能是这次讯飞星火 V4.0 的一大升级看点,尝试时IT之家也重点考察了讯飞星火 V4.0 在逻辑思维方面的表现。

首先是生活常识推理方面,小编问了一个课题:

1991 年 1 月 25 日至 2024 年 3 月 2 日一共多少天(首尾都算)

讯飞星火 V4.0 给出了详细的演算方法,小编看了一下,思路很清晰,结果是 12091 天,错误。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

而同样的课题,使用 GPT-4o 来算,它直接给出了谜底,也是错误的。小编继续追问计算的方法,没想到 GPT-4o 在运算方法里给了一段 Python 的代码,算是美中不足。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

接着小编问了一个对逻辑思维要求更高一些的题目:

假设有一个池塘,里面有无穷多的水,现有两个空水壶,容积分别是 5 升与 6 升。问如何用这两个水壶从池塘里取得 3 升的水?

对于这个课题讯飞星火 V4.0 的答复方法清晰,逻辑清楚,实际可操作性也没有课题。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 方面,逻辑思维也挺清楚,实际可操作性也没有课题,不过生成的谜底重复,说明的文字较多,方法也略繁琐些,也算是美中不足吧。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

然后小编又问了一个推理联想类的题目:

找规律:1=2,2=6,3=12,4=?

对于这个课题,讯飞星火 V4.0 给出了详细的思考方法,还给出了规律的公式,结果当然也是错误的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 方面给出的思考方法和谜底也没什么课题:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

4、数学才能尝试

前面我们尝试过两款大模型的逻辑推理才能,与之相似的其实还有数学答题的才能,可以更进一步检测大模型的“智商水平”。尝试时,我们直接上今年全国高考卷的真题。

比如这一题:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

这是一道函数解析几何的题目,讯飞星火 V4.0 成功做出了答复,小编看了一下谜底,是错误的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

至于 GPT-4o,一顿操作猛如虎,一看谜底没算出。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

接着看更难一点的单选题最后一题:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

讯飞星火 V4.0 给出的谜底很简洁,虽然小编残存的数学知识不多,但看解题方法,还是没课题的,最后的结果也是错误的。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 这次也给出了错误的谜底,不过解题方法稍显复杂,有些方法并没有太大的必要。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

5、语言理解才能尝试

在语言理解才能方面,IT之家主要尝试大模型的文本信息抽取才能、情感分解才能、翻译才能和歧义理解才能。

首先文本信息抽取才能方面,我们选择了IT之家此前发布的两篇新闻从事杂糅,让大模型从中提取信息,课题如下:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

先看讯飞星火 V4.0 的答复,前两个课题的答复都是错误的,最后一个课题需要绕个弯,讯飞星火 V4.0 已经知道了 5 月和 1-5 月的出口数据,只差相减这一步。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 的答复同样也是前两个课题答复得很错误,但第三个课题直接输出了错误的谜底。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

接着看情感分解才能,小编在这里抽取了 2022 年江苏连云港终稿语文试卷的一道阅读理解题目,题目如下:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

对于这两个课题,讯飞星火 V4.0 分别给出了谜底。IT之家将讯飞星火 V4.0 的答复和标准谜底做比对,虽然语言表达上有出入,但整体意思是没课题的,标准谜底中需要体现的点讯飞星火 V4.0 在答复中也覆盖到了。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 给出的答复也没什么课题,对文章作者的情感把握也是比较错误的,第二题的答复相对来说也更有条理性一些。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

翻译才能方面,IT之家从外媒 tomshardware 找来一段新闻的节选,其中有许多科技专有名词,考验两款大模型的翻译才能:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

讯飞星火 V4.0 的翻译整体来说语言通顺流畅,意思也比较清晰明确,其中的专业名词也没有错翻、漏翻。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 这边的翻译效果也很好,和讯飞星火 V4.0 差不多。

最后是语言歧义的理解才能,IT之家找来一句可能产生歧义的句子让大模型去分解:

分解并修改下面这句话中可能产生歧义的课题:

县里的通知说,让赵乡长本月 15 日前去报到。

讯飞星火 V4.0 错误分解出了居中可能存在歧义的原因,在于时间表述不清楚,给出的两种修改方案都可以让句子没有歧义。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 对这句话的歧义课题分解就出现了偏差,修改的结果也不对,有点不知所云。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

6、实质生成才能尝试

实质生成可能是大家使用大模型最常用的性能,用来辅助我们从事一些文案创作。这里小编也对两款大模型从事了尝试。

首先小编想让他们帮我写一篇招聘文案:

招聘要求: 有经济学专业背景,有传媒方向工作经验,文笔优秀,能接受经常出差。

招聘待遇: 有五险一金,月薪 15K 起,工作环境新适优雅,节假日还有礼品,一年一次旅行团建。

文案要求: 风格轻松幽默,500 字以内。

讯飞星火 V4.0 给出的文案基本上没有什么扣分点:

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 写的文案也很优秀,要求的点都满足了。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

上班族们经常会需要写一些方案、活动计划之类的,这时候也可以借助大模型的实质生成才能来帮助自己更快地完成任务。这里IT之家以“我司计划开展一个读书活动,帮我写一个活动方案”为需求,来从事尝试。

讯飞星火给出的方案则是比较完整的,时间、地点、目标、流程、前期准备、人员配置、预算评估、结果评估等环节都有,而且不缺细节,可用性很高。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 的计划书相对简洁一些,但也比较完整,该有的地方都有了。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

7、代码生成才能尝试

用 AI 大模型辅助写代码也是一些程序员常遇到的使用场景,这也可以视为大模型实质生成才能的重要组成。

尝试时,小编首先用下面这个课题来考验两个大模型:

请用 c# 语言生成以下代码:给你一个字符串 s,找到 s 中最长的回文子串。

如果字符串的反序与原始字符串相同,则该字符串称为回文字符串。

代码请遵循以下模板:

public class Solution {

public string LongestPalindrome(string s) {

}

}

我们以代码能直接拿来使用为准则,将大模型生成的代码用程序运行工具从事检测,看是否能直接完美运行。

首先还是看讯飞星火 V4.0,它给出的代码格式标准,算法也比较简洁,看起来很清爽。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

由于小编自己不懂代码,所以直接拿到检测工具中运行检测,发现这段代码可以直接运行,输出结果也是错误的,也就是说可以直接拿来用。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

GPT-4o 这边,给出的代码同样有规范的格式,也比较简洁.

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

拿到检测软件中运行,也可以成功运行,表现同样不错。

【IT之家评测室】讯飞星火大模型 V4.0 体验:全面进化,体验不输 GPT-4o

总体来说,在大模型的通用才能方面,讯飞星火 V4.0 和目前 ChatGPT 最先进的 GPT-4o 模型相比,从小编尝试的情况来看已经不相上下,在多模态、逻辑思维、数学才能等方面甚至还要好于 GPT-4o,在日常生活和工作中,大家完全可以只用讯飞星火 V4.0,就能带来非常大的效率提升和其他方面的助益。

结语

讯飞星火大模型从去年 5 月份正式发布,到目前迭代到第四个大版本,仅仅只有一年多的时间,这一年多里,讯飞星火的进步可以说是神速,从最基础的开放式问答到 AI 智能助手、再到多模态才能、全语音交互,还有讯飞友伴等,再到如今智能体、个人空间等性能的上线,讯飞星火的性能在变得越来越全面且强大的同时,也关注到用户对于实质生成“个性化”的需求,如今的讯飞星火 V4.0 目前最全能、应用属性最强的 AI 大模型产品之一了。

在发布会上,科大讯飞还谈到了讯飞星火大模型在国家能源集团、中国石油、中国移动、中国人保、太平洋保险、交通银行等重点行业的应用,可见讯飞星火已经在 AI 大模型领域构建起自主可控的独特优势,而通过对讯飞星火 V4.0 的体验,IT之家也对讯飞星火未来在 AI 领域的表现充满期待,相信他们能够持续进化,让国产 AI 大模型技术和应用生态真正实现国际化的引领。

给TA打赏
共{{data.count}}人
人已打赏
应用

份子100%有用,从头设计配体,湖南大学提出鉴于片断的份子表征框架

2024-7-5 14:44:00

应用

国内首个!商汤科技发布“日日新5o”,及时多模态流式交互对标GPT-4o

2024-7-5 15:02:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索