【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

近两个月来,国内大模型卷进了“长文本”大战,科大讯飞旗下的讯飞星火大模型也不例外。最近,讯飞星火大模型迎来了 V3.5 版本的更新,此次更新显著增强了对长文本、长图文和长语音的处理威力。同时,新版本还首次推出了星火图文辨别大模型、多情感超拟人合成技术以及一句话复刻功能。根据官方的说明,讯飞星火大模型在长文本处理方面,能够快速吸收和理解来自不同渠道的大量文本数据,针对各个行业和专业领域的问答,提供更加精确的回覆。此外,在文件上传、知识问答响应速度以及文本生成等方面,讯飞星火的效率也得到了显著的提升。今年初,IT之家对

近两个月来,国内大模型卷进了“长文本”大战,科大讯飞旗下的讯飞星火大模型也不例外。最近,讯飞星火大模型迎来了 V3.5 版本的更新,此次更新显著增强了对长文本、长图文和长语音的处理威力。同时,新版本还首次推出了星火图文辨别大模型、多情感超拟人合成技术以及一句话复刻功能。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

根据官方的说明,讯飞星火大模型在长文本处理方面,能够快速吸收和理解来自不同渠道的大量文本数据,针对各个行业和专业领域的问答,提供更加精确的回覆。此外,在文件上传、知识问答响应速度以及文本生成等方面,讯飞星火的效率也得到了显著的提升。

今年初,IT之家对讯飞星火 V3.5 版本进行了深入的感受,并将其与 GPT-4 进行了全面的比较。从IT之家的评测来看,讯飞星火 V3.5 的综合威力已经能够与 GPT-4 相媲美,在逻辑推理、数学威力和知识库更新速度等方面,甚至展现出了一定的领先优势。

那么,搭载了长文本、长图文、长语音等新功能的讯飞星火大模型 V3.5 更新版,感受又将如何呢?接下来,IT之家将围绕这些新功能,进一步分享感受感受。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

红框内,就是讯飞星火 V3.5 新威力的入口,最右侧的文件里,包含了你上传过的所有文档,都会以“云空间”的形式保存在里面,方便下次使用

一、长文本感受

长文本处理威力已经成为衡量各大模型产品硬实力的关键指标之一。

在日常生活中,我们不可避免地会遭遇那些冗长的文本实质,比如阅读起来乏味透顶的隐衷政策,那些篇幅庞大、晦涩难懂的免责条目,还有那些曲折搀杂,绕来绕去的保险合同。

面对这些动辄数十万字的文档,要完整地阅读它们,其难度堪比啃完哲学著作《形而上学》。

对于笔者自己而言,如果某一天在卫生间里忘记带手机,一边是放着一册 xx 保险示范条目。另一边放着一瓶沐浴露。我宁愿把沐浴露的成分列表背过,都不愿意去主动看 xx 保险条目。

然而,这些玩意的存在是有其必要性的,毕竟,写出来就是给我们看的。你可以选择不看,但若遇到题目,这些隐衷政策和合同条目就可能成为关键。

所以题目来了,我们如何在数万乃至数十万字的实质中迅速定位到关键信息?特别是诸如保险条目、合同这些,如何找到对我们自己最有利的条目?或者,如何立即发现那些对我们不利规定?

再比如,对于一些财务人员,又或者是笔墨工作者,当面对某企业发布财报或白皮书时,如何从海量信息中提取出最关键的要点?如何快速找到最关心的信息?

总而言之,这种长文本的阅读需求是生活中经常遇到的痛点,而大模型的存在意义,就是帮我们繁杂的笔墨中找到我们最想要、最所需的信息。

那么讯飞星火大模型 V3.5 的表现又如何?

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

讯飞星火大模型 V3.5 界面,为了方便大家阅读,网页放大了 50%

1、合同条目类

首先,讯飞星火大模型 V3.5 全新引入了新引入的“星火合同助手”小组件,能全面辅助用户快速起草各类合同。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

讯飞星火 V3.5 不仅能够提供一系列专业题目的通俗解答,确保法律准确性与合规性,还能通过其精确地判断和回覆,帮助用户更有效地理解和处理搀杂的信息。

以下图的《网站隐衷政策》为例,这种隐衷政策在我们生活中到处可见,诸如每款 App 打开之前都滑动同意那些冗长的条目。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

网站隐衷政策

笔者将该隐衷政策复制成 Word,随后上传至讯飞星火大模型 V3.5 聊天框中:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

红色箭头部分是长文档上传入口

随后询问了如下两个题目:

概述该隐衷条目中我需要特别注意的题目

该隐衷政策会获取我的哪些信息

讯飞星火大模型 V3.5 在收到题目后,都迅速做出了简单易懂的回覆。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

接下来笔者又上传了《费改机动车商业保险示范条目及免责事项仿单》(下图),字数在 2 万 + 左右,并针对免责条目、保险赔偿等方面咨询了各种题目。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

费改机动车商业保险示范条目及免责事项仿单

比如,笔者询问“发动机进水赔偿吗?”,讯飞星火大模型 V3.5 迅速给出了回覆:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

回到《免责事项仿单》中,确实找到了这一说法,如下图红框内。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

不过,笔者对这个“特约条目”的意思还是不太够理解,接着继续问飞星火大模型 V3.5,给出的回覆(下图):

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

随后,同样的题目咨询了保险公司人工客服,回覆如下:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

讯飞星火大模型 V3.5 和人工客服给出的回覆是一样的。

关于这个“特约条目”,这里插一句。

笔者在网上查询了一番资料,简单来讲,保险新规后,正常发动机涉水是在车损险保障范围内的。但是呢,有些人的用车环境是在沙漠或者是雨水较少的地区。那么投保这个“特约条目”,可以进一步降低保费,但发动机进水损坏后,保险公司不会理赔。

从讯飞星火大模型 V3.5 的回覆来看,确实将这个“条目”的意思表达的清清楚楚,和客服回覆的也基本一致。

但是,这里有个“发动机涉水是包含在车损险保障范围内”的前提,而这个前提并未出现在这份两万字的“免责事项仿单”中。讯飞星火大模型 V3.5 是通过笔者提供的长文本来检索,自然也不知道这一点。

接下来,笔者又问“建议购买吗?”

讯飞星火大模型 V3.5 给出了明确的回覆 —— 不建议。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

客服同样不建议。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

笔者又针对保险中的各种题目进行了发问,讯飞星火大模型 V3.5 都给出了精确回覆:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

从各种回覆来看,讯飞星火 V3.5 都达到了一个令人满意的水准,且具备了一定的逻辑推理威力,能够给用户一个正确的建议。

2、研究讲述类

本月 26 日上午,OPPO 发布了《OPPO 创新与知识产权白皮书》,pdf 文件,共有 23 页实质。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

针对这份白皮书的实质,笔者也进行了一系列的发问。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

讯飞星火 V3.5 的回覆结果自然是令人满意的,且反馈速度极快,几乎就在几秒钟内给出回覆。这对于一些笔墨工作者而言,简直就是效率神器了。

关于理想汽车的一份研究讲述,有大量的图表、图片说明和数据,讯飞星火 V3.5 甚至还能根据讲述中非常细分化的题目(比如销量)做出回覆。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

针对用户在科研方面的需求,这次讯飞星火 V3.5 还加入了长文本摘要威力,针对行业讲述,也加入了长文本生成威力。

在星火助手中心中,找到星火科研助手,即可进行一系列的专业化回覆。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

笔者上传了研究讲述《全球产业数字化转型趋势及方向研判》和《华为终端可持续发展讲述 (2022-2023 年)》,并就其中的专业性题目发起了一系列发问。

讯飞星火 V3.5 能够提供系统性的回覆,以应对这些专业领域的搀杂题目。

长文本摘要:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

长文本生成:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

3、读书娱乐类

最后,笔者将余华《在细雨中呼喊》故事 TXT 文档上传至讯飞星火 V3.5,并针对故事中呈现的众多角色和故事情节提出了一系列题目。

《在细雨中呼喊》也是笔者最喜欢的故事之一,来来回回已经读了四五遍,对里面的每个故事和剧情都有深刻的印象。

但是呢,毕竟这也是一部有着 14.9 万字的长篇故事,故事里蕴含了众多的细节与情节交织,要让我给出一个周全而精确的回覆,恐怕还真不容易。

那么讯飞星火 V3.5 的表现如何?

首先笔者发问,故事主人公的父亲(孙广才)是一个怎样的人?讯飞星火 V3.5 的回覆如下:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

在笔者看来,孙广才的后半生算是一个彻头彻底的无赖,自私虚伪,可鄙可怜。讯飞星火 V3.5 给出的回覆与笔者的观点颇为接近,但评判的“力度”不太够。但不可否认,矛盾贯穿了孙广才的整个人生,讯飞星火 V3.5 也给出了这个观点。

《在细雨中呼喊》故事中作者对死亡有非常多的描述,而孙广才的死又是故事中最具戏剧化的一幕。

关于这个题目,讯飞星火 V3.5 也做了精确的回覆 —— 他葬身于最为肮脏的地方,但死时并不知道这些。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

关于祖父的一生经历,讯飞星火 V3.5 也能做一个简练的总结:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

不过,关于一些更搀杂的题目,讯飞星火 V3.5 在事实陈述上虽然明晰透彻,在深度评价方面稍显肤浅了一些。

比如,在“看待孙光明救人行为”这一题目时,讯飞星火 V3.5 回覆“对其无私英雄主义的赞赏,也透露出对其鲁莽行为的批评态度。”

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

故事中作者却是这样描述的:

孙光明是为了救那个孩子才淹死的。将舍己救人用在我弟弟身上,显然是夸大其词。弟弟还没有崇高到愿意以自己的死去换别人的生。

他在那一刻的行为,来自于他对那几个七八岁孩子的权威。

当死亡袭击孙光明手下的孩子时,他粗心大意地以为自己可以轻而易举地去拯救。

被救的孩子根本无法回忆当初的情景,他只会瞠目结舌地看着询问他的人。几年以后,当有人再度提起这事时,那孩子一脸的将信将疑,仿佛这是别人编造的。

若不是村里有人亲眼所见,孙光明很可能被认为是自己淹死的。

二、长图文感受

比起单纯的无笔墨图片或长文本之外的搀杂情况,讯飞星火 V3.5 的图文辨别大模型可以针对搀杂版面进行高精度解析。

官方表示,辨别场景包括教育(书籍、作文批改)、专利、学术论文、报纸、金融文档、体检讲述、自然场景、PPT、产品仿单、海报、读物、药盒、APP 截图等等。

针对上述场景,你可以对图片中的笔墨信息进行发问,也可以基于笔墨信息进行更深入、整合性的发问。

以笔者刚刚买的“鼻用喷雾剂”举例,手机拍摄仿单照片,随后上传至讯飞星火 V3.5 中。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

笔者询问注意事项、使用方法,讯飞星火 V3.5 都能给出具体回覆。

从结果来看,基本上是将仿单中的笔墨信息“OCR”了出来,然后根据词义整理,反馈给发问者。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

更搀杂的场景,笔者上传了 USB 测试仪使用仿单的截图:

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

针对不同的接口,进行了功能发问,讯飞星火 V3.5 回覆也令人满意。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

笔者又上传了此前参加活动拍摄一张 PPT 图片,并让讯飞星火 V3.5 提取照片中的重点。

结果显示,讯飞星火 V3.5 准确地辨别出了照片中的实质,并且正确判断出这是广汽集团的技术展示,同时注意到了在场观众对此表现出的高度关注。

写到这,笔者简单感慨一下,这个功能的想象力空间确实巨大,特别是对于视障人士而言,尽管他们的双眼无法看见,但只需通过手机拍下照片,上传至讯飞星火,便能立即通过语音描述,将眼前的世界传达给视障者,能够给日常生活带来极大的帮助。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

当然,现阶段的感受也并非十全十美,比如就出现过一次“已读乱回”的现象(下图),回覆得莫名其妙,有一定的优化空间。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

三、长语音、视频感受

在当今的学习与生活中,我们不仅需要大模型来助力笔墨处理,同样也需要其协助处理语音和视频资料。尤其在“全民短视频”的风潮下,明明一两句就能说明白的话,非要做成一个视频。

同时,对于学生群体和职场人士而言,无论是学术讲座还是商务采访的视频资料都包含了丰富的信息。关键在于,如何从这些视频中高效提取出核心要点?

升级后的讯飞星火 V3.5 能够协助用户在这些多媒体实质中迅速捕捉和理解关键信息。

笔者上传了IT之家《今天,北京车展,哭笑嘿哈》这篇语音文章,时长在 19 分钟左右。

针对音频,笔者发问了音频的主要实质,讯飞星火 V3.5 用极短的时间给出了回覆。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

从结果来看,基本是令人满意的。

不过也有一些细节上的小错误,比如把极氪辨别成了“极客”,把蔚来 ET7 辨别成了“A7”,但瑕不掩瑜,这个表现已经很出色了。要知道,上述音频中有各种新技术名词、新车名称,以及各种汉英夹杂的情况,这本身就有非常高的辨别难度。

接下来笔者又围绕腾势、迈腾等新车,提出了更具体的题目,讯飞星火 V3.5 的答复都很令人满意。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

讯飞星火 V3.5 同样也支持上传视频,就拿IT之家发布过的《种草华为运动健康全家桶》导购视频为例,视频长达 6 分钟。

首先,笔者让其概述整个视频实质,讯飞星火 V3.5 给出了精确回覆。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

不过,一个细节上的小错误,把“HarmonyOS”辨别成了“哈姆 6s”(也有可能跟视频里的读音有关),但是整体回覆并没有偏离主题,也没有给出含糊不清的回覆。

询问视频推荐哪些值得买的产品,讯飞星火 V3.5 也能依次排列,并给出每个产品的亮点。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

另外,在感受中,讯飞星火 V3.5 在辨别过程中,也没有太长的加载时间,基本题目都是按“秒”来回覆的,而且是越用越快,你问的题目越多,它回覆的速度就越快。

四、讯飞星火语音大模型

讯飞星火 V3.5 这次升级了星火语音大模型,带来了“多情感超拟人合成”和“一句话声音复刻”首发两项功能,偏趣味性感受。

在语音对话中是一个类似通话界面,而讯飞星火大模型所提供的回覆非常接近自然人声,虽然带有一丝机器人特有的韵味,但整体上已经非常逼真。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

“一句话声音复刻”就很有意思了,它可以模仿你或者是身边其他人的声音。完成声纹录制后,你可以在“我创建的发音人”中找到自己的声音。选择后,在使用语音交互时,大模型就会以自己的声音与你对话,且声音还原地相当真实。

【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版感受

大家可以点击下方视频感受一下:

总结:

AI 不是一个新鲜的概念,几年前谈及 AI 改变生活,笔者总觉得是天方夜谭,遥不可及。然而,也就在这短短两三年的时间里,AI 技术迎来了爆炸性的升级变革,一个真正属于 AI 的黄金时代就在眼前。

在这个过程中,科大讯飞既是参与者,也是推动者。讯飞的星火大模型,也仅仅是科大讯飞在 AI 领域创新的一个具体呈现之一。

这一次讯飞星火大模型 V3.5 升级,在长文本处理、图文辨别以及长语音和视频处理方面都展现出了卓越的威力,重点加码了用户在专业性、实用性这两方面的需求感受。

就拿文章开头讲到的那样,我们每天要接触着海量的信息,一份用词晦涩、专业术语堆积、绕来绕去的合同,又或者是搀杂难懂的免责条目就能难道无数打工人。

在过去,或许需要上网查阅各种资料,又或者是花钱咨询专家来获得帮助。这个过程中,你或许还会遇到各种充值缴费才能显示答案,寻找专家过程中也难免遇到各类骗子。

但是有了讯飞星火大模型 V3.5 这类应用的出现,上述题目处理的就非常简单了。

类似的场景还有那些冗长繁琐的会议音频,打工人可以轻松地在几万字的车轱辘话中找到最关键的那几句;在视频中迅速提取精华,甚至为科研讲述快速生成摘要…

尽管讯飞星火大模型 V3.5 在某些细节感受上还有待优化,但其所带来的想象力空间无疑是巨大的。

今年 6 月 27 日讯飞星火 V4.0 将正式发布,届时还将带来哪些新功能,我们可以好好期待一下了。

给TA打赏
共{{data.count}}人
人已打赏
AI

一键换装神器爆火,老黄换上抱抱脸 T 恤,CEO 本人:我被替代了,和他争 CEO 职位争不过

2024-4-28 9:30:57

AI

英伟达黄仁勋称 AI 不会完全取代人类职责:人类有很好的判断力,有些情况机器无奈理解

2024-4-29 8:39:50

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索