阿里巴巴发布首个全模态大模型 Qwen2.5-Omni,挑战全球科技巨头

3月27日,阿里巴巴在凌晨时分隆重推出了其首个全模态大模型 —— 通义千问 Qwen2.5-Omni-7B。 这款模型具有强大的功能,能够同时处理文本图像、音频和视频等多种输入方式,并且可以实时生成文本与自然语音输出。 这一创新的技术突破,标志着阿里在人工智能领域的又一次进步。

3月27日,阿里巴巴在凌晨时分隆重推出了其首个全模态大模型 —— 通义千问 Qwen2.5-Omni-7B。这款模型具有强大的功能,能够同时处理文本图像、音频和视频等多种输入方式,并且可以实时生成文本与自然语音输出。这一创新的技术突破,标志着阿里在人工智能领域的又一次进步。

在权威的多模态融合任务 OmniBench 的评测中,Qwen2.5-Omni 取得了令人瞩目的成绩,刷新了行业纪录,全面超越了 Google 的 Gemini-1.5-Pro 等同类模型。这一结果不仅展现了 Qwen2.5-Omni 的强大能力,也进一步巩固了阿里在全球科技竞争中的领先地位。

大脑 大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

Qwen2.5-Omni 的独特之处在于其能够模拟人类的多感官方式,以接近人类的方式 “立体” 地认知和理解世界。这意味着,Qwen2.5-Omni 不仅能够识别各种输入,还可以通过音视频分析情感状态,在面对复杂任务时,提供更智能和自然的反馈与决策能力。这使得它在实际应用中展现出更高的灵活性和适应性。

随着 AI 技术的不断进步,Qwen2.5-Omni 的发布无疑将推动行业的发展,并为各行各业的数字化转型提供新动力。阿里巴巴通过开源这一大模型,吸引了全球开发者的关注,为更多创新应用的开发创造了条件。未来,Qwen2.5-Omni 有望在教育、医疗、娱乐等多个领域产生深远影响。

阿里巴巴此次的发布不仅是技术上的一大进步,更是对未来多模态 AI 应用的全新探索。

相关资讯

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。

降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等工具,可以让开发者实现「统一端边云,全端自动部署」,开启了机器学习开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与

院士、委员、专家共议“双智建设”:场景驱动、标准协同、以人为本

智能网联汽车和智慧城市基础设施,已经成为日常生活中随处可见的元素。2021年,住建部和工信部将16个城市列为双智试点城市,探索智慧城市基础设施与智能网联汽车协同发展。试点城市提供了哪些思路?双智的未来该走向何处?这些问题成为当前双智行业关注的重点。近日,由腾讯智慧交通、腾讯研究院联合举办了“双智建设专家研讨会“,共同探讨双智建设的新思路、新机遇。中国工程院院士郭仁忠、全国政协委员、交通运输部科学研究院副院长兼总工程师王先进、中国电动汽车百人会秘书长兼首席专家张永伟、中国信息通信研究院副院长王志勤、中国城市规划设计研