​IBM 推出小型AI模型 Granite 3.2 ,强调高效推理与实用性

IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。 该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。 Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。

IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。

QQ_1741229530181.png

Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。IBM 声称,这一新模型在一些关键基准测试中,性能达到或超过了更大型的模型,如 Llama3.211B 和 Pixtral12B。此外,Granite3.2的8B 模型在标准数学推理基准测试中,也显示出能匹敌或超越更大模型的能力。

为了提升推理能力,Granite3.2的某些模型还具备 “思维链” 功能,能够阐明中间推理步骤。该功能虽然需要较大的计算能力,但用户可以根据需求随时启用或禁用,以优化效率并降低整体成本。IBM AI 研究副总裁 Sriram Raghavan 在发布会上表示,下一代人工智能的重点在于效率、整合与实际影响,让企业在不超支的情况下实现强大的成果。

除了推理能力的提升,Granite3.2还推出了 “Granite Guardian” 安全模型的小型化版本,尽管体积缩减了30%,但性能仍然保持在前一代模型的水平。此外,IBM 还引入了一种名为 “可言语化信心” 的能力,这种能力能够更细致地评估风险,并在安全监测中考虑不确定性。

Granite3.2是在 IBM 的开源 Docling 工具包上训练的,该工具包允许开发者将文档转换为定制的企业 AI 模型所需的特定数据。模型训练过程中处理了8500万份 PDF 文件以及2600万个合成问答对,以增强 VLM 处理复杂文档工作流的能力。

IBM 还宣布推出下一代 TinyTimeMixers(TTM)模型,这是一种紧凑的预训练模型,专注于多变量时间序列预测,具备最长可达两年的长远预测能力。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

划重点:  

📊 Granite3.2引入视觉语言模型,提升文档处理与数据提取能力。  

💡 新模型具备思维链功能,能够阐明推理过程,增强推理能力。  

🔍  Granit Guardian 安全模型小型化30%,但性能未受影响,同时推出可言语化信心的风险评估功能。

相关资讯

北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅

消息称“AI 教母”李飞飞正建立初创公司,开发可理解 3D 空间关系的 AI 系统

当地时间周六,据路透社援引 6 名知情人士消息,计算机科学家李飞飞正在建立一家初创公司。该公司旨在利用类似人类的视觉处理技术,使 AI 具备高级推理能力,有望成为 AI 技术的一次飞跃。IT之家注:李飞飞被广泛称为“AI 教母”,与通常用来指因 AI 技术突破而在 2018 年获得图灵奖的三位研究人员的“AI 教父”对应。这三名“AI 教父”则是杰弗里・辛顿、杨立昆、约书亚・本西奥。一位消息人士通过李飞飞上个月在温哥华 TED 大会发表的演讲,对这家初创公司进行了详细描述:李飞飞曾表示,最前沿的研究涉及一种算法,这