小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品

感谢据“小米公司”官方微博,今天小米大语言模型 MiLM 正式通过大模型备案,相关模型据称将逐步应用于小米汽车、手机、智能家居等产品中,后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单,当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。IT之家根据 GitHub 项目页给出的信息得知,MiLM-6B 是由小米公司开发的一个大规模预训练语言模型,参数规模达 64 亿。▲ 图源 MiLM-6B 的 GitHub 页面而根据
感谢据“小米公司”官方微博,今天小米大语言模型 MiLM 正式通过大模型备案,相关模型据称将逐步应用于小米汽车、手机、智能家居等产品中,后续“将面向更多用户开放体验”。

小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品

小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单,当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。

IT之家根据 GitHub 项目页给出的信息得知,MiLM-6B 是由小米公司开发的一个大规模预训练语言模型,参数规模达 64 亿。

小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品

▲ 图源 MiLM-6B 的 GitHub 页面

而根据 C-Eval 给出的信息,MiLM-6B 模型在具体各科目成绩上,在 STEM(科学、技术、工程和数学教育)全部 20 个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。

小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品

▲ 图源 C-Eval

据悉,MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间。

在 10 个“社会科学”测试科目中,除“教育学和地理”外,该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中,MiLM-6B 则在“历史与法律”基础上有着不错的准确率表现。

相关资讯

多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-N

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!

说到2024年AI圈的热门话题,当然不能错过视频生成模型了! 即使是在12月,国内外视频模型的更新脚步依旧没有放缓。 其中以Sora、可灵AI为代表。