联发科创新基地(MediaTek Research)现已发布两款支持繁体中文的轻量级多模态模型,分别是号称可在手机上运行的 Llama-Breeze2-3B 模型和适用于轻薄笔记本电脑的 Llama-Breeze2-8B 模型。
AI在线获悉,系列模型基于 Meta Llama 3.2 语言模型打造而成,主打繁体中文处理能力,同时支持多模态输入和函数调用,能够识别图像并调用外部工具。
在繁体中文处理能力方面,联发科提供的对比显示,相较于参数量相同的 Llama 3.2 3B Instruct 模型,Llama-Breeze2-3B 在撰写关于台北夜市的小短文时,能够准确列举出士林夜市、饶河街夜市和罗东夜市等当地知名夜市,而 Llama 3.2 3B Instruct 模型仅正确提及士林夜市,还生成了两个不存在的夜市。
此外,联发科还基于 Llama-Breeze2-3B 开发了一款安卓 AI 助理 App,并同时推出一款 AI 文字转语音模型 BreezyVoice,号称仅需输入 5 秒的示例音频,就能实时生成逼真的语音。