阿里云
开源仅6天,阿里万相大模型登上全球开源榜首
3月3日消息,开源社区Hugging Face最新榜单显示,开源仅6天的阿里万相大模型已反超DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大模型。 根据最新数据,万相2.1(Wan2.1)在Hugging Face及魔搭社区的总下载量已超百万,在Github的Star数超6k。 万相2.1登顶Hugging Face模型热榜和模型空间榜万相开源后迅速吸引了国内外开发者和用户的广泛关注。
通义灵码上线模型选择功能 新增支持 DeepSeek-V3、R1 模型
2月12日,阿里云百炼平台推出多款重磅AI模型,包括DeepSeek-V3、DeepSeek-R1以及DeepSeek-R1-Distill-Qwen-32B等6款模型,进一步丰富了其AI模型矩阵。 与此同时,通义灵码也宣布全新上线模型选择功能,支持基于百炼平台的DeepSeek-V3和DeepSeek-R1满血版671B模型,为AI编程领域注入了新的活力。 通义灵码是由阿里云和通义实验室联合出品的AI编码助手,提供代码智能生成和研发智能问答能力。
阿里云百炼上线全尺寸 DeepSeek 模型,1 元最高可享受 200 万 tokens
阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款全尺寸模型。DeepSeek-V3、DeepSeek-R1 满血版可享各 100 万免费 tokens,蒸馏版 1 元最高可享受 200 万 tokens,即日起,所有用户可直接使用。
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
阿里巴巴(中国)有限公司今日发文宣布,阿里云 PAI Model Gallery 已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它
最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
李飞飞团队 s1 模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息。
多个平台纷纷上线 DeepSeek 大模型,推动人工智能技术革新
近日,多个中国云服务平台集中上线了 DeepSeek 大模型,标志着这一新兴技术在国内的广泛应用。 参与此次上线的有百度智能云、华为云、阿里云、腾讯云、360数字安全以及云轴科技等企业,用户们可以在各大平台上体验 DeepSeek-R1、DeepSeek-V3等先进模型。 在上线发布会当天,百度智能云宣布其千帆平台已正式上架 DeepSeek-R1和 DeepSeek-V3模型,并推出了超低价格方案,用户还可以享受限时免费的服务体验。
DeepSeek 登陆阿里云,支持云上一键部署 V3、R1 模型
阿里云计算有限公司昨日发文官宣,阿里云 PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1。
阿里云通义开源Qwen2.5-VL,视觉AI超越Claude 3.5
阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Claude3.5。 阿里云官方介绍称,新的Qwen2.5-VL能够更准确地解析图像内容,并突破性地支持超过1小时的视频理解。
通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布:号称优于 Deepseek V3 等竞品,暂未开源
据介绍,通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。
阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
通义万相 2.1 还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
阿里云通义灵码 AI 程序员全面上线,宣称 10 分钟完成网页开发及美化
通义灵码 AI 程序员全面上线,同时支持 VS Code、JetBrains IDEs,前端后端开发全覆盖,宣称“全程对话协作实现从 0 到 1 完成复杂编码任务”。
传音控股与阿里云达成合作,通义千问大模型搭载于前者旗下 AI 手机
传音控股(以下简称传音)已与阿里云达成合作,通义千问大模型已经搭载在传音旗下科技品牌 TECNO 推出的 AI 手机 PHANTOM V Fold2 中,打造了深度本地化的“实用型 AI”。通过机身上特定的 AI 按键,用户可一键调用端侧大模型,在离线环境中依然可以流畅运行多轮 AI 对话,并实现文档及通话摘要。
阿里云与黑芝麻智能完成大模型车载芯片级适配
阿里云今日宣布与黑芝麻智能达成深度合作,通义千问 15 亿、30 亿参数大模型已成功在黑芝麻智能武当 C1200 家族芯片上完成部署,在离线推理场景可实现多轮流畅对话。未来通义大模型将通过斑马智行新版车机系统,向车端用户提供智能座舱体验。
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室”
阿里云和大模型企业零一万物今日达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。
消息称“通义”应用团队从阿里云分拆,并入阿里智能信息事业群
有知情人士称,此次调整包括通义 To C 方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。(智能涌现)
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义App。