阿里通义千问开源 320 亿参数模型,已实现 7 款大谈话模型全开源
感动4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到,通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大谈话模型。此次开源的 320 亿参数模型,将在性能、服从和内存占用之间实现更理想的平衡。例如,比拟通义千问 14B 开源模型,32B 在智能体场景下能力更强;比拟通义千问 72B 开源模型,32B 的推理…- 27
- 0
通义千问开源320亿参数模型,已实现7款大说话模型全开源
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾功能、效力和内存占用的均衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大说话模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大说话模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则…- 3
- 0
元象首个MoE大模型开源:4.2B激活参数,效果堪比13B模型
元象发布XVERSE-MoE-A4.2B大模型 , 选择业界最前沿的混合大师模型架构 (Mixture of Experts),激活参数4.2B,效果即可媲美13B模型。该模型全开源,无条件免费商用,让海量中小企业、研究者和开发者可在元象高功能“全家桶”中按需选用,推动低成本部署。GPT3、Llama与XVERSE等主流大模型发展遵循规模理论(Scaling Law), 在模型训练和推理的过程中,…- 6
- 0
Databricks 推出 1320 亿参数大言语模型 DBRX,号称“现阶段最强开源 AI”
Databricks 近日在推出了一款通用大言语模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准尝试中都逾越了“市面上所有的开源模型”。IT之家从民间新闻稿中得知,DBRX 是一个基于 Transformer 的大言语模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。研究人员对这款模型进行尝试,相较…- 5
- 0
周鸿祎自称“开源信徒”:发布将开源 360 智脑 7B 模型,撑持 50 万字长文本输入
感谢360 创始人周鸿祎近日透露即将开源 360 智脑 7B(70 亿参数模型),撑持 360k(50 万字)长文本输入。周鸿祎表示,前段时间大模型行业卷文本长度,100 万字“很快将是标配”。“我们打算将这个威力开源,大家没必要重复造轮子,定为 360k 主要是为了讨个口彩。”他还自称“开源的信徒”,信奉开源的力量。据介绍,360 智脑长文本威力已入驻大模型产品“360AI 浏览器”。周鸿祎还谈…- 6
- 0
开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有
「太狂野了」。这是迄今为止最强大的开源大语言模型,超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。本周三,大数据人工智能公司 Databricks 开源了通用大模型 DBRX,这是一款拥有 1320 亿参数的混合大师模型(MoE)。DBRX 的基础(DBRX Base)和微调(DBRX Instruct)版本已经在 GitHub 和 Hugging Face 上发布,可用…- 14
- 0
号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,说话理解、编程能力等均超 GPT-3.5
初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型说话模型,比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构,包含 1320 亿参数,共 16 个专家网络组成,每次推理使用其中的 4 个专家网络,激活 360 亿参数。Databricks 在公司博客文章中介绍,在说话理解、编程、数学和逻辑方面,…- 6
- 0
2024环球开发者先锋大会首日顺利召开
3月23日,“2024环球开发者先锋大会”(GDC)在上海徐汇盛大开幕。大会以“模速空间——开发者的模力之源”为主题,促进环球范围内最尖端技术、最热门议题和最先锋人材的深入交流与对话,以上海模速空间革新生态社区为抓手,不断优化生态环境,引导环球顶尖人材向上海汇聚,助推上海成为高科技工业高地。从GAIDC到GDC,今年“开发者”的范畴从AI扩展到整个技术领域,涵盖数字孪生、人工智能、5G、机器人、区…- 3
- 0
华为云入局人形机器人,与创企乐聚机器人签署分工协议
感谢综合科创板日报、“乐聚机器人”民间公众号消息,3 月 15 日,华为云与人形机器人创业企业乐聚机器人签署分工协议,共同探索“华为盘古大模型 夸父人形机器人”应用场景,这是华为云分工的首个人形机器人企业。双方还将打造通用具身智能解决方案,建设“人形机器人 ”开放生态平台。民间表示,华为云推出的盘古大模型具备强大的语义懂得、动态筹备、多模态信号懂得等能力,将为人形机器人大模型的开发提供智能化决策基…- 3
- 0
马斯克 xAI 宣告正在开源 Grok-1 模型,体量 3140 亿参数号称“全球最大”
感谢马斯克旗下 AI 初创企业 xAI 今天发布新闻稿,宣告正在开源 3140 亿参数的混合专家模型 Grok-1,该模型遵循 Apache 2.0 和谈开放模型权重和架构,号称是“迄今为止全球参数量最大的开源大语言模型”。截至IT之家发稿,官方已经在 GitHub 中发布了 Grok-1 论文源代码,但还未开源模型主体。就在本月,马斯克宣告告状 OpenAI 及其 CEO 阿尔特曼,声称 Ope…- 7
- 0
继告状 OpenAI 并要求对方回复开源后,马斯克颁布发表本周 xAI 将开源 Grok
感谢马斯克今日下午通过 X(推特)颁布发表,自家人工智能公司 xAI 将在本周内开源人工智能助手 Grok。随后,马斯克在回应网友“OpenAI 也应当如此,如果它们要像名字中的‘Open’那样”的帖子时表示,“OpenAI 就是谎话。”就在本月,马斯克颁布发表告状 OpenAI 及其 CEO 阿尔特曼,声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的和谈,该和谈旨在推动 AI 技术朝着…- 4
- 0
世界最大开源 AI 社区 Hugging Face 涉足开源机械人领域,前特斯拉科学家领衔
据外媒 VentureBeat 报导,AI 创企 Hugging Face 设立开源机械人项目,前特斯拉科学家 Remi Cadene 领衔。Remi Cadene 的 X 平台动态显示,这位前特斯拉人形机械人 Optimus 团队成员加入 Hugging Face 并启动了一个开源机械人项目,招募愿在巴黎建造“真正的机械人”的工程师。参考IT之家以往报导,Hugging Face 目前主营业务均…- 8
- 0
讯飞星火V3.5正式发布,鉴于全国产算力平台“飞星一号”训练
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布鉴于首个全国产算力训练的讯飞星火V3.5。2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火鉴于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。首个…- 18
- 0
FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通
打破“算计孤岛”、联通“技术孤岛”,推动异构平台之间的互联互通,是隐衷算计技术下一阶段的重要发展方向。国家数据局印发的《“数据要素×”三年行动计划(2024—2026年)》提出:“打造安全可信流通环境,深化隐衷算计、联邦学习等技术应用,巩固数据利用可信、可控、可计量能力,促进数据合规高效流通使用。”[1]中国信通院评论文章曾指出:“隐衷算计有望成为支撑数据流通产业的基础设施,解决不同产品之间的技术…- 25
- 0
大模型训练算力利用率达60%,蚂蚁开源分布式训练扩大库ATorch
近日,蚂蚁团体宣布开源大模型分布式训练加快扩大库ATorch。ATorch可针对不同模型和硬件资源,实现深度进修主动资源静态优化和分布式训练稳定性晋升,帮助晋升深度进修的智能性。据了解,在大模型训练中,ATorch千亿模型千卡级别训练的算力利用率可达60%,相当于为跑车装上了强劲的引擎。图:ATorch致力于让大模型训练更高效、可复现随着生成式大模型的爆发,模型训练的数据集和参数规模成指数级增长,…- 3
- 0
阿里云首创PilotScope新技巧,为AI4DB使用提速
12月20日,数据库国际顶会VLDB2024公布新一批论文,阿里云新技巧PilotScope成功入围,该平台技巧可实行AI算法在数据库的“一键布署”,极大降低数据库中AI算法的使用门槛,为数据库智能化开辟了崭新空间。同日阿里云宣布将PilotScope全部技巧收费开源。图说:数据库顶会VLDB2024数据库是事关国计民生的基础软件技巧,数据库技巧的更新影响着数字时代的千行百业,其中一个前沿领域即是…- 8
- 0
助力AI技巧共享,蚂蚁开源又一核心技巧“因果进修系统 OpenASCE”
当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机械进修规模的顶级聚会,与 ICML 并称为人工智能规模难度最大,水平最高,影响力最强的聚会。聚会首日,中国互联网企业蚂蚁团体受邀举办主题为“知识增强 AI 在垂直行业的利用探…- 5
- 0
超越LLama2,通义千问登顶HuggingFace开源大模型排行榜榜首
12月8日消息,全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜,阿里云通义千问力压Llama2等国内外开源大模型登顶榜首。HuggingFace的开源大模型排行榜(Open LLM Leaderboard)是目前大模型领域最具权威性的榜单,收录了全球上百个开源大模型,测试维度涵盖阅读明白、逻辑推理、数学计算、事实问答等六大评测。通义千问(Qwen-72B)表现抢眼,…- 5
- 0
昆仑万维开源「天工」13B系列大模型,0门槛商用
10月30日,昆仑万维宣布开源百亿级大言语模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源华文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了平等范围模型的最好效果,…- 9
- 0
Llama 2 的入门与实战,呆板之心邀请了 4 位技能大牛手把手教你
呆板之能报道编辑:Sia「Llama 2 大模型算法与运用实际」-呆板之心 AI 技能论坛将于 8 月 26 日在北京举办。如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI 圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca…… 得益于 Meta Llama 模型的开源,A…- 5
- 0
iPhone、Mac上都能跑,刷屏的Llama 2究竟功能如何?
昨天凌晨,相信很多人都被 Meta 颁布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示,「对于人工智能和 LLM 来说,这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。」- 8
- 0
开源
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!