小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

功能更强大的 Code Llama 70B 模型来了。今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。Code Llama 70B 提供与之前发布

功能更强大的 Code Llama 70B 模型来了。

今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。

图片

我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。

Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:

CodeLlama - 70B,基础代码模型;

CodeLlama - 70B - Python,专门面向 Python 的 70B;

Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。

Code Llama 最初是 Meta 在 2023 年 8 月推出的工具,免费用于研究和商业用途。

据 Meta AI 博客文章的介绍,Code Llama 70B 可比其他版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。

在 HumanEval 基准测试中,Code Llama 70B 的准确率达到了 53%,优于 GPT-3.5 的 48.1%,进一步接近 OpenAI 论文报告中 GPT-4 的 67%。

图片

Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码并对人工编写的代码进行调试。发布之初,Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的,Code Llama 70B 也是如此。

当时 Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。

Meta 提供的 Code Llama 版本包括:

Code Llama,基础代码模型;

Code Llama-Python,Python 微调版;

Code Llama-Instruct,自然语言指令微调版。

其中,后面两个模型专注于特定的编码语言。现在这个模型大家族又加入了 Code Llama 70B,在代码任务上又提升了一个台阶。

图片

Code Llama 70B 是在 1TB 的代码和代码相关数据上训练而成,托管在代码存储库 Hugging Face 上。

Meta 表示,其较大的型号 34B 和 70B 模型可返回最佳结果并提供更好的编码帮助。

但在开发者的使用体验中,Code Llama 70B 仍然存在明显不足。

比如有人发现,对于生成质数的请求,Code Llama 70B 无法完成:

图片

图片

图片

也有人说,这一限制是为了避免某些不好的用途,比如生成非法质数。非法质数可以被用来表示一些禁止拥有或散布的资料,而依照美国的数位千禧年著作权法,散布这类程式是非法的。

图片

参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

相关阅读

发布一天,Code Llama 代码能力突飞猛进,微调版 HumanEval 得分超 GPT-4

官方的 Code Llama 开源:免费商用,神秘版本接近 GPT-4

相关资讯

最强开源编程大模型一夜易主:Codestral 精通 80 + 语言,参数量仅 22B

开源代码大模型的王座,再次易主!来自素有“欧洲 OpenAI”之称的 Mistral,用 22B 参数量表现超越了 70B 的 Code Llama。模型名为 Codestral,将代码的英文 Code 与公司名结合而成。在 80 多种编程语言上进行过训练后,Codestral 用更少的参数实现了更高的性能,窗口长度也达到了 32k,相比之前一众 4k、8k 的模型大幅增加。而且已经有人表示,GPT-4o 和 Claude3-Opus 都失败的代码编辑任务,被 Codestral 成功解决了。于是有网友直言,Cod

号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5

初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构,包含 1320 亿参数,共 16 个专家网络组成,每次推理使用其中的 4 个专家网络,激活 360 亿参数。Databricks 在公司博客文章中介绍,在语言理解、编程、数学和逻辑方面,对比 Meta 公司的 Llama 2-70B、法国 Mistral AI 公司的 Mixtral 以及马斯克旗下 xA

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。今天,英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。