LLaMa 3

腾讯Hunyuan超越Llama 3，成为NLP领域新霸主
腾讯最近发布了一款名为Hunyuan的先进Moe（Mixture of Experts）模型，该模型在多个基准测试中表现出色，超越了Llama 3，成为自然语言处理（NLP）领域的新领导者。地址如下：github: : ：合成数据增强： Hunyuan-Large通过合成数据增强训练，能够学习到更丰富的表示，处理长上下文输入，并更好地泛化到未见数据。 KV缓存压缩：采用分组查询注意力（GQA）…
理论
- 979
- 0
哎呀AIYA11月6日
英伟达对话模型ChatQA进化到2.0版本，上下文长度提到128K
开放 LLM 社区正是百花齐放、竞相争鸣的时代，你能看到 Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 等许多表现优良的模型。但是，相比于以 GPT-4-Turbo 为代表的专有大模型，开放模型在很多领域依然还有明显差距。在通用模型之外，也有一些专精关键领域的开…
理论
- 13
- 0
机器之心7月25日
面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！
图注：面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中，刷新开源大模型推理性能 SOTA。图注：面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B，超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b，以及闭源模型 GPT-3.5-turbo。 Eurux…
应用
- 983
- 0
张进5月1日
首批华文版Llama3模型来了，解释成语、答弱智吧成绩
华文成绩，华文回答。最近，Meta 推出了 Llama 3，为开源大模型树立了新的标杆。和以往的原始 Llama 模型一样，Llama 3 对华文的支持效果欠佳，经常会出现你用华文提问，它用英文或华文英文回复的现象。因此，要想让国内用户用上该模型，开发者还需对其进行微调。最近，在 Github 以及 HuggingFace 平台上，我们已经陆陆续续地看到了一些这样的项目，比如 llama3-Ch…
工程
- 8
- 0
机器之心4月25日
AI在用| 没错，树莓派5也能飙上Llama 3了！
机器之能报道编辑：山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何利用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能利用案例，来具体介绍AI利用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。4 月 18 日，Meta 发布了 Llama 3，号称「迄今最强的开源大模型」。根据 Meta 的说法，…
应用
- 5
- 0
机器之能4月23日
Llama 3超大杯有何惊喜？Meta会一直开源吗？当初为何笃信元宇宙？扎克伯格新访谈回应一切
昨天凌晨，Meta 突然官宣了 Llama 3，把开源模型的实力又往上提了一截。Llama 3 总共有三个版本 ——8B、70B 和 405B。其中，8B 和 70B 版本已经开源，405B 版本仍在训练中。根据现有的评测数据，405B 版本的性能已经逼近 GPT-4（参见《开源大模型 Llama 3 王者归来！最大底牌 4000 亿参数，性能直逼 GPT-4》）。这大概促使 OpenAI 尽早发…
应用
- 4
- 0
机器之心4月22日
LLaMa 3或将推迟到7月颁布，剑指GPT-4，从Gemini吸取教训
LLaMa 3 正寻找宁静与可用性的新失调点。过去的图象生成模型常被人们诟病人物主要以「白人」为主，而google Gemini 在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差，让用户们瞠目结舌。google表示，该模型变得比开发者预期的越发谨慎。这不仅体现在生成图片的题目上，还体现在常常将一些提示认作敏感提示，从而回绝回覆。在此事不断发酵时，这项宁静与可用性…
应用
- 9
- 0
机器之心2月29日