llama3

浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版：运行显存仅需 23GB，号称性能媲美 LLaMA3
浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版，性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB，处理每 token 所需算力约为 1.9 GFLOPs，算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB，所需算力为 140GFLOPs。据浪潮信息…
应用
- 28
- 0
汪淼8月23日
斯坦福团队为剽窃清华系面壁智能 AI 模型道歉：Llama3-V 模型将悉数撤下
近日斯坦福大学的 AI 研究团队的 Llama3-V 开源模型被指控剽窃了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5，在网上引起热议。图源 Pexels5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型，但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似，仅有部分…
AI
- 7
- 0
远洋6月4日
斯坦福团队被曝剽窃清华系大模型，已删库跑路，创始人回应：也算国际认可
斯坦福 AI 团队，竟然曝出了剽窃事件，而且剽窃的还是中国国产的大模型成果 —— 模型结构和代码，几乎形态各异！跟任何剽窃事故一样……AI 圈内都惊呆了。斯坦福的这项研究叫做 Llama3-V，是于 5 月 29 日新鲜发布，宣称只需要 500 美元就能训出一个 SOTA 多模态大模型，比 GPT-4V、Gemini Ultra、Claude Opus 都强。Llama3-V 的 3 位作家或许是…
AI
- 18
- 0
清源6月3日
面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型：8B 参数、高效部署手机
感谢面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5，支援 30 种说话，宣称可兑现：最强端侧多模态综合性能：超出 Gemini Pro 、GPT-4VOCR 才能 SOTA（IT之家注：State-of-the-Art）：9 倍像素更清晰，难图长图长文本精确辨认图像编码快 150 倍：首次端侧系统级多模态减速▲ OpenCompass 模…
AI
- 14
- 0
泓澄（实习）5月21日
Karpathy称赞，从零完成LLaMa3项目爆火，半天1.5k star
项目中代码很多很全，值得细读。一个月前，Meta 发布了开源大模型 llama3 系列，在多个关键基准测试中优于业界 SOTA 模型，并在代码生成任务上全面领先。此后，开发者们便开始了本地部署和完成，比如 llama3 的中文完成、llama3 的纯 NumPy 完成等。十几个小时前，有位名为「Nishant Aklecha」的开发者发布了一个从零开始完成 llama3 的存储库，包括跨多个头的注…
AI
- 24
- 0
机器之心5月20日
70B 模型秒出 1000token，代码重写超越 GPT-4o，来自 OpenAI 投资的代码神器 Cursor 团队
70B 模型，秒出 1000token，换算成字符接近 4000！研究人员将 Llama3 举行了微调并引入加快算法，和原生版本相比，速率足足快出了快了 13 倍！不仅是快，在代码重写工作上的显露甚至超越了 GPT-4o。这项成果，来自爆火的 AI 编程神器 Cursor 背后团队 anysphere，OpenAI 也参与过投资。要知道在以快著称的推理加快框架 Groq 上，70B Llama3 …
AI
- 10
- 0
清源5月17日