RWKV
无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型,其在每个基准测试中,都优于 Llama 2 13B,并且在代码、数学和推理方面也优于 LLaMA 1 34B。与大模型相比,小模型具有很多优点,比如对算力的要求低、可在端侧运行等。近日,又有一个新的语言模型出现了,即 7.52B 参数 Eagle 7B,来自开源非盈利组织 RWKV,其具有以下特点:基于 RWKV-v5 架构构
2/1/2024 2:37:00 PM
机器之心
- 1
资讯热榜
Manus 内测启动:Monica 团队推出“通用 AI 代理”引发热议
阿里新开源推理大模型QwQ-32B,性能媲美DeepSeek-R1、显存需求更小
DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)
三分钟部署自己的 DeepSeek R1 满血版,彻底告别服务器繁忙!
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
Sesame 发布 CSM 语音模型:跨越“恐怖谷”,逼真程度惊艳全球
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
用上DeepSeek,改简历快人一步:AI简历优化保姆级教程
标签云
人工智能
OpenAI
AIGC
ChatGPT
AI绘画
AI
DeepSeek
机器人
数据
谷歌
大模型
智能
Midjourney
用户
学习
GPT
模型
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
芯片
Gemini
代码
神经网络
计算
腾讯
研究
Sora
AI设计
3D
开发者
GPU
AI for Science
英伟达
机器学习
场景
伟达
预测
华为
Transformer
模态
百度
驾驶
Anthropic
深度学习
文本
AI视频
苹果
搜索
神器推荐
算力
LLaMA
科技
视频生成
应用
xAI
干货合集
Copilot
安全
2024
字节跳动
特斯拉
具身智能
亚马逊
语音
视觉
人形机器人
AI应用场景
写作
机器
AGI