盘古 π
挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型
5 年前,Transformer 在国际神经信息处理大会 NeurIPS 2017 发表,后续其作为核心网络架构被广泛用于自然语言处理和计算机视觉等领域。1 年前,一项重大的创新引起了人们的广泛关注,那就是 ChatGPT。这个模型不仅能够执行复杂的 NLP 任务,还能以人类对话的方式与人类进行互动,产生了深远的影响。1 年以来,“百模大战” 在业界激烈开展,诞生了如 LLaMA、ChatGLM 和 Baichuan 等开源大模型,推动了 LLM 领域的快速发展。除了通用 LLM,为了支撑更多行业的应用和商业变现,
1/2/2024 11:52:00 AM
机器之心
- 1
资讯热榜
生成式 AI 已过时:英伟达黄仁勋首提 Agentic AI,后续是机器人 Physical AI
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
早报速读!2025年最新AI视频产品评测&优秀案例
清华团队开源 “赤兔 Chitu” 推理引擎,助力国产 AI 生态发展
无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血
DeepSeek爆火后的新Scaling Law究竟是什么?
Sesame发布CSM模型:实时情感定制 AI语音合成迈向新高度
OpenAI紧急上书,矛头直指DeepSeek!15页提案欲锁死中国AI
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
机器人
数据
谷歌
大模型
Midjourney
模型
智能
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
Gemini
芯片
代码
神经网络
腾讯
计算
研究
Sora
英伟达
AI设计
3D
AI for Science
GPU
开发者
机器学习
场景
华为
预测
Anthropic
伟达
Transformer
模态
百度
深度学习
AI视频
驾驶
苹果
文本
搜索
神器推荐
xAI
LLaMA
算力
Copilot
人形机器人
安全
科技
视频生成
应用
字节跳动
具身智能
干货合集
2024
视觉
大语言模型
AGI
特斯拉
Claude
亚马逊
语音
架构