SimpleQA
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。
10/31/2024 7:26:30 AM
清源
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
谷歌
大模型
智能
Midjourney
模型
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
芯片
Gemini
代码
神经网络
计算
腾讯
研究
Sora
AI设计
3D
开发者
GPU
AI for Science
英伟达
机器学习
场景
伟达
预测
华为
Transformer
模态
Anthropic
百度
深度学习
驾驶
文本
AI视频
苹果
搜索
神器推荐
算力
LLaMA
科技
Copilot
xAI
视频生成
安全
应用
干货合集
2024
字节跳动
特斯拉
人形机器人
具身智能
视觉
语音
Claude
亚马逊
大语言模型
AI应用场景
AGI