AI在线 AI在线

Wei

CoT提出者Jason Wei:大模型评估基准的「七宗罪」

Jason Wei 是思维链提出者,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。在 CV 领域,研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代,我们该如何评估 LLM 性能?现阶段,研究者已经提出了诸如 MMLU、GSM8K 等一些评估基准,不断有 LLM 在其上刷新得分。但这些评估基准真的完美吗?思维链提出者 Jason Wei 在一篇博客中进行了深入的研究。Jason Wei 首先列举了几种成
5/27/2024 3:43:00 PM
机器之心

本科毕业加入谷歌,还写了「思维链」开山之作,这位OpenAI新秀正为本科生答疑解惑

本科毕业就加入谷歌,还以一作身份写出了「思维链」的开山之作,现在在 OpenAI 参与打造 ChatGPT,Jason Wei 从他的视角为年轻 AI 研究者提供了一些建议。
7/24/2023 2:45:00 PM
机器之心
  • 1