答案

研究发现：AI 越聪明就越有可能“胡编乱造”

一项新研究发现，随着大型语言模型（LLM）变得越来越强大，它们似乎也越来越容易编造事实，而不是避免或拒绝回答它们无法回答的问题。这表明，这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到，该研究发表在《自然》杂志上，研究人员研究了一些业界领先的商业 LLM：OpenAI 的 GPT 和 Meta 的 LLaMA，以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现，虽然这些 LLM 的回答在许多情况下变得更加准确，但总体上可靠性更差，给出错误答案的比例比旧模型更

9/29/2024 1:20:36 PM

远洋

微软副总裁 Vik Singh：AI 聊天机器人需“学会求助”而非“制造幻觉”

当地时间 9 月 1 日，据法新社报道，微软公司副总裁 Vik Singh 在接受采访时说，“坦率地说，如今（生成式 AI）真正缺少的能力，即是当模型无法确定（自身答案是否准确）时，能够主动说‘嘿，我不确定，我需要帮助’。”自去年以来，微软、谷歌及其竞争对手一直在迅速部署如 ChatGPT、Gemini 等生成式 AI 应用，这些应用可以按需生成各种内容，并给用户一种“无所不知”的错觉。尽管生成式 AI 的开发取得了进展，它们仍然会出现“幻觉”或编造答案。图源 PexelsVik Singh 坚持认为，“真正聪明的

9/2/2024 9:45:25 AM

清源

AI 成为大学生学业“金手指”：能获更高分，且难被发现

大学生已开始用 AI 来完成课业，而且 AI 提交的答卷平均分高于真人，且很难被检测出来。英国雷丁大学心理与临床语言科学学院副教授 Peter Scarfe 表示，大学生开始利用 ChatGPT 等 AI 工具完成课业，不仅能获得更高分，且很难判断出来。IT之家翻译 Scarfe 教授采访内容：“我们研究中的数据表明，检测人工智能生成的答案非常困难。目前关于 AI 的讨论已有很多，代大学生完成课业也是 AI 的一种形式，只是本次调查的样本数量比较有限。”在这项发表在 Plos One 杂志上的研究中，Scarfe

6/27/2024 2:53:37 PM

故渊

10家国产大模型、GPT-4o共同挑战新鲜高考作文，还自我打分，谁是第一？

机器之能报道编辑：杨文10家国产明星大模型PK高考作文，谁是AI圈的笔杆子？高考这几天，AI 可真够忙的 ——考前忙着押题，考后忙着做题，甚至监考都得上阵。6 月 7 日上午，备受瞩目的 2024 年高考正式开始。第一场语文，毫无意外爆上热搜，全是跟作文有关。其中新课标 I 卷直接拿「人工智能」做文章。有网友认为，今年的高考作文题目真简单，还有网友觉得想写出彩要费点心思。那么，当 AI 遇上高考作文，能碰撞出怎样的火花？我们决定使用国产明星大模型，尝试写一写高考作文，与各位考生「一较高下」。参赛选手包括 ——百度家

6/7/2024 1:57:00 PM

机器之能