答案
研究发现:AI 越聪明就越有可能“胡编乱造”
一项新研究发现,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到,该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更
微软副总裁 Vik Singh:AI 聊天机器人需“学会求助”而非“制造幻觉”
当地时间 9 月 1 日,据法新社报道,微软公司副总裁 Vik Singh 在接受采访时说,“坦率地说,如今(生成式 AI)真正缺少的能力,即是当模型无法确定(自身答案是否准确)时,能够主动说‘嘿,我不确定,我需要帮助’。”自去年以来,微软、谷歌及其竞争对手一直在迅速部署如 ChatGPT、Gemini 等生成式 AI 应用,这些应用可以按需生成各种内容,并给用户一种“无所不知”的错觉。尽管生成式 AI 的开发取得了进展,它们仍然会出现“幻觉”或编造答案。图源 PexelsVik Singh 坚持认为,“真正聪明的
AI 成为大学生学业“金手指”:能获更高分,且难被发现
大学生已开始用 AI 来完成课业,而且 AI 提交的答卷平均分高于真人,且很难被检测出来。英国雷丁大学心理与临床语言科学学院副教授 Peter Scarfe 表示,大学生开始利用 ChatGPT 等 AI 工具完成课业,不仅能获得更高分,且很难判断出来。IT之家翻译 Scarfe 教授采访内容:“我们研究中的数据表明,检测人工智能生成的答案非常困难。目前关于 AI 的讨论已有很多,代大学生完成课业也是 AI 的一种形式,只是本次调查的样本数量比较有限。”在这项发表在 Plos One 杂志上的研究中,Scarfe
10家国产大模型、GPT-4o共同挑战新鲜高考作文,还自我打分,谁是第一?
机器之能报道编辑:杨文10家国产明星大模型PK高考作文,谁是AI圈的笔杆子?高考这几天,AI 可真够忙的 ——考前忙着押题,考后忙着做题,甚至监考都得上阵。6 月 7 日上午,备受瞩目的 2024 年高考正式开始。第一场语文,毫无意外爆上热搜,全是跟作文有关。其中新课标 I 卷直接拿「人工智能」做文章。有网友认为,今年的高考作文题目真简单,还有网友觉得想写出彩要费点心思。那么,当 AI 遇上高考作文,能碰撞出怎样的火花?我们决定使用国产明星大模型,尝试写一写高考作文,与各位考生「一较高下」。参赛选手包括 ——百度家
首个基于交互式网页搜索的中文问答开源框架,清华、人大、腾讯联合发布WebCPM
来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型框架 WebCPM
GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升
模拟人类推理过程,华为诺亚提出 Progressive-Hint Prompting (PHP) 引导大模型渐近正确答案。
ChatGPT 5天用户破百万,却突遭Stack Overflow封禁
要问最近 AI 圈哪个模型最火爆,你不得不把 OpenAI 推出的 ChatGPT 排在前面。自从发布以来,这个对话模型可谓是出尽风头,很多人更是对其产生了一百个新玩法,让它写个代码、修改修改 bug、开发个小游戏、解答一下物理知识、去参加一场考试…… 仿佛没有它不会的。
- 1