错误

美国科学家使用 AI 探索癌症治疗方案，患者体内免疫细胞将可“杀死”癌细胞

AI 正在千行百业陆续得到投入使用，当前科学家们正试图借助 AI 的力量，找到治疗癌症的最佳手段。据 abc7news 当地时间 18 日报道，美国旧金山格拉德斯通研究所（Gladstone Institutes）所长迪帕克・斯里瓦斯塔（Deepak Srivastava）博士在采访中表示，团队正在共同努力，利用 AI 来了解哪些实验对杀死癌细胞最有影响。“我们将能够处理那些迄今为止无法治疗的癌症，并能够通过工程化患者自己的免疫细胞，使其专门杀死癌细胞。”斯里瓦斯塔博士说。“这是第一次，我们将能够利用人工智能进行数

7/20/2024 7:41:27 PM

清源

9.11和9.9谁大？我们实测15个大模型，超半数翻车

机器之能报道编辑：杨文大模型们还是搞不定简单的数学题。这几天，一个测试大模型「脑瓜」灵不灵光的提示词火了 ——9.11 和 9.9 哪个大？这道连小学生都能一口答对的数学题，却难倒一片大模型界的「英雄好汉」。事情是这样的。Scale AI 的高级提示工程师 Riley Goodside 拿「9.11 and 9.9——which is bigger?」这个提示词来问 GPT-4o，却得到「前者更大」的回答。其他大模型也纷纷翻车。7 月 17 日，我们拿国内 12 款大模型，外加国外的 GPT-4o、Claude 3

7/18/2024 2:32:00 PM

机器之能

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

批评不仅能让人进步，也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是，就在 CriticGPT 放出的前几天，北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下，验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上，它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注，然后用得到的数据训练出

7/8/2024 11:30:24 PM

清源

专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

感谢当地时间 27 日，OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型，用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生成答案中不准确的地方。据介绍，CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习（IT之家注：Reinforcement Learning from Human Feedback，RLHF）”的技术来训练、改进 GPT-4 的回答。然而随着 ChatGPT 的准确性日益提升，

6/28/2024 7:10:36 AM

清源