对话 IJCAI2024 大会主席张成奇：克服了幻觉，大模型就不够「靓丽」

作者丨王悦张进编辑丨陈彩娴第 33 届 IJCAI 大会在韩国济州岛圆满结束，为期一周（8.3-8.9）的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者，大会现场的氛围跟 8 月的济州岛天气一样火热，现场的热情氛围昭显了当下人工智能领域的蓬勃发展。延续了 IJCAI 2023，此次大会最热门的两个领域依然是计算机视觉跟机器学习，有关大模型的话题往往参与者众。此次参会人数将近 3000人，论文提交数量超过 2023 年的 23.8%。

作者丨王悦张进

编辑丨陈彩娴

第 33 届 IJCAI 大会在韩国济州岛圆满结束，为期一周（8.3-8.9）的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者，大会现场的氛围跟 8 月的济州岛天气一样火热，现场的热情氛围昭显了当下人工智能领域的蓬勃发展。

延续了 IJCAI 2023，此次大会最热门的两个领域依然是计算机视觉跟机器学习，有关大模型的话题往往参与者众。此次参会人数将近 3000人，论文提交数量超过 2023 年的 23.8%。

张成奇是 IJCAI 首位华人大会主席，也是进入 IJCAI 理事会的第三位华人，前两位分别是IJCAI 2019理事会主席杨强和IJCAI 2023理事会主席周志华。

张成奇告诉 AI 科技评论，他跟 IJCAI 的渊源要追溯到2011 年，这一年在他的积极参与下澳大利亚墨尔本成功取得了 IJCAI 2017 的举办权。这一届赞助创历史新高，赞助费超 70 万美元，这是与张成奇的努力密不可分的。

更重要的是，张成奇本人在人工智能领域的成就亦不容小觑。

张成奇于 1982 年在吉林大学攻读硕士研究生，从事专家系统方面的研究，而吉林大学是中国最早开始研究人工智能的单位之一。早年，张成奇曾用9年时间做一项研究，最终于1992年在 “国际人工智能杂志（Artificial Intelligence Journal）”上发表了大陆华人中的第一篇AI 期刊文章。根据2024年8月份Google Scholar统计，张成奇的所有文章被引用总数超过33000次，H-Index为70。

对话 IJCAI2024 大会主席张成奇：克服了幻觉，大模型就不够「靓丽」

在从事人工智能和数据挖掘领域研究的 40 多年时间里，张成奇取得了丰硕的研究成果，到目前为止，共发表 300多篇科技论文，很多论文都发表在顶级期刊。曾于2011年获得新南威尔士州科学与工程（工程和ICT类）奖，并在2011年获得悉尼科技大学副校长卓越研究（领导类）奖。

大会主席张成奇认为，IJCAI 的举办极大地促进了当地人工智能领域的交流，此次 IJCAI 选址韩国相比在其他地方举办韩国参会者多出超 20 倍。

在韩国济州岛举办的 2024 IJCAI 现场，AI 科技评论跟张成奇对话，讲述他首次担任大会主席的感受、本次 IJCAI 的变化以及他对当下人工智能发展、大模型发展的一些看法。以下是对话原文（经过简单编辑）：

一、IJCAI 更严格了，但被接收的大部分都是好文章

AI 科技评论：今年各国的参会人数在整体参会者中占比大约是多少？

张成奇：中国参会者大概可以达到参会总人数的 1/3 左右。韩国参会者人数相比在其他地方举办多了起码 20 倍，占总参会人数的1/5左右。IJCAI 选址对当地参会人数会有很大地促进作用，比如 2017 年澳大利亚的 IJCAI ，有 500 多澳大利亚人参加（大约1/4），这次澳洲过来的学者就只有 70 人左右。

AI 科技评论：我们观察到，今年 IJCAI 的很多赞助商都来自中国。

张成奇：是的。从 2017 年起主要的赞助商都来自国内，这次来的参展企业有信也科技，百度、滴滴、华为、美图、OPPO、ViVo、京东，贝式计算等。

IJCAI 从 2017 年开始，专门设置了一个 Sponsorship Officer，之前是我在负责，从去年开始由于涵负责，我来协助。

企业赞助的钱每年都可以资助很多学生，金额可以达到数十万美金，受资助的学生也更愿意在这个会议上投论文，这是一个正循环。

AI 科技评论：组织 IJCAI 的过程中，是否遇到过很大的困难？

张成奇： IJCAI 整体进程推进得较顺利。由于我自己有组织过很多场大型国际会议的经验，对其中的节奏把握有很多经验，可以算得上驾轻就熟。在近30年来，我先后在澳大利亚人工智能年会、亚太人工智能年会、亚太数据挖掘大会、国际数据挖掘大会这些会议中多次担任大会主席。

AI 科技评论：您担任过这么多地区会议、国际会议的华人主席，有什么感受？

张成奇：能够担任顶会主席的人非常少，其中的华人就更少。我之前当过 KDD、ICDM 的主席，这次也担任了 IJCAI 的主席。这一系列主席当下来之后，至少感觉组织事情更有条理了。

对话 IJCAI2024 大会主席张成奇：克服了幻觉，大模型就不够「靓丽」

张成奇与学者在 IJCAI 现场交流

另一个角度来看， IJCAI 是综合性会议，强调涵盖更多、更丰富的 AI 垂直领域，不像 CVPR、ICML 这些只关心一个研究领域的垂直会议。

综合性会议的特点是，文章接收量的范围相对宽一些，但想要办出大名气就比较难。

二、应用大模型要注意“领域的错误敏感度”

AI 科技评论：您怎么看待今天的大模型？

张成奇：大模型叫生成式模型，生成式模型最大的优点是它生成效果很靓丽，“脑子”很发散，像人一样很聪明。但是最大缺点是有幻觉，而且幻觉无法被克服，如果克服了幻觉，那么生成式模型也就没有那么靓丽了。

人的聪明之处在于解决问题，人算 38的平方是算不过计算机的，计算机在这种传统、有标准的东西范围是不会出错的，大模型反而会出错。这就是大模型的优缺点。

AI 科技评论：我们应该如何利用现在的大模型？

张成奇：要注意区分大模型在不同领域的错误敏感度。

举三个例子：

第一个场景，核电站维修完全不能容忍错误，任何概率包括 0.01% 的错误都不能容忍，这种情况的错误敏感度较低；

第二个场景，写诗作画可以随意发挥，写错、做错没有坏的影响，这种情况的错误敏感度就较高；

第三个场景，股票交易可以出错，因为股票没有 100% 赚钱的，只要赚钱超过50% 就可以，这种情况的错误敏感度就是中性。

因此，大模型很发散、很聪明，但是它不保证全部对，也不保证没幻觉。所以这时使用者要考虑不同领域的错误敏感度，中性敏感度只要它正确率超过 50%，是可以被使用的。很多人吐槽幻觉问题，说有幻觉就不能用了。但其实并不是这样，写诗作画、股票交易等领域都是可以用的。

99.9% 的人都是大模型的使用者，很难决定或左右大模型是否拥有幻觉。但我们可以判断各种领域对错误容忍的敏感度，什么领域能用，什么领域不能用。不仅要考虑模型能力好不好，还要考虑是否和对应的领域适配。

但需要知道的是，大模型的幻觉问题不能从根上解决，否则的话它就不是大模型了，也不是生成式了。所以不能只盯着难以被解决的幻觉问题，要扬长避短、趋利避害。

AI 科技评论：在您的判断中，目前阶段有哪些适合大范围应用大模型的领域？

张成奇：导游行业。比如规划一条路线，多绕几分钟没有太大关系，只要别发生危险就可以，所以这个领域容忍度很高。从这个角度开发垂直大模型是值得尝试的。

智能养老也很适合做大模型应用，中国的养老，有两个刚需，分别是健康和饮食。于健康管理而言，需要精准控制吃药的时间、药量、频率等；于饮食管理而言，比如糖尿病的人哪些食品不能吃？身体寒寒的人哪些食物不能吃？食谱怎么给千人千面的搭配？这些是大模型能够帮助实现智能化和个性化的方面。

除此之外，情感陪伴，也可以使用现在的生成式模型来实现，无论是外在的形象、实体陪伴，还是语言、情感的陪伴都也可做得很丝滑。

社交层面，也可以通过大模型匹配到不同的兴趣爱好圈，加入不同的话题。还有运动管理，比如一位70岁老人是走 5,000 步还是走1万步呢？是早晨走，中午走还是晚上走？是分开走，还是和别人一起走？都可以从大模型上去寻找答案。

开发通用大模型无需过度考虑领域问题，但要是做垂直领域大模型，一定要选好领域。

AI 科技评论：大模型发展的下一步趋势是什么？

张成奇：一方面是减少算力，提高效率；另一方面是应用领域会越来越宽。沿着这两个方向改进，都是渐进性的进步，至于之后能不能有 break through，就需要看底层架构有没有突破，需要有像 GPT 这样革命性的变革。

因此，在通用领域上，大模型比 99% 的人都聪明，但是在专业领域中，他们始终无法超越专家。

大模型的技术专家都在研究怎么解决幻觉、怎么提高效率。但还有一个层面，也需要站在普通老百姓用模型的角度看，怎样去把现有的大模型能力更好地发挥出来，怎样能够让技术更普惠人类社会。我认为更多要从上往下走，从现象中将本质抽象出来后，再往下落。

AI 科技评论：具身智能也在今年掀起了一波热度，你认为这是泡沫吗？

张成奇：人的智能大致可以分成感知、认知、行为三个方面。深度学习解决了感知问题，GPT + 深度学习在很大程度上解决了认知问题，而行为智能方面一直没有很大突破，所有机器人控制都是属于行为智能。

现在要做的事，是把感知、认知、行为等多种智能的层面融合起来。早期人工智能为什么没法用？就是因为它感知上不过关，认知层面在前进，但是还没有到达终点，后边有好多东西要做，但也能实现很多工作了。

所以为什么家庭机器人还要需要时间？就是因为他的行为执行还是有难度。现在有了GPT，它的能力会上一个大台阶，这些台阶已经够消化 5 年 10 年了。

AI 科技评论：具身智能下一阶段将如何发展？

张成奇：具身智能这个方向一定能得到长足的发展，原因是现在的智能，不管感知、认知，单独拿出来都是没法用。

AI 科技评论：如何看待 Agent？

张成奇：Agent 原来就是一个方向，很多年了一直火不起来，后来热度到低谷，现在又升上去了。原因是之前对环境的感知判断做得不好，现在环境感知已经提高了很多，剩下需要做好协调工作。

{{userData.name}}已认证

对话 IJCAI2024 大会主席张成奇：克服了幻觉，大模型就不够「靓丽」

IJCAI 2024：论文提交量增加了23.8%，但录用率并无上升

韩国 N 号房卷土重来：这一次是 Deepfake，波及超 200 所学校

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践