论文
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析,研究三个模型在应对幻觉问题上的性能对比。 其研究发现:ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势,能够灵活切换不同的策略进行思考推理。 相比之下,DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略,但表现了出对这些策略的抗拒,且推理过程存在错误或混乱。
性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
大模型的快速及持续发展,离不开对模型所有权及数据隐私的保护。 AAAI 2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调框架ScaleOT,可以实现在模型性能无损的前提下,将模型隐私保护效果提升50%。 相比于知识蒸馏技术,还降低了90%的算力消耗,为百亿级参数模型的跨域微调提供了一种高效和轻量化的解决方案。
CVPR 2025录用率22.1%,LeCun中奖!大模型参评,审稿人19篇论文被拒
刚刚,CVPR 2025录用结果出炉! 今年,共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%。 近两年来,CVPR录用结果逐年递减。
全球AI顶会AAAI 2025 在美开幕,产学研联手的“中国队”表现亮眼
当地时间2月25日,AAAI 2025 在美国宾夕法尼亚州费城举办,会议为期8天,于3月4日结束。 AAAI 由国际人工智能促进协会主办,是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议,每年举办一届。 AAAI 2025 共有12957篇有效投稿,录用3032篇,录取率为 23.4%。
大学老师说AI作文全判0分 网友:过度依赖造成思维惰性
近年来,随着人工智能技术的迅速发展,AI 工具逐渐成为大学生完成各类报告和论文的 “得力助手”。 根据央视新闻的报道,部分高校教师和专家表示,利用 AI 生成内容的学生中,个别案例涉及不当行为,如伪造研究数据、编辑实验图片和替代自主设计等,已构成学术不端。 在某高校的作业群中,一则通知引起了学生们的广泛关注。
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
据南京大学人工智能学院网站报道,南大LAMDA组钱超教授团队在DATE 2025发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。 电子设计自动化(Electronic Design Automation,EDA)是芯片设计的基石产业,被誉为「芯片之母」。 欧洲设计自动化与测试会议(Design, Automation and Test in Europe Conference,DATE)是EDA领域的顶级国际学术会议。
AMD开源科研AI Agent,一站式自动写论文
科学研究的漫长历程中,受限于时间和资源,许多高质量的研究想法未能得到充分探索。 如果能够减少探索想法的限制,研究人员将能够同时研究多个概念,增加科学发现的效率。 所以,为了帮助科研人员节省时间快速撰写论文,AMD和约翰·霍普金斯大学的研究人员联合开源了一个专用于科研的AI Agent——Agent Laboratory。
如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?
本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
1985 年,著名计算机科学家、图灵奖得主姚期智提出了一个与哈希表有关的猜想。 现在,40 年过去了,一名本科生却成功推翻了这个猜想。 而这项成就却源自一个始于 2021 年秋的故事。
AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?
编辑 | 1984随着生成式 AI 技术的普及,学术界正面临着一个新的挑战:越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。 这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格,其危害不容忽视。 作为广受欢迎的学术搜索引擎,Google Scholar 在展示搜索结果时,并未区分这些可疑论文与经过严格质量把关的研究成果。
41%博士后逃生学术界,顶刊PNAS揭残酷真相!名校光环背后曝职业危机
去年,随着LLM产品化和工程化的发展,工业界的研究岗迅速缩减,许多AI博士面临巨大的就业压力,纷纷表示后悔读博。 工业界机会稀少,学术界同样问题重重。 为此,有的博士生甚至转行去当了主播。
2025年AAAI Fellow名单出炉!港科大(广州)熊辉等四位华人学者入选
2025年AAAI Fellow名单火热出炉! 其中四位华人学者获选。 每年,AAAI通过其Fellow计划表彰一批在人工智能领域做出重大、持续贡献的个人。
495篇参考文献!北交大清华等高校发布多语言大模型综述
虽然大模型取得突破性进展,但其在多语言场景下仍具有局限性,存在很大的改善空间。 那么,大模型多语言能力到底什么水平? 其发展又存在什么样的挑战?
姚期智团队开源新型注意力,节省90%内存不降性能,一个框架统一MHA/MQA/GQA
新型注意力机制TPA,姚期智院士团队打造。 TPA对每个token做动态的张量分解,不存储完整的静态KV,而是保留分解的版本,内存占用节省90%(或者更多),而不会牺牲性能。 论文中还证明了流行的MHA、MQA、GQA都是TPA的特殊情况,用一个框架统一了现代注意力设计。
厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
本文经AIGC Studio公众号授权转载,转载请联系出处。 厦门大学联合网易提出StoryWeaver,可以根据统一模型内给定的角色实现高质量的故事可视化。 可根据故事文本生成与之匹配的图像,并且确保每个角色在不同的场景中保持一致。
陶哲轩自述被拒稿是常事,「大牛名字」不是通行证!
著名数学家、菲尔兹奖得主陶哲轩在个人社交网站上分享了自己被拒稿的经历,出发点是有人曾表示「陶哲轩被拒稿」很不可思议,但其实自己每年都会被拒稿。 拒稿事件在经过几天发酵后,登上了Hacker News热榜:让网友感到惊奇的是,原来「大牛名字」也不保中,进而引发了关于「审稿制度」合理性的讨论。 下面是陶哲轩发布的原文:今天我投稿的一篇论文被期刊拒绝了,他们礼貌地回信说虽然他们觉得这篇论文有趣,但并不适合他们的期刊。
o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份
圣诞马拉松的第一天,OpenAI对外发布了o1 pro。 近乎全网都震惊于o1 pro高达博士水平的数学、科学、编程能力。 最近,OpenAI总裁Greg Brockman在X上转发了世界顶尖免疫学专家Derya Unutmaz的帖子。
芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
编辑 | 白菜叶一项新研究表明,采用人工智能工具分析数据和建模结果对年轻科学家的职业前景有着巨大的影响,大大增加了他们在各自领域晋升到有影响力职位的机会。 但这种对个体研究人员的利好似乎以牺牲科学为代价。 芝加哥大学和清华大学的研究人员分析了六个科学学科(生物学、医学、化学、物理学、材料学和地质学,不包括计算机科学)的近 6800 万份研究论文,发现融入人工智能技术的论文被引用的次数更多,但同时也集中在更窄的主题上,而且重复性更强。