LLM为何频频翻车算术题?研究追踪单个神经元,「大脑短路」才是根源
由于缺少对运行逻辑的解释,大模型一向被人称为「黑箱」,但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。 例如Claude在2023年发表的一项研究,将大模型中大约500个神经元分解成约4000个可解释特征。 而10月28日的一项研究,以算术推理作为典型任务,借鉴类似的研究方法,确定了大模型中的一个模型子集,能解释模型大部分的基本算术逻辑行为。- 971
- 0
取代高贵量子方式,南科大AI方式实现蛋白质-药物系统多尺度量子「精炼」
编辑 | 萝卜皮生物大份子构造对于药物开发和生物催化至关重要。量子「精炼」(Quantum refinement,QR)方式采用牢靠的量子力学(QM)方式进行晶体细化,在提高构造质量甚至纠正生物大份子的构造方面显示出前景。然而,巨大的估计成本和复杂的量子力学/份子力学(QM/MM)设置限制了 QR 的运用。在这里,南方科技大学的研讨团队将稳健的呆板学习势(Machine Learning Pote…- 7
- 0
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
KAN 作家:我想传达的信息不是「KAN 很棒」,而是「尝试批判性地思考当前的架构,并寻求从根本上不同的替换方案,这些方案可以完成有趣、有用的事情。」多层感知器(MLP),也被称为全连接前馈神经收集,是当今深度进修模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器进修中用于逼近非线性函数的默认法子。但是最近,来自 MIT 等机构的研讨者提出了一种非常有潜力的替换法子 ——KAN…- 7
- 0
助力碳纳米材料钻研,上海交大团队开发数据启动的主动进修框架
编辑 | X碳纳米材料的可控合成,比如单晶、大面积石墨烯,手性碳纳米管,是实现其在未来电子或能源设备中潜在应用的关键挑战。基底催化滋生为碳纳米构造的可控合成提供了一种非常有前途的方式。然而,静态催化外面的滋生机制和更通用的计划策略的发展仍然是一个挑战。近日,来自上海交通大学和日本东北大学(Tohoku University)的钻研团队,展示了主动机械进修模型如何无效地揭示基底(Substrate)…- 6
- 0
CVPR 2022 | 图象也是德布罗意波!华为诺亚&北大提出量子启发MLP,本能超越Swin Transfomer
来自华为诺亚方舟实验室、北京大学、悉尼大学的研究者提出了一种受量子力学启发的视觉 MLP 新架构。- 7
- 0
MLP
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!