编码器
iPhone 可跑 2B 小钢炮:谷歌 Gemma 2 小模型来袭,跑分超 GPT-3.5
谷歌 DeepMind 的小模型,又上新了!就在刚刚,谷歌 DeepMind 发布 Gemma 2 2B。它是从 Gemma 2 27B 中蒸馏而来。虽然它的参数只有 2.6B,但在 LMSYS 竞技场上的得分,已经超越了 GPT-3.5 和 Mixtral 8x7B!在 MMLU 和 MBPP 基准测试中,它分别取得了 56.1 和 36.6 的优异成绩;比起前代模型 Gemma 1 2B,它的性能超过了 10%。小模型击败了大几个数量级的大模型,再一次印证了最近业界非常看好的小模型方向。谷歌在今天,一共公布了
代谢数据集上四项指标达94%~98%,西南交大团队开发多尺度图神经网络框架,助力药物研发
作者 | 刘悦睿编辑 | 红菜苔药物研发过程中,了解分子与代谢路径之间的关系,对于合成新分子和优化药物代谢机制至关重要。西南交通大学杨燕/江永全团队开发了一种新型的多尺度图神经网络框架MSGNN,来将化合物与代谢路径联系起来。它包括特征编码器、子图编码器和全局特征处理器三部分,分别学习了原子特征、子结构特征和额外的全局分子特征,这三个尺度的特征可赋予模型更全面的信息。该框架在 KEGG 代谢路径数据集上的表现优于现有方法,Accuracy、Precision、Recall、F1分别达到98.17%、94.18%、9
上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊
上海交通大学与上海人工智能实验室联合团队聚焦医学人工智能,提出了首个基于医学领域知识增强的 Chest X-ray 的基础模型。
论文插图也能自动生成了,用到了扩散模型,还被ICLR接收
如果论文中的图表不用绘制,对于研究者来说是不是一种便利呢?有人在这方面进行了探索,利用文本描述生成论文图表,结果还挺有模有样的呢!
刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+
CodeT5+,你值得拥有。
无监督训练用堆叠自编码器是否落伍?ML博士对比了8个自编码器
柏林工业大学深度学习方向博士生 Tilman Krokotsch 在多项任务中对比了 8 种自编码器的性能。
- 1