算法

扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型居然就是生物的进化算法! 这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:论文地址: Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。 Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:视频地址: 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。

AdaBoost分类器完全图解

译者 | 朱先忠审校 | 重楼本文将通过完整的源码与图解方式向你展示AdaBoost算法运行逻辑,并指出其优点与不足,还将其与随机森林算法进行对比分析。 简介每个人都会犯错,即使是机器学习领域最简单的决策树也存在这个问题。 AdaBoost(自适应增强)算法不会忽略这些错误,而是会做一些不同的事情:它会从这些错误中学习(或适应)以变得更好。

澳门大学最新!CVPR'24 ALOcc:自适应再出山,精度与速度的完美均衡!

写在前面 & 笔者的个人理解基于视觉的语义占用和流量预测在为自动驾驶等现实世界任务提供时空线索方面发挥着至关重要的作用。 现有方法优先考虑更高的精度,以满足这些任务的需求。 在这项工作中,通过引入一系列针对3D语义占用预测和流量估计的有针对性的改进来提高性能。

终于把 Seq2Seq 算法搞懂了!!

Seq2Seq(Sequence-to-Sequence)模型是一种用于处理序列数据的神经网络架构,广泛应用于自然语言处理(NLP)任务,如机器翻译、文本生成、对话系统等。 它通过编码器-解码器架构将输入序列(如一个句子)映射到输出序列(另一个句子或序列)。 图片模型结构Seq2Seq 模型由两个主要部分组成。

快速学会一个算法,卷积神经网络

大家好,我是小寒今天给大家介绍一个强大的算法模型,卷积神经网络卷积神经网络(CNN)是一种专门用于处理图像、视频等具有网格结构数据的深度学习模型。 CNN 通过局部连接和参数共享的方式,大幅减少了模型的计算量,能有效提取数据的局部和全局特征,被广泛应用于计算机视觉领域,如图像分类、物体检测、图像分割等。 图片卷积神经网络的基本结构卷积神经网络的主要包括卷积层、池化层和全连接层。

AI开源项目 | FastGPT- 深入解析 FastGPT 的知识库逻辑与检索机制:让 AI 更聪明的秘密

如何让 AI 更加智能化、精准化,成为了研究者和开发者们关注的焦点。 FastGPT 作为一款前沿的 AI 模型,其知识库逻辑与检索机制无疑是其成功的关键所在。 本文将为您详细解析 FastGPT 的知识库逻辑与检索机制,并结合知识库的特性,提供实用的教学意义,帮助您更好地理解这一技术背后的原理与应用。

大模型压缩KV缓存新突破,中科大提出自适应预算分配,工业界已落地vLLM框架

改进KV缓存压缩,大模型推理显存瓶颈迎来新突破——中科大研究团队提出Ada-KV,通过自适应预算分配算法来优化KV缓存的驱逐过程,以提高推理效率。 打破KV Cache压缩将所有注意力头分配相同压缩预算的常规做法,针对不同的注意力头进行适配性压缩预算分配展开来说,由于大模型在自回归生成过程中,每生成一个新token都需要将对应的KV矩阵存储下来,这导致缓存随着生成序列长度的增加而急剧膨胀,引发内存和I/O延迟问题,尤其在长序列推理中尤为突出。 因此,KV缓存压缩成为了一项必要的优化。

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍

强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。

养猪业新神器,AI 工具可解读猪叫声背后的情绪

路透社于 10 月 24 日发布博文,报道称欧洲科学家开发了一种能够解读猪叫声的人工智能(AI)算法,从而帮助猪农了解猪的情绪和压力状态。 根据共同领导该研究的哥本哈根大学行为生物学家埃洛迪・曼德尔-布里费尔的说法,该算法有可能提醒农民注意猪的负面情绪,从而改善它们的福祉。 该研究由来自丹麦、德国、瑞士、法国、挪威和捷克共和国的科学家共同进行,核心是通过分析数千个不同情境下的猪叫声,理解它们所表达的情感。

逐际动力发布多形态双足机器人 TRON 1:可选双点足 / 双足 / 双轮足,6.98 万元起

逐际动力今天宣布发售首款多形态双足机器人 TRON 1,中国和海外同步上架,标准版早鸟价 6.98 万起。据介绍,TRON 1 采用“三合一”模块化设计,一机支持多形态算法研发,配合三种足端可兼顾人形机器人双腿结构的简易构型和多种足端的灵活切换(AI在线注:分别为双点足 / 双足 / 双轮足,可根据不同模式实现站立行走、全地形移动等能力)。根据足端拆装后的形态变化,TRON 1 可实现足端自适应识别,进行运控模式自动切换,为科研用户提供多形态、多用途的研究平台。

中国科学院利用人工智能,发现迄今为止距其主星最近的最小行星

感谢由中国科学院上海天文台葛健教授带领的国际团队,研发了一种结合 GPU 相位折叠和卷积神经网络的深度学习算法,并在开普勒(Kepler)2017 年释放的恒星测光数据中发现了五颗直径小于地球、轨道周期短于 1 天的超短周期行星。▲ 已知行星半径和行星轨道半长轴分布以及五个新发现的超短周期行星(红点)其中四颗是迄今为止发现的距其主星最近的最小行星,类似火星大小。这是天文学家首次利用人工智能一次性完成搜寻疑似信号和识别真信号的任务。

AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议,并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,C

提速1400倍,准确标注酶活性位点,浙大、澳门理工多模态深度学习方法,登Nature子刊

编辑 | 萝卜皮注释酶中的活性位点对于药物发现、疾病研究、酶工程和合成生物学等多个领域的发展至关重要。尽管已经开发出许多自动注释算法,但速度和准确性之间的重大权衡限制了它们的大规模实际应用。浙江大学、澳门理工大学等机构的联合研究团队引入了 EasIFA,一种酶活性位点注释算法,它融合了来自蛋白质语言模型和 3D 结构编码器的潜在酶表示,然后使用多模态交叉注意框架将蛋白质水平信息与酶促反应知识对齐。EasIFA 比 BLASTp 速度提升 10 倍,召回率、准确率、f1 分数和 MCC 分别提升 7.57%、13.0

研究:AI 测谎能力比人类更强,但会对社会交往造成影响

德国维尔茨堡大学当地时间 12 日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。图源 Pixabay来自维尔茨堡、杜伊斯堡、柏林和图卢兹的研究人员探讨了 AI 在检测谎言方面的有效性及其对人类行为的影响。这项研究的主要发现可以总结如下:在基于文本的谎言检测中,AI 的准确性优于人类。没有 AI 的支持,人们不愿指责他人撒谎。在 AI 的支持下,人们更有可能表达对遇到谎言的怀疑。只有大约三分之一的研究参与者会利用向 AI 询问评估的机会。然而,大多数人

分子100%有效,从头设计配体,湖南大学提出基于片段的分子表征框架

编辑 | KX分子描述符广泛应用于分子建模,但在 AI 辅助分子发现领域,缺乏自然适用、完整且「原始」的分子表征是一个挑战,影响 AI 模型的性能和可解释性。在使用先进的自然语言处理(NLP)方法解决化学问题时,会出现两个基本问题:(1)什么是「化学词」?(2)如何将它们编码为「化学句子」?近日,湖南大学研究团队提出了一种灵活的、基于片段的多尺度分子表征框架 t-SMILES 的框架来解决第二个问题。该框架使用 SMILES 类型的字符串描述分子,并且可以将基于序列的模型作为主要生成模型。t-SMILES 具有三种

300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]该文章的第一作者帅欣成,目前在复旦大学FVL实验室攻读博士学位,本科毕业于上海交通大学。他的主要研究方向包括图像和视频编辑以及多模态学习。前言本文提出了解决一般性编辑任务的统一框架!近期,

BPAA 第四届全球应用算法模型典范大赛启动

5月15日,世界人工智能大会品牌赛事BPAA第四届全球应用算法模型典范大赛(简称“BPAA大赛”)在第四届上海数字创新大会上正式启动。第四届上海数字创新大会是上海市经济和信息化委员会、上海市科学技术委员会、上海市数据局、上海市普陀区人民政府联合主办的市级产业大会,以“沪领数字新动能,共融新质生产力”为主题,汇聚各方力量共同擘画数字中国建设蓝图,探索新质生产力的数实交融之道。上海市相关委办领导、普陀区主要领导等在大会现场见证了第四届BPAA大赛的启动。第四届全球应用算法模型典范大赛启动仪式现场BPAA大赛作为世界人工