算法

70B 模型秒出 1000token,代码重写超越 GPT-4o,来自 OpenAI 投资的代码神器 Cursor 团队

70B 模型,秒出 1000token,换算成字符接近 4000!研究人员将 Llama3 进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了 13 倍!不仅是快,在代码重写任务上的表现甚至超越了 GPT-4o。这项成果,来自爆火的 AI 编程神器 Cursor 背后团队 anysphere,OpenAI 也参与过投资。要知道在以快著称的推理加速框架 Groq 上,70B Llama3 的推理速度也不过每秒 300 多 token。Cursor 这样的速度,可以说是实现了近乎即时的完整代码文件编辑。有人直

消息称小红书内测自研大模型“小地瓜”,有望落地社交和搜索

感谢据 36 氪报道,多个独立信源透露,由小红书 AI 创新负责人张德兵(薯名:宇尘)牵头的大模型团队,在部分内部产品灰度测试自研通用大模型基座“小地瓜”。小红书 AI 产品的探索,则主要由小红书产品和设计负责人邓超(薯名:樱木)负责。报道称,知情者透露小红书对上线新 AI 产品的态度非常谨慎,原因是害怕破坏现有的内容生态。一名知情者说:“小红书的内容生态是活人种草,AI 在里面怎么样才不违和,这是困扰小红书的一个问题。”据悉,社交和搜索则是小红书希望走出图文种草的舒适区,用 AI 触达更多用户的新场景。IT之家注

国家网信办发布第五批深度合成服务算法备案信息,理想汽车 MindGPT 等 394 个算法在列

感谢国家网信办今日发布公告,根据《互联网信息服务深度合成管理规定》,现公开发布第五批境内深度合成服务算法备案信息。《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。请尚未履行备案手续的深度合成服务提供者和技术支持者尽快申请备案。IT之家从《境内深度合成服务算法备案清单(2024 年 4 月)》文件获悉,本次共有 394 个算法通过备案

云天励飞推出“深目”AI模盒,实现算法在线学习、自我迭代

把大模型“装”进小盒子,云天励飞创新“AI+”路径

达摩院2025届春招启动,开放20余类实习岗位

3月21日消息,阿里达摩院已开启春季2025届实习生招聘,面向海内外2025届应届毕业生开放20余类实习岗位。记者注意到,达摩院招聘官网放出的岗位信息,既有视频多模态理解、多语言大模型、医疗AI、运筹优化等热门的人工智能方向,更有芯片软件、芯片设计/验证/DFT、计算体系结构、编辑器与计算体系结构开发等集成电路方向。部分岗位信息显示,达摩院的研究方向注重不同领域的融合探索,如“设计探索针对新型芯片架构的编译工具链,探索流行深度学习算法在新一代计算架构芯片上的优化算法”,要求候选人有集成电路设计或深度学习算法等研究经

量子计算新进展,腾讯量子实验室设计新算法进行量子近似优化

编辑 | 白菜叶组合优化问题普遍存在,并且通常在计算上很难解决。量子近似优化算法(QAOA)是最具代表性的量子经典混合算法之一,旨在通过将离散优化问题转化为连续电路参数上的经典优化问题来解决组合优化问题。QAOA 目标景观因普遍存在局部最小值而臭名昭著,其可行性很大程度上依赖于经典优化器的功效。在最新的研究中,腾讯量子实验室(Tencent Quantum Laboratory)的研究人员为 QAOA 设计了 double adaptive-region Bayesian optimization(DARBO)。测

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加速框架,能做到效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低了推理耗时。以Llama2-7B-chat模型与Dolly数据集为例,实测token生成速度可由48.2个/秒,升至112.9个/秒,提速2.34倍。而在蚂蚁内部的RAG(检索增强生成)数据集上,百灵大模型AntGLM 10B版本的加速比达到5.36,与此同时,显存增加和内存消耗几乎

阿里云首创PilotScope新技术,为AI4DB应用提速

12月20日,数据库国际顶会VLDB2024公布新一批论文,阿里云新技术PilotScope成功入围,该平台技术可实现AI算法在数据库的“一键部署”,极大降低数据库中AI算法的应用门槛,为数据库智能化开辟了全新空间。同日阿里云宣布将PilotScope全部技术免费开源。图说:数据库顶会VLDB2024数据库是事关国计民生的基础软件技术,数据库技术的更新影响着数字时代的千行百业,其中一个前沿领域即是数据库智能化(AI4DB,AI for Database)。现在的数据库系统非常复杂,对稳定性要求极高,即便将单一AI算

重温图灵原理,感受反证法的力量

图灵原理揭示了人类永远不可能做到可知而全知,本文将阐释图灵是如何基于对角线证明,从反证法的角度对图灵原理进行证明的。

ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐

相比去年评出的 15 篇杰出论文,ICML 2023 的获奖论文数量大大减少,只有 6 篇。

能胜任统计学家?Transformers超强学习机制「自动算法选择」

Salesforce AI Research、北京大学和 UC 伯克利合作的最新论文,发现 Transformer 模型在上下文中学习(in-context learning)的新机制:「自动算法选择」,类似统计与机器学习专家能够现实完成的工作。

光学算法简化模拟人工智能训练

编辑 | 白菜叶研究人员开发了一系列模拟和其他非常规机器学习系统,期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示,他们已经提出了一种训练算法(NTT 上个月宣布),该算法对让这些系统实现其承诺大有帮助。他们的结果建立在光学模拟计算机上,代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计

国内首届AI安全大赛圆满收官,上交大、北交大、北理工等夺得三项赛道冠军

从长远看,人工智能的安全问题,还需从算法模型的原理上突破,唯有持续加强基础研究,才能破解核心科学问题。

WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践

昇思 MindSpore 是华为开源的新一代全场景 AI 框架,支持端、边、云全场景灵活部署,开创全新的 AI 编程范式,降低 AI 开发门槛,旨在实现开发友好、运行高效、部署灵活三大目标,同时着力构筑面向全球的人工智能开源社区,推动人工智能软硬件应用生态繁荣发展。昇思 MindSpore 原生支持大模型,联合合作伙伴推出了四大领域创新模型。鹏城实验室基于昇思 MindSpore 先后推出了业界首个 2000 亿参数中文预训练语言模型鹏程,盘古和面向生物医学领域的鹏程,神农大模型、中科院自动化所基于昇思 MindS

如何通过机器学习算法,将EV电池运用到极致?

编译 / 刘梦婷近日,剑桥大学的研究人员开发了一种机器学习算法,可以通过预测不同的驾驶模式对电池性能的影响,帮助电动车减少充电时间,延长电池寿命,提高安全性和可靠性。研究结果发表在《自然通讯》(Nature Communications)杂志上。该团队开发了一种非侵入式方法来检测电池,并获得电池整体健康状况。然后,将这些结果输入机器学习算法,该算法可以预测不同驾驶模式将如何影响电池未来的健康状况。研究人员表示,该算法可以通过建议路线和驾驶模式,最大限度地减少电池退化和充电时间,来充分利用电动汽车的电池。如果将其用于

Creator 面对面 | 几何深度学习的算法设计和数学理论

2016年,Yann LeCun 等人在 《Geometric deep learning: going beyond Euclidean data》一文中提出几何深度学习这一概念。现今几何机器学习和基于图的机器学习已经是当前最热门的研究课题之一。

ICML2022奖项公布:15篇杰出论文,复旦、厦大、上交大研究入选

ICML2022 共评选出 15 篇杰出论文和一篇时间检验奖论文。

CVPR 2022 | 多机器人协同主动建图算法

本文是 CVPR 2022入选论文《Multi-Robot Active Mapping via Neural Bipartite Graph Matching》的解读。该论文由北京大学陈宝权研究团队与山东大学、腾讯AI Lab、清华大学、斯坦福大学合作,将传统方法与机器学习相结合,提出了多机器人协同主动建图算法 NeuralCoMapping,实现了室内场景完整地图的高效构建。 实验证明,相比于其他多机协同建图算法,NeuralCoMapping 在时间效率上具有显著优势,而且在多种未知场景和不同数量机器人上表现出卓越的泛化能力。