资讯列表
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。
12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术
本篇论文的核心作者包括罗切斯特大学的博士研究生张泽良,指导教师徐辰良副教授,以及来自Adobe的研究员赵文天,万锟和李宇哲。 尽管近期 Qwen2-VL 和 InternVL-2.0 的出现将开源多模态大模型的 SOTA 提升到了新高度,但巨大的计算开销限制了其在很多场景下的应用。 近日,Adobe 研发团队联合罗切斯特大学系统性得研究了主流多模态大模型在参数和计算模式层面的冗余,并提出了名为 YOPO(You Only Prune Once)的一系列剪枝方案。
史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖
今年的NeurIPS,竟然一口气颁发了两个时间检验奖(Test of Time Awards)! 用官方的话来说就是:这两篇论文对整个领域的影响是不可否认的。 第一篇,很经典——GAN。
消息称亚马逊正开发视频 AI 模型,减少对 Anthropic 的依赖
据介绍,新模型代号为“奥林巴斯”(Olympus),将能够理解图像和视频中的场景,并通过简单的文字提示来搜索视频中的特定片段或场景,例如篮球比赛中的绝杀时刻。
刚刚,Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖
刚刚,NeurIPS 官方公布了 2024 年度的时间检验奖,破天荒的颁给了两篇论文。 一篇是 Ian Goodfellow 的生成对抗网络(GAN),一篇是 Ilya Sutskever 的 Seq2Seq。 但 10 年前的这两篇论文获得时间检验奖,也可以说是实至名归。
魔法降临!港中文MagicDriveDiT:暴力提升生成质量40%!
写在前面 & 笔者的个人理解扩散模型的快速发展极大地改善了视频合成,特别是在可控视频生成方面,这对自动驾驶等应用至关重要。 然而,现有的方法受到可扩展性和控制条件集成方式的限制,无法满足自动驾驶应用对高分辨率和长视频的需求。 本文介绍了一种基于DiT架构的新方法MagicDriveDiT,并解决了这些挑战。
广电总局发布《数字虚拟人技术要求》:符合场景的任务设定、形象完好等
国家广播电视总局组织审查了《数字虚拟人技术要求》,现批准为中华人民共和国广播电视和网络视听推荐性行业标准,予以发布。标准编号为 GY / T 411-2024,该标准自发布之日起实施。
标记化在LLM中有怎样的重要作用?
译者 | 李睿审校 | 重楼如今,GPT-3、GPT-4或谷歌的BERT等大型语言模型(LLM)已经成为人工智能理解和处理人类语言的重要组成部分。 但在这些模型展现出令人印象深刻的能力背后,却隐藏着一个很容易被忽视的过程:标记化。 本文将解释标记化的定义,标记化如此重要的原因,以及在实际应用中是否能够规避这一步骤。
马斯克 xAI 强势出击,Grok AI 有望下月推独立 App 挑战 ChatGPT
科技媒体 The Verge 今天(11 月 28 日)发布博文,报道称埃隆・马斯克(Elon Musk)旗下的 xAI 公司为加强和 OpenAI 公司的竞争,计划于 12 月为旗下 Grok 聊天机器人推出独立应用程序,以吸引更多用户。
摩托罗拉海外推出 Moto AI 首次公测,双击手机背部即可随时访问
即日起,Motorola Razr 50 Ultra、Razr+、Razr 50及 Edge 50 Ultra等设备的用户可通过系统通知注册测试计划,或访问 motorola.com 了解详情并完成报名。
被曝入局浏览器市场后,OpenAI 将前谷歌 Chrome 工程师纳入麾下
综合鞭牛士、Search Engine Journal等26日消息,前谷歌Chrome浏览器工程师达林·费舍尔(Darin Fisher)近期加入了OpenAI。
美国华盛顿装上 AI 防空摄像头,22 年老设备下岗
美国国防部刚刚部署了一个摄像系统,该系统使用了一种基于人工智能的视觉识别系统,名为增强型区域态势感知(ERSA)系统。ERSA 系统还具有机器学习功能,使其在各种锁定模式下追踪物体的能力大大增强,甚至能够捕捉到像以各种模式飞行的鸟儿这样的小目标。
华为与大连化学物理研究所签约合作,共建智能化工大模型
华为今日与大连化物所签署深化项目合作协议,双方将充分发挥各自优势,围绕“新型算力、化工大模型、人才培养”等方面,共同探索面向未来的智慧化工厂建设。
谷歌前 CEO 施密特谈“AI 恋人”潜在风险:使心智未成熟青少年痴迷其中
“想象一下,一个 AI 女友不仅外貌完美,而且能在情感上完全契合你。这种 AI 女友可能深深吸引男性,甚至让他们的思维被完全占据。”他进一步警示说,这种痴迷在心智尚未成熟的人群中尤为可能发生。
Scaling Law 撞墙?复旦团队大模型推理新思路:Two-Player架构打破自我反思瓶颈
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
推动发射智能化,火箭院“航天超脑”AI 大模型平台亮相
“航天超脑”平台是一款适用于航天领域的生成式人工智能产品,它不仅汲取了中国航天 60 多年来积累的深厚数据和文档资源,更在持续地学习与迭代中,成长为航天发射辅助决策、引领智慧的“专家级伙伴”,可推动航天发射智能化。
微软澄清:不会使用用户的 Word 和 Excel 数据来训练 AI 模型
网络安全博客 Cyberciti.biz 的博主 nixCraft 称,微软的“连接体验”功能会自动抓取用户在 Word 和 Excel 文档中的数据,用于训练公司的 AI 模型。对此,微软官方澄清称,该公司不会使用这些数据来训练其大型语言模型(人工智能模型)。
昆仑万维「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试
今天,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版(Skywork o1)。 Skywork o1是由昆仑万维集团发布的具有慢思考推理能力的系列模型。 这是国内第一款中文逻辑推理能力的o1模型。