资讯列表
重磅!微软发布新AI Agent,集成在office全家桶、自动化时代来了
今天凌晨,微软在官网发布了全新企业级AI助手——Microsoft 365 Copilot Chat。 Copilot Chat除了支持的传统的文本生成、文件分析(PDF、Word等)、图像生成之外,最大亮点便是支持AI Agent功能,并且集成在了Microsoft 365商业版中,可直接调用企业自有数据,执行夸端到端的超复杂自动化业务流程。 例如,在供应链管理中,Copilot Chat能够实时监控库存水平,根据销售数据和市场趋势预测需求,自动生成采购订单,并协调物流配送,提升整个供应链工作效率。
单图秒变3D对象,还可交互实时编辑!Stability AI中科大校友新作
近日,Stability AI发布消息,公开3D重建新方法SPAR3D的设计原理、代码、模型权重等。 SPAR3D可在一秒内从单张图像生成3D物体的完整结构并且可以实时编辑。 文章亮点:新方法SPAR3D实现了实时编辑,在不到一秒内可从单图完成3D对象的结构生成。
大步迈向VLA!港中文GPT4Scene:从视频中理解3D场景~
写在前面&笔者的个人理解具身人工智能是指能够通过与物理环境交互来执行各种任务的智能系统。 它在工业检测、智能家居和智能城市中有着广泛的应用和发展前景。 3D 场景理解涉及多模态语言模型理解室内环境整体布局和物体之间空间关系的能力。
ChatGPT全年更新大总结!重看「大模型风向标」进化之路
2024年,大模型已经深入融入了我们的日常生活。 而作为领跑者,ChatGPT也一直是大模型届的指南针,无论是去年发布的大模型o1-pro,Sora Turbo,还是各种小功能,比如视频模式、打断说话等,甚至是每月200美元的高额定价,OpenAI的每一场发布会都能给广大AI爱好者带来一些新震撼、新思路。 下面共同回顾一下OpenAI在2024年发布的关键更新,一起见证大模型的进化之路!
姚期智团队开源新型注意力,节省90%内存不降性能,一个框架统一MHA/MQA/GQA
新型注意力机制TPA,姚期智院士团队打造。 TPA对每个token做动态的张量分解,不存储完整的静态KV,而是保留分解的版本,内存占用节省90%(或者更多),而不会牺牲性能。 论文中还证明了流行的MHA、MQA、GQA都是TPA的特殊情况,用一个框架统一了现代注意力设计。
打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度
很多大模型的官方参数都声称自己可以输出长达32K tokens的内容,但这数字实际上是存在水分的? ? 最近,陈丹琦团队提出了一个全新的基准测试工具LONGPROC,专门用于检测长上下文模型处理复杂信息并生成回复的能力。
揭秘大模型强推理能力幕后功臣“缺陷”,过程级奖励模型新基准来了
截止目前,o1 等强推理模型的出现证明了 PRMs(过程级奖励模型)的有效性。 (“幕后功臣” PRMs 负责评估推理过程中的每一步是否正确和有效,从而引导 LLMs 的学习方向。 )但关键问题来了:我们如何准确评估 PRMs 本身的性能?
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
从章鱼通过改变皮肤颜色来融入周围环境,到人类大脑在受伤后重新连接神经网络,无不体现着那句经典的名言——「物竞天择,适者生存」。 然而,对于LLM来说,想要加入哪怕只是一句话的新知识,都必须要再训练一次。 针对这一挑战,来自Sakana AI的研究团队刚刚提出了一种全新的方法——Transformer²。
马斯克 xAI 再放大招:网页版 Grok 上线,无需 X 账户
埃隆・马斯克(Elon Musk)旗下 xAI 公司在推出 iOS 版后,最新上线推出了网页版 Grok AI 聊天机器人,意味着用户无需访问 X.com 甚至无需拥有 X 账户,即可体验 Grok 的各项功能。
微软为企业推出 Copilot Chat:提供免费 AI 聊天和按需付费 AI 代理功能
微软今日宣布将其免费的企业级 AI 助手 Copilot 重新命名为 Microsoft 365 Copilot Chat,提供免费 AI 聊天功能,并新增按需付费的 AI 代理功能。此举旨在让用户在工作中逐步习惯并依赖 AI 技术,进而吸引他们订阅每月 30 美元(IT之家备注:当前约 220 元人民币)的完整版 Microsoft 365 Copilot 服务。
泰国总理自曝差点成电诈受害者:AI 伪造“外国领导人”试图骗钱
她表示,自己差点被一个高科技的骗局欺骗。“我要提醒大家,连我都差点上当受骗,这个问题非常重要。泰国数字经济与社会部已经介入调查。我们必须承认,诈骗手段越来越隐蔽,越来越先进。”
OpenAI CEO 阿尔特曼:未来“提问能力”将比“智力”更重要
OpenAI 首席执行官萨姆・阿尔特曼(Sam Altman)表示,AI 可能正在逐渐削弱“原始智力”的重要性。在最近一期《ReThinking》播客节目中,阿尔特曼与组织心理学家亚当・格兰特(Adam Grant)对话时提到:“未来我们仍然会重视某种能力,但它将不再是以前那样的原始智力。提出正确问题的能力将比找到答案的能力更为重要。”格兰特似乎认同阿尔特曼的观点,他表示:“我认为,能够连接不同点并识别模式的人将更具优势。”
国产视频生成大模型 Vidu 2.0 上线:10 秒即可“出片”
官方表示,Vidu 2.0还实现了效果升级,使风格、主题更一致,首尾帧更自然;提供错峰模式,低峰时段不限量、不扣积分,同时还支持一次性生成4条素材。不过,Vidu 2.0目前不支持文生视频功能。
从寻人到防踩踏,印度大壶节首次引入 AI 技术守护 4.5 亿朝圣者
为应对全球最大规模宗教集会带来的安全挑战,印度政府在本届大壶节(Maha Kumbh Mela)中首次大规模部署人工智能技术,通过人脸识别摄像头、水下无人机和机器人浮标等先进设备,为近 4.5 亿朝圣者提供安全保障。
近8年后,谷歌Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GPT-4 等超大型模型性能更强。 」终于,在 2017 年推出影响 AI 行业长达 8 年的 Transformer 架构之后,谷歌带来了全新的架构 Titans。 这次,谷歌的重点是将推理领域非常重要的测试时(test-time)计算用在了记忆(memory)层面。
为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
周二,在一场涉及 Meta 的人工智能版权案件(Kadrey 诉 Meta 案)中,法院公开了 Meta 高管和研究人员的内部通信记录。这些文件显示,Meta 在开发其最新 AI 模型 Llama 3 的过程中,高管和研究人员将超越 OpenAI 的 GPT-4 视为核心目标,并在内部讨论中表现出极强的竞争意识。
交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断
编辑 | ScienceAI当医生面对复杂病例时,往往需要反复思考、权衡多种可能性,才能得出准确诊断。 以鉴别诊断为例,它要求医生生成可能的诊断列表,并通过评估临床发现,逐步排除不符合条件的选项。 如今,AI 也学会了这种「深思熟虑」的诊断方式。
AI预测自然灾害,全球首个支持全天候灾害响应的多模态超高分辨率数据集BRIGHT
编辑 | ScienceAI这是全球首个支持全天候灾害响应的多模态超高分辨率数据集,论文和数据集已公开,作者团队来自东京大学(UTokyo),理化学研究所(RIKEN),苏黎世联邦理工学院(ETH Zurich)和微软亚洲研究院(MSRA)。 论文链接::,自然灾害和人为灾害频发,给全球范围内的人类社会带来了重大影响。 快速而精准的灾后评估尤其是建筑损毁评估,是制定紧急救援决策、减少人员伤亡和财产损失的重要依据。