资讯列表
Meta 发布 Motivo AI 模型,打造更逼真元宇宙体验
Meta 公司周四宣布推出名为 Meta Motivo 的人工智能模型,该模型旨在控制类人数字智能体的动作,从而提升元宇宙体验。
AI数据就绪:C级高管的愿景与IT部门的挑战
企业领导或许对其企业的数据已准备好迎接AI充满信心,但IT工作者的说法却大相径庭,他们中的大多数人每天都在花费数小时对数据进行梳理。 根据Capital One最近的一项AI就绪度调查,近九成企业领导表示其企业的数据生态系统已准备好大规模构建和部署AI,然而,在受访的IT从业者中(包括数据科学家、数据架构师和数据分析师),有84%的人每天至少要花费一小时来解决数据问题。 该调查显示,70%的IT专业人员每天花费一到四小时来处理数据问题,而14%的人每天花费超过四小时。
Adobe 股价跌 14% 创两年来最大跌幅:受人工智能颠覆担忧影响
Adobe 股价当地时间周四下跌 14%,为 2022 年 9 月以来的最大跌幅,此前这家软件供应商发布了令人失望的收入指引。
NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
李飞飞最新采访来了,继续延伸她在NeurIPS有关视觉智能的话题。 她表示,解决空间智能问题是迈向全面智能化的基础和关键一步。 不过从现场传出的NeurIPS演讲PPT中竟然有写:AI将取代人类?
微软出招!新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining
OpenAI谷歌天天刷流量,微软也坐不住了,推出最新小模型Phi-4。 参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。 数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。
OpenAI很会营销,而号称超强AI营销的灵感岛实测成效如何?
OpenAI 是懂营销的,连续 12 天发布,每天一个新花样,如今刚过一半,热度依旧不减。 毫无疑问,这是 AI 的时代,这是信息爆炸的时代。 在这个信息爆炸的时代,营销必不可少,正如著名作家米兰・昆德拉写的那样:「企业只有两个职能:营销和创新。
李飞飞:World Labs这样实现「空间智能」
遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。 李飞飞已经在人工智能历史上赢得了一席之地,她多年来一直致力于创建 ImageNet 数据集和竞赛,在深度学习革命中发挥了重要作用。
Meta公布黑科技:戴上腕带即可隔空打字,引领神经接口AR革命
每一个新的计算平台都带来了我们与设备互动方式的范式转变。 鼠标的发明为今天主导PC世界的图形用户界面(GUIs)铺平了道路,而智能手机直到触摸屏的出现才开始真正获得影响力。 同样的规则也适用于可穿戴设备和AR,想象一下,在晨跑时只需轻轻一触指尖就能拍照,或者用几乎察觉不到的手部动作来导航菜单。
多智能体架构Insight-V来了!突破长链视觉推理瓶颈
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
小模型界o1来了:微软推出Phi-4,数学推理能力太逆天!14B模型击败GPT-4o!还印证了AI墙的一个重要推断
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)家人们,微软Phi-4的数学能力太逆天了。 谁看了不感慨一句:小模型才是未来! 8个月前,微软发布了Phi-3,性能超过庞然大物Llama-3,狠狠惊艳了我们一把。
再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2
三维场景重建旨在基于围绕目标场景拍摄的一组图像恢复出场景的三维结构,其核心追求是精准的几何结构以及逼真的图像渲染。 随着近两年的发展,3D Gaussian Splatting(3DGS)因其训练和渲染效率上的优势逐渐成为该领域的主流算法。 这一技术使用一组离散的高斯椭球来表示场景,并使用高度优化的光栅器进行渲染。
字节跳动与北京大学成立豆包大模型联合实验室
联合实验室的科研将基于字节跳动豆包大模型展开。来自高校和企业的科研人员将在实验室内,重点围绕大模型的训练、推理等开展科研工作。
微软推出 14B 参数小语言模型 Phi-4:专攻数学等领域复杂推理
微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。
扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性
扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗? 从表面上看,这两种方法似乎各有侧重:扩散模型专注于通过迭代的方式逐步去除噪声,将数据还原成清晰的样本。 而流匹配则侧重于构建可逆变换系统,目标是学习如何将简单的基础分布精确地映射到真实数据分布。
信通院报告:飞桨等国产深度学习框架将迎新发展机遇
近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024年)》。 报告指出,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。 未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。
ChatGPT「睁眼」了!OpenAI版「Her」满血上线,还有圣诞限定彩蛋
OpenAI直播第六天,可以说是把圣诞氛围拉满了。 在高级语音模式中,不仅加入了视频聊天,而且还有限定版圣诞老人语音。 这就意味着,通过设备共享摄像头摄取到的内容,我们就可以和「Her」实时视频对话了!
CCF-CV携手合合信息打造技术分享论坛,聚焦大模型时代中的视觉安全前沿热点
近期,《咬文嚼字》杂志发布了2024年度十大流行语,“智能向善”位列其中,过去一年时间里,深度伪造、AI诈骗等话题屡次登上热搜,AI技术“野蛮生长”引发公众担忧。 今年9月,全国网络安全标准化技术委员会发布了《人工智能安全治理框架》,指出人工智能既面临自身技术缺陷、不足带来的内生风险,也面临不当使用、滥用甚至恶意利用带来的外部风险。 为探寻AI安全治理道路,近期,由中国计算机学会计算机视觉专委会主办,合合信息承办,中国运筹学会数学与智能分会协办的《打造大模型时代的可信AI》论坛(简称“论坛”)顺利举行。
闭环仿真日新月异的今天,如何紧跟节奏?自动驾驶3DGS最新综述!
写在前面NeRF技术兴起于2020年,自此掀起了三维重建领域新一轮的革新风暴。 三年时间飞逝,新的算法和改进层出不穷,其视觉质量逐步提高突破。 并且在该技术的支持下,许多领域都取得了突破性的成果。